最近学了点py的爬虫。还没有到框架,只是request库加bs4解析的程度。不知道是不是我不熟悉bs库的问题,我总感觉正则表达式比bs4好用😀。就是有的时候bs的findall方法反而找不到目标,但是正则表达式解析一下就有结果。难道findall不应该“人如其名”一样直接返回全部文档的匹配项吗?还是bs解析成文档树导致标签藏得太深了,实在是找不到...Anyway总之想爬点什么我必须把篮球和鸡结合起来,bushi)是弹幕和词云。弹幕做成的词云,很有意思,能直接看出观众的关注点和视频内容,乃至某种态度。比如某Chubbyemu的医学视频的弹幕词云:上面最大的两个词是该频道固有的猜人名环节贡献的最多词组。而这个故事发生在一个吃了腐败土豆的囚犯身上,病情跟肉毒有关这是某财经视频的弹幕词云:最近日元贬值,聊的最多的是美元,以及日本。这是日本人在上海旅游的视频:这是海军生日的视频:不管到哪都能看见“哈哈哈”和“啊啊啊”,看出来b友真的喜欢表达自己激动和喜悦。所以要怎么做才能获得这么炫酷有趣的词云?起先我是想去通过bv获取页面进行一个弹幕的寻找。但是很遗憾太复杂,没有找到门道。后来了解到,b站的弹
walker
人生若只如初见
本站由
特别加持