Skip to content

huxiaoheng44/sougou_wechat_crawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 

Repository files navigation

sougou_wechat_crawler

基于Selenium WebDriver搜狗微信公众号爬虫
主要功能是根据输入的关键词爬取2020年最新的文章,包括标题和网址
通过webdriver解决搜狗微信的反扒机制,干脆就直接使用浏览器进行爬虫,虽然效率比较低,但是实现起来难度小,适合轻量级的爬虫。 注:如果搜狗微信没有登录只能默认爬取10页,登录后才能查任意次数

keyword 修改搜索关键词
page_num 为爬取的页数

About

基于Selenium WebDriver搜狗微信公众号爬虫

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages