指定的一批微信公众号(订阅号),需要爬取过去3年所有的历史文章,以及每日定时
爬取更新的文章。将文章的链接、文章内容(包括图片)永久保存到本地。由于文章的链
接为临时链接,需要定时更新新的文章链接。
要求:
1. 需要做成可配置的程序,用户可配置微信公众号列表,程序自动从列表中爬取公众
号。
2. 需要规避反爬虫,保证程序持续的稳定性。
3. 技术平台:最好使用linux平台(centos),爬虫搜索优先使用java或者python。
4. 工作地点在北京(方便联系),有实际的爬虫经验。
站内信箱联系,价格私聊。
--
FROM 124.127.67.*