岗位职责:
网页信息的抓取、清洗、存储、更新;
周期性抓取任务调度、监控;
分布式结构化抓取平台的设计和开发;
岗位要求:
熟悉HTTP协议,熟悉HTTP接口的调试分析;
熟悉基本算法和数据结构;
熟练掌握并应用scrapy进行爬虫开发;
熟练使用Redis、SQL中至少一个存储组件;
熟练阅读js代码;熟练使用Linux操作系统;
熟练使用git;熟悉基于正则表达式、XPath、CSS等网页信息抽取技能;
工作地址北京 - 海淀区 - 中关村国际孵化园D座606
请加微信:1731零800六伍6 云孚人事微信 发简历约面试
--
FROM 114.249.223.*