职能:
1.负责指定网页的定向抓取和页面内容的提取分析
2.爬虫框架的架构设计,反爬技术突破,保障稳定的数据获取能力;
要求:
1.1年以上爬虫开发经验
2.熟悉python/javascript/c#/c++语音,熟悉Linux开发环境和常用命令
3.熟悉htm/css/xpath/ajax/xml等常用web知识,熟悉selenium等常用爬虫技术
4.精通网页抓取原理及技术,熟悉正则表达式,从结构化和非结构化的数据中获取信息
5.能够解决封账号,封IP采集等问题,解决网页抓取,信息抽取等问题,构建完善的网络信息收集平台
6.有实际的爬虫开发经验,有解决反爬经验尤佳
7.能够独立解决问题能力,有良好的团队协作和沟通能力
备注:日薪范围与实习月份面议!
简历请发至:2098212089@qq.com
联系电话:010-5937-3330
公司地址:北京市海淀区北四环西路58号理想国际大厦708
Gemalto Cogent北京研发中心主要从事生物特征计算机自动识别算法和软硬件系统研发,在生物识别领域处于全球领先位置。我们在自动指纹识别系统(AFIS),人像识别(Facial Recognition),虹膜识别(Iris Recognition),以及利用生物特征进行安全认证(Biometric Security Authentication)等领域处于国际领先地位,客户群遍布于全世界各国家的执法机构,出入境管理,保险和银行业,和其他许多需要利用生物特征来识别和认证主体身份的行业。
--
FROM 58.220.95.*