北京范普拉科技公司诚聘专职和兼职各两名数据抓取工程师:
职责:
1、负责公司的电商数据抓取核心技术研究以及爬虫策略优化;
2、根据业务需求,实现大规模文本、图片数据抓取、清洗、存储等工作;
3、对数据质量负责,提供数据分析报告,优化数据应用架构,支持产品研发。
要求:
1、计算机专业统招本科及以上学历
2、熟练Linux系统及Shell;熟练Python、Java开发语言;
3、熟悉Mysql、SQLserver、PostgreSql数据库,熟练搭建数据库服务器及集群服务;
4、熟悉编写网络爬虫采集规则,能破解js混淆、破解识别复杂图片验证码, 对反爬、加解密、代理、模板等关键技术理解透彻
5、熟悉Redis、Memcache、MongoDB等NoSQL缓存技术以及分布式系统的设计和应用,对 IO、多线程有扎实理解;
6、掌握多种解析工具Xpath、Beautifulsoup、pyspider,熟练IP代理,熟悉Hadoop;
7、有 Storm/Spark streaming/Flink 等分布式流计算经验者优先,有 Scrapy / Pyspider / Nutch / Heritrix 框架的使用经验或自己手写过类似框架优先;
8、精通API接口对接、高效对接相关业务系统;
请将简历发至如下email,
电话:010-65008080
Email: hr@vanpra.com※ 修改:·intlcool 于 Feb 8 10:28:28 2022 修改本文·[FROM: 68.5.245.*]
※ 来源:·水木社区
http://www.mysmth.net·[FROM: 68.5.245.*]
修改:intlcool FROM 68.5.245.*
FROM 68.5.245.*