岗位职责:
1.负责多平台信息数据抓取和清洗,信息抽取、数据清洗、结构化等工作;
2.解决数据爬虫的遇到问题,设计爬虫策略和防屏蔽规则
3.配合算法工程师进行数据分析;
任职要求:
1、计算机相关专业本科以上,具有爬虫开发工作经验;
2、能熟练使用Python独立完成数据爬虫的开发;
3、熟悉html/css/xpath/ajax/xml等技术,熟悉HTTP传输协议;
4、熟悉常见爬虫框架,熟悉网页抓取原理和整合技术,
5、熟悉数据处理方法,如正则表达式;
6、熟练使用mysql、sqlserver等数据库;
7、熟悉常用linux命令,能够在linux环境下工作
加分:
1.熟悉Java或php开发及部署背景优先;
2.有分布式爬虫系统设计、工程化和运维经验者优先。
3.有反爬经验优先。
4.熟悉数据抽取,有数据分析经验者优先
欢迎计算机或者相关专业的在校学生(硕士,博士),请有意者发送简历到 guoyan@ittc.com.cn
公司简介:
科威国际技术转移有限公司于2002年6月由清华大学发起成立,承担清华大学国际技术转移中心的商业化运作,是国内最早设立的以市场化方式运作的国际技术转移与技术商业化服务机构。公司专业从事国际技术转移,通过技术授权、转让、孵化、投融资、咨询等模式,致力于实现技术的商业化。
公司以生物化工、节能环保、医疗器械等技术领域为关注重点,成功完成了多项技术的引进和出口,客户遍布美国、德国、西班牙、新西兰、日本、俄罗斯、意大利、印度等。
--
FROM 67.230.172.*