欢迎计算机或者相关专业的在校学生(硕士,博士),每周可以实习3天或以上,连续实习4个月以上;
清华大学国际技术转移中心于2001年6月,由清华大学校务委员会通过并发起成立。2002年6月,成立实体化公司科威国际技术转移有限公司。在近二十年的发展中,中心致力于开展国际技术转移、技术商业化与技术孵化等工作。目前是首批国家级技术转移中心、首批“国家技术转移示范机构”、中国科技部火炬中心“国际科技合作依托机构”、“中国创新驿站”秘书处的运营单位和北京市科学技术委员会认定“首都科技条件平台清华大学研发实验服务基地”,控股与参股项目/公司十余个。
岗位职责:
1.负责多平台信息数据抓取和清洗,信息抽取、数据清洗、结构化等工作;
2.解决数据爬虫的遇到问题,设计爬虫策略和防屏蔽规则
3.配合算法工程师进行数据分析;
任职要求:
1、计算机相关专业本科以上,具有爬虫开发工作经验;
2、能熟练使用Python独立完成数据爬虫的开发;
3、熟悉html/css/xpath/ajax/xml等技术,熟悉HTTP传输协议;
4、熟悉常见爬虫框架,熟悉网页抓取原理和整合技术,
5、熟悉数据处理方法,如正则表达式;
6、熟练使用mysql、sqlserver等数据库;
7、熟悉常用linux命令,能够在linux环境下工作
加分:
1.熟悉Java或php开发及部署背景优先;
2.有分布式爬虫系统设计、工程化和运维经验者优先。
3.有反爬经验优先。
4.熟悉数据抽取,有数据分析经验者优先
工作地点:北京市海淀区中关村东路1号院科技大厦B座701B
联系人微信:18611782962
邮箱:guoyan@ittc.com.cn
--
FROM 101.254.122.*