【奇虎360】【数据抓取实习生】
职位描述:
1、目标是从互联网海量信息中抓取并筛选出有价值的内容,并转换为适合移动端展示的格式以推荐给用户,涉及到的环节包括爬虫,抽取,去重,质量识别等;
2、主要工作集中在爬虫和抽取环节;
3、由于需要覆盖大量长尾数据,对内容的精确抽取涉及到非常多的挑战;
4、帮助覆盖更多的内容,并将内容以更加精准的形式展现给用户。
职位要求:
1、对技术有热情, 既有高远目标,也能脚踏实地
2、有扎实的数据结构和算法功底, 强悍的编码能力
3、熟悉linux开发环境,熟悉C++和python语言的优先
4、理解http,熟悉html、DOM、xpath优先
5、熟悉机器学习相关知识优先
投递地址:minxinlin@360.cn 邮件题目请标明【姓名-应聘岗位】,请以附件形式添加个人简历
--
FROM 218.30.116.*