【实习】【今日头条】数据抓取实习生
实习时间:>3天/周 >3个月
实习薪资:面议
简历投递:zengyuan@bytedance.com "姓名+最快到岗时间+可实习几个月+每周几天" 附上做过的项目代码
职位描述:
1、目标是从互联网海量信息中抓取并筛选出有价值的内容,并转换为适合移动端展示的格式以推荐给用户,涉及到的环节包括爬虫,抽取,去重,质量识别等;
2、主要工作集中在爬虫和抽取环节;
3、由于需要覆盖大量长尾数据,对内容的精确抽取涉及到非常多的挑战;
4、帮助头条覆盖更多的内容,并将内容以更加精准的形式展现给用户。
职位要求:
1、对技术有热情, 既有高远目标,也能脚踏实地;
2、有扎实的数据结构和算法功底, 强悍的编码能力;
3、熟悉linux开发环境,熟悉C++和python语言的优先;
4、理解http,熟悉html,DOM,xpath优先。
关于团队
从零到1,我们伴随头条的每一天变化,海量数据,优质模型,高标准召回率~
挑战&机遇,只等你的加入~
--
FROM 120.52.147.*