【今日头条】招聘 数据抓取实习生
工作地点:北京市海淀区知春路(离地铁站5分钟)
请将简历发送至:hr@bytedance.com “姓名+抓取实习+每周可实习天数+最早入职时间+可实习期限”
实习薪资:日薪200~300元/天
实习时间:3~4天/周,≥6个月
职位描述:
今日头条的目标是给用户推荐他所感兴趣的各种信息(不只是新闻),因此数据是今日头条的核心。抓取的目标是从互联网海量信息中抓取并筛选出有价值的内容,并转换为适合移动端展示的格式以推荐给用户,涉及到的环节包括爬虫,抽取,去重,质量识别等.
实习生职位的主要工作集中在爬虫和抽取环节。 由于需要覆盖大量长尾数据,对内容的精确抽取涉及到非常多的挑战,你的加入,可以帮助头条覆盖更多的内容,并将内容以更加精准的形式展现给用户。
职位要求:
1.对技术有热情, 既有高远目标,也能脚踏实地
2.有扎实的数据结构和算法功底, 强悍的编码能力
3.熟悉linux开发环境,熟悉C++和python语言的优先
4.理解http,熟悉html,DOM,xpath优先
需要提交的材料:
1.简历
2.SNS账号(或链接),如微博、豆瓣等
3.你经常上的3个技术网站
4.你阅读过的3本值得推荐的技术类书籍
--
--
FROM 106.37.230.*