数据抓取实习生
实习地点:北三环中路中航广场矮楼
时间要求:每周>=4天(暑期全职优先),3个月及以上
实习福利:三餐全包,租房补贴,免费健身
实习薪资:200-300/天,按出勤天数计算
请以“数据抓取实习生_姓名_学校_年级_入职时间_每周X天”为邮件标题,将简历及相关要求材料发送至hr@bytedance.com :)
岗位描述:
1.今日头条的目标是给用户推荐他所感兴趣的各种信息(不只是新闻),因此数据是今日头条的核心。
2.抓取的目标是从互联网海量信息中抓取并筛选出有价值的内容,并转换为适合移动端展示的格式以推荐给用户,涉及到的环节包括爬虫,抽取,去重,质量识别等。
3.实习生职位的主要工作集中在爬虫和抽取环节。 由于需要覆盖大量长尾数据,对内容的精确抽取涉及到非常多的挑战,你的加入,可以帮助头条覆盖更多的内容,并将内容以更加精准的形式展现给用户。
任职要求:
1.对技术有热情, 既有高远目标,也能脚踏实地
2.有扎实的数据结构和算法功底, 强悍的编码能力
3.熟悉linux开发环境,熟悉C++和python语言的优先
4.理解http,熟悉html,DOM,xpath优先
5.需要提交的材料:
1)简历
2)SNS账号(或链接),如微博、豆瓣等
3)你经常上的3个技术网站
4)你阅读过的3本值得推荐的技术类书籍
--
修改:reaishenghuo FROM 120.52.147.*
FROM 120.52.147.*