“今日头条”是一款基于数据挖掘的推荐引擎产品,是国内移动互联网领域成长最快的产品服务之一。“今日头条”第一个版本于2012年8月上线,截至2015年12月,“今日头条”已经在为超过3.5亿的忠诚用户服务。我们的团队是一支拥有丰富创业及成熟公司经验的靠谱团队,聚集了来自一流学校和一流公司的顶尖人才,在推荐引擎、机器学习等技术领域拥有与世界级公司接轨的能力。公司正处于高速发展期,2014年6月,今日头条获得C轮1亿美元的融资,现招聘以下职位:
数据抓取实习生
【主要职责】
今日头条的目标是给用户推荐他所感兴趣的各种信息(不只是新闻),因此数据是今日头条的核心。抓取的目标是从互联网海量信息中抓取并筛选出有价值的内容,并转换为适合移动端展示的格式以推荐给用户,涉及到的环节包括爬虫,抽取,去重,质量识别等。实习生职位的主要工作集中在爬虫和抽取环节。 由于需要覆盖大量长尾数据,对内容的精确抽取涉及到非常多的挑战,你的加入,可以帮助头条覆盖更多的内容,并将内容以更加精准的形式展现给用户。
【能力要求】
1、对技术有热情, 既有高远目标,也能脚踏实地;
2、有扎实的数据结构和算法功底, 强悍的编码能力;
3、熟悉linux开发环境,熟悉C++和python语言的优先;
4、理解http,熟悉html,DOM,xpath优先。
实习时间: ≥3个月
请以“数据抓取实习生_姓名_学校_年级_入职时间_每周X天”为邮件标题,将简历发送至hr@bytedance.com;)
--
FROM 120.52.147.*