【实习】【北京】【字节跳动】搜索算法、搜索后端、数据挖掘、数据抓取
字节跳动搜索部门介绍:字节跳动搜索部门主要负责今日头条、抖音、火山等产品的搜索业务,支持网页搜索和垂搜。通过大规模机器学习、深度学习算法,给用户最好的搜索体验,服务于字节跳动的全球用户。借助于字节跳动的流量和资源优势,你将与业界搜索大牛组成的一流技术团队共同成长,始终追求极致不断改进,一同探索搜索行业新的最佳实践。 招聘方向:算法、工程
搜索算法实习生
学历要求:本科及以上 职位亮点:弹性工作,免费三餐,休闲下午茶,扁平管理,职业大牛,团队氛围好 工作城市:北京 工作年限:不限 职位描述:
1、参与ByteDance搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验; 2、参与头条/抖音/TikTok等核心产品的搜索研发工作,服务数亿全球用户; 3、参与搜索核心算法改进,可能的方向包括: (1)NLP:将业界最先进的NLP技术应用到搜索算法改进中,包括纠错、分词、改写、Term Weighting、意图识别; (2)Ranking:解决千亿级网页的排序问题,攻克基础检索、相关性、意图理解、权威性、时效性等世界难题; (3)页面分析和摘要:从千亿网页中提取最有价值的信息,进行结构化字段提取、智能摘要生成、转码等工作来优化搜索体验; (4)链接分析:从万亿链接中找出最有价值的网页,优化链接质量、索引质量、垃圾作弊识别、调度策略等; 职位要求:
1、出色的分析问题、解决问题能力;2、出色的机器学习、NLP和数据挖掘基础,并能很好的建模解决问题; 3、扎实的代码能力,扎实的数据结构和基础算法功底;4、熟悉linux开发环境,熟练使用C++和python语言;
搜索后端研发实习生 学历要求:本科及以上 职位亮点:弹性工作,免费三餐,租房补贴,休闲下午茶,扁平管理,过亿用户,职业大牛,团队氛围好 工作城市:北京 工作年限:不限 职位描述:
1、参与ByteDance搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验; 2、参与头条/抖音/TikTok等核心产品的搜索研发工作,服务数亿全球用户; 3、参与搜索核心架构改进,可能的方向包括: (1)设计开发千亿级网页搜索的数据流、分布式建库、在线检索系统,设计业内领先的检索架构; (2)设计开发万亿级Spider系统的实时计算、调度分发、压力控制、蜘蛛抓取等服务; (3)设计开发高可用的搜索引擎稳定性解决方案、自动测试和运维平台; 4、在这里你可以毫无历史包袱地实现自己的架构梦想。 职位要求:
1、出色的分析问题、解决问题能力; 2、出色的分布式系统架构设计和开发能力;3、数据结构和基础算法功底;4、精通linux开发环境、C++语言、网络和多线程编程; 有主流大规模搜索引擎架构和稳定性经验者加分
数据挖掘实习生
学历要求:本科及以上 职位亮点:免费三餐,租房补贴,休闲下午茶,扁平管理 工作城市:北京 工作年限:不限 职位描述:
1、负责搜索Spider系统的基础数据挖掘和核心技术研发 2、负责互联网资源特征数据挖掘,包括页面特征、站点特征、页面价值度、热点变化趋势等 3、负责链接的反垃圾,识别无价值链接,控制链接规模 4、利用机器学习/深度学习算法建立模型,预估链接质量 职位要求: 1、计算机或相关专业,本科及以上学历 2、熟悉C/C++语言编程,熟悉linux平台、shell编程 3、对数据结构和算法设计有较为深刻的理解 4、熟悉搜索相关领域如:网页抓取/页面分析/信息挖掘/统计分析 优先 5、有机器学习深度学习经验优先
数据抓取实习生
学历要求:本科及以上 职位亮点:免费三餐,租房补贴,休闲下午茶,扁平管理 工作城市:北京 工作年限:不限 职位描述:
1、负责搜索Spider系统的架构设计和核心模块开发2、负责搜索Spider分布式计算、调度、抓取、压力控制等模块的设计开发3、负责蜘蛛程序的开发优化,基于webkit内核的js渲染引擎4、负责网页特征抽取,利用模版或自动化抽取网页特征5、负责搜索Spider数据可视化,日常数据分析和监控职位要求:
1、计算机或相关专业,本科及以上学历2、熟悉C/C++语言编程,熟悉linux平台、shell编程3、对数据结构和算法设计有较为深刻的理解4、有大数据工作经验,熟悉hadoop/storm/spark等经验者优先5、有搜索引擎/Spider抓取等相关经验者优先
注:实习岗位拥有转正机会
邮件主题及简历命名: 姓名-岗位-社招/实习
其他部门和岗位也可推
邮箱: sunjiajia.it@bytedance.com
--
FROM 120.52.147.*