【工作职责】
从互联网的海量信息中抓取并且筛选出有价值的单语和双语数据,帮助机器翻译及相关产品提高翻译质量和语种支持能力,包括但不限于:
* 机器翻译语料系统的抓取策略设计,模型构建,数据抽取等相关算法设计和开发
* 新增语种的语言检测、分句、词法分析;
* 双语对齐算法的实现和改进;
* 双语数据的清洗和筛选;
* 语料数据的分类;
* 由于需要覆盖大量长尾数据及格式,对内容的精确抽取涉及到非常多的挑战。
【能力要求】
* 计算机相关专业本科以上学历;
* 有以下任意领域的实践经验:数据挖掘 / 信息检索 / 自然语言处理 / 机器学习 / 统计分析 / Hadoop / Spark;
* 对技术充满热情,勇于尝试,有较强创新的能力和快速学习能力;
* 较强的发现、分析和解决技术问题的工程能力;
* 熟悉Linux,熟悉java、C/C++、Python开发;
* 良好的主动性、逻辑思维能力和沟通能力。
【加分项】
* 精通Map-Reduce模型,具有使用Hadoop、Hive、Spark、Nutch等相关平台进行大数据处理和挖掘的经验;
* 有过Office/PDF/HTML/XML等多种格式文档解析经验;
* 懂得英语以外的其他外语;
* 踏实,追求细节和完美。
【时间要求】
每周保证32小时的工作时间(其中至少12小时为工作日白天),三个月至半年的实习期
【实习补贴】
1.200-250元/天
2.免费三餐~免费班车~水果、酸奶等零食不定时投喂~
更多实习生招聘信息请登录网易招聘官网hr.163.com或者实习僧官网浏览~
【简历投递】
有意向的同学,请以“申请岗位+姓名+学校+年级”为简历标题及邮件主题,将简历投递至邮箱:grp.youdaointern@corp.netease.com。
--
FROM 220.181.102.*