单位及项目简介:中国互联网络信息中心(以下简称CNNIC)负责国家网络基础资源的运行管理和服务,提供互联网域名解析、物联网标识解析等关键网络服务。CNNIC牵头承担了国家发改委物联网技术研发及产业化专项“国家物联网标识管理公共服务平台”项目,与其它三家兄弟单位工信部电信研究院、工信部电子科学技术情报研究所以及中国物品编码中心共同推动国家物联网标识管理公共服务平台的建设及产业化进程。目前该平台涵盖了一个根平台、三个子平台,在全国建设了一个主节点(北京)、一个备份节点(北京,同城备份)及三个从节点(广州、重庆及无锡),目前已开始向智能家居、智能交通、商品溯源、智能农业、进出口食品管理等物联网相关产业提供基础平台服务。因项目建设的需要,现招聘网络爬虫开发实习生1名。
工作职责:在项目负责人的指导下开发针对物联网标识的网络爬虫并处理所爬取的数据。
主要工作内容:
1. 基于开源爬虫软件搭建物联网标识抓取平台;
2. 在项目负责人的指导下开发适用于物联网标识提取的页面切词算法,该算法区别于互联网爬虫所常用的中/英文切词算法;
3. 根据物联网标识的特征设计独特的爬取策略,该策略区别于互联网爬虫所常用的链接分析方法;
实习岗位要求:
1. 计算机、通信或软件等相关专业研究生,对常用数据结构及算法有深入理解,对爬虫原理有深入理解。
2. 精通java 语言,熟练掌握一种脚本语言(比如python),熟悉nutch和solr等网络爬虫及搜索相关开源软件者优先;
3. 具备良好的沟通能力、快速学习能力,较强的逻辑能力、执行能力。
4. 每周能工作三天及以上,时间较充裕的低年级研究生优先。
工作地点在城铁13号线知春路站附近,有意者请将简历发送至dengguangqing@cnnic.cn。
--
FROM 218.241.119.*