【待遇】
8k~16k。实习期至少3个月,应届生满3个月通过考核的公司会考虑发正式offer。
通过实习获得offer正式入职的免除试用期。
非应届生长期实习的,待遇从第4个月期按正式职位的65%计算,从第7个月开始按80%计算。
【联系方式】
请发简历到hr@database.cool。
站内与我联系也行。
【公司介绍】
数聚变公司成立于2015年,专注于数据管理与数据应用服务,同时推动共享数据库的建设。
公司两个联合创始人李昂达与宋鹏程毕业于清华大学,公司目前团队由12名全职人员与10名实习生构成。公司已于2016年初完成了天使轮融资,目前办公地点位于清华科技园的启迪之星孵化器。
【数据道】是世界上第一款让没有编程能力的大众用户可以在几分钟内自助创建一个真正的数据库的在线软件服务,整个服务基于公司原创的表单云存储技术实现。【数据道】通过提供各行业的常用数据模板,降低行业用户使用门槛与提高营销效果,并将从2017年起通过数据应用平台与合作伙伴一起为客户提供增值服务。
【岗位职责】
1、负责开发分布式网络爬虫系统,进行多平台信息的抓取和分析;
2、负责大规模数据的抓取、清洗、分类、质量识别、分析、存储等工作;
3、负责网络爬虫系统的算法调优、性能升级、抓取/反抓取策略对抗,解决爬虫过程中的疑难问题;
4、负责对抓取数据进行日常跟踪,爬虫系统状态监控,保证数据抓取准确稳定;
【任职资格】
1、985重点院校计算机相关专业相关本科,硕士/博士在读,热爱相关工作;
2、 优秀的分析问题和解决问题的能力,对解决具有挑战性问题充满激情,有强烈的上进心和求知欲,有个人技术博客或在各技术社区活跃者优先;
3、 较强的沟通能力和逻辑表达能力,具备良好的团队合作精神和主动意识;
4、1年以上java开发经验,1年以上数据抓取或文本处理相关工作经验,熟悉分布式爬虫架构,至少使用过一种开源爬虫框架;
5、熟悉HTTP服务端知识,熟悉基于Cookie的网站模拟登录原理;熟悉多线程、网络编程;熟悉正则表达式、XPath、CSS、Javascript等网页信息抽取技术;热爱网页抓取原理及技术,精通正则表达式,从结构化的和非结构化的数据中获取信息;
6、具有数据挖掘、自然语言处理、信息检索、机器学习背景者优先;
--
FROM 58.200.235.56