岗位职责:
1、原始数据的自动解析处理、入库、备份;
2、数据采集与爬取以及数据清洗;
3、了解各数据源特点与缺陷,研究修正方法,制定缺陷数据修正方案并实现;
4、设计数据自动处理流程并编制文档,开发、维护数据自动化处理平台;
5、优化数据处理流程和性能,持续提高数据处理能力和效率;
6、制定数据质量检测方案,保证数据整体交付质量;
7、协助技术负责人完成数据架构升级,实现近乎实时的数据产品更新。
岗位要求:
1、计算机相关专业本科以上学历,有数据爬虫和ETL处理相关工作经验;
2、熟练掌握Java和面向对象设计开发的方法,熟悉python和多线程开发,擅长多种开源技术应用能力;
3、熟悉HTTP/HTTPS等网络通信协议,有能力研发爬虫防屏蔽规则,避免限制;
4、熟悉数据库原理,有数据处理性能优化经验;
5、熟悉脚本执行和自动化测试,有能力搭建数据测试框架并设计用例标准,注重效率和自动化。
6、熟悉Linux系统及基本操作;
7、良好的代码编写能力;思路清晰、分层明确,良好的数据结构以及API设计能力,代码可读性强、复用性高;
8、有良好的沟通和团队协作能力,高度的责任心和创新精神。
加分项:
1、熟悉专利数据知识者优先;
2、具有良好的英文听说读写能力者优先。
工资待遇:
10-15K,优秀者可面议
公司地址:北京市海淀区中电信息大厦
简历请发送到service@himmuc.com
关于我们:
天启黑马信息科技(北京)有限公司(以下简称天启黑马)于2019年9月27日成立,是一家聚焦于创新情报和创新工具的互联网初创公司。我们“用科技成就用户的每一次创新”,利用大数据和人工智能技术自动挖掘全球专利和科技文献信息背后隐藏的关系,为全球创新者提供精准的创新情报;并在此基础上开发技术创新工具,让创新者可以借助全球发明家的智慧轻松获取创意灵感,才思泉涌。
我们以囊括全球90%以上最新技术情报的专利信息作为切入点,构建全球最大的专利数据库,并翻译为中英日俄韩等多种语言,为全球用户提供最新最便捷的专利信息。我们将全球不同的专利文本整理成统一的格式,发掘其中被隐藏的关键信息和统计数据,为用户的决策提供更全面的支撑。
为数据赋能是我们的核心。通过大数据和人工智能技术,我们实现了全球专利文献的高精度智能检索,只需把你的想法输入计算机,甚至你还没来得及输入,计算机已经为你找出全球范围内和你有同样想法的专利和发明家,我们将“人找信息”变为“信息找人”。
通过专利情报缩短60%的研发时间,节省40%的研发经费是我们追求的目标。我们不断探寻各类创新情景下的不同解决方案,让计算机变身为专利情报专家,即使不懂专利,用户也能轻松获取准确的创新情报。
提升所有创新环节的效率是必不可少的工作。我们不仅提供丰富、精彩、可定制的可视化图表,而且用自动化体系让用户不为同一件事浪费两次时间,再到页面布局,再到交互设计……,不断提高软件效率和用户体验才能让天启黑马成为全球创新情报领域真正的黑马。
技术没有最好,只有最适合。我们探索最新的自然语言处理技术、图像识别技术与专利文献的最佳契合点,也在丰富的传统技术库中筛选问题的最佳解决方案,最终让市场最大限度地发挥技术和解决方案的价值。这不是任何人都胜任的,幸好我们的团队有精通计算机语言和算法思想的IT精英;有熟稔专利文献和专利运用的情报精英;更有横跨中欧、无往不利的市场精英!
突破自己,成就他人。永远以用户为第一,不断提升创新效率和创新质量。人是已知世界上唯一拥有创造力的生物,信息革命后如何将信息为人所用,让人类更好地创造,从信息时代跨入创意时代,是时代给我们出的难题,也是时代留给我们书写伟大的试卷。
我们以用户第一,员工第二,股东第三为优先顺位,竭力提供优厚回报和高效保障,不让创造者为琐事烦扰,我们相信员工的尽情发挥和全面发展会带领我们走得更快更远!
--
FROM 49.7.65.*