数据挖掘实习生(本次招聘主要面向清华学生)
100-200/天
岗位职责:
1、协助设计/开发分布式网络爬虫;
2、分析众多数据源页面结构及请求/返回规律;
3、研究相关算法,设计优化执行策略.监控执行性能等;
4、参与软件项目开发,按迭代进度要求及质量要求完成开发任务。
任职要求:
1. 精通网络编程.HTTP协议
2. 熟练掌握网页抓取原理及具体技术,从结构化/非结构化数据中获取信息
3. 熟练掌握Python或Java开发语言及相关开发框架
4. 了解html、javascript、css、json、正则表达式等常见技术点
5. 熟练使用关系数据库(如mysql)及NoSql数据库(如mongodb、redis)
6. 具备数据挖掘等搜索引擎相关知识,有从事网络爬虫.验证码图片识别.网页信息存取经验优先
7. 较好的编程素养,懂得敏捷开发方法及软件设计模式,有实践经验优先抽取经验优先
8. 具有HBase、Hadoop、Spark大数据处理及分析经验优先
9、可长期实习(每周实习时间不少于3天),本科、研究生不限。
数据处理实习生(本次招聘主要面向清华学生)
100-200/天
岗位职责:
1. 了解并能构建Hadoop平台,了解map-reduce,spark
2. 熟悉网络爬虫原理,有网络爬虫开发经验优先,熟悉http协议,熟悉协议分析
5. 熟悉数据关联分析、关系挖掘
6. 熟练编写规范化Java python代码
7. 逻辑思维强,善于推理,敢于挑战
8. 具备良好的文档编制习惯和代码书写规范
9. 做事耐心细致,有条理,善于沟通,团队意识强
任职要求:
1. 熟悉高并发、分布式的系统架构设计,具有大规模分布式计算平台的使用和并行计算开发经验,有spark环境下的开发经历者优先;
2. 熟悉hadoop和spark分布式计算框架,以及相关技术,如HBase,Hive等
3. 熟悉spark集群环境平台的搭建;
4. 有丰富SQL开发经验,精通MySQL、Oracle等关系型数据库中的一种;
5. 具备良好的JAVA Python开发技能,对主流框架技术有深入了解;
6. 熟悉Linux系统,熟练使用shell/perl/python脚本处理问题;
9、可长期实习(每周实习时间不少于3天),本科、研究生不限。
个人发展:工作优秀的实习生,公司会在其毕业后转为正式员工。
简历投递:limj@tsinghua.edu.cn
联系方式:13910538137(王总) 13521955575(李老师)
上班地址: 北京市朝阳区琨莎中心B座811室
公司信息:
深圳前海千般资本管理有限公司注册资本5000万元,在北京、上海、深圳、南京、成都、济南、香港等城市均设立了全资子公司,管理资金超过数百亿,大宗交易额位居全国前五名,每年交易金额达到300-500亿元。公司网站为www.chamcap.com。
千般财富为所有员工提供有竞争力的薪资福利、完善的晋升通道、高端的职业平台;为新入职员工提供系统的培训,快速打造行业精英;为骨干员工提供丰厚的股权激励。
--
FROM 101.5.224.*