项目需求:
1.研究对象为某些特定产业(暂定为有机大米、饮用水和纯粮白酒)
2.需要从事这些行业的企业信息,企业所在范围以京津冀地区为主,如果范围过大,可仅仅以某地区为主,需要包括一些大型企业在某地区本地的分支机构和销售网点。
3.企业本身资质信息的收集以全国企业信用查询信息里面包含的信息为最好,某些企业查询软件可搜集部分企业信息,但往往不全或有偏差,尽可能多收集些,尤其是大中企业不要缺失。需要网页爬虫下载,这些企业在第一条涉及的三种领域内的产品信息。来源主要为大型企业都有自己的网站,以及大中小型企业在阿里巴巴、淘宝、京东上的产品信息。能尽可能多的收集些他们网站和大型购物网站信息最好,如果相关网站有访问设置,可仅搜索下载前一定比例的内容
4.对收集到的信息能进行一定程度的数据和文本挖掘,形成具有一定统计学意义的结论,如自动更新淘宝销量排名,形成价格信息排列表等。
5.方便操作,数据库输入输出较方便,便于自身维护和更新。输出的文本格式灵活。
兼职要求:
1、熟悉网页爬虫,有页面抓取分析经验,熟悉Python/ruby编程者优先 ;
2、强烈的责任心,兼职时间较为充裕;
联系扣扣:一四零二七三零八九六
--
修改:peiduofen FROM 223.73.103.*
FROM 223.73.103.*