请基于Hadoop开发应用,实现如下需求:
1.支持用任意关键词同时搜索google,baidu,bing,搜狐将搜索内容获取
2.将搜索结果进行如下处理:
1) 去除重复结果
2) 去除多余图片信息、广告信息
3) 存入HDFS
3.筛选后的结果按照如下纬度显示(支持手工排序)用Hadoop进行匹配分析,分析内容包括:
1)按最后更新时间排序
2)按关注度(顶的次数,回复次数)排序
3)按发表方(厂家官方,媒体,bbs,博客)排序
4)按标签(如果存在的话)排序
联系人:136-0125-4739 ;whoselife@126.com
价格: 3000
--
FROM 123.123.254.*