拿忽悠客户方案来吓唬谁?
拿web接口爬网页,还爬没有风控的站
就以为自己站在前沿了
你找个明白人问问,那些上亿大项目都怎么做的
取的什么数据,怎么取的
【 在 Suley 的大作中提到: 】
: 这话又外行了,是不是以为舆情监控就只是采采数据?我只是和你谈了采集阶段的方案而已,因为你的HOOK方案也就只能做到这儿了,几台服务器,带宽够,IP够,采集短视频完全没问题。
: 但是后面的事儿你恐怕就不清楚了,后面还有很多事情要做,数据清洗、结构化、进大数据中台、做NLP、情感分析、新闻传播路径分析、传播预警、话题聚类、知识图谱构建、舆情报告、竞对分析、词云图等等,这些才是服务器资源消耗的大头。
: 我们已经基于这个领域的数据做了很多功能了。基于文本这块分析做得很成熟,不过主要做的都是B端的业务为主而已。
: ...................
--
FROM 114.242.249.*