这话又外行了,是不是以为舆情监控就只是采采数据?我只是和你谈了采集阶段的方案而已,因为你的HOOK方案也就只能做到这儿了,几台服务器,带宽够,IP够,采集短视频完全没问题。
但是后面的事儿你恐怕就不清楚了,后面还有很多事情要做,数据清洗、结构化、进大数据中台、做NLP、情感分析、新闻传播路径分析、传播预警、话题聚类、知识图谱构建、舆情报告、竞对分析、词云图等等,这些才是服务器资源消耗的大头。
我们已经基于这个领域的数据做了很多功能了。基于文本这块分析做得很成熟,不过主要做的都是B端的业务为主而已。
短视频也在做,问题不是采不下来,而是视频的处理代价比较高,除了要音频转文字外,还要对画面做主体识别、OCR文字识别,舆情监控一般是通过关键词来监控,如何准确识别关键词和主体,排除歧义,对于短视频来说,成本和代价都比较高。
其实这个市场也没有那么大,做那么多年了,我还不知道这个市场的主要客户是谁吗?窄义的舆情监控服务这个市场现在也就几十亿的规模,其实算是很小的一个2B市场了,高峰的时候差不多有上千家公司做这个,一般一个标准产品售价在几万。竞争还是比较激烈的。广义的有很多舆情方面的服务,比如舆情态势分析,舆情应对策略指导,舆情人工报告。
【 在 slowaction 的大作中提到: 】
: 你把别人当外行
: 那我告诉你,全国所有做相关工作的都需要那几个应用的数据,不过现在没人做得好
: 你们公司几台服务器能搞定,赶快去发财吧
--
FROM 221.218.214.*