感谢各位,实际问题是这样:
一个软件,用于文本数据的处理,统计某些关键字出现的次数。例如统计出现“翻红”“涨停”“拉高”等词汇的次数,算出一篇新闻对应的情绪的分值。
命中关键词的次数阅多,分值越高。所以定义域是正整数,命中0次分数为0,分数不超过1。
以上算法是行业内通行的算法。具体用什么算法,各厂家不一样。我们有一套老旧代码,开发者早离职了,在代码里看到了一楼写着的数值,给定了某些点的值,其它点的值使用线性插值。无公式,无文档,不知道这些值为什么这样定义。
有客户问这些值的具体含义是什么?所以我们要给出一个公式。
关于背景,没有藏着掖着,如果没说清楚,欢迎问我。感谢各位。
对于精度问题。在编程时,如果代码里写了0.995,那么默认解析值在0.994到0.996之间。如果我们找到的f(x)超出范围,说明公式不对。
【 在 cafitren 的大作中提到: 】
: 让人免费回答问题,藏着掖着不太好。我也很好奇是什么实际问题。
:
--
FROM 106.120.85.*