- 主题:连续看了三天的机器学习了
这个正则表达式吧
【 在 shenqing 的大作中提到: 】
: 我现在的问题是:
: 我有一堆数据,几十万吧,里面有一些来源质量比较好,基本可以认为是正确的,另外一部分来源质量比较差。我需要把这些质量不好的数据,把里面的错误自动的找出来。
: 这些数据都有自己特殊的定义规则,比如第一个只能是数字,第二个只能是字母。
: ...................
--
FROM 1.80.137.*
这个几十万条?找个实习生 比如一百万 一天5000条也能改完吧
【 在 shenqing 的大作中提到: 】
: 正则表达式我们搞了一年了
--
FROM 1.80.137.*
那就两个 双重校对 各做各的
【 在 shenqing 的大作中提到: 】
: 实习生也会犯错误啊,那怎么办?再来一波实习生?
--
FROM 1.80.137.*
外包? 实习生 这个就是体力劳动吧?
【 在 shenqing 的大作中提到: 】
: 成本大了一点
--
修改:zinfandel FROM 1.80.137.*
FROM 1.80.137.*