机器学习的本质就是聚类。
聚类只能追求尽量把大多数正向的数据聚在一起而把负向的数据排除在外。
这就决定了,边角案例在任何机器学习训练的模型里,理论上都有极大可能被错误处理。
你说的包含绝大多数边角案例的“模型的泛化能力”,从来不是机器学习的目标,也是机器学习做不到的。
说的直白一点,如果训练数据中包含太多边角案例,那么训练出来的模型质量会比较差。
【 在 yehorse 的大作中提到: 】
: 标 题: Re: 这就是特斯拉最新的FSD的真实水平
: 发信站: 水木社区 (Tue Sep 20 09:56:36 2022), 站内
:
: 那你这模型的泛化能力就太差了。
:
: 【 在 ia 的大作中提到: 】
: : 并不是。
: : 所谓训练模型只会把标记过的训练材料里面最通用的特性提取出来,绝大多数边角案例都会被弃掉。
: : 我天天和各种模型打交道,对这个还是比较了解的。
: : ...................
:
: --
:
: ※ 来源:·水木社区
http://www.mysmth.net·[FROM: 120.245.130.*]
--
FROM 131.107.1.*