首页 > 学院 > 开发设计 > 正文

Quora问题精选:哪些机器学习算法即使在小数据集的情况下也可以表现的很好?

2019-11-06 08:25:00
字体:
来源:转载
供稿:网友

作者:Xavier Amatriain ,前ML研究员,目前在Quora负责工程技术 

为了理解这个问题的答案你需要知道两个基本常识:

1)从贝叶斯的角度看,如果你没有大数据,你应该相信你之前使用的任何一个模型;

2)从机器学习的角度来看,小数据最好采用低复杂性(或高偏差)模型,以避免数据过度拟合。

总之,如果你的数据集很小,你应该选择参数少、低复杂性的模型或你之前使用的任何一个模型。

以下这几个都是小数据情况下可以考虑的模型:

1)线性模型:如线性/逻辑回归模型,这个模型对多参数和少量参数都能很好的适应;

2)简单的贝叶斯模型:如朴素贝叶斯,这个模型只需要很少的参数,很容易往任何一种你之前使用的模型方向去调整。

3)另外,正如“小数据学习:小数据训练情况下分类器比较”一文所示,支持向量机在某些条件下可以表现良好。

翻译:数据小咖

原文连接:What are some machine learning algorithms that can learn well even with a small data set?


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表