作者:Xavier Amatriain ,前ML研究员,目前在Quora负责工程技术
为了理解这个问题的答案你需要知道两个基本常识:
1)从贝叶斯的角度看,如果你没有大数据,你应该相信你之前使用的任何一个模型;
2)从机器学习的角度来看,小数据最好采用低复杂性(或高偏差)模型,以避免数据过度拟合。
总之,如果你的数据集很小,你应该选择参数少、低复杂性的模型或你之前使用的任何一个模型。
以下这几个都是小数据情况下可以考虑的模型:
1)线性模型:如线性/逻辑回归模型,这个模型对多参数和少量参数都能很好的适应;
2)简单的贝叶斯模型:如朴素贝叶斯,这个模型只需要很少的参数,很容易往任何一种你之前使用的模型方向去调整。
3)另外,正如“小数据学习:小数据训练情况下分类器比较”一文所示,支持向量机在某些条件下可以表现良好。
翻译:数据小咖
原文连接:What are some machine learning algorithms that can learn well even with a small data set?
新闻热点
疑难解答