在前一篇文章中解释了线性回归以及如何梯度下降的方法优化参数,内容参考了吴恩达老师的《机器学习》和书籍《机器学习实战》
这一篇再次回顾线性回归的概念已经它的应用场景,重点展示一个应用的例子。 目录如下:
线性回归的概念线性回归的优缺点线性回归的应用及例子
回归可以用来做预测和分类,当目标值是连续的时,我们称为回归;当目标值是离散的时,我们称为分类。线性回归其实就是函数拟合。假设我们有了训练集包含
上一篇文章讲了梯度下降的方法来找到最优的参数,还有另一种通过矩阵的方式来优化参数(具体推导过程可参考斯坦福 《machine learning》课程,之后会写文章专门推导),参数优化的公式为:
线性回归可以处理数值型的数据,并且预测目标数据为连续型数据
应用例子:根据天气中的 CO 和 NOX量 推测 O3量(使用了UCI Air quality 数据集)
收集数据 UCI提供了大量的不同行业的数据集,链接如下: https://archive.ics.uci.edu/ml/datasets.html 其中我选择的是Air quality的数据:
准备数值
Air quality的数据格式如下:
由于线性回归要求连续型数值,我选择了 3,10作为自变量,11作为被预测的因变量。 先从网站上把数据下载下来,然后做处理提取出对应的数据。
寻找回归系数
然后可视化结果 我首先是想画出两个自变量和目标值的3D图,但是不知道原因结果并不显示,所以我画出来了预测值和目标值的二维图,它们应该会尽量靠近一条
总结: 这个例子很多地方不完善,作为一个学习的例子理解线性回归的应用场景。
Reference:
S. De Vito, E. Massera, M. Piga, L. Martinotto, G. Di Francia, On field calibration of an electronic nose for benzene estimation in an urban pollution monitoring scenario, Sensors and Actuators B: Chemical, Volume 129, Issue 2, 22 February 2008, Pages 750-757, ISSN 0925-4005,].
哈林顿李锐. 机器学习实战 : Machine learning in action[M]. 人民邮电出版社, 2013.
新闻热点
疑难解答