首页 > 学院 > 开发设计 > 正文

线性回归的概念和应用

2019-11-06 09:33:45
字体:
来源:转载
供稿:网友

在前一篇文章中解释了线性回归以及如何梯度下降的方法优化参数,内容参考了吴恩达老师的《机器学习》和书籍《机器学习实战》

这一篇再次回顾线性回归的概念已经它的应用场景,重点展示一个应用的例子。 目录如下:

线性回归的概念线性回归的优缺点

线性回归的应用及例子

线性回归的概念

回归可以用来做预测和分类,当目标值是连续的时,我们称为回归;当目标值是离散的时,我们称为分类。线性回归其实就是函数拟合。假设我们有了训练集包含(x1,x2,y),线性回归就是要找到一个函数使下列的式子成立,其中自变量在函数中的最高次项为1,θ为自变量参数: y=θ0+θ1x1+θ2x2 通过这个式子,我们可以用已知的x1,x2,来预测y了。

上一篇文章讲了梯度下降的方法来找到最优的参数,还有另一种通过矩阵的方式来优化参数(具体推导过程可参考斯坦福 《machine learning》课程,之后会写文章专门推导),参数优化的公式为: θ=(XTX)−1XTy⃗  其中 这里写图片描述 这里写图片描述

线性回归的优缺点

优点:较简单,易于理解缺点:只能用于拟合线性数据

线性回归的应用

线性回归可以处理数值型的数据,并且预测目标数据为连续型数据

应用例子:根据天气中的 CO 和 NOX量 推测 O3量(使用了UCI Air quality 数据集)

收集数据 UCI提供了大量的不同行业的数据集,链接如下: https://archive.ics.uci.edu/ml/datasets.html 其中我选择的是Air quality的数据: 这里写图片描述

准备数值

Air quality的数据格式如下: 这里写图片描述

由于线性回归要求连续型数值,我选择了 3,10作为自变量,11作为被预测的因变量。 先从网站上把数据下载下来,然后做处理提取出对应的数据。

这里写图片描述

寻找回归系数

这里写图片描述

然后可视化结果 我首先是想画出两个自变量和目标值的3D图,但是不知道原因结果并不显示,所以我画出来了预测值和目标值的二维图,它们应该会尽量靠近一条 y=x的函数线。 这里写图片描述 这里写图片描述

总结: 这个例子很多地方不完善,作为一个学习的例子理解线性回归的应用场景。

Reference:

S. De Vito, E. Massera, M. Piga, L. Martinotto, G. Di Francia, On field calibration of an electronic nose for benzene estimation in an urban pollution monitoring scenario, Sensors and Actuators B: Chemical, Volume 129, Issue 2, 22 February 2008, Pages 750-757, ISSN 0925-4005,].

哈林顿李锐. 机器学习实战 : Machine learning in action[M]. 人民邮电出版社, 2013.


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表