山东省分市区的人口与财政收入数据(2015年,数据来源山东省统计信息网),中国有句老话,叫做“人多力量大”,当然,也有个别想当一秒钟英雄的不甚认同这句话,比如下面:
但是一般来说,在我们的印象中,人口的多少与财政收入也往往是正相关的。那么我们首先来进行一下全局的一元回归,看看结果:
以前漏掉回归概念的科普:R-squared,也就是判定系数,这个系数在0-1之间,越接近1,表示这回归模型的效果越好,比如判定系数为1的话,就表示模型中的自变量能够100%的解释因变量的变化……类推,上面的0.04,就表示在这个模型里面,自变量只能解释4%的因变量的变化……换句话说,这两个东东基本上就没有啥关系嘛。但是,我抽取一个市的数据,比如威海,然后再计算一下,如下所示:
这一刻,我的心情是:
如果说,这是虾神刻意提出来的一些数据,还情有可原……但是这不是一个完整的市么?肯定是幻觉……我们来换一个城市……嗯,就换成虾神最喜欢的格陵兰——greenland……当然,你叫它青岛也行……
当一个数据,在A区域内有很强的解释能力,比如在威海市,人口数量对财政收入的变化,可解释性超过了96%,但是同样居于鲁东的青岛,只有1%,简直就不能用不显著来形容。这种在不同区域具有不同性质的情况,就是在空间分析里面无所不在的空间异质性了……如何能够避免这个问题呢?那么地理加权的回归分析,就是为了对这个问题进行修正而生。正如虾神所言:天若不生GWR,万古回归如长夜……
至于这个神器如何使用,如何解读,我们下回分解……新闻热点
疑难解答