回归方程怎么求-求回归方程的一般步骤


前几日发布了一篇文章,标题为《如何让学理科的女友理解多元回归?》其阅读量与互动量出乎意料地超越了以往的作品。虽然过往我曾撰写过内容更为丰富、质量更高的文章,但在阅读量和互动方面,这篇却遥遥领先。

下图展示了最近30天的图文阅读数据,惊喜地发现,通过朋友圈阅读的占比达到了7.5%。

特别值得注意的是,《如何让学文科的女友理解多元回归?》一文,前天和昨天的阅读数据表明,通过朋友圈阅读的人数占到了30.97%,是平均水平的四倍之多。这表明该文章被众多读者所分享,且很多人正是通过朋友圈的分享才得以阅读到这篇文章。

这样的阅读量与分享量,无疑提醒我,在今后的内容创作中,不仅要关注内容的价值,还需在标题上多下功夫。我们都知道新闻资讯常常以吸引人的标题吸引读者点击,但内容却可能空洞无物。我逐渐认识到,既然我们已经提供了有价值的信息,为何不尝试一个有趣且吸引人的标题呢?未来我所推送的文章,标题将更加注重吸引力,绝不会出现文不对题的情况。

回到主题:如何让学文科的女友理解多元回归?

要理解多元回归,首先得掌握一元回归的基础。多元回归其实是一元回归的延伸:增加自变量并相应地添加限制条件。本文将补充一元回归的相关知识。无论文理生都学过如何计算回归方程,但使用条件可能并不为所有人所熟知。

为了更好地解释问题,这里以一个市场营销案例为例。在市场营销中,当商家投入广告费用后,若广告起作用,其效果会体现在销售额上。我们已经收集了广告投入(x)与对应销售额(y)的数据,并已将其录入SPSS中。我们的目标是利用这些数据来预测当投入一定广告费用时,将会产生多少销售额。

1. 回归方程的计算方法

计算回归方程的方法主要是最小二乘法。这种方求得一条直线,使得各个点到该直线的竖向距离之和最小(注意不是各点到直线的垂直距离)。理解其原理后,后续的计算工作可由计算机完成。

2. 散点图的绘制与变量相关性检查

在构建回归方程前,需要先检查自变量与因变量之间的相关性。绘制散点图是一种有效的检查方法。本例中给出的散点图显示出很好的相关性。

有时散点图可能未显示出强烈的相关性。如某些情况下,散点图显示的相关性不佳,可能需要进行变量代数转换以建立线。在有些情况下,如散点图中存在强影响点,需确认其是否有问题并考虑是否删除。

3. 构建回归方程并计算预测值

通过SPSS等软件可以计算出回归方程。得到方程后,即可用它来计算预测值。本例中先预测了广告费用的销售额,并将预测值与实际销售额进行比较以得出残差。

4. 计算残差并检查残差的正态性

回归模型基于一定前提假设,其中之一是残差应呈正态分布且随自变量增大而均匀分布。

(1)首先计算残差。

(2)绘制残差与自变量的分布图。本例中残差随自变量增大而均匀分布。

若残差不随自变量增大而均匀分布,则不能建立回归模型,即使其相关系数很高。如出现这种情况,需检查自变量或因变量是否未经过合适的线性变换。

考虑到此类较为理论且需软件操作的知识,制作成视频教程可能更为直观易懂。我会尽快上线新的课程来详细讲解这些内容,敬请期待!

对于本文的标题与内容似乎不太匹配的担忧,我深感理解。但在新闻报道中,编辑往往更注重吸引眼球的标题,而内容则可能较为简略。我会努力在提供有价值内容的也注重标题的吸引力,以期为大家带来更好的阅读体验。