线性相关系数r（线性相关系数r与R

2024-12-2405:12:29综合资讯3

线性回归分析是一项深入探究变量间关系的研究方法，在各类实际研究中都有它的身影。无论您是否对其有过系统学习，对于线性回归的基本理解与运用，想必都有所涉猎。

尽管如此，在实际操作中，仍会遇到许多细微但关键的步骤，常令人陷入深思，耗费大量时间。但正是这些细节，构成了我们分析的完整流程。

本文将详细梳理回归分析的分析流程，以便我们更好地理解和应用这一工具。

回归分析本质上研究的是一个或多个自变量X对一个因变量Y（均为定量数据）的影响关系。

当只有一个自变量时，我们称之为简单线性回归；而当有多个自变量时，则称为多元线性回归。在SPSSAU中，我们都可以通过【通用方法】里的【线性回归】来实现分析。

值得注意的是，因变量Y必须是定量数据。如果Y为定类数据，我们则可以选择【进阶方法】中的【logit回归】。

在选择自变量时，虽然没有数量上的严格限制，但为避免共线性问题，我们通常不建议一次性放入太多自变量。建议根据专业知识进行选择，并确保样本量满足分析需求，通常是自变量的20倍以上。

若自变量中含有定类数据，需要进行哑变量处理，可以在SPSSAU的【数据处理】→【生成变量】中进行设置。

控制变量可以是定量数据或定类数据，更多的是定类数据，如性别、年龄、工作年限等人口统计学变量。这些变量一般不需要特殊处理，可以直接放入分析框架。

理论上，回归分析要求因变量Y服从正态分布。SPSSAU提供了多种检验正态性的方法。

若数据出现非正态分布，可以进行对数处理。对于问卷数据，可以跳过正态性检验，因为问卷数据的等级性质使其很难保证完全的正态性。

在进行回归分析之前，通常需要进行相关分析。这是因为相关分析可以帮助我们初步了解变量间是否存在关系，而回归分析则是深入研究这种关系是否有影响。

操作案例：在线英语学习购买因素研究

①操作步骤

以性别、年龄、月收入水平、产品、促销、渠道、价格、个性化服务、隐私保护为自变量，购买意愿为因变量，进行线性回归分析。确保勾选“保存残差和预测值”。

②指标说明

非标准化系数（B）: 回归模型中使用的是非标准化系数。

标准化系数（Beta）: 可用于比较自变量对Y的影响程度。Beta值越大，说明该自变量对Y的影响越大。

t值: 是t检验的过程值，用于计算P值。一般无需关注具体数值。

P值: P值小于0.05即说明其所对应的自变量对因变量存在显著性影响关系。

VIF值: 用于检验共线性问题。VIF大于5说明存在共线性问题。

R²及调整R²: 是模型拟合指标，反应Y的波动有多少比例能被X的波动描述。

D-W值: 用于检验残差独立性。D-W值在2附近（1.7~2.3之间）说明模型构建良好。

③结果分析

在得到分析结果后，首先关注的是产品、促销、个性化服务、保护隐私这四个变量对购买意愿的正向影响关系。

登录 找回密码