线性相关系数r 线性相关系数r与R_

2024-12-2405:12:29综合资讯3

线性回归分析是一项深入探究变量间关系的研究方法,在各类实际研究中都有它的身影。无论您是否对其有过系统学习,对于线性回归的基本理解与运用,想必都有所涉猎。

尽管如此,在实际操作中,仍会遇到许多细微但关键的步骤,常令人陷入深思,耗费大量时间。但正是这些细节,构成了我们分析的完整流程。

本文将详细梳理回归分析的分析流程,以便我们更好地理解和应用这一工具。

回归分析本质上研究的是一个或多个自变量X对一个因变量Y(均为定量数据)的影响关系。

当只有一个自变量时,我们称之为简单线性回归;而当有多个自变量时,则称为多元线性回归。在SPSSAU中,我们都可以通过【通用方法】里的【线性回归】来实现分析。

值得注意的是,因变量Y必须是定量数据。如果Y为定类数据,我们则可以选择【进阶方法】中的【logit回归】。

在选择自变量时,虽然没有数量上的严格限制,但为避免共线性问题,我们通常不建议一次性放入太多自变量。建议根据专业知识进行选择,并确保样本量满足分析需求,通常是自变量的20倍以上。

若自变量中含有定类数据,需要进行哑变量处理,可以在SPSSAU的【数据处理】→【生成变量】中进行设置。

控制变量可以是定量数据或定类数据,更多的是定类数据,如性别、年龄、工作年限等人口统计学变量。这些变量一般不需要特殊处理,可以直接放入分析框架。

理论上,回归分析要求因变量Y服从正态分布。SPSSAU提供了多种检验正态性的方法。

若数据出现非正态分布,可以进行对数处理。对于问卷数据,可以跳过正态性检验,因为问卷数据的等级性质使其很难保证完全的正态性。

在进行回归分析之前,通常需要进行相关分析。这是因为相关分析可以帮助我们初步了解变量间是否存在关系,而回归分析则是深入研究这种关系是否有影响。

操作案例:在线英语学习购买因素研究

①操作步骤

以性别、年龄、月收入水平、产品、促销、渠道、价格、个性化服务、隐私保护为自变量,购买意愿为因变量,进行线性回归分析。确保勾选“保存残差和预测值”。

②指标说明

非标准化系数(B): 回归模型中使用的是非标准化系数。

标准化系数(Beta): 可用于比较自变量对Y的影响程度。Beta值越大,说明该自变量对Y的影响越大。

t值: 是t检验的过程值,用于计算P值。一般无需关注具体数值。

P值: P值小于0.05即说明其所对应的自变量对因变量存在显著性影响关系。

VIF值: 用于检验共线性问题。VIF大于5说明存在共线性问题。

R²及调整R²: 是模型拟合指标,反应Y的波动有多少比例能被X的波动描述。

D-W值: 用于检验残差独立性。D-W值在2附近(1.7~2.3之间)说明模型构建良好。

③结果分析

在得到分析结果后,首先关注的是产品、促销、个性化服务、保护隐私这四个变量对购买意愿的正向影响关系。