pearson相关性分析

2025-04-1608:58:04综合资讯0

相关性

统计关系存在于两个或多个随机变量(或可被视为具有某种可接度的量测)之间。当一个或多个变量的变化引起其他相关变量的系统性变化时,就存在这种关系。两个随机变量之间相关性的数学度量即为相关系数。如果随机变量的变化不会导致另一个随机变量的规则变化,但会导致其统计特征发生变化,那么这种关系不被视为相关性。

相关系数的值在-1到+1之间变动。当值接近1时,表示所研究变量之间的相关性高;若值趋于1,则认为相关性为正;若值趋于-1,则相关性为负。正相关表示其中一个变量的增加导致第二个变量的增加,而负相关则表示一个值的增加会导致第二个值的减少。

以下类型的相关性有助于定义分析变量之间的联系紧密程度:

1. 线性和非线性相关:线性相关指其中一个值增减,第二个值相应地作相同方向的改变。非线性相关中,变量的变化不直接导致另一个变量的变化,但可用其他函数来描述。

2. 正负相关:描述了这种依赖性的特征。

图1显示了下跌趋势的示例。

这种计算方法能够根据变量的实际数值来揭示变量之间的直接关系。对于线性的关系,Pearson系数便能被计算出来。在金融市场的背景下,这种关系可能意味着存在一个或其他方向的时间流动联系。Pearson相关系数的计算公式如下:

现在,让我们来计算图1中数据的Pearson相关系数,以衡量结束价格对时间的依赖性。为此,我们需在表格中输入数据:

计算过程如下:

1. 首先计算价格和数量的平均值。

2. 接着找出每种变量类型的平均值偏差。

3. 数值的乘积是公式中的分子部分。

4. 第5列和第6列是平方偏差,平方根的和构成公式的分母部分。

5. 通过上述数值,我们可以计算出Pearson相关系数。

这些步骤揭示了变量间存在很强的线性负相关。

还有一种计算方法可以确定随机变量间的直接线——等级相关分析。这种方法不是基于分析元素的数值,而是基于相应的等级来进行评估。其值同样在-1到1之间变动,绝对值反映了联系的紧密程度,符号则表示了两个元素间的连接方向。计算公式如下:

以图1为例,让我们考虑一个等级相关性的计算示例,并在新表中输入值:

从表中可以看出,我们对收盘价进行了排名。利用公式计算了特征的等级差,并将所得值代入公式中。

图2展示了Spearman等级相关系数的计算过程。通过计算差异的平方和并代入公式,我们得到一个结果值。

同样地,Kendall等级相关系数也是衡量随机变量间线的一种度量。虽然计算方法不同,但对分析元素值的排序是类似的。其计算公式涉及匹配的和与反转的和的概念。以图1为例,我们需对表数据进行排序并根据特定规则计算匹配和反转的值。将这些值代入公式后,我们可以得到Kendall相关系数。