经济学并非一成不变的科学生态,它由诸多概率定律所构建。故而,明智的投资者应当寻求通常不会出错的常规做法,并避开那些普遍被认为是错误的行为和。
01 数据分析与趋势理解
数据中心趋势(Central tendency)
平均法则是在交易中经常被提及的一个原理,它提示我们一连串的异常损失预计会被相等且相反的利润所抵消。预期当前市场估值过高或超买后将会出现估值过低或超卖的情况,并不符合平均法则的真谛。在一个大数据集里,大部分事件会分散接近平均值,使得异常事件变得微不足道。长期的盈利、亏损或价格波动的持续性只是罕见的异常事件,随着时间推移,它们会被大量的正常波动所平衡。
算术平均(average)
算术平均数是统计学中最基本、最常用的平均指标。在数值型数据中,每个数据都是独立存在的,彼此之间不具有相互影响关系。算术平均数易受极端数据的影响,因为平均数反应灵敏,数据的微小变化都会影响到最终结果。
其他平均数概念
加权平均数同时考虑到各组数值的大小和分布频数。几何平均数适用于描述连续时间平均变化率的问题,如投资收益率等。调和平均数则是一种时间加权平均值,但更倾向于受极端值的影响。
价格分布与中位数、众数
了解价格的分布对于预测市场行为至关重要。分布测量可以告诉我们事件发生的可能性,并有助于设置概率或置信水平。中位数和众数也是定义数据分布的重要参数。
数据变异性(Variability)
偏度和峰度是描述数据点位形态的阶矩。偏度揭示了数据分布的倾斜程度,而峰度则反映了数据集群的形态。标准差作为方差的平方根,反映了数据序列中变异性的平均数量。
无论是进行单样本t检验、相关配对t检验还是独立双样本检验,都需要对数据的平均值和变异性有深入的理解。
接下来,我们将以全球指数交易数据为分析样本,使用Python进行描述性统计分析。
我们将利用efinance包获取全球指数数据,该包可视为对东方财富网数据的爬虫工具。
从配对相关和个体分布图来看,国内各大指数存在较强的相关性,分布呈现“左偏、长右尾”的特征。这反映了市场在大部分时间内处于较低点位(收益较低),但在某些时候会出现较大的波动(异常高收益)。
参考资料:
Kaufman P J . Trading Systems and Methods
+ Website[M]. Wiley Publishing, 2013.