一、随机变量与描述性统计量
(一)随机变量
1.定义
(1)我们将一个能取得多个可能值的数值变量 x 称为随机变量。比如我们规定对于某 A 公 司发行的债券,定义违约变量:
(2)那么Default就是一个随机变量。
再比如,A公司发行的普通股估价在未来某一天的收盘价S可以是5元,可以是10元。 也可以是5~10元的任意一个数值,于是S同样是一个随机变量。
(3)如果一个随机变量x最多只能取可数的不同值,则为离散型随机变量;如果x的取 值无法一一列出,可以遍取某个区间的任意数值,则为连续型随机变量。 在上面的例子中,Default只能取0或1,因而是离散型随机变量;而S的取值可能是任意一个大于0的数, 因而是连续型随机变量。
2.随机变量的分布
(1)如果x是离散型的,x最多可能取n个值 x0,x1,?,x
(2)如果x是一个连续型随机变量,由于无法列出x取每个特定值的概率,我们改用概 率密度函数来刻画x的分布性质。
(二)随机变量的数字特征与描述性统计量
常用的一些数字特征和它们的描述性统计量有下面几种。
1.期望(均值)
(1)随机变量 x 的期望(或称均值,记做 E(X))衡量了 X 取值的平均水平;它是对 X 所 有可能取值按照其发生概率大小加权后得到的平均值
(2)在X 的分布未知时,用抽取样本 X1,?, Xn 的算术平均数(样本均值)
例:某投资者将其资金分别投向A、B、C三只股票,占总资金的比重分别为40%、40%、20%; 股票A、B、C的期望收益率分别为Ra=14%、Rb=20%、Rc=8%,则该股票组合的收益率Rp
=0.4×14%+0.4×20%+0.2×8%=15.2%
2.方差与标准差
(1)方差:对于投资收益率 r,用方差(δ2)或标准差(δ)来衡量它偏离期望值的程度。
(2)方差和标准差除了应用于分析投资收益率,还可以用来研究价格指数、股价指数等的波动情况。
3.分位数
(1)分位数通常被用来研究随机变量X以特定概率(或者一组数据以特等比例)取得大于 或等于(或小于等于)某个值的情况。
(2)一般来说,设0≤α≤1,随机变量X的上α分位数是指满足概率值 P{X≥xα}=α的数 xα,下α分位数是指满足概率值P{X≤xα}=α的数 xα。
4.中位数
(1)中位数是用来衡量数据取值的中等水平或一般水平的数值。
(2)对于随机变量 x 来说,它的中位数就是上 50%分位数 x50%,这意味着 X 的取值大于其中位数和小于其中位数的概率各为50%。
(3)对于一组数据来说,中位数就是大小处于正中间位置的那个数值。
二、正态分布
1.正态分布是最重要的一类连续型随机变量分布,当一个随机变量的取值受到大量不同因素作用的共同影响,并且单个因素的影响都微不足道的时候,这个随机变量就服从或近似服从 正态分布。
2.在金融市场上,以股票为例,当没有任何决定性的消息发布的时候,股价走势很多时候呈现出“随机游走”的特点,这里的“随机游走”就是指股价的波动值服从正态分布。
3.正态分布密度函数的显著特点是中间高两边低,由中间(X=p)向两边递减,并且分布左右对称,是一条光滑的“钟形曲线”。
4.正态分布距离均值越近的地方数值越集中,而在离均值较远的地方数值则很稀疏;这意味 着正态分布出现极端值的概率很低,而出现均值附近的数值的概率非常大。 同时图像越“瘦”,正态分布集中在均值附近的程度也越大。
三、随机变量的相关性——相关系数
1.相关系数是从资产回报相关性的角度分析两种不同证券表现的联动性。
我们通常用ρij 表示证券 i 和证券 j 的收益回报率之间的相关系数。
2.相关系数的绝对值大小体现两个证券收益率之间相关性的强弱。
如果 a 与 b 证券之间的相关系数绝对值|ρab|比 a 与 c 证券之间的相关系数绝对值|ρac| 大,则说明前者之间的相关性比后者之间的相关性强。
3.相关系数ρij总处于+1和-1之间,亦即|ρij|≤1。
若Pji=1,则表示ri和rj完全正相关;相反,若ρij=-1,则表示ri和rj完全负相关。 如果两个变量间完全独立,无任何关系,即零相关,则它们之间的相关系数ρij=0。
4.通常情况下两个证券收益率完全相关和零相关的情形都不会出现,其相关系数往往是区间(-1,1)中的某个值,即0< |ρij|<1,这时我们称这两者不完全相关。
5.当0<ρij<1时,ri与 rj正相关,其中一个数值的增加(降低)往往意味着另一个数值的增加(降低);
6.而当-1<ρij<0时,ri与rj负相关,其中一个数值的增加(降低)往往意味着另一个数值的降低(增加)。
7.市场上的不同证券之间经常会显示出明显的相关性。
分析工商银行、中国银行、中石油与宝钢股份四只股票的每日收盘价数据,对比分析它们的 走势后发现,工商银行与中国银行的股价高度正相关,相关系数达到0.89;而中石油与宝 钢股份的股价高度负相关,相关系数达到-0.72。