投资学

投资学

前言

这其实是我学习博迪《投资学》和财大刘志东老师的“投资学课程”的笔记。
学投资学的初衷,是由于自己确实有让自己资产保值增值的需求,毕竟每年6%的通胀率,你不让你的钱保值增值,就会被这个社会收割6%的通胀税。可是,你要把你的资产做到6%的收益率,可不是件容易的事啊,你看现在的银行的各类理财产品,也就是4%左右的收益率。你要是看到5%、6%的产品,都被贴上了高收益、高风险的标签了,可是,6%是起码要达到的收益率呀。基于此,至少为了让自己的资产可以不缩水,必须、有必要认真学习一下投资学的内容。
我是带着问题来学习的,我其实对投资这块,脑子里是有一大堆问题的:
  • 我是个风险厌恶型的人,那么我多少钱应该买无风险的资产,多少钱买有风险的资产?
  • 那么,到底什么是无风险资产?他们的收益率能到多少?
  • 啥是风险?到底怎么来衡量风险?
  • 组合就好么?无风险+有风险资产如何组合?有风险资产内部如何组合(比如多少股票,多少基金)?基金应该挑选那些?
  • 如何择时?也就是何时入场、何时立场?
  • 有没有什么对冲手段么?比如保险、期货对冲,没想赚啥杠杆的钱,就想对冲,这种工具有么,有哪些?
  • 系统性风险究竟能不能对冲掉?如果来了,如何甄别和规避?
如果是6%的收益率,也就是抵御通胀的收益率的话,100万,10年,可以变成180万,赚80%的收益率;10%的话,7年就可以翻倍,复利的力量:
但是,前提是,你真的可以保证你有能力做到持续的6%+的正收益,所以,我想通过自己的学习和研究,想找个目标迈进。
另外,这个笔记其实很简单的,只记录了我觉得最需要的一些**“干货”**,没有详细和冗余的解释,但是,如果要全面和深刻掌握,还是得去认真深入学习, 比如夏普的《投资学》、博迪的《投资学》、徐高的《徐高 - 金融经济学二十五讲》、中央财经大学的“投资学”课程、王蓁老师的量化投资课程等。 请参考我最后一章的附录,可以获得更多细节。

衡量风险收益

期望回报率是对未来资产回报率的预估,注意,是未来!可是,我们无法预知未来,所以,我们往往用过去的资产收益情况,来预估未来。
我们用过去资产的回报率来当做未来的收益率,用过去的波动率(也就是标准差)来当做未来的波动,这只是一种没办法的替代而已, 所以,千万不要忘记这点,也千万别“忽悠”了自己,时刻牢记,过去无法代表未来,对未来的不确定性,永远保持敬畏。
我们往往用过去资产的收益的均值,来“估计”资产的收益期望(注意,包含了未来);
我们往往用过去资产的收益的标准差,来“估计”资产的风险,这个也好理解,方差代表了波动,波动大的资产,我们就认为风险大;

无差异曲线

你冒险就希望多收益,对吧?你降低风险,对收益预期也降低。所以,你的投资的好恶就可以用一个平滑曲线表示。
而我冒同样的险,跟你的收益不一样,所以我的好恶曲线,和你的不一样。
所谓无差异,是说,你对预期的感受是一致的,风险大了你就觉得收益就大点,风险小收益就小,你**“认”**这个感受,你觉得这个风险低,收益只能是这些,你接受。 在我理解,其实一个无差异曲线,往往对应着一个或者一类投资产品。
用数学表达就是:
U=E(r)0.005Aσ2U=E(r)-0.005 A \sigma^{2}
,这里面变量是
E(r),σ2E(r),\sigma^2
,不变的是这个人的好恶
AA
这里的
I1,I2,I3I_1,I_2,I_3
,都是一个人的,你可以理解成对不同的投资标的的风险接受程度。而对同一个投资产品,他的收益预期和风险偏好就是一条曲线。 且,这个人的这些偏好曲线都是不相交的。
不同人的无差异曲线,他们的**“陡峭”**程度不一样,越陡,越厌恶风险。
为何是下凸的呢?
是因为,风险越大,人们对收益的期待就约**“偏大”**,曲线就偏陡;而风险小,预期收益就小,曲线就平缓,所以,就是一个下凸的曲线。

均值方差分析

几个基本公式先列一下,
均值:
rˉ=1Ni=1Nri\bar{r}=\frac{1}{N} \sum_{i=1}^{N} r_{i}
方差:
σr2=1Ni=1N(rirˉ)2\sigma_{r}^{2}=\frac{1}{N} \sum_{i=1}^{N}\left(r_{i}-\bar{r}\right)^{2}
标准差:
σr=1Ni=1N(rirˉ)2\sigma_{r}=\sqrt{\frac{1}{N} \sum_{i=1}^{N}\left(r_{i}-\bar{r}\right)^{2}}
协方差:
σxy=1Ni=1N(xixˉ)(yiyˉ)\sigma_{x y}=\frac{1}{N} \sum_{i=1}^{N}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)
相关系数:
hoxy=σxyσxσyho_{x y}=\frac{\sigma_{x y}}{\sigma_{x} \sigma_{y}}
但其实,我们是假设,过去的分布和未来相同,过去的模式会在未来不断重复出现,所以,我们可以用把这种历史数据的计算扩展到期望,即:
均值:
rˉ=E(r)=j=1Mpjrj\bar{r}=E(r)=\sum_{j=1}^M p_j r_j
方差:
σr2=E(rrˉ)\sigma_{r}^{2}=E(r-\bar{r})
相关系数:
hoxy=E(xxˉ)(yyˉ)ho_{x y}=E(x-\bar{x})(y-\bar{y})
这些式子,在数学意义上不是严格相等,但是,在上面提到的金融假设上,就近似相等了。可是,过去就代表未来么?这个问题值的深思。

偏度和峰度

前面我们说过,我们考察一个投资产品,把他过去的、历史的,用来作为未来的投资的最大参考。 我们用过去的均值
rˉ\bar{r}
来作为未来收益率的期望
E(r)E(r)
,我们用过去的标准差
σ\sigma
来作为未来收益率的波动的度量。 但是,这就够了么?不。我们还可以用偏度,和峰度,来帮着我们更深入的去考察资产的收益率。
偏度
我们用偏度来判断,这个分布是不是个“优质分布”,优质分布应该偏度>0:
看图说话,我们肯定喜欢右面的那个,偏度>0的那个分布,对吧,大部分都是更高的收益,而右面那个比较差的收益多。
峰度
我们用峰度来判断,这个分布是不是个“优质分布”,优质分布应该峰度>3:
黄色的是正态分布,峰度=3,我们当然希望峰度>3的,因为这样波动率(标准差)小啊,收益率更稳定啊。

组合的正态性

我们当然希望,我们可以预测的收益率是呈现一个正态分布。为何呢?因为正态分布是我们最有掌控感,可以用数学刻画出来的分布。 用均值和方差,就可以比较“精确”地描述它了。但是如果他不是正态分布,左右偏一些的话,你很难去对他进行数学建模了。
比如正态分布的话,你就可以比较精确地算出在多大概率下,它的波动率(标准差)会是多少。
看这种别人统计的,美股的图,它是一年期的收益,抽样了无数股票,单抽1个的时候,收益率其实不太符合正态分布。 但是到了128个的时候,他们的平均组合收益率,已经非常接近正态分布了(观察偏度=0了)。

无风险和风险资产组合

无风险收益
rfr_f
和风险资产收益
rsr_s
,他们组合到一起,收益如何表达呢?表达成:组合收益均值
rpr_p
、组合收益方差
σp\sigma_p
:
rˉp=E[(1w)rf+wrs]=(1w)rf+wrˉs=rf+w(rˉsrf)σp2=E[(1w)rf+wrs(1w)rfwrˉs]2=E[w2(rsrˉs)2]=w2σs2\begin{aligned} \bar{r}_{p}&=E\left[(1-w) r_{f}+w r_{s}\right]\\ &=(1-w) r_{f}+w \bar{r}_{s}\\ &=r_{f}+w\left(\bar{r}_{s}-r_{f}\right) \\ \sigma_{p}^{2}&=E\left[(1-w) r_{f}+w r_{s}- \\ (1-w) r_{f}-w \bar{r}_{s}\right]^{2}\\ &=E\left[w^{2}\left(r_{s}-\bar{r}_{s}\right)^{2}\right]\\ &=w^{2} \sigma_{s}^{2} \end{aligned}
然后,把这两者组合收益均值
rpr_p
、组合收益方差
σp\sigma_p
的关系表达出来:
rˉp=rf+rˉsrfσsσp\bar{r}_{p}=r_{f}+\frac{\bar{r}_{s}-r_{f}}{\sigma_{s}} \sigma_{p}
这是个线性关系,你愿意承担更大的风险
σp\sigma_p
,你就可以得到更高的收益
rpˉ/E(rp)\bar{r_p}/E(r_p)
,而直线的斜率是个常数
rˉsrfσs\frac{\bar{r}_{s}-r_{f}}{\sigma_{s}}
这个直线也叫:资本配置线CML
现在,把资本配置线CML和无差异曲线结合起来:
这图啥意思?想表达啥?
上面那条无差异曲线,当然好,效用比较高(就是同样风险/标准差下,它收益更高),可是,你做梦吧,因为根本“实现不了”。
为何实现不了?资本配置线CML是啥来着?是你调整你有风险和无风险的组合权重,得到一个组合收益的曲线。所以,你根本无法达到上面那条"预期"的无差异曲线的预期。
那你如果选下面那条无差异曲线呢?你如果选它,你是可以达到“它”期待的预期,但是,你同样风险/标准差下,本可以达到中间那条无差异曲线所能期待的更高收益呢。你何必呢?
切点C代表啥?
代表了,你最能达到最大效用预期,被满足啦,你呀,按照C点的权重,去配置的无风险和有风险资产,会让你的效用预期最大(无差异曲线被满足),且,也是个可是“实现”的一个组合。

两种风险资产组合

rˉ1=E(r1)rˉ2=E(r2)σ12=E(r1rˉ1)2σ22=E(r2rˉ2)2σ12=E(r1rˉ1)(r2rˉ2)\begin{array}{ll} \bar{r}_{1}=E\left(r_{1}\right)\\ \bar{r}_{2}=E\left(r_{2}\right) \\ \sigma_{1}^{2}=E\left(r_{1}-\bar{r}_{1}\right)^{2} \\ \sigma_{2}^{2}=E\left(r_{2}-\bar{r}_{2}\right)^{2} \\ \sigma_{12}=E\left(r_{1}-\bar{r}_{1}\right)\left(r_{2}\right. & \left.-\bar{r}_{2}\right) \end{array}
好,我们现在给第一个分配权重
ww
,那第二种资产权重是
1w1-w
组合收益均值:
rˉp=E(r)=wrˉ1+(1w)rˉ2\bar{r}_{p}=E(r)=w \bar{r}_{1}+(1-w) \bar{r}_{2}
组合收益方差:
σp2=E[wr1+(1w)r2(wrˉ1+(1w)rˉ2)]2=E[w(r1rˉ1)+(1w)(r2rˉ2)]2=E[w2(r1rˉ1)2+(1w)2(r2rˉ2)2+2w(1w)(r1rˉ1)(r2rˉ2)]=w2σ12+(1w)2σ22+2w(1w)σ12\begin{aligned} \sigma_{p}^{2} &=E\left[w r_{1}+(1-w) r_{2}-\left(w \bar{r}_{1}+(1-w) \bar{r}_{2}\right)\right]^{2} \\ &=E\left[w\left(r_{1}-\bar{r}_{1}\right)+(1-w)\left(r_{2}-\bar{r}_{2}\right)\right]^{2} \\ &=E\left[w^{2}\left(r_{1}-\bar{r}_{1}\right)^{2}+(1-w)^{2}\left(r_{2}-\bar{r}_{2}\right)^{2}+\\ 2 w(1-w)\left(r_{1}-\bar{r}_{1}\right)\left(r_{2}-\bar{r}_{2}\right)\right] \\ &=w^{2} \sigma_{1}^{2}+(1-w)^{2} \sigma_{2}^{2}+2 w(1-w) \sigma_{12} \end{aligned}
可变的变量是
ww
,来调整第一个风险资产和第二个风险资产的组合。
那最优的
ww^{*}
应该是多少好呢?就是这个
ww^{*}
下,组合收益最大:
σp2w=02σ12w2σ22(1w)+2σ124σ12w=02σ12w2σ22+2σ22w+2σ124σ12w=0σ12wσ22+σ22w+σ122σ12w=0(σ12+σ222σ12)w=σ22σ12w=σ22σ12σ12+σ222σ12\begin{aligned} &\frac{\partial \sigma_{p}^{2}}{\partial w}=0 \\ & \Rightarrow 2 \sigma_{1}^{2} w^{*}-2 \sigma_{2}^{2}\left(1-w^{*}\right)+2 \sigma_{12}-4 \sigma_{12} w^{*}=0 \\ & \Rightarrow 2 \sigma_{1}^{2} w^{*}-2 \sigma_{2}^{2}+2 \sigma_{2}^{2} w^{*}+2 \sigma_{12}-4 \sigma_{12} w^{*}=0 \\ & \Rightarrow \sigma_{1}^{2} w^{*}-\sigma_{2}^{2}+\sigma_{2}^{2} w^{*}+\sigma_{12}-2 \sigma_{12} w^{*}=0 \\ & \Rightarrow\left(\sigma_{1}^{2}+\sigma_{2}^{2}-2 \sigma_{12}\right) w^{*}=\sigma_{2}^{2}-\sigma_{12} \\ & \Rightarrow w^{*}=\frac{\sigma_{2}^{2}-\sigma_{12}}{\sigma_{1}^{2}+\sigma_{2}^{2}-2 \sigma_{12}} \end{aligned}
那,最好的收益均值(
rpˉ\bar{r_p}^{*}
)是多少?
rˉp=wrˉ1+(1w)rˉ2=σ22σ12σ12+σ222σ12rˉ1+(1σ22σ12σ12+σ222σ12)r2=σ22σ12σ12+σ222σ12rˉ2+σ12σ12σ12+σ222σ12rˉ2=σ12rˉ2+σ22rˉ1σ12(rˉ1+rˉ2)σ12+σ222σ12\begin{aligned} \bar{r}_{p}^{*} &=w^{*} \bar{r}_{1}+\left(1-w^{*}\right) \bar{r}_{2} \\ &=\frac{\sigma_{2}^{2}-\sigma_{12}}{\sigma_{1}^{2}+\sigma_{2}^{2}-2 \sigma_{12}} \bar{r}_{1}+\left(1-\frac{\sigma_{2}^{2}-\sigma_{12}}{\sigma_{1}^{2}+\sigma_{2}^{2}-2 \sigma_{12}}\right) \overline{r_{2}} \\ &=\frac{\sigma_{2}^{2}-\sigma_{12}}{\sigma_{1}^{2}+\sigma_{2}^{2}-2 \sigma_{12}} \bar{r}_{2}+\frac{\sigma_{1}^{2}-\sigma_{12}}{\sigma_{1}^{2}+\sigma_{2}^{2}-2 \sigma_{12}} \bar{r}_{2} \\ &=\frac{\sigma_{1}^{2} \bar{r}_{2}+\sigma_{2}^{2} \bar{r}_{1}-\sigma_{12}\left(\bar{r}_{1}+\bar{r}_{2}\right)}{\sigma_{1}^{2}+\sigma_{2}^{2}-2 \sigma_{12}} \end{aligned}
好吧,看图就明白了,最优的点,就是方差最小的这个点:
不过这个,曲线可不是一直都是个曲线,当这两种风险资产的相关性(可以用相关系数
hoho
来衡量)不同的时候,曲线的形态也不同:

多种风险资产组合

上面是两种风险资产组合,那一堆(多种)资产组合在一起,啥样呢?那就不是个曲线了,而是一个区域了。
这个区域中,我们只关心同等风险(标准差)下,收益最大的那个组合,对吧?所以,这些点就形成了一个叫“有效前沿”的曲线:
这个求解,组合少的时候,可以用拉格朗日优化方式直接求解,组合比较多的时候,往往通过蒙特卡洛采样得到。

市场组合

上面,我们探讨了无风险和有风险组合的关系,就是“资本市场线CML”;还探讨了有风险的组合(2种-曲线、和推广都多种-曲面); 现在,我们把这两者结合起来:
看这种图,我们逐一解释:
M点
是过
rfr_f
的直线(也就是资本市场线CML),和有效前沿的切点。它代表了最优的投资组合。为何是最优? 因为任何高于这个切点的直线(资本市场线CML),都是不可能实现的,因为没碰到任何投资组合区域的内容。 而低于这个切点的直线(资本市场线CML),斜率都是低于切线,也就是投资的效率都低(多投1块钱,获得收益更少), 所以,切线是最优的。
A点
A点,是A点所属的这个人的无差异曲线,其中的一条,也就是这个人所期盼的:“效用预期”最大(越往左上角收益越大),且是“可实现”(不相交就没法实现收益啊)。
而此时,这个A点,也就是最优的一个的无风险
rfr_f
和市场组合
rmr_m
的最优的“我”最喜欢的组合收益
rpr_p
了。
B点
这个是另外一个人的无差异曲线和资本市场线的切线,也就是B所属的这个人,他最优的投资组合。

CAPM

CAPM太经典了,经典到是现代金融的一个开启的奠基之作。
它说了一件什么事呢?
还记得上节我们说,有限前沿和无风险利率的切线,得到了切点M,应该就是市场组合的最优解,对吧? 那市场组合,咋组合法?是应该包含了全世界所有的风险资产,对吧? 那么,CAPM说的就是,这个最优解,就是市场的现状,市场变动来变动去,最终都会均衡收敛到这个点。 嗯,你肯定不信,恩,我也不信! 但是,CAPM是一个理想的模型,他有7大前提条件,这里就保证了结论的有效性。
7大假设:
  1. 1.
    没有交易成本(佣金、买卖价差等)。
  1. 1.
    没有税收。
  1. 1.
    所有资产都可以任意交易,并且无限可分。
  1. 1.
    完全竞争:所有人都是价格的接受者,没有影响价格的能力。
  1. 1.
    所有人都以均值方差的方式选择投资组合:偏好更高的期望回报率,以及更低的回报率 波动率。
  1. 1.
    所有资产(包括无风险资产)都可以任意买空卖空。
  1. 1.
    一致预期:所有人针对相同的时间区间(1 期)考虑投资问题,并对资产的预期回报率和预期波动率状况有相同预期。
这个理论的伟大意义在于,他对资产定价,提出了一个相对合理的模型,这个是跨时代的,后面的各种资产定价理论也都源于它。
如果市场组合与整个市场不同,则某些资产的供需一定不平衡,从而必然 引发资产价格调整,最终使得市场组合一定等同于整个市场。
它的推导证明就不给出了,教材上都有,也可以参考这篇,我也其实也不太关心,我主要关心的是这玩意怎么用?
基于CAPM,就可以推导出CAMP公式,它可以用来给任何一个风险资产计算收益率:收益率和市场组合的收益率之间关系:
E(ri)rf=σiMσM2[E(rM)rf]βi=σiM/σM2E(ri)rf=βi[E(rM)rf]E\left(r_{i}\right)-r_{f}=\frac{\sigma_{i M}}{\sigma_{M}^{2}}\left[E\left(r_{M}\right)-r_{f}\right] \\ \beta_{i}=\sigma_{i M} / \sigma_{M}^{2} \\ E\left(r_{i}\right)-r_{f}=\beta_{i}\left[E\left(r_{M}\right)-r_{f}\right]
这式子表达了什么?
市场上的各种风险资产,它们的期望回报率
E(ri)E(r_{i})
,存在线性关系。它们都分布在一条截距为
rfr_f
,斜率为
E(rM)rfE(r_M)-r_f
的直线上, 这根直线就是证券市场线SML

SML和CML

区分一下证券市场线SML和前面的资本市场线CML
对比他们的公式:
SML:E(ri)=rf+βi[E(rM)rf]CML:E(ri)=rf+σiσM[E(rM)rf]\begin{aligned} &SML: E\left(r_{i}\right)=r_{f}+\beta_{i}\left[E\left(r_{M}\right)-r_{f}\right] \\ &CML: E\left(r_{i}\right)=r_{f}+\frac{\sigma_{i}}{\sigma_{M}}\left[E\left(r_{M}\right)-r_{f}\right] \end{aligned}
长的很像,对不对?但是,其实他们的区别很大!
这样图,说明的很清楚:
  • 资本市场线CML,用来表达无风险加上有风险资产的组合的收益率和波动率之间的关系,它是资产最优组合M和
    rfr_f
    的连线,截距是
    rfr_f
    ,斜率是
    E(rM)rfσM\frac{E(r_M)-r_f}{\sigma_M}
    ,x是无风险和有风险资产组合的标准差(波动率),y是预期收益率
    E(r)E(r)
  • 证券市场线SML,说的是每一个资产
    rir_i
    和全市场组合
    rMr_M
    的比例关系,截距是
    rfr_f
    ,斜率是
    E(rM)rfE(r_M)-r_f
    ,x是
    βi\beta_i
    ,,y是预期收益率
    E(r)E(r)

β\beta

我们可以采集一个股票的每月的收益率
rir_i
,我们得到一系列的时间序列;然后我们用指数的收益率近似代替市场收益率
rMr_M
; 然后我们就可以通过一个一元回归分析,可以求解出
βi\beta_i
,也就是得到这个资产的
β\beta
系数, 这个系数说明了什么?它说明了,这个资产的收益率
rir_i
和市场收益率
rMr_M
的关系,比如正相关,负相关, 某种程度反映着这个资产受市场波动的影响程度。
这里再详细说一下,一元回归
β\beta
的细节:
E(rit)=rf+βi(E(rMtrf)+ϵit)E(r_{it})=r_f + \beta_i (E(r_{Mt} - r_f) + \epsilon_{it})
这个式子,没法做回归,变形一下,
E(rit)rf=αi+βi(E(rMtrf)+ϵit)E(r_{it}) -r_f = \alpha_i + \beta_i (E(r_{Mt} - r_f) + \epsilon_{it})
说一下下标:t表示时间周期,比如每日、每月或者每年,用它来表示一个时间序列;i是一个固定的值,用来代指某一个资产。
好了,可以做回归了,你可以拿到市场基准利率,一般用一年期国债利率
rfr_f
;你也可以得到资产的投资收益,是一个时间序列,每个时间周期上的收益
ritr_{it}
;你也可以得到市场的收益,它也是个时间序列,比如股指的每个时间周期的收益率
rMtr_{Mt}
,然后你就可以做一元回归了。
你一定可以得到一堆的,每个时间周期上的残差,
ϵit\epsilon_{it}
,它的期望应该是0。你还可以得到一个
αi\alpha_i
,理论上,他应该接近于0,如果你想验证CAPM模型,它就应该为0。如果是你想找出这个资产,可以有一个超额收益,那么这个
就是超额收益。
除了用一元回归可以求解
β\beta
外,你还可以通过协方差求解:
还记得前面
β\beta
的定义么?
βi=σiM/σM2\beta_{i}=\sigma_{i M} / \sigma_{M}^{2}
所以,你就可以通过计算股票的每月收益率
rir_i
,和这个月对应的市场的收益率
rMr_M
,然后按照上式,计算出响应的
β\beta

夏普指数

夏普指数:
SRi=E(ri)rfσ(ri)S R_{i}=\frac{E\left(r_{i}\right)-r_{f}}{\sigma\left(r_{i}\right)}
夏普指数,就是刻画,你单位风险下的的收益率。有点抽象,其实很简单,举个例子,比如无风险收益是3%,产品A是23%年化收益率,产品B是13%的年化收益率,但是A的风险是4%(风险就是方差),而B的风险是1%,那么,产品A的夏普指数是 $\frac{23%-3%}{4%}=5$,而产品B的夏普指数是 $\frac{13%-3%}{1%}=10$,那么产品B其实是更好的投资标的,大白话,就是,我不能光看收益率高就买它,我还得看风险大不大,两个的比值大的那个,最好!

CAPM的妙用

简化协方差计算:
我们组合N个资产,我问你组合的方差是多少,怎么算?
通过
β\beta
,我们可以大大简化这个组合资产的方差计算。

因子模型

不同于CAPM那么强的、那么多的假设,能不能少点假设,还能推出资产定价呢?恩,这个就是APT要研究的。
不过为了研究APT,得先搞出一个因子模型,它更偏数学,纯粹就是用一个线性模型,引入一个因子的概念,把资产的收益肢解成因子和线性组合。 (注意,还没到市场假设的地步,市场假设是有APT那边才提出,这就就是偏数学的假设,后面会提,别急)
因子模型就假设资产收益是有一个线性的模型来构建:
rit=ai+bi1F1t+bi2F2t++bikFkt+eitr_{it}=a_{i}+b_{i 1} F_{1t}+b_{i 2} F_{2t}+\cdots+b_{i k} F_{kt}+e_{it}
先看一眼这个式子,我不解释,我先简化它成一个因子,在一个因子模型(单因子)里,再好好解释他们每一项。

单因子

好,我们来把因子模型,简化到只有一个因子:
rit=αi+βiFt+eitr_{it} = \alpha_i + \beta_i F_t + e_{it}
这个式子包含几个强假设或者叫约束(这玩意是数学约束,不过,其实也不算,它还是有点业务含义,但是绝不是CAPM和APT的那些更偏市场的假设):
  • 随机误差
    eie_i
    和因子
    FF
    不相关
  • 不同资产的的随机误差也不相关:
    ei,eje_i,e_j
    不相关 如果相关(可以通过相关性假设检验来确认),就应该可以出另外一个更精确的收益率的因子模型公式出来,可能再多出一到多个因子来。
看这个公式,需要说明一下:
  • ritr_{it}
    ,下标有个t,说明是对序列中某个值的,比如某天的、某月、某年的收益率,他受到对应天的因子值
    FtF_t
    的影响
  • 因子
    FF
    ,它影响资产收益
    ritr_{it}
    的波动,他带来风险(波动),它可能是天气、可能是大盘、可能是税收啥的,啥都可以,但是,他们都有一个共通特点,就是是一个普遍性因素,他不仅影响我这个资产,也影响别人的资产,他是个和我的这个资产个例无关的,个例资产相关的我举个例子,比如老板跑路,厂房着大火之类的因素,这些个例因素, 都被归集到了
    eie_i
    中了。另外,它是一个时间序列值,比如大盘,是每天、每月、每年的收益率。
  • β\beta
    ,就是来刻画,我这个资产,受对应因子的影响程度的,因子是变来变去的,有自己的均值、方差、趋势,我们(要计算的资产)被他(因子)左右、影响,系数
    β\beta
    就是影响的大小。
  • αi\alpha_i
    ,是个啥,书上其实都没讲清楚,我觉得是一个不受因子
    FtF_t
    影响的收益,徐高的书上说是期望回报率,他还用了
    rˉi\bar{r}_i
    来表示,很是让人费解。 我觉得,就是一个横竖,你这个资产可以拿到的一个稳定的收益,如果类别CAPM,对应的就是无风险收益
    rfr_f
    ,对应这个资产,横竖都可以拿到的收益。 注意,他是个数,也就是说,他是个稳定的值。
  • eite_{it}
    呢,就是这个资产的个体风险,咋理解?我理解就是排除了因子们影响的个体的收益波动,比如知乎上的帖子说的,你这个农场发生水灾了导致收益的波动。另外,残差项的期望为0:
    E(ei)=0E(e_i)=0
    ,为何=0呢?是因为,我们是用拟合来求解,这个模型的,那残差项就是
    eie_i
    ,他的数学含义就是这样,在线性回归中,我们知道
    E(ei)=0E(e_i)=0
  • 下标说明一下:i表示某一个资产,而t表示每个时间
那么,自然地,你可能会问,这个
eite_{it}
里还藏着一些共同因素的风险咋办?比如出生率(我觉得比较变态的例子)因素,其实没有被单独拎出来, 它其实藏在这个个体风险
eite_{it}
中,那我这个线性预测就不准了吧。对,这个是个好问题!我说说我的理解,我觉得,这个正是前面说的3个假设 的重要性,即因子间、因子和某个资产的个体风险、不同的资产的个体风险间,这3个配对,都要无关。在我看来,这其实是一个非常非常强的假设, 臣妾是做不到的。因子多了去了,你也没法穷举,你只能不断地挖掘,你只能找到更多的无关的因子们,让藏在个体风险
eite_{it}
中的因子们从个体风险
eite_{it}
尽量的剥离出来,让你的模型越来越精确地去刻画资产的定价。
其实有个trick,实现的时候,就是你找到一个因子,或者别的因子,获得多个因子,比较他们的优劣的时候,可以变相地去检验,他们拟合后的残差,也就是个体风险
eite_{it}
的相关性,即资产1和资产2的个体风险
eite_{it}
,他们是不是相关,从来反向验证你的因子选择和模型的好坏。

多因子

现在来看,多因子的线性模型:
rit=ai+bi1F1t+bi2F2t++bikFkt+eitr_{it}=a_{i}+b_{i 1} F_{1t}+b_{i 2} F_{2t}+\cdots+b_{i k} F_{kt}+e_{it}
其中个,
FiF_i
是因子,对比单因子,它有多个了,恩,将来,你也得用多元回归来做了。 他们每个人,都是一个时间序列,是真实世界存在的序列,比如GPD每年变化率+人口出生变化率+...,多个,都能拿到。
各因子之间,因子与误差项之间,误差项之间,还是要保持前面单因子的那个约束,即协方差应该都为0:
cov(Fit1,Fit2)=0,cov(Fi,ei)=0,cov(eit1,eit2)=0cov(F_{it_1},F_{it_2})=0, cov(F_i,e_i)=0, cov(e_{it_1},e_{it_2})=0
还是那句话,如果不独立,说明,残差项
eie_i
中,还有些信息没有被提取出来,应该还可以再抽象出一个新的因子,这个模型还需要再挖掘。 (相关性检验,是个方法好,可以用来做模型好坏的一个检验标准)

总结

CAPM假设太强,所以夏普提出了这个简化的因子模型,就3个要求,试图简化解释资产的收益的解释,啥都可以是因子,你自己找吧。 这玩意提出来,就可以推导后续的资产套利理论啦。另外,这玩意,也可以简化组合资产的方差、协方差计算,可以降低计算数量级。 还有现在的多因子模型的量化,也是基于它,可以说它是理论基础。后面的著名的Fama-French三因子,就是其中的一个应用而已。
这里的词比较,你可千万别晕啊,我再给你掰吃掰吃:
  • 多个资产
    rir_i
    各自有自己的
    αi\alpha_i
    βi\beta_i
  • 多个资产
    rir_i
    之间可以组合起来得到
    rpr_p
  • 一个资产受多个因子
    FjF_j
    影响,我为了区别,用了下标
    jj
  • 组合资产
    rpr_p
    其实也受多个因子
    FjF_j
    的影响,如果你知道每个资产的
    αi,βi\alpha_i,\beta_i
    ,就可以比较方便的计算出组合资产
    rpr_p
    αp,βp\alpha_p,\beta_p

ATP

???为何说ATP是相对定价?相对是什么含义?为何CAPM就叫做绝对定价?绝对在哪里? 徐高老师解释说,CAPM叫“绝对”的原因是,它是从无倒有,从10个假设中,直接推导出资产的价格,所以叫绝对。
APT不是这个思路,他是参考着别人的价格来定我的价格,一个市场,就存在一个价格,体现了一价定律,那么最终一个资产价格会收敛到一个稳定价格上,且,是参照别人的价格制定的。 徐高老师给的例子,就是,汉堡、可乐、汉堡可乐套餐,这三个价格,可以相互参照,相互作用,如果有价格的不合理,就可以通过其他的套利,导致价格回归到合理位置。
一价定律或单一价格法则指出:“假设其他条件不变,在有效率市场的情况下,任何同质物品的价值应该等同。”
所以,我们再来理解一下**“相对”**的意思,后面会讲,就是通过组合几个资产,通过调整不同的权重,“发现”定价不合理的资产,对他进行套利,从而逼迫他,重新回到合理的价格上。你丫相对不合理,那我就通过套利组合,逼迫你回到相对合理的价格上。
除了用一个相对定价的方式来定价的思路外,这里再说一个为何要引入APT定价的原因。
CAPM给了一个定价模型,按理说,如果它靠谱,你把市场的资产,去做一个CAPM检验,比如用一个资产(如股票、基金)的收益率,去跑一下CAPM模型,结果你发现,很多时候,不一定符合,徐高老师说,特别是中国的股票,根本没法拟合出来,这也好理解,CAPM的那些假设,我们大A股,大多不满足。所以,这就逼着搞量化的人们,去想别的办法来给资产定价啦,这个也是APT由来的原因。
所以,就引入了APT,APT是基于因子模型。而因子模型,其实就是用一些所谓的“因子”,来线性表达出资产价格来;有了因子模型,就可以自圆其说地推导出来APT,APT就是说,你看,因为你们这些资产可以表达成因子的线性组合,然后我就依据这个线性组合,就可以推呀推,推导出,你们的价格是可以通过套利,被逼迫达到一个稳态价格,从而让套利空间消失,这个动态过程,最终定出了资产的合理价格。
反过来,因为有ATP的严谨证明,就会反过来,让你找各种因子,变得有意义,否则,就是一个暴力数据挖掘,找出这种相关性而已。有了APT理论,就可以让你觉得,噢!我找出的这些因子,真的是可以影响和决定定价的呀。
再多说一句,即使挖掘出一些因子,但是,也不是这些因子就是靠谱的、可信的,可以放心大胆地去用来做投资的依据,还是要不断地通过市场去验证和修正,保证其的真实有效性。
另外一个问题,为何多因子模型,是一个线性模型,为何不能是一个2次的,甚至其他非线性模型? 徐高老师说,这个就是通过APT给出的(APT实际给出了线性的依据)
"市场没有套利机会的时候,一些受到共同因子共同影响的资产的期望回报率,应该满足线性关系"(线性就是这么来的!)
APT并没有指出到底是哪些因子?狠泛化的一个理论,约束很小,狠灵活。
latent factor。
徐高老师说,实际上可以找到很多很多因子,对股票收益率的拟合度都很好,甚至
R2R^2
可以到0.9,很高了,但是,如果你用它去预测真正的未来的收益率,
R2R^2
会降到甚至0.02。但是,他没有解释为什么?不太理解...
他只有市场一个因素,APT是一个泛化模型,可以随意定义因子。
“套利资产定价理论”
在已知某些资产的价格之后,怎样给 其他一些相关的资产定价。从这个意义上来说,无套利定价理论也可被称为“相对定价”。 无套利定价理论的思想就是资产市场中应当不存在套利机会。 无套利定价理论就比均衡定价理论更优越。两套理论分别代表了两 条不同的思路,都有着各自的利弊。
罗斯于 1976 年首次提出的“套利资产定价理论”(Arbitrage Pricing Theory, 简称 APT)
是 Fama 与 French 提出的三因子模型(Fama,French,1993) 具有开创性。 Fama 与 French 用市场组合的超额收益率、规模、和账面市值 比 3 个因子来解释不同资产回报率
r~irf=αi+βiM(r~Mrf)+βisS~MB+βihH~ML+ε~i\tilde{r}_{i}-r_{f}=\alpha_{i}+\beta_{i M}\left(\tilde{r}_{M}-r_{f}\right)+\beta_{i s} \tilde{S} M B+\beta_{i h} \tilde{H} M L+\tilde{\varepsilon}_{i}
  • S~MB\tilde{S}MB
    : 是市值因子,表征了上市公司的规模大小
  • H~ML\tilde{H}ML
    : 是账面市值比(book to market), 是公司的账面价值除以公司股票总市值
三因子模型的解释效果就比 CAPM 所对应的 单因子模型好了很多
所谓因子,实际上是会影响随机 折现因子的不确定性来源。
资产的期望收益率是由一些共同的因子所决定的。不同的资产对不 同因子的敏感性不一样,因而造成了不同资产期望回报率的不同
至于这些因子是什么,它 们与不同资产之间的关系是怎样的,多因子模型并不从理论上加以回答,而将其留给实践操 作来确认。也就是说,应用多因子模型的投资者需要自行决定哪些因子是重要的,需要用来 分析资产回报率。
从实践的角度来看,APT 和因子模型是相当抽象的,既没有告诉我们因子是什 么,该怎么去选取,也没有告诉我们资产对各个因子的敏感性如何估计。但这恰恰是 APT 理论一般性、灵活性的体现。
我们将其称为因子风险 (factor risk)。因子前的系数 β 叫做资产对因子的载荷(loading)。与因子风险无关的剩余 风险
ϵi~\tilde{\epsilon_i}
叫做个体风险(idiosyncratic risk)
CAPM 视为 APT 的一个特例。就 CAPM 看来,所有资产的期望回报率只 有一个因子决定,就是市场组合的回报率。而各个资产对因子的敏感度就是各个资产的 β。 所以,我们可以把 CAPM 视为一个单因子模型。
APT的三个基本假设:
  • 因素模型能描述证券收益;
  • 市场上有足够的证券来分散风险;
  • 完善的证券市场不允许任何套利机会存在

无风险套利 APT

APT的基本假设
  • 市场是有效的、充分竞争的、无摩擦的
  • 投资者是不满足的,只要有套利机会,就会一直继续下去
  • 任何资产收益满足:
    r~i=rˉi+βi1F~1+βi2F~2+...+βikF~k+ei\tilde{r}_i = \bar{r}_i + \beta_{i1} \tilde{F}_1+\beta_{i2} \tilde{F}_2+...+\beta_{ik} \tilde{F}_k+ei
    ,其中,
    rˉi=E(r~i)\bar{r}_i=E(\tilde{r}_i)
    ,而且,
    E(F~)=0E(\tilde{F})=0
    因子期望为0,这里
     ~
    表示的是一个时间序列,是个随机变量。
  • 不同资产的
    eie_i
    完全无关,且期望为0:
    E(ei)=0,Cov(ei,ej)=0E(e_i)=0,Cov(e_i,e_j)=0
  • 市场上的资产远远大于因子数
注意!这个多因子模型,是有些异样的 ,他的截距项是一个期望形式,且,要求因子的均值等于0,这些都是很强的一些假设,为什么???在实际使用ATP的过程中,也需要把因子均值归一化,使其
E(ei)=0,Cov(ei,ej)=0E(e_i)=0,Cov(e_i,e_j)=0
老师讲了一个概念,叫**“惊奇”**,数学上表达为
yE(y)y - E(y)
,所以,这里,惊奇就体现在这些因子带来的“惊奇”之和再加上残差
ϵ\epsilon

单因子下的APT

首先我们设有2个资产,
r~i\tilde{r}_{i}
是时序的随机变量,是资产的各个时间点的收益率;
rˉi\bar{r}_{i}
表示的是资产的期望回报
E(ri)E(r_i)
,简化的表示;
βi\beta_i
是对因子的loading,而
f~\tilde{f}
就是因子,他也是一个时间序列。
现在我们假设有2个资产:
r~i=rˉi+βif~r~j=rˉj+βjf~\begin{array}{l} \tilde{r}_{i}=\bar{r}_{i}+\beta_{i} \tilde{f} \\ \tilde{r}_{j}=\bar{r}_{j}+\beta_{j} \tilde{f} \end{array}
这里有一些假设和简化:
  • 因子均值为0,E(\tilde{f}) = 0,实际处理的时候,会对因子做均一化处理(即减去均值)
  • 忽略了个体风险
    ε~i=0\tilde{\varepsilon}_i = 0
    ,TODO
这个式子表示,就是一种假设,就是这么设定的,就是这样的形式,你说着换个形式怎么来的,就是人为规定的。
它表示,一个资产的收益,是围绕它的期望波动,波动的原因是由因子们引起的,你说因子们是啥?其实给出,只是告诉你,跟“某些”因子有关,至于是那些因子,你可以自己去探索和假设,无所谓,只要自洽就可以。
因子,其实,在现实中,就是影响资产的风险,比如GPD、税率、市场指数等,她们就是会影响这个资产的风险,而且是系统风险(啥叫系统风险,就是这个风险谁都影响,各种资产都影响),这些风险,可是波动的,你这个资产,随着这些波动的比例,就是对应的
β\beta
,也就是因子的loading。
好,我现在想这些因子(风险)消除掉,那咋办?这个
β\beta
肯定是个常数啦(每种资产对因子的波动是个固定的值),那我只有通过组合资产i和资产j,来实现了。如何做呢?
我构建资产组合:
r~p=wr~i+(1w)wr~j\tilde{r}_{p}=w \tilde{r}_i + (1-w) w \tilde{r}_j
,
这样可以推出
=[wr~i+(1w)r~j]+[wβi+(1w)βj]f~=[w\tilde{r}_i+(1-w)\tilde{r}_j]+[w\beta_i+(1-w)\beta_j]\tilde{f}
现在我想消除风险(因子),对比?那我就让风险(因子)
f~\tilde{f}
前面的系数
βp\beta_p
为0,不就成了么!
w0βi+(1w0)βj=0w_0 \beta_i + (1-w_0) \beta_j = 0
这样,我们解出:
w0=βjβjβiw_0 = \frac{\beta_j}{\beta_j - \beta_i}
我们把权重
w0w_0
带回到上面的组合收益的式子,这个
w0w_0
下,组合的因子
f~\tilde{f}
的系数搞成了0,就只剩组合的预期收益了:
r~p0=w0r~i+(1w0)r~j=βjβjβirˉi+(1βjβjβi)rˉj=βjrˉiβirˉjβjβi\tilde{r}_{p_{0}}=w_{0} \tilde{r}_{i}+\left(1-w_{0}\right) \tilde{r}_{j}=\frac{\beta_{j}}{\beta_{j}-\beta_{i}} \bar{r}_{i}+\left(1-\frac{\beta_{j}}{\beta_{j}-\beta_{i}}\right) \bar{r}_{j}=\frac{\beta_{j} \bar{r}_{i}-\beta_{i} \bar{r}_{j}}{\beta_{j}-\beta_{i}}
如果市场上没有啥套利机会,那这个值也只能是市场无风险收益
rfr_f
(如果有套利机会,我们肯定会考虑买入更多,或者卖出了),所以:
βjrˉiβirˉjβjβi=rf\frac{\beta_{j} \bar{r}_{i}-\beta_{i} \bar{r}_{j}}{\beta_{j}-\beta_{i}}=r_{f}
所以,可以推出:
rˉirfβi=rˉjrfβj\quad \Rightarrow \quad \frac{\bar{r}_{i}-r_{f}}{\beta_{i}}=\frac{\bar{r}_{j}-r_{f}}{\beta_{j}}
这个等式两边的量(她们相等,对i资产、j资产一样的)是一个常量,定义成一个常数
λ\lambda
λrˉirfβi=rˉjrfβj\lambda \triangleq \frac{\bar{r}_{i}-r_{f}}{\beta_{i}}=\frac{\bar{r}_{j}-r_{f}}{\beta_{j}}
根据这个式子,就可以推出,任何一个资产的收益
rˉi\bar{r}_i
,都满足:
rˉi=rf+βiλ\bar{r}_i = r_f + \beta_i \lambda
徐高老师的教程上说,这个
λ\lambda
还未知,还需再找个方法求出,不过,在我看来,后面求
λ\lambda
的过程,只是对
λ\lambda
的另外一种理解而已。
它的求法,也很简单,就是之前为了消除组合资产的因子
f~\tilde{f}
对资产收益的影响,而使其loading为0,现在呢,我们换个思路,使其为1,你说为何要为1,其实,就是为了求出
λ\lambda
的另外一种表示。
w1βi+(1w1)βj=1w1=1βjβiβjw_{1} \beta_{i}+\left(1-w_{1}\right) \beta_{j}=1 \quad \Rightarrow \quad w_{1}=\frac{1-\beta_{j}}{\beta_{i}-\beta_{j}}
w1w_1
带回到组合权重的式子:
=[wr~i+(1w)r~j]+[wβi+(1w)βj]f~=[w\tilde{r}_i+(1-w)\tilde{r}_j]+[w\beta_i+(1-w)\beta_j]\tilde{f}
中,
r~p1=[1βjβiβjrˉi+(11βjβiβj)rˉj]+f~=[1βjβiβjrˉi+βi1βiβjrˉj]+f~=rˉiβjrˉi+βirˉjrˉjβiβjf~=βirˉjβjrˉiβiβj+rˉirˉjβiβjf~=rf+λ+f~\begin{aligned} \tilde{r}_{p_{1}} &=\left[\frac{1-\beta_{j}}{\beta_{i}-\beta_{j}} \bar{r}_{i}+\left(1-\frac{1-\beta_{j}}{\beta_{i}-\beta_{j}}\right) \bar{r}_{j}\right]+\tilde{f} \\ &=\left[\frac{1-\beta_{j}}{\beta_{i}-\beta_{j}} \bar{r}_{i}+\frac{\beta_{i}-1}{\beta_{i}-\beta_{j}} \bar{r}_{j}\right]+\tilde{f} \\ &=\frac{\bar{r}_{i}-\beta_{j} \bar{r}_{i}+\beta_{i} \bar{r}_{j}-\bar{r}_{j}}{\beta_{i}-\beta_{j}} \tilde{f} \\ &=\frac{\beta_{i} \bar{r}_{j}-\beta_{j} \bar{r}_{i}}{\beta_{i}-\beta_{j}}+\frac{\bar{r}_{i}-\bar{r}_{j}}{\beta_{i}-\beta_{j}} \tilde{f} \\ &=r_{f}+\lambda+\tilde{f} \end{aligned}