论文:股市可预测性与技术指标协整性的模型检验

按字母查成语词典：A|B|C|D|E F G|H|J|K|L|M|N|O|P|Q|R|S|T|W|X|Y|Z
在线新华字典：按偏旁部首查询汉字 | 按汉字拼音查询汉字 | 五笔字根查询
工商管理论文 | 工学工业论文 | 社会艺术论文 | 理学医学论文 | 语言教育论文 | 计算机论文

» 论文阅读

股市可预测性与技术指标协整性的模型检验

内容摘要　
　　周爱民.股市可预测性与技术指标协整性的模型检验.数理统计与管理.1999，18(1)，5～10
　　一个有效的股市，其价格应该是随机波动的，反映市场信息的同质等量分布，或者说无人能靠分析过去的信息而赚到钱。但这与“可预测”并无矛盾，因为预测科学本身并不能提供100%的精度，而且“可预测”和靠预测来赚钱又根本是两回事，股市有效性所遵从的随机游动模型本身就告诉了我们这一点。本文从建立股市自回归预测模型出发，并通过检验股市主要技术指标的协整性来说明这一点，同时指出了各种模型的阶数高与低与股市有效性相对强与弱之间的存在着反向的关系。

一、沪、港股市可预测性的模型检验

　　本文提出股市可预测性，针对的是证券市场有效性概念里，容易引起误解的几个地方〔1〕。需要强调的是：说证券市场价格“可预测”不等于说“可以100%的准确预见”，而是说“可以使用一般用于经济预测的方法，建立起能在一定误差要求之下预测证券市场价格变动的预测模型”。显然，任何方法建立起的任何预测模型都是存在误差的。“可预测”是指所建立起的预测模型其误差是在可接受的范围内。比如一个遵循随机游走模型的随机变量，当它的方差与期望之比满足一定条件时，随机游走模型本身就是一个误差满足一定要求的预测模型。
　　笔者认为股市的“可预测性”是一个始终伴随着证券市场有效性递进的强进程概念，即证券市场的有效性越强，其市场指数的变动中暴涨暴跌的情况就越少，建立预测模型的可能性就越大，“可预测性”就越强；反之如果证券市场的有效性越弱，单边上升或单边下降的可能性就越大，接下来随着市场的急速转向，建立预测模型的可能性就越小，其“可预测性”就越弱。
　　为支持以上概念的提出，我们使用上海股市有史以来的指数数据和香港联交所的同期恒生指数，建立两地股市误差满足要求的预测模型，即下面的(1.1)式。

　　MIt=a0+a1LMIt+a2D2+……+apDp+εt　　(1.1)

　　其中MIt为股指数据，LMIt为其一阶滞后变量，D2=Δ2MIt,…，Dp=ΔpMIt,分别为股指数据MIt二阶、…、p阶的差分变量。p为自回归的阶数，可由过拟合F-检验准则来界定，过拟合F-检验统计量的计算见下面的(1.2)式。

　　F=(N-p)(SSEp-SSEp+1)/SSEp+1～F(1,N-p)　　(1.2)

其中N为样本容量，p为所检验的模型阶数，也即模型中所用解释变量的个数，而SSEp为p阶模型的残差平方和：SSEp=,其中et=Xt-Xt为模型残差。过拟合F-检验准则对于(1.1)式的修正AR(p)模型可以给出阶数是否足够高的检验，用于在显著程度α下检验模型是否过度拟合，检验临界值及实际的计算结果见表1.1。

　　表1.1　上海股市指数1991年12月17日至1995年12月7日，对p=21至24时的过拟合F统计量的检验(对α=0.01,0.005,0.001)

模型样本容量自由度原始模型F统计量修正模型F统计量 Fα=0.001F理论值 α=0.005F理论值 α=0.001F理论值
p=21
p=22
p=23
p=24
1007
1007
1007
1007
985
984
983
982
45.854
29.982
37.414
28.940
19.188
359.385
625.829
218.076
6.63
6.63
6.63
6.63
7.88
7.88
7.88
7.88
10.83
10.83
10.83
10.83

　　通常在假设H0∶ap+1=0,之下，当F＞Fα时，拒绝假设H0，当F＜Fα时，则接受假设H0。如果拒绝了假设H0，意味着AR(p)的阶数仍可升高，p+1阶的滞后变量(在我们的模型中指更高阶的差分变量Dp+1)可以被引入作为解释变量。如果接受了假设H0，则意味着AR(p)的阶数已够高了。表2.1给出了对上海股指使用F-过拟合检验的情况，从中可以看出，当模型阶数由p=21升至p=22时，模型的F统计量发生本质性变化，因此p=22时模型最好。
　　以下为上海股市指数1991年12月17日至1995年2月7日，对p=22时的修正AR(p)模型。
　　MIt=-7.48(-8.55)+1.01(945.92)LMIt+10.63(52.62)D2-70.89(-33.84)D3+
　　+336.72(26.40)D4-1213.9(-22.18)D5+3448.7(19.37)D6-7911(-17.33)D7+
　　+14893(15.75)D8-23264(-14.47)D9+30370(13.41)D10-33265(-12.51)D11+
　　+30612(11.72)D12-23635(-11.03)D13+15247(10.41)D14-8158.5(-9.84)D15+
　　+3580.3(9.33)D16-1267.3(-8.86)D17+352.95(8.42)D18-74.482(-8.01)D19+
　　+11.196(7.62)D20-1.0683(-7.26)D21+0.0486(6.91)D22
　　其中括号内的数值分别为对应回归参数的t统计量，且MSE=71.22,F=40700,R2=0.9989,DW=0.0819,相对误差的均值、标准差及绝对值的平均值分别为：-0.0005，0.0105，0.82%；表示模型精度的各概率值分别为：P(10%)=100%,P(8%)=100%,P(5%)=100%,P(1%)=65.94%。
　　使用Cochrane-Orcutt修正法可以使模型误差MES=5.607,F=11510,R2=0.9197,DW=1.9171。而相对误差的均值、标准差及绝对值的平均值分别为：-0.0000，0.0026，0.17%；表示模型精度的各概率值分别为：P(10%)=100%,P(8%)=100%,P(5%)=100%,P(1%)=99.4%。
　　继续增在模型的阶数p将是徒劳无益的，在造成过度拟合的同时反而会使模型的拟合精度下降，事实上对p=10的模型其相对误差就已经足够小了。
　　虽然在相同年龄期内(历史前五年)，香港联交所的恒生指数通过动态随机游程检验的时间要比上证指数晚一些，但在1990年至1995年底同期恒生指数的有效性要比上证指数强的多〔2〕。而同期恒生指数修正的AR(p)模型体现出了很高的精度。p=10时的模型其相对误差就已经足够小了(常数项不为著，去除)：
　　MIt=1.0008(6413.99)LMIt+4.51(56.80)D2-12.19(-36.56)D3+
　　+21.61(28.08)D4-26.19(-23.04)D5+21.99(19.58)D6-12.64(-17.0)D7+
　　+4.76(14.97)D8-1.06(-13.28)D9+0.11(11.84)D10
　　括号内数值为对应回归参数的t统计值，且MSE=1592,F=4113000,R2=1,DW=0.2097;相对误差的均值、标准差及其绝对值的平均值分别为：0.00007，0.005，.021%；表示模型精度的各概率值分别为：P(10%)=100%,P(8%)=100%,P(5%)=100%,P(1)=95%。
　　即使不使用修正的AR(p)的模型，仅使用随机游走模型也能很好地预测恒生指数：
　　HSt=1.0005(2107.48)LHSt，
　　其中括号内数值为对应回归参数的t统计量值，且MES=14760，F=4441000，R2=0.9997,相对误差的均值、标准差及绝对值的平均值分别为：-0.0003，0.0151,0.17%;表示模型精度的各概率值分别为：P(10%)=99.92%,P(8%)=99.75%,P(5%)=99.01%,P(1%)=62.35%。可见绝大多相对误差都在5%以下。可见这的确说明，有效性越强的股市预测模型的精确度也越高。
二、沪、港股市技术指标的协整性检验而技术分析的有效性也是一个始终伴随着证券市场弱有效—半强有效—强有效的弱进程概念。即证券市场的有效性越强，技术分析的“有效性”相对越弱。反之，在有效性越弱的证券市场，技术分析的“有效性”越强。
　　技术分析有效性的模型检验是通过对上证指数及其两个最常用的技术分析指标：简单算术移动平均指标和乖离率指标建立协整模型来实现的。协整理论的宗旨在于：对于那些建模较为困难的非平稳序列，通过引入与其协整的差分变量，达到使模型成立并提高模型精度的目的。
　　首先，若一个非平稳序列Yt通过d次差分后可变成平稳的，就称此序列具d阶整形，记为Yt～I(d)，平稳序列Yt具有零阶整形，记为Yt～I(0)。若Yt～I(1)，则ΔYt～I(0),即：一阶整形变量的差分为零阶整形。
　　检验整形阶数的迪凯-富拉尔(Dickey-Fuller)方程有三种类型，分别为：
　　第一类检验模型：Yt=δYt-1+εt,或：ΔYt=(δ-1)Yt-1+εt
　　第二类检验模型：Yt=εb+δYt-1+εt,或：ΔYt=εb+(δ-1)Yt-1+εt
　　第三类检验模型：Yt=εb+γt+δYt-1+εt,或：ΔYt=εc+γt+(δ-1)Yt-1+εt
　　假设检验H0∶δ=1为单位根检验，对应假设为H1∶δ＜1为平稳检验。由普通最小二乘法算得的回归参数的t统计量，不能再直接用于该假设检验，而是用蒙特卡罗法给出的ADF检验临界值，统计量有几种，我们使用T1ADF=tδ(δ-1)。
　　若变量Xt=(X1t,…，Xnt)的每一个分量都是d阶整形，存在一n维向量α，使αTXt～I(d-b),其中d≥b≥0,则称X1t,…,Xnt具有(d,b)阶协整，记为Xt～CI(d,b)，α称为协整向量。特别当d=b=1时，称Xt为(1，1)阶协整。对(1，1)阶协整的序列，葛兰佳尔提出两步法(Granger,1987)来检验序列的协整关系：
　　(1)用X2t,…,Xnt来解释变量X1t∶X1t=α1X2t+…+αnXnt+Vt;
　　(2)检验残差Vt的整形阶数，若其为零阶整形(即是平稳序列)，则X1t,…,Xnt便是(1，1)阶协整的，协整向量为(1)中的回归参数α1,…,αn。
　　首先分别对上海股指MI、MI5日移动平均线MA5、5日乖离率BIAS的5日移动平均线B5进行整形阶数的检验。在充分比较了不同检验模型的“好”与“坏”之后，决定对MI、MA5、B5均使用第二类增强型的ADF检验方程进行整形阶数的检验，统计量为TADF=(δ-1)/SE(δ-1),经检验可知MI、MA5和B5均为1阶整形，结果如表2.1。

　　表2.1　MI、MA、AB整形阶数的ADF检验

上　　海　　股　　指　　　　　　　　恒　　生　　股　　指

变量
MI
MA5
B5
残差项
ADF
-4.68
-3.49
-10.45
-4.15
检验类型
k=2
k=2
k=2
k=2
显著程度
99%
99%
99%
99%
临界值
-3.43
-3.43
-3.43
-3.43
ADF
-4.01
-3.70
-10.18
-3.81
检验类型
k=2
k=2
k=2
k=2
显著程度
99%
99%
99%
99%
临界值
-3.43
-3.43
-3.43
-3.43

　　再按照葛兰佳尔(Granger)的两步法，考察MI、MA5与B5之间的协整关系，即：
　　MIt=0.999(2085.33)MA5t+7.552(109.07)B5t+εt
　　其中括号内数字为对应估计参数的t统计量，F=2185000,R2=0.9998,MSE=144.7,自由度=1005,残差Et的均值=0.2235,均方差=12.02。
　　根据葛兰佳尔表示定量，如内生变量Yt与外生变量集Xt=(X1t,X2t,…,Xnt)构成(1，1)阶协整，协整向量为α=(1,α1,…,αn)T,(Yt,Xt)α～I(0)时，应有误差校正模型：

其中Yt=αTXt+εt中的εt～I(0),k0,kj(j=1,…,n)的选择应使ωt成为白噪声。
　　现引入残差的一阶滞后变量Et-1和股指MIt一阶差分变量的滞后变量：Dt-1=L(MIt-MIt-1),Dt-2=L2(MIt-MIt-1),…,Dt-m=Lm(MIt-MIt-1),MA5t一阶差分的滞后变量：DMt-1=L(MA5t-MA5t-1),DMt-2=L2(MA5t-MA5t-1),…,DMt-k=Lk(MA5t-MA5t-1),以及B5t一阶差分的滞后变量：DBt-1=L(B5t-B5t-1),DBt-2=L2(B5t-B5t-1),…,DBt-h=Lh(B5t-B5t-1),可建立协整模型的误差修正模型如下：
　　Et=-0.007(-0.03)+0.13(3.91)Dt-1-0.17(-3.48)DMt-1+0.08(2.10)DMt-2+
-0.42(-1.69)DBt-1+0.26(3.80)DBt-2+0.64(24.38)Et-1
　　其中括号内的数值为对应回归参数的t统计量值，且：F=154.1,R2=0.4809,MSE=75.38,DW=1.9964。过拟合F检验结果、误差修正模型的相对误差均值、均方差、绝对值平均值，及表示精度的概率值，如表2.2，由表可确定m=1,k=h=2时的模型“最好”。
　　表2.2　　沪指协整误差修正模型的过拟合F检验(ε=0.01)及估计精度。

协整误差过拟合检验自由最后相对误差绝误差修正模型的精度
修正阶数
m=k=h=1
m=1,k=h=2
m=k=h=2
恒指协整模型
F统计量
16.1
0.7
0.5
临界值
6.63
6.63
6.63
度
1000
997
996
均值
10-5
10-5
10-5
10-5
均方差
10-2
10-2
10-2
10-2
对均值
0.55%
0.56%
0.56%
0.43%
P(8%)
99.7%
99.7%
99.7%
100%
P(5%)
99.4%
99.5%
99.5%
99.8%
P(1%)
84.5%
84.8%
84.6%
88.8%

　　恒生指数与其主要技术指标之间的协整关系为：
　　MIt=0.9997(6429.94)MA5t+7762(118.13)B5t
　　其中括号内的数值为对应回归参数的t统计量值，且：F=20910000,R2=1.000,MSE=1567。过拟合F检验的结果说明，有效性相对较强的市场，其协整误差修正模型中要求有更高的阶数，因此也能达到相对更小的相对误差。对于恒生指数的模型不需要进行误差修正，m=k=h=2时模型的精确程度已经高于上证指数经修正后的协整模型了(见表2.2中最后一行)。
　　既然在股市指数MIt与其两个最经常使用的技术指标简单算术移动平均指标MA5t和乖离率B5t之间存在着协整关系，也就是说无论股指是否平稳，MIt与MA5t和B5t的一线性组合之间相差的只是一个白噪声。所以说明技术分析指标能够在一定精度的前提下，解释股指的变动，也即技术分析是有效的。
三、来自模型检验的启发

　　上海股市目前虽不具备弱有效性，但弱有效性是在逐步增强的。对于这种股市有效性的渐近性质，可从几个方面来验证。例如可以使用不同期限的动态游程统计量验证股市的渐近性质，也可以由各种模型下动态的过拟合F统计量来验证股市有效性的渐近性质。这就是说，对于不同股市的有效性比较，或者是对相同股市不同时期的有效性比较，可以通过各种模型的阶数来检验。而这种检验深层次的意义在于，在不能验证一个发展中的股市是有效的时候，只是确定了市场指数不能服从只有一个滞后项的随机游动模型，但它可能服从带有多个滞后项的模型。而且随着股市有效性的由弱到强，市场指数服从的模型阶数越来越少，直到减少到一个时，也就验证了市场指数服从随机游动模型了。下面我们通过一个典型的LARCH模型(Geweke,1986)［3］来说明这一点。
　　设随机误差项εt遵从条件正态分布：
　　Pt=P0+cPt-1+εt,εt｜φt-1～N(0,ht)
　　ln(ht)=a0+a1ln(ε2t-1)+…+apln(ε2t-p))
　　其中P0表示分离出的趋势，c≈1为游走倾向，t-1=｛Pt-1,PXt-2,…｝为给定的条件集合。另外，为保证条件方差为正，应有：a0＞0,ai≥0,i=1,2…P,P由过拟和F检验来确定，F统计量在大样本情况下(样本超过500)的临界值为6.63。
　　经过计算发现：1991年1月23日至1995年12月17日，上海股指数据的LARCH模型不同阶数的过拟合F检验值分别为：F7=36.66;F10=24.05;F23=16.73;F30=14.21,阶数在30阶以上。
　　1992年2月13日至1995年12月17日，上海股指数据的LARCH模型不同阶数的过拟合F检验值为别为：F14=6.99;F15=6.58;F16=6.77;F17=6.15;F18=6.03,阶数为17较为明确。此时有：Pt=4.51(2.12)+0.994(336.19)Pt-1,括号内为相应估计值的t统计量，且R2=0.989,F=113000,MSE=1137,DW=1.88。
　　1993年1月20日至1995年12月17日，上海股指LARCH模型的过拟合F检验值分别为：F26=7.45;F27=6.89;F28=6.37;F29=6.35,阶数28较为明确。此时有：
　　Pt=8.120(1.84)+0.989(182.91)Pt-1
　　R2=0.9787,F=33460,MSE=997.6,DW=2.0592。
　　1994年1月25日至1995年12月17日，上海股指LARCH模型的过拟合F检验值F1=1.37,以SSE=Σ(ln(H)-E［ln(h)］)2=34.848计，F0=1.18,均明显小于临界值，因此LARCH模型的阶数应为0。此时有：Pt=20.75(3.8)+0.97(87.4)Pt-1,R2=0.942,F=7633,MSE=660.4,DW=1.9825。
　　其中DW统计量的期望值为2.0042，方差为0.008，残差Et(=Pt-20.75-0.97Pt-1)及相对误差Dt(=Et/Pt)的均值、根方差和所处区间分别为：1.726E-9，25.67，［-139,178.6］;-1.588E-3,0.038,［-18.54%,23.39%］。ln(ht)=6.512(278.2)+0.005(1.1)ln(ε2t-1)
　　与前相同，1995年1月26日至1995年12月17日，上海股指LARCH模型的过拟合检验值F1=0.204,以SSE=Σ(ln(H)-E［ln(H)］2=46.028计，F0=0.210,均明显小于临界值，因此LARCH模型的阶数应为0。此时有：Pt=20.75(3.8)+0.968(87.4)Pt-1,R2=0.942,F=7633,MSE=660.4,DW=1.983。
　　其中DW统计量的期望值为2.0042，方差为0.008，残差Et(=Pt-20.75-0.968Pt-1)及相对误差Dt(=Et/Pt)的均值、根方差和所处区间分别为：1.614E-8，21.42，［-134.2，175.5］；-9.905E-4，0.030，［-17.88%，22.98%］。ln(ht)=6.039(112.4)-0.006(-0.5)ln(ε2t-1)
　　可见，对于股市有效性不同的时间段，其条件异方性的强弱不同。在有效性相对较强时间段上，条件异方差性相对较弱，反之在有效性相对较弱的时间段上，条件异方差性相对较强。

作者单位：周爱民　　(南开大学国际经济研究所　天津300071)

参考文献

［1］周爱民(1997)，股市有效性、可预测性与技术指标的协整性，南开经济研究，1997(1).
［2］周爱民(1997)，股市有效性的动态监测，经济科学，1997(3).
［3］汤敏　茅于轼(1996)，现代经济学前沿专题——第二集，商务印书馆.
［4］俞乔：“市场有效、周期异动与股价波动”，《经济研究》，1994，9期.
［5］Dickey,D.A.,and W.A.Fuller,(1981):“Likelihood Ratio Statistics for Autoregressive Time Series with a Unit Root”,Economitrica,49:1057-1072.
［6］Engle,R.F,and C.E.J.Grange,(1991):“Cointegrated Economic Time Series:An Overview with New Results”,in R.F.Engle and C.W.J.Ganger(eds),Long-run Economic.

数理统计与管理1999年第1期 No.1 1999

本文摘录自互联网络,在此刊登仅为传递更多信息,版权归作者所有.

» 培训展台

» 学校展示

» 武汉培训课程导航