1µÚÕÂ
Time Series Analysis 
¢ò 

Ê±¼äÐòÁÐ
¢ò


±¾ÕÂ½«´ÓÊ±¼äÐòÁÐµÄ½Ç¶ÈÀ´½éÉÜ¶àÖØ¹²ÏßÐÔ¡¢Áë»Ø¹é¡¢Lasso »Ø¹éµÈÄÚÈÝ¡£Çë¶ÁÕß×¢Òâ£¬±¾ÕÂ·û
ºÅºÍ¹«Ê½¸ñÊ½ÑØÓÃ±¾´ÔÊéµÚÈý±¾Ê±¼äÐòÁÐÒ»ÕÂ£¬ºÍÓÅ»¯ºÍ»Ø¹éÕÂ½Ú¸ñÊ½ÂÔÓÐ²»Í¬¡£


µ«·²Âú×ãÒÔÏÂÁ½¸öÌõ¼þµÄÀíÂÛ£¬±ã¿ÉÒÔ³ÆÎªºÃÀíÂÛ£º»ùÓÚ¼¸¸öÓÐÏÞµÄ±äÁ¿£¬×¼È·ÃèÊö´óÁ¿¹Û²â
Öµ£»ÄÜ¶ÔÎ´À´¹Û²âÖµ×ö³öÈ·¶¨µÄÔ¤²â¡£

A theory is a good theory if it satisfies two requirements: it must accurately describe a large class of 
observations on the basis of a model that contains only a few arbitrary elements, and it must make 
definite predictions about the results of future observations. 

¡ªË¹µÙ·Ò¡¤»ô½ð (Stephen Hawking) 
Core Functions and Syntaxes 

±¾ÕÂºËÐÄÃüÁî´úÂë


e 
collintest()º¯Êý½øÐÐBelsley¹²ÏßÐÔ¼ìÑé
e 
cond(A)º¯Êý·µ»Ø¾ØÕóAµÄ2-·¶ÊýÄæÔËËãµÄÌõ¼þÊýinv(A)¼ÆËã·½ÕóÄæ¾ØÕó£¬Ïàµ±ÓÚA^(-1) 
e 
corrcoef(A) ·µ»ØAµÄÏà¹ØÏµÊýµÄ¾ØÕó£¬ÆäÖÐAµÄÁÐ±íÊ¾Ëæ»ú±äÁ¿£¬ÐÐ±íÊ¾¹Û²âÖµ
e 
corrplot(X)º¯Êý»æÖÆXÖÐÃ¿¶Ô±äÁ¿µÄÏà¹ØÐÔÍ¼Ïñ
e 
datenum() ½«ÈÕÆÚ±äÁ¿"date"×ª»»ÎªÊýÖµ±äÁ¿"number"corrplot() 
e 
diag() ´´½¨¶Ô½Ç¾ØÕó»ò»ñÈ¡¾ØÕóµÄ¶Ô½ÇÔªËØ
e 
egcitest()º¯Êý½øÐÐEngle-Granger¼ìÑé
e 
fimplicit(f) ÔÚÄ¬ÈÏÇø¼äÉÏ»æÖÆf(x)=0¶¨ÒåµÄÒþº¯Êý
e 
fitlm()º¯ÊýÓÃÀ´¹¹½¨ÏßÐÔ»Ø¹éÄ£ÐÍ
e 
interp2(X,Y,V,Xq,Yq) ¶þÎ¬ÄÚ²åÖµ£¬¸ù¾ÝX-Y-V¶ÔÓ¦¹ØÏµ£¬¶þÎ¬ÄÚ²åÖµ»ñµÃ(Xq£¬Yq)´¦Öµ
e 
lagmatrix() ¹¹½¨°üº¬ÖÍºóÊ±¼äÐòÁÐµÄ¾ØÕó
e 
lasso()º¯ÊýÀ´¹¹½¨Lasso»Ø¹éÄ£ÐÍ
e 
lassoPlot()º¯Êý»æÖÆÄ£ÐÍÏµÊýËæLasso²ÎÊý¦Ë±ä»¯µÄÍ¼Ïñ
e 
repmat(A,r) Ê¹ÓÃÐÐÏòÁ¿rÖ¸¶¨ÖØ¸´·½°¸¡£ÀýÈç£¬repmat(A,[2 3]) Óërepmat(A,2,3)·µ»ØÏàÍ¬µÄ

½á¹û

e 
ridge() ¹¹½¨Áë»Ø¹éÄ£ÐÍ²¢Çó½âÄ£ÐÍÏµÊý

e 
size(A) »ñµÃÊäÈë¾ØÕóAµÄ¸÷¸öÎ¬¶È³¤¶È


MATLAB½ðÈÚ·çÏÕ¹ÜÀíÊ¦FRM 
| 
½ðÈÚ¿Æ¼¼FintechÓ¦ÓÃ
1.1 ¶àÖØ¹²ÏßÐÔ
±¾´ÔÊéµÚÈý±¾Ê±¼äÐòÁÐIÒ»ÕÂÖÐ½éÉÜ¹ý£¬¶ÔÓÚµ¥¸öÄ¿±ê±äÁ¿(target variable) Ê±¼äÐòÁÐ{Yt}ºÍn¸ö½â
ÊÍ±äÁ¿ (explanatory variable) Ê±¼äÐòÁÐ{X X X1, 2, ,t t nt}, ,...,{}{}£¬ËüÃÇÖ®¼äµÄ»Ø¹éÄ£ÐÍ¿É±íÊ¾Îª£º
Y ct t t =++¦Â¦ÅX (1-1) 
ÆäÖÐ£¬Xtº¬ÓÐ¸÷¸öÊ±¼äÐòÁÐ½âÊÍ±äÁ¿£¬ÈçÊ½1-2ËùÊ¾¡£
Xt t t nt =....X X X1, 2, ,, ,..., T (1-2) 
ÏòÁ¿¦ÂÔòÊÇXtµÄÏµÊýÏòÁ¿£¬ÓÐ£º
¦Â=[¦Â¦Â¦Â1 2, ,..., n] (1-3) 
¦Åt
ÊÇÎó²îÏòÁ¿£¬±íÊ¾YtÖÐÎÞ·¨±»Xt½âÊÍµÄ²¿·Ö£»¶øcÔòÎª³£ÊýÏî¡£
ËùÎ½µÄ¹²ÏßÐÔ (colinearity)£¬ÊÇÖ¸Á½¸ö½âÊÍ±äÁ¿£¬±ÈÈçX1,tºÍX2,t£¬ËüÃÇÖ®¼ä´æÔÚÏßÐÔ¹ØÏµ£»ÆäÖÐ
Ò»¸ö±äÁ¿¿ÉÒÔÓÉÁíÒ»¸ö±äÁ¿ÏßÐÔ±íÊ¾£¬¼´£º
X X2, 0 1 1,t t t =+¦Á¦Á¦Å+ (1-4) 
¶àÖØ¹²ÏßÐÔ (multicollinearity)£¬ÔòÊÇÖ¸Á½¸öÒÔÉÏµÄ½âÊÍ±äÁ¿Ö®¼ä´æÔÚÏßÐÔ¹ØÏµ£¬¼´£º
X X X Xnt t t n n t t, 0 1 1, 2 2, 1 1, =++++¦Á¦Á¦Á¦Á¦Å...+ (1-5) 
µ±´æÔÚÍêÃÀµÄÏßÐÔ¹ØÏµÊ±£¬Îó²îÏî¦Åt
½«²»ÔÙ´æÔÚ£¬»òÕßËµÎó²îÏîÎªÁã¡£
ÄÇÃ´£¬Èç¹û½âÊÍ±äÁ¿Ö®¼ä´æÔÚÕâÑùµÄÏßÐÔ¹ØÏµ£¬¶ÔÔ­À´µÄ»Ø¹éÄ£ÐÍ»áÓÐÔõÑùµÄÓ°ÏìÄØ£¿ÊýÑ§ÉÏ£¬
Ê½1-6¡«Ê½1-10¿ÉÒÔ¸ø³ö½â´ð¡£
yX¦Ât t =. . (1-6) 
ÆäÖÐ£¬ÏòÁ¿yt°üº¬Ä¿±ê±äÁ¿{Yt}ÔÚt m=1, 2,..., ÉÏµÄÊ±¼äÐòÁÐÊý¾Ý£º
yt m =¡­[YY Y1 2,, , ]T (1-7) 
¾ØÕóX. t°üº¬½âÊÍ±äÁ¿{X X X1, 2, ,t t nt}, ,...,{}{}µÄÊ±¼äÐòÁÐÊý¾ÝÒÔ¼°³£ÊýÏî1£º
X. t =
..
..
..
....
1 
1 
....
X X 
X X 
1 
11 1 
m nm 
.
.
n 
(1-8) 

µÚ 1 ÕÂ Ê±¼äÐòÁÐ¢ò 
| 
Time Series Analysis ¢ò
ÏòÁ¿¦Â. °üÀ¨ÏµÊýÏòÁ¿¦ÂºÍ³£ÊýÏîc£º
¦Â. =[c, , ,..., ¦Â¦Â¦Â1 2 n]T (1-9) 
¶Ô¦Â. Çó½âÊ±£¬¿¼ÂÇµ½X. tÍùÍù²»ÊÇ·½Õó£¬Æä×îÐ¡¶þ³Ë·¨µÄ½âÐèÒª¶ÔXX.. 
t t 
T ÇóÄæ£¬¼´£º
¦ÂXXXy. =(.. . 
t t t t 
T T).1 
(1-10) 
Èç¹û½âÊÍ±äÁ¿{X X X1, 2, ,t t nt}, ,...,{}{}Ö®¼ä´æÔÚÍêÈ«µÄ¶àÖØ¹²ÏßÐÔ£¬ÄÇÃ´¾ØÕóX. tÖÐÓÐÒ»ÁÐ¿ÉÒÔÓÉÆä
ËûÁÐµÄÏßÐÔ×éºÏµÃµ½£¬ÄÇÃ´¸Ã¾ØÕó¾Í²»ÊÇÂúÖÈ¾ØÕó¡£ÔÚ¸ÃÇé¿öÏÂ£¬X. t±¾Éí²»¿ÉÄæ£¬XX.. 
t t 
T Ò²²»¿ÉÄæ£»
¼´(XX.. 
t t 
T ).1 
²»´æÔÚ£¬ÎÞ·¨»ñµÃ¦Â. µÄ×îÐ¡¶þ³Ë½â¡£
µ±½âÊÍ±äÁ¿{X X X1, 2, ,t t nt}, ,...,{}{}Ö®¼ä´æÔÚ²»ÍêÈ«µÄ¶àÖØ¹²ÏßÐÔÊ±£¬XX.. 
t t 
T ÒÀ¾É¿ÉÄæ£¬µ«±ä³ÉÁËÒ»
¸ö²»ÊÊ¶¨ÎÊÌâ (ill-posed problem) ¡£´ËÊ±£¬¶Ô¦Â. µÄÇó½â±äµÃ²»ÎÈ¶¨£»ÊÜµ½¶àÖØ¹²ÏßÐÔµÄÓ°Ïì£¬½âµÄÎ¨Ò»
ÐÔºÍ×¼È·ÐÔÊÜµ½ÁËÌôÕ½¡£ÊäÈëÊý¾ÝX. tÇáÎ¢µÄ±ä»¯¶¼»áÒýÆð½â¦Â. µÄ½Ï´ó±ä¶¯¡£ÔÚ²»ÊÊ¶¨ÎÊÌâÖÐ£¬¾ßÓÐÄÚ
ÔÚ¹²ÏßÐÔµÄ¾ØÕóÒ²±»³ÆÎª²¡Ì¬¾ØÕó (ill-conditioned matrix)¡£
ÔÚÊýÖµ·ÖÎöÖÐ£¬³£Ê¹ÓÃÌõ¼þÊý (condition number) À´ºâÁ¿ÎÊÌâµÄÊÊ¶¨ÐÔ¡£Í¨³£Ê¹ÓÃÏ£À°×ÖÄ¸¦ÊÀ´±í
Ê¾Ìõ¼þÊý£¬ÆäÖµµÄ·¶Î§Îª´óÓÚµÈÓÚ1£¬¼´¦Ê¡Ý1 ¡£ÔÚÌõ¼þÊý¦ÊÏÂ£¬ÊäÈëÊý¾ÝX. tÖÐ1%µÄÈÅ¶¯£¬»áÖ±½Óµ¼
ÖÂ¦Â. ¦Ê% µÄÎó²î¡£¸ßÌõ¼þÊýÒâÎ¶×ÅÎÊÌâµÄÊÊ¶¨ÐÔ²î£¬µÍÌõ¼þÊýÒâÎ¶×ÅÎÊÌâµÄÊÊ¶¨ÐÔºÃ¡£ÔÚMATLAB ÖÐ
¿ÉÖ±½Óµ÷ÓÃº¯Êýcond()ÇóµÃÊäÈë¾ØÕóµÄÌõ¼þÊý¡£
»Ø¹ËÔÚ±¾´ÔÊéµÚÈý±¾µÚ11ÕÂÊ±¼äÐòÁÐIÖÐµÄÀý×Ó£¬ÀûÓÃMATLAB ×Ô´øµÄÊý¾ÝData_CreditDefaults£¬
½¨Á¢Ò»¸öÎ¥Ô¼ÂÊµÄÊ±¼äÐòÁÐ»Ø¹éÄ£ÐÍ¡£ÆäÖÐ£¬Ä¿±ê±äÁ¿ÊÇÍ¶×Ê¼¶±ð(invested grade) µÄ¹«Ë¾Õ®È¯Î¥Ô¼ÂÊ
(¼´Êý¾ÝÖÐµÄIGD)£¬¶ÔÓ¦µØÓÐ4¸ö¿ÉÑ¡ÔñµÄ½âÊÍ±äÁ¿£ºÈýÄêÇ°½øÈëÍ¶×Ê¼¶±ðµÄ·¢Õ®ÈË°Ù·Ö±È (AGE)£»
ÆÀ¼¶ÎªBBBµÄÍ¶×Ê¼¶±ð·¢Õ®ÈË°Ù·Ö±È (BBB)£»ÅòÕÍÂÊµ÷Õûºó (inflation adjusted) ¹«Ë¾Ò»ÄêÊÕÒæÔ¤²â
(CPF)£»¹«Ë¾Õ®È¯ÓëÕþ¸®Õ®È¯Àû²î (SPR)¡£»¹ÊÇÒÔÕâ¸ö»Ø¹éÄ£ÐÍÎªÀý£¬ÎÒÃÇÀ´¿´¿´ÔÚ½¨Ä£µÄ¹ý³ÌÖÐÈçºÎ
·¢ÏÖºÍ´¦Àí¿ÉÄÜ´æÔÚµÄ¹²ÏßÐÔÎÊÌâ¡£Ê×ÏÈ£¬Í¬ÑùÔËÐÐÒÔÏÂ´úÂë½¨Ôì±¾´ÔÊéµÚÈý±¾µÚ11ÕÂµÄ»Ø¹éÄ£ÐÍ£º
B5_Ch1_1_A.m 
clc; clear all; close all 
%% Import MATLAB data 
load Data_CreditDefaults 
% Matrix of regresor X 
X = Data(:, 1:4); 
% Table of regressor X 
XTbl = DataTable(:,1:4); 
% Regressor names 
RegressorNames = series(1:4); 
% Number of observations 
T_num = size(X,1); 

MATLAB½ðÈÚ·çÏÕ¹ÜÀíÊ¦FRM 
| 
½ðÈÚ¿Æ¼¼FintechÓ¦ÓÃ
% Regressand y 
y = Data(:, 5); 
% Convert dates to serial date numbers: 
dateNums = datenum([dates,ones(T_num,2)]); 
%% Original regression model 
% Use fitlm() function 
Md0 = fitlm(DataTable) 
ÔËÐÐ½á¹ûÈçÏÂ¡£
Md0 = 
Linear regression model:
IGD ~ 1 + AGE + BBB + CPF + SPR 
Estimated Coefficients: 
Estimate SE tStat pValue 
_________ _________ _______ _________ 
(Intercept) -0.22741 0.098565 -2.3072 0.034747 
AGE 0.016781 0.0091845 1.8271 0.086402 
BBB 0.0042728 0.0026757 1.5969 0.12985 
CPF -0.014888 0.0038077 -3.91 0.0012473 
SPR 0.045488 0.033996 1.338 0.1996 
Number of observations: 21, Error degrees of freedom: 16Root Mean Squared Error: 0.0763R-squared: 0.621, Adjusted R-Squared 0.526 
F-statistic vs. constant model: 6.56, p-value = 0.00253 
¿ÉÒÔ¿´³ö£¬¸÷¸ö½âÊÍ±äÁ¿¶ÔÓ¦µÄ·ûºÅ¶¼ÊÇÕýÈ·µÄ£¬·ûºÏ×ÔÉíµÄ¾­¼ÃÑ§¹ØÏµ¡£µ«ÊÇ¾ÍÏÔÖø¶È¶øÑÔ£¬
È¡¾öÓÚÑ¡¶¨ÏÔÖøÐÔË®Æ½£¬²¢²»ÊÇËùÓÐµÄ±äÁ¿¶¼±íÏÖ³ö×ã¹»µÄÏÔÖøÐÔ¡£Ïà½ÏÓÚÆäËû±äÁ¿¶øÑÔ£¬±äÁ¿CPF 
±íÏÖÁË½Ï¸ßµÄÏÔÖøÐÔ¡£
ÏÈÀ´¿´¿´4¸ö½âÊÍ±äÁ¿Ö®¼äµÄÏà¹ØÐÔ¡£ÔËÐÐÒÔÏÂ´úÂë£¬»ñµÃ½âÊÍ±äÁ¿¼äµÄÏà¹ØÐÔ¾ØÕó²¢»æÖÆÏà¹Ø
ÐÔÍ¼Ïñ£º
B5_Ch1_1_B.m 
%% Visulize the correlation of X 
corr_coe = corrcoef(X) 
figure 
corrplot(XTbl, 'testR', 'on') 
×¢Òâ´úÂëÖÐ£¬º¯Êýcorrplot()ÆðÓÃÁË¶ÔÏà¹ØÐÔÏµÊýµÄ¼ÙÉè¼ìÑé£»¶ÔÓ¦Í¼ÏñÖÐµÄÏà¹ØÐÔÏµÊýÈç¹û±ê×¢
ÎªºìÉ«£¬ËµÃ÷¸Ã½á¹ûÍ¨¹ýÁËt-¼ìÑé£¬¾ßÓÐÏÔÖøÐÔ¡£´úÂëÔËÐÐµÃµ½µÄÏà¹ØÐÔÏµÊý¾ØÕócorr_coeÈçÏÂ¡£
corr_coe = 
1.0000 0.4578 0.0566 -0.0686 
0.4578 1.0000 0.3955 0.3082 
0.0566 0.3955 1.0000 0.0874 
-0.0686 0.3082 0.0874 1.0000 

µÚ 1 ÕÂ Ê±¼äÐòÁÐ¢ò 
| 
Time Series Analysis ¢ò
Éú³ÉµÄÏà¹ØÐÔÏµÊýÍ¼ÏñÈçÍ¼1.1ËùÊ¾¡£½âÊÍ±äÁ¿BBBÓëAGEµÄÏà¹ØÐÔÏµÊýÎª0.46£¬ÇÒÍ¨¹ýÁË¼ÙÉè¼ì
Ñé£»ÓëCPFµÄÏà¹ØÐÔÏµÊýÎª0.40£»ÓëSPRµÄÏà¹ØÐÔÏµÊýÎª0.31¡£×ÜÌå¶øÑÔ£¬BBBÕ¹Ê¾³öÁËÓëÆäËûÈý¸ö½â
ÊÍ±äÁ¿Ö®¼ä½ÏÍ»³öµÄÏà¹ØÐÔ£¬µ«²¢²»Ê®·Ö½ôÃÜ¡£·´Ö®£¬ÆäËûÈý¸ö½âÊÍ±äÁ¿Ö®¼äµÄÏà¹ØÐÔÔòÎ¢ºõÆäÎ¢¡£
Èç¹ûËÄ¸ö½âÊÍ±äÁ¿Ö®¼äÏà¹ØÐÔÏµÊýÎª1»ò.1£¬ÒâÎ¶×Å¾ØÕóXt ÖÐ´æÔÚÍêÈ«¶àÖØ¹²ÏßÐÔ¡£Ïà¹ØÐÔÏµÊýµÄ¾ø
¶ÔÖµÔ½´ó£¬°µÊ¾×Å¶àÖØ¹²ÏßÐÔÔ½Ã÷ÏÔ¡£
Correlation Matrix 
1 2 3 
SPR 
-5 0 5 10 
CPF 
20 40 
BBB 
4 6 8 10 12 
AGE 
1 
2 
3 
SPR 
-5 
0 
5 
10 
15 
CPF 
20 
30 
40 
50 
BBB 
4 
6 
8 
10 
12 
AGE 
0.46 0.06 -0.07 
0.46 0.40 0.31 
0.06 0.40 0.09 
0.07 0.31 0.09-
Í¼1.1 ½âÊÍ±äÁ¿AGE¡¢BBB¡¢CPF¡¢SPRÖ®¼äµÄÏà¹ØÐÔÏµÊý
½Ó×Åµ÷ÓÃº¯Êýcond()£¬ÔËÐÐÈçÏÂ´úÂë£º
B5_Ch1_1_C.m 
%% Calculate condition numbers 
XI = [ones(T_num, 1), X]; 
kappa = cond(XI) 
% Ones-matrix 
kappa_one = cond(ones(size(XI))) 
% Zeros-matrix 
kappa_zero = cond(zeros(size(XI))) 

MATLAB½ðÈÚ·çÏÕ¹ÜÀíÊ¦FRM 
| 
½ðÈÚ¿Æ¼¼FintechÓ¦ÓÃ
% Identity-matrix 
kappa_identity = cond(eye(size(XI, 2))) 
ÔËÐÐ½á¹ûÎª£º
kappa = 
205.8085 
kappa_one = 
2.6099e+63 
kappa_zero = 
Inf 
kappa_identity = 
1 
ÕâÀï²»µ¥µ¥¼ÆËãÁË±¾ÀýÖÐ¾ØÕóX. tµÄÌõ¼þÊýkappa£¬»¹¼ÆËãÁËÍ¬Ñù´óÐ¡µÄÈ«1¾ØÕóµÄÌõ¼þÊýkappa_ 
one¼°È«0¾ØÕóµÄÌõ¼þÊýkappa_zero£¬ÒÔ¼°Ò»¸ö5 ¡Á 5µ¥Î»¾ØÕóµÄÌõ¼þÊýkappa_identity¡£¿ÉÒÔ¿´µ½µ¥Î»¾Ø
ÕóÍêÈ«²»´æÔÚ¹²ÏßÐÔ£¬ËùÒÔµ±Ìõ¼þÊýkappa_identity = 1£¬Öµ×îÐ¡¡£È«1¾ØÕó´æÔÚÍêÈ«µÄ¹²ÏßÐÔ£¬ÆäÌõ¼þ
Êýkappa_one ÖµÊ®·Ö´ó£»È«0¾ØÕó¶ÔÓ¦µÄÌõ¼þÊýkappa_zero ¸üÊÇ´ïµ½ÁËÕýÎÞÇî´ó£¬ÊÇ×î¼«¶ËµÄÇé¿ö¡£±¾
ÀýÖÐ¾ØÕóX. t¶ÔÓ¦µÄÌõ¼þÊýkappa Ò²²»Ð¡£¬ÔÚÌõ¼þÊýkappa_identity ºÍkappa_zero Ö®¼ä£¬ÏÔÊ¾´æÔÚÒ»¶¨µÄ
¹²ÏßÐÔ¡£²»ÄÑ·¢ÏÖ£¬ÎÞÂÛÊÇÏà¹ØÐÔÏµÊý»¹ÊÇÌõ¼þÊý£¬¶ÔÓÚ¼«¶ËÇé¿öÏÂµÄ¶àÖØ¹²ÏßÐÔ¿ÉÒÔÅÐ¶ÏµÃÊ®·Ö×¼
È·¡£µ«Í¨³£Çé¿öÏÂ¸üÊÊºÏ×ö¶¨ÐÔ·ÖÎö¶ø²»ÊÇ¶¨Á¿·ÖÎö¡£
ÕâÀïÔÙ½éÉÜÒ»¸ö¹²ÏßÐÔµÄ¶ÈÁ¿Ö¸±ê£¬·½²îÅòÕÍÒò×Ó(variance inflation factor, VIF)£¬Ò²³ÆÎª·½²îÀ©
´óÒò×Ó¡£Ò»¸öº¬ÓÐn¸ö½âÊÍ±äÁ¿µÄ¾ØÕóX. t£¬¶ÔÓÚÆäÖÐµÄÈÎÒâ½âÊÍ±äÁ¿{Xit, }£¬Æä¶ÔÓ¦µÄ·½²îÅòÕÍÒò×Ó
VIFi¿ÉÓÉÊ½1-11 ¼ÆËãµÃ³ö¡£
VIFi =
1.
1 
Ri 
2 (1-11) 
Ê½ÖÐ£ºRi 
2 Îª½âÊÍ±äÁ¿{Xit, }ÓëÆä½âÊÍ±äÁ¿{X jijt, },(¡Ù)µÄ»Ø¹éÄ£ÐÍµÄ¾ö¶¨ÏµÊý¡£
X Xit j jt t, 0 , = +¦Á¦Á¦Å+
j ji=¡Ù
¦²1, 
n 
(1-12) 
¶øVIFiµÄµ¹ÊýÔòÊÇ½âÊÍ±äÁ¿{Xit, }¶ÔÓ¦µÄÔÊ²îtolerancei¡£
tolerance 1i i =.=R2 
VIF 
1 
i 
(1-13) 
µ±Ä³¸ö±äÁ¿{Xit, }ÄÜ±»ÆäËû±äÁ¿ÍêÈ«ÏßÐÔ½âÊÍÊ±£¬Ri 
2 µÄÖµÇ÷½üÓÚ1£¬VIFiµÄÖµ½«Ç÷½üÓÚÎÞÇî´ó¡£
ËùÒÔ£¬¸÷¸ö±äÁ¿µÄVIFÖµÔ½Ð¡£¬ËµÃ÷¹²ÏßÐÔÔ½Èõ¡£×î³£ÓÃµÄVIFãÐÖµÊÇ10£¬¼´½âÊÍ±äÁ¿µÄVIFÖµ¶¼²»´ó
ÓÚ10Ê±£¬ÈÏÎª¹²ÏßÐÔÔÚ¿É½ÓÊÜ·¶Î§ÄÚ¡£´ËÍâ£¬VIF ¡Ü 5Ò²ÊÇ±È½Ï³£¼ûµÄ£¬µ«Ïà¶Ô¶øÑÔ¸üÎªÑÏ¸ñµÄÅÐ¶Ï
±ê×¼¡£

µÚ 1 ÕÂ Ê±¼äÐòÁÐ¢ò 
| 
Time Series Analysis ¢ò
ÔÚMATLAB ÖÐ£¬¿ÉÒÔ×ñÑ­ÈçÍ¼1.2ËùÊ¾µÄ²½ÖèÀ´¼ÆËãVIFÖµÒÔ¼°ÅÐ¶Ï¹²ÏßÐÔµÄÓ°Ïì¡£Í¬Ê±£¬Ò²¿ÉÒÔ
¸ù¾Ý½âÊÍ±äÁ¿¾ØÕóX. t µÄÏà¹ØÐÔÏµÊý¾ØÕóÖ±½ÓÇóµÃ¸÷¸ö±äÁ¿µÄVIFÖµ¡£ÊýÑ§ÉÏ¿ÉÒÔÖ¤Ã÷£¬¾ØÕóX. t µÄÏà¹Ø
ÐÔÏµÊý¾ØÕóµÄÄæ¾ØÕóµÄ¶Ô½ÇÔªËØ¾ÍÊÇÏ£ÍûµÃµ½µÄVIFÖµ¡£
Start 
{Xi, t}, i = 1,2,...,n 
i = i + 1 
If i = n 
End 
{VIFi}, i = 1,2,...,n 
i = 1 
Calculate the regression model¡¯s R2 
i 
Calculate the i-th VIFi for {Xi,t}: 
Create the regression model for {Xi,t}: 
Xi,t = ¦Á0 + ¦²¦Áj Xj,t + ¦Åt 
j=1, j¡Ùi 
n 
VIFi = 1 
1-R2 
i 
Í¼1.2 ·½²îÅòÕÍÒò×ÓVIF¼ÆËãÁ÷³ÌÍ¼
ÔÚÇ°ÃæµÄÀý×ÓÖÐ£¬Ïà¹ØÐÔÏµÊý¾ØÕócorr_coeÒÑ´æÔÚ£¬ÔËÐÐÈçÏÂ´úÂë¡£
B5_Ch1_1_D.m 
%% Calculate VIF 
VIF = diag(inv(corr_coe))' 
RSquared_i = 1-(1./VIF) 
µÃµ½µÄ½á¹ûÎª£º
VIF = 
1.3870 1.7901 1.2216 1.1850 
RSquared_i = 
0.2790 0.4414 0.1814 0.1561 
×¢Òâ´úÂëÊ×ÏÈÊ¹ÓÃÁËinv() º¯ÊýÀ´»ñµÃÏà¹ØÐÔÏµÊý¾ØÕócorr_coe µÄÄæ¾ØÕó(corr_coe)-1£»È»ºóÓÖÊ¹ÓÃÁË
diag()º¯ÊýÌáÈ¡ÁËÄæ¾ØÕó (corr_coe)-1µÄ¸÷¸ö¶Ô½ÇÔªËØÖµÎªVIFÖµ¡£¶ÁÕßÃÇ¿ÉÒÔ¸ù¾ÝÍ¼1.2µÄ²½Öè×ÔÐÐ±àÐ´
³ÌÐòÊµÏÖ²¢ÑéËãÒÔÉÏµÄ½á¹û¡£
ÁíÒ»¸öMATLAB ¿ÉÒÔÌá¹©µÄ¹¤¾ßÊÇBelsley¹²ÏßÐÔ¼ìÑé(Belsely collinearity test)£¬¿ÉÒÔÖ±½Óµ÷ÓÃ
collintest()º¯ÊýÀ´Íê³É¸Ã¼ìÑé¡£±¾ÀýÖÐ£¬¿ÉÒÔÔËÐÐÈçÏÂ´úÂë¡£

MATLAB½ðÈÚ·çÏÕ¹ÜÀíÊ¦FRM 
| 
½ðÈÚ¿Æ¼¼FintechÓ¦ÓÃ
B5_Ch1_1_E.m 
%% Collinearity test 
X0Tbl = ... 
[table(ones(T_num,1),'VariableNames',{'Const'}),XTbl]; 
collintest(X0Tbl); 
figurecollintest(X0Tbl,'tolIdx',10,'tolProp',0.5, ... 
'display','off','plot','on'); 
×¢Òâcollintest() º¯ÊýµÄÊäÈë±äÁ¿ÀàÐÍ¼È¿ÉÒÔÊÇ±í¸ñ£¬Ò²¿ÉÒÔÊÇ¾ØÕó£¬¸ÃÀýÖÐ£¬Ê¹ÓÃµÄ±äÁ¿ÀàÐÍÊÇ
±í¸ñ¡£Ö±½ÓÓ¦ÓÃcollintest()º¯Êý£¬µÃµ½µÄ½á¹ûÎª£º
Variance Decomposition 
sValue condIdx Const AGE BBB CPF SPR 
---------------------------------------------------------
2.0605 1 0.0015 0.0024 0.0020 0.0140 0.0025 
0.8008 2.5730 0.0016 0.0025 0.0004 0.8220 0.0023 
0.2563 8.0400 0.0037 0.3208 0.0105 0.0004 0.3781 
0.1710 12.0464 0.2596 0.0950 0.8287 0.1463 0.0001 
0.1343 15.3405 0.7335 0.5793 0.1585 0.0173 0.6170 
ÈôÅäºÏ¡°figure¡±Ò»ÆðÊ¹ÓÃ£¬ÄÜµÃµ½¶ÔÓ¦µÄÍ¼Ïñ£¬ÈçÍ¼1.3ËùÊ¾¡£
Const AGE BBB CPF SPR 
Variables 
0 
0.1 
0.2 
0.3 
0.4 
0.5 
0.6 
0.7 
0.8 
0.9 
Variance-Decomposition ProportionscondIdx 12 
condIdx 15.3 
tolProp 
Í¼1.3 Belsley¹²ÏßÐÔ¼ìÑé½á¹ûÍ¼
µ÷ÓÃcollintest()º¯ÊýËùµÃ±í¸ñÖÐ¡°sValue¡±Ö¸ÆæÒìÖµ(singular value) ¡£collintest()º¯ÊýÊäÈë±äÁ¿µÄ¾Ø
ÕóÐÎÊ½¾­¹ýÆæÒìÖµ·Ö½â (singular value decomposition) £¬Ô­¾ØÕó±ä³ÉÁËU¦²VT µÄÐÎÊ½¡£¡°sValue¡±ÁÐÖÐ
¸ø³öµÄ¾ÍÊÇÆæÒìÖµ¾ØÕó¦²ÖÐµÄÆæÒìÖµ¡£¹ØÓÚÆæÒìÖµ·Ö½âµÄÄÚÈÝ£¬±¾´ÔÊéµÚÈý±¾ÊýÑ§¢óÖÐ×öÁËÏàÓ¦µÄ½é
ÉÜ¡£¡°condIdx¡±Ö¸Ìõ¼þÖ¸±ê (condition index)£¬ÓÃÀ´ÏÔÊ¾½âÊÍ±äÁ¿µÄ¹²ÏßÐÔ£¬ÖµÔ½´óËµÃ÷¸Ã±äÁ¿ÓëÆä
Ëû±äÁ¿µÄÁªÏµÔ½½ôÃÜ¡£
±í¸ñÖÐConst¡¢AGE¡¢BBB¡¢CPF¡¢SPRÁÐ¶ÔÓ¦µÄÊÇ¸÷¸ö½âÊÍ±äÁ¿£¬°üÀ¨ÁË³£ÊýÏîÔÚÄÚ£¬Ã¿Ò»
ÁÐÏÔÊ¾µÄÊÇ¸Ã½âÊÍ±äÁ¿ÔÚÒ»¶¨µÄÌõ¼þÖ¸±êË®Æ½ÉÏ£¬ÏàÓ¦µÄ±äÒìÊý·Ö½â±È (variance-decomposition 
proportions)¡£Õâ¸öÖµÔ½´ó£¬ËµÃ÷¹²ÏßÐÔÔ½Ç¿¡£ÕâÀï£¬¼ÈÒªÉè¶¨Ìõ¼þÖ¸±êµÄãÐÖµ£¬Ò²ÒªÉè¶¨±äÒìÊý
·Ö½â±ÈµÄãÐÖµ¡£ÔÚMATLAB ÖÐ£¬Ìõ¼þÖ¸±êµÄÄ¬ÈÏãÐÖµÊÇ¡°30¡±£¬±äÒìÊý·Ö½â±ÈµÄãÐÖµÊÇ¡°0.5¡±¡£

µÚ 1 ÕÂ Ê±¼äÐòÁÐ¢ò 
| 
Time Series Analysis ¢ò
ÔÚcollintest() º¯ÊýÖÐ£¬Ö¸Áî·û'tolIdx' ¿ÉÒÔÉè¶¨Ìõ¼þÖ¸±êµÄãÐÖµ£¬¶ø'tolProp'¿ÉÒÔÉè¶¨±äÒìÊý·Ö½â±ÈµÄ
ãÐÖµ¡£Ö¸Áî·û'display'Éè¶¨Îª'off' »òÕß'on'£¬¾ö¶¨ÊÇ·ñÒÔ±í¸ñÐÎÊ½ÏÔÊ¾½á¹û¡£Ö¸Áî·û'plot'Éè¶¨Îª'off' »ò
Õß'on'£¬¾ö¶¨ÊÇ·ñ»æÖÆÍ¼Ïñ¡£
ÔÚ±¾ÀýÖÐ£¬½«Ìõ¼þÖ¸±êµÄãÐÖµÉè¶¨ÎªÁË¡°10¡±£¬·²ÊÇÌõ¼þÖ¸±ê³¬¹ý¸ÃãÐÖµµÄÐÐÐÅÏ¢£¬¾Í»áÔÚÍ¼
ÏñÖÐ»æÖÆ³öÀ´£¬Í¬Ê±±äÒìÊý·Ö½â±ÈµÄãÐÖµÒ²»á»æÖÆÔÚÍ¼ÏñÖÐ¡£±í¸ñ½á¹ûÖÐµÄ×îºóÁ½ÐÐ¶ÔÓ¦µÄÌõ¼þÖ¸±ê
¶¼³¬¹ýÁËãÐÖµ¡°10¡±£¬ËùÒÔÕâÁ½ÐÐµÄ±äÒìÊý·Ö½â±È¶¼ÔÚÍ¼ÏñÖÐ»æÖÆÁË³öÀ´£¬¶ÔÓ¦µÄ±äÒìÊý·Ö½â±ÈµÄãÐ
Öµ¡°0.5¡±Ò²ÔÚÍ¼ÏñÖÐ³ÊÏÖÁË³öÀ´¡£ÔÚÌõ¼þÖ¸±êÎª12.0464 Ê±£¬Ö»ÓÐ±äÁ¿BBB µÄ±äÒìÊý·Ö½â±È³¬¹ýÁËãÐ
Öµ¡£ÔÚÌõ¼þÖ¸±êÎª15.3405 Ê±£¬±äÁ¿AGEºÍSPRÖ®¼ä¾ù³¬¹ýÁË0.5 µÄ±äÒìÊý·Ö½â±È£¬°µÊ¾ÁËËüÃÇÖ®¼ä´æ
ÔÚÁËÒ»¶¨µÄ¹²ÏßÐÔ¡£
µ«ÊÇ£¬ÓÉÓÚÊ¹ÓÃÁË±ÈÄ¬ÈÏÉèÖÃ¸üµÍµÄÌõ¼þÖ¸±êãÐÖµ£¬ÕâÀïÏÔÏÖ³öµÄ¹²ÏßÐÔÊµ¼ÊÉÏÊÇ±È½ÏÈõµÄ¡£Èç
¹û²»ÈËÎªµØÉè¶¨ÕâÁ½¸öãÐÖµ£¬Ó¦ÓÃÄ¬ÈÏÉèÖÃ£¬ÔËÐÐÒÔÏÂ´úÂë¡£
B5_Ch1_1_F.m 
% Default settings of 'tolIdx'=30 and 'tolProp'=0.5 
collintest(X0Tbl, 'plot', 'on') 
ÓÉÓÚÃ»ÓÐ³¬¹ýÉè¶¨ãÐÖµµÄ½á¹û£¬»áµÃµ½ÌáÐÑÐÅÏ¢£¬¾ßÌå½á¹ûÎª£º
Warning: No critical rows to plot. 
> In collintest (line 291) 
ËùÒÔµ±´ó¼Ò²»ÄÜ³É¹¦µØ»æÖÆ³öBelsley ¹²ÏßÐÔ¼ìÑéµÄÍ¼Ïñ£¬¿ÉÄÜÐèÒª²é¿´Ò»ÏÂãÐÖµÉèÖÃµÃÊÇ·ñºÏ
ÊÊ¡£ÏÂÃæµÄ´úÂë¸ø³öÁËÒ»¸öÓ¦ÓÃBelsley ¹²ÏßÐÔ¼ìÑé¶øÇÒ¹²ÏßÐÔ½ÏÇ¿µÄÀý×Ó¡£¶ÁÕß¿ÉÒÔ×Ô¼ºÔËÐÐ´úÂëÀ´
²é¿´Ò»ÏÂ½á¹û¡£
% Another example 
load Data_Canada 
collintest(DataTable) 
collintest(DataTable, 'plot', 'on') 
1.2 Áë»Ø¹é
ÁíÒ»¸ö³£ÓÃµÄÕë¶Ô¶àÖØ¹²ÏßÐÔµÄ²¹¾È´ëÊ©ÊÇ²ÉÓÃÁë»Ø¹é (ridge regression)£¬Ò²³ÆÎª¼¹»Ø¹é¡£Èç
1.1½ÚÌáµ½µÄ£¬ÔÚÒ»°ãµÄÏßÐÔ»Ø¹éÖÐ£¬ÓÉÓÚ¹²ÏßÐÔµÄ´æÔÚ£¬Ê¹µÃ¾ØÕóXX.. 
t t 
T ÖÐº¬ÓÐ·Ç³£½Ó½üÓÚÁã (near 
singularity) µÄÌØÕ÷Öµ£¬µ¼ÖÂÔÚÍ¨¹ýÊ½1-14¶Ô¦Â. Çó½âÊ±Ôì³É¸ÉÈÅ¡£
¦ÂXXXy. =(.. . 
t 
T T 
t t t).1 
(1-14) 
ÔÚÁë»Ø¹éÖÐ£¬ÒýÈëÁËÁë²ÎÊý(ridge parameter)£¬Í¨³£¼ÇÎªk£¬²¢ÇÒÎªÕýÖµ¡£¶ÔÓÚÔ­À´µÄ¾ØÕóXX.. 
t t 
T £¬

MATLAB½ðÈÚ·çÏÕ¹ÜÀíÊ¦FRM 
| 
½ðÈÚ¿Æ¼¼FintechÓ¦ÓÃ
Áë»Ø¹éÖ±½Ó½«Áë²ÎÊýÌí¼Óµ½¶Ô½ÇÔªËØÉÏ£¬ÒÔ´ïµ½¸Ä±ä¹ýÓÚÎ¢Ð¡µÄÌØÕ÷ÖµµÄÄ¿µÄ¡£ÓÚÊÇ£¬¶Ô¦Â. µÄÇó½â±»
×ª»¯³ÉÁËÊ½1-15¡£
¦ÂXXIXy. =+(.. . t t t t 
T Tk ).1 (1-15) 
Ê½ÖÐ£ºIÎªÒ»¸öÓëXX.. t t 
T ´óÐ¡ÏàÍ¬µÄµ¥Î»¾ØÕó¡£
ÔÚMATLAB ÖÐ£¬¿ÉÒÔÖ±½Óµ÷ÓÃº¯Êýridge(y, X, k, scaled) À´¹¹½¨Áë»Ø¹éÄ£ÐÍ¡£¸Ãº¯ÊýµÄÊäÈë±äÁ¿yÊÇ
Ä¿±ê±äÁ¿(Òò±äÁ¿) ÁÐÏòÁ¿£»XÊÇ°üº¬ÓÐ½âÊÍ±äÁ¿µÄ¾ØÕó£¬Ã¿ÁÐ¼´ÎªÒ»¸ö½âÊÍ±äÁ¿£»kÊÇÁë»Ø¹é²ÎÊý£¬ÔÊ
ÐíÒÔÏòÁ¿µÄÐÎÊ½ÊäÈë²»Í¬µÄÁë»Ø¹é²ÎÊý¡£¸Ãº¯ÊýµÄÊä³ö¼´ÎªÔÚ²»Í¬Áë»Ø¹é²ÎÊýkÏÂ¸÷½âÊÍ±äÁ¿µÄÏµÊý
Öµ¡£ÔÚÄ¬ÈÏÇé¿öÏÂ¸Ãº¯Êý»á½«ËùÓÐ±äÁ¿¹éÒ»»¯ÎªÆÚÍûÖµÎª0¡¢±ê×¼²îÎª1µÄÐòÁÐ¡£
´ËÍâ£¬ridge()º¯Êý»á×Ô¶¯Ìá¹©³£ÊýÏî£¬ÔÚÊäÈë±äÁ¿¡°X¡±ÖÐ²¢²»ÐèÒªÔÙ¼ÓÈë³£ÊýÁÐ¡£Ì¸µ½º¯Êý¶Ô
ÊäÈëÊý¾ÝµÄ¹éÒ»»¯£¬¾ÍÓÖÒª×¢Òâº¯ÊýÁíÒ»¸öÊäÈë±äÁ¿¡°scaled¡±¡£Ä¬ÈÏÇé¿öÏÂ£¬¡°scaled¡±µÄÖµÎª1£¬
²»»á½«º¯ÊýµÃµ½µÄÏµÊý½â¦Â. »Ö¸´µ½¹éÒ»»¯Ö®Ç°µÄÁ¿¼¶£»Èô¡°scaled¡±µÄÖµÉè¶¨Îª0£¬Ôò»á½«ÏµÊý½â¦Â. »Ö
¸´µ½¹éÒ»»¯Ö®Ç°µÄÁ¿¼¶£¬´ËÊ±ÓëÊäÈëÊý¾ÝµÄÁ¿¼¶¾ÍÊÇÒ»ÖÂÁË¡£
»¹ÊÇ¼ÌÐøÇ°ÃæµÄÀý×Ó£¬Ê×ÏÈÔËÐÐÈçÏÂ´úÂë£¬µ¼ÈëÊý¾Ý¡£
B5_Ch1_2_A.m 
clc; clear all; close all 
%% Import MATLAB data 
load Data_CreditDefaults 
% Matrix of regresor X 
X = Data(:, 1:4); 
% Number of observations 
T_num = size(X,1); 
% X Matrix with constant 
XI = [ones(T_num, 1), X]; 
VarNames = {'AGE','BBB','CPF','SPR'}; 
% Regressand y 
y = Data(:, 5); 
×¢ÒâÔÚÒÔÉÏ´úÂëÖÐ£¬¡°X¡±ÊÇ²»º¬ÓÐ³£ÊýÁÐµÄ½âÊÍ±äÁ¿¾ØÕó£»¡°XI¡±ÊÇº¬ÓÐ³£ÊýÁÐµÄ½âÊÍ±äÁ¿¾Ø
Õó¡£ÔÚ¿¼²éÁë²ÎÊýkµÄÈ¡Öµ·¶Î§Ê±£¬¿ÉÒÔ¸ù¾ÝXX.. t t 
T µÄ¶Ô½ÇÔªËØ´óÐ¡À´Éè¶¨¡£¾ßÌå¼ûÈçÏÂµÄ´úÂë¡£
B5_Ch1_2_B.m 
% Define ridge parameter 
MuI = mean(diag(XI'*XI)); 
k = 0:MuI/10; 
È¡¾ØÕóXX.. t t 
T ¶Ô½ÇÔªËØÆ½¾ùÖµµÄÊ®·ÖÖ®Ò»×÷ÎªÁë²ÎÊýkµÄÉÏÏÞ£¬´ÓÁã¿ªÊ¼ÒÔ1Îª²½³¤²ÉÑù¡£Êµ¼ÊÔË
ÓÃÖÐ£¬¶ÔÁë²ÎÊýkµÄÈ¡Öµ²»ÄÜ¹ý´ó£¬·ñÔòÓ°ÏìÇó½â¾«¶È¡£ÕâÀïÑ¡È¡Ò»ÖÖ´Ö·ÅµÄÈ¡Öµ£¬ÆäºÃ´¦ÊÇÄÜÔÚ½Ï
´ó·¶Î§ÄÚ¹Û²ìµ½ÏµÊý½â¦Â. ËæÁë²ÎÊýkµÄ±ä»¯¶ø±ä»¯¡£¶ÔÓÚ²»Í¬µÄÎÊÌâ£¬¶ÔkµÄÈ¡ÖµÓÐÊ±Ò²ÒªÊÓÇé¿ö¶ø
¶¨¡£½ÓÏÂÀ´µ÷ÓÃridge()º¯Êý£¬×¢ÒâÏÂÃæ´úÂëÖÐº¯ÊýµÄÊäÈë±äÁ¿¡°scaled¡±µÄÖµÉè¶¨Îª0¡£

µÚ 1 ÕÂ Ê±¼äÐòÁÐ¢ò 
| 
Time Series Analysis ¢ò
B5_Ch1_2_C.m 
% Ridge regression 
ridgeBetas = ridge(y,X,k,0); 
[var_num,k_num] = size(ridgeBetas) 
figure 
plot(k,ridgeBetas(2:end,:)) 
xlim([0 max(k)]) 
legend(VarNames) 
xlabel('Ridge Parameter \itk') 
ylabel('Coefficient Estimate') 
ÔËÐÐ½á¹ûÎª£º
var_num = 
5 
k_num = 
494 
ÔÚ´úÂëµÄÔËÐÐ½á¹ûÖÐ¿ÉÒÔ¿´µ½ridge()º¯ÊýµÄÊä³ö½á¹û¡°ridgeBetas¡±ÊÇÒ»¸ö¡°var_num¡±¡Á¡°k_ 
num¡±µÄ¾ØÕó¡£ÕâÀïvar_numµÄÖµÎª5£¬ÒòÎªÓÐËÄ¸ö½âÊÍ±äÁ¿ÔÙ¼ÓÉÏ³£ÊýÏî£¬ridgeBetasµÄµÚÒ»ÐÐ¼´Îª
³£ÊýÏîµÄÖµ¡£k_numµÄÖµÎª494£¬¶ÔÓ¦µÄÊÇÁë²ÎÊýkµÄ494¸ö²»Í¬È¡Öµ£¬Ã¿¸öÈ¡Öµ¶ÔÓ¦Ã¿Ò»ÁÐ²»Í¬µÄ
¦Â. ½â¡£
ÉÏÃæµÄ´úÂëÒ²Í¬Ê±»æÖÆÁËÍ¼1.4£¬±íÃ÷ÔÚ²»Í¬µÄÁë²ÎÊýkÏÂÏµÊý½â¦Â. ËæµÄkÔö¼Ó¶ø²úÉúµÄ±ä»¯¡£
0 50 100 150 200 250 300 350 400 450 
Ridge Parameterk 
-0.02 
-0.01 
0 
0.01 
0.02 
0.03 
0.04 
0.05 
Coefficient EstimateAGEBBB 
CPFSPR 
Í¼1.4 Áë»Ø¹é»ñµÃµÄ½âÊÍ±äÁ¿ (AGE¡¢BBB¡¢CPFºÍSPR) ÏµÊýÖµËæÁë²ÎÊýkÔö´óµÄ±ä»¯
ÈçÍ¼1.4ËùÊ¾£¬µ±k=0 Ê±£¬¶ÔÓ¦µÄ¦Â. ½â¾ÍÊÇÆÕÍ¨ÏßÐÔ»Ø¹éµÄ½â£¬Ëæ×ÅkÖµµÄ±ä»¯£¬¦Â. ½âÒ²¿ªÊ¼±ä
»¯¡£ÎªÁËÈ·¶¨ºÏÊÊµÄkÖµ£¬ÕâÀï»¹ÐèÒª½øÒ»²½×·×ÙÄ£ÐÍ¾ù·½²îµÄ±ä»¯¡£ÔÚÒ»¸öÓÐn¸ö½âÊÍ±äÁ¿£¬Ã¿¸ö
½âÊÍ±äÁ¿µÄÑù±¾³¤¶ÈÎªmµÄ»Ø¹éÄ£ÐÍÖÐ£¬¾ù·½Îó²î (mean squared error, MSE) ¿ÉÓÉÊ½1-16¼ÆËã¡£

MATLAB½ðÈÚ·çÏÕ¹ÜÀíÊ¦FRM 
| 
½ðÈÚ¿Æ¼¼FintechÓ¦ÓÃ
MSE =.
mn 
1 
.¦²i 
m 
=1 
(YYi i 
. )2 
(1-16) 
»Ø¹Ë±¾´ÔÊéµÚÈý±¾»Ø¹éÄ£ÐÍµÄÕÂ½ÚÖÐ£¬µ±Ê±½éÉÜµÄÊÇ¾ù·½¸ùÎó²î (root mean squared error£¬
RMSE)£¬Ò²¾ÍÊÇMSE ¿ª·½ºóµÄ½á¹û£¬±¾ÖÊÉÏ²¢ÎÞ²îÒì¡£¸Ã²¿·ÖÄÚÈÝ»¹½éÉÜÁË²Ð²îÆ½·½ºÍ (sum of 
squares for error, SSE)£¬²¢½éÉÜÁËÈçºÎÍ¨¹ý»Ø¹éÄ£ÐÍµÄ²Ð²îÏî¦Å¼ÆËãµÃµ½²Ð²îÆ½·½ºÍ¡£¶ÁÕß¿ÉÒÔ»Ø¹ËÏà
¹ØÕÂ½ÚµÄÖªÊ¶£¬ÕâÀïÖ±½ÓÓ¦ÓÃÏÂÃæµÄ´úÂë¡£
B5_Ch1_2_D.m 
% Calculate MSE 
yhat = XI*ridgeBetas; 
RidgeRes = repmat(y,1,k_num)-yhat; 
RidgeSSE = RidgeRes'*RidgeRes; 
RidgeDFE = T_num-var_num; 
RidgeMSE = diag(RidgeSSE/RidgeDFE); 
figureplot(k,RidgeMSE) 
xlim([0 max(k)]) 
xlabel('Ridge Parameter \itk') 
ylabel('MSE') 
ÒÔÉÏ´úÂëÖÐµÄ¡°yhat¡± ¼´ÎªMSE¹«Ê½ÀïµÄ{Y. i}£»¡°RidgeRes¡± °üº¬ÁËËùÓÐ²»Í¬Áë²ÎÊýkÏÂµÄ²Ð
²îÏî£»¡°RidgeSSE¡± ÔòÊÇ²Ð²îÆ½·½ºÍµÄ½á¹û£¬×îºóµÃµ½µÄMSEÖµ´æ´¢ÓÚ±äÁ¿¡°RidgeMSE¡±ÖÐ¡£
ÒÔÉÏ´úÂëÍ¬Ê±»æÖÆÁËÍ¼1.5£¬Õ¹Ê¾ÁËMSEÖµËæÁë²ÎÊýkÔö´ó¶ø±ä»¯µÄÇé¿ö¡£Ò»°ãÇé¿öÏÂÓ¦¸ÃÑ¡Ôñ
×îÐ¡µÄMSEÖµ¶ÔÓ¦µÄÁë²ÎÊýkÖµ£¬×÷Îª×îºóµÄÄ£ÐÍ²ÎÊý¡£ÔÚ±¾ÀýÖÐ£¬ÒòÎª¸÷¸ö½âÊÍ±äÁ¿Ö®¼äÃ»ÓÐÍ»³ö
µÄ¶àÖØ¹²ÏßÐÔ£¬ËùÒÔÁë»Ø¹éÔÚ´Ë´¦µÄ×÷ÓÃ²¢²»Ã÷ÏÔ£¬Ô­À´ÆÕÍ¨ÏßÐÔ»Ø¹éµÄ½á¹ûÒÑ¾­¾ßÓÐ²»´íµÄÄâºÏ
ÓÅ¶È¡£
0 50 100 150 200 250 300 350 400 450 
Ridge Parameter k 
0.006 
0.008 
0.010 
0.012 
0.014 
MSE 
Í¼1.5 Áë»Ø¹éµÄMSEÖµËæÁë²ÎÊýkÔö´óµÄ±ä»¯

µÚ 1 ÕÂ Ê±¼äÐòÁÐ¢ò 
| 
Time Series Analysis ¢ò
1.3 Lasso»Ø¹é
±¾½Ú½«½éÉÜÁíÒ»ÖÖ»Ø¹é·½·¨¡ª Lasso»Ø¹é (Lasso regression) ¡£¸Ã·½·¨×î³õÓÚ1986 ÄêÓÉFadil 
SantosaµÈÌá³ö²¢Ó¦ÓÃÓÚµØÇòÎïÀíÑ§ (geophysics) ÁìÓò¡£1996ÄêºóÓÖ±»Ñ§ÕßÃÇÖØÐÂ·¢ÏÖºÍÉîÈëÑÐ¾¿£¬²¢
µÃµ½ÁË¸ü¹ã·ºµÄÓ¦ÓÃ¡£
ÔÚ½éÉÜLasso»Ø¹éµÄ¾ßÌåÄÚÈÝÇ°£¬ÓÐ±ØÒªÏÈ´ÓÓÅ»¯ÎÊÌâµÄ½Ç¶ÈÀ´»Ø¹ËÒ»ÏÂÖ®Ç°ÒÑ¾­½éÉÜ¹ýµÄÏßÐÔ
»Ø¹éºÍÁë»Ø¹é¡£ÏßÐÔ»Ø¹éºÍÁë»Ø¹é¶¼¾ßÓÐËüÃÇ¸÷×Ô¶ÔÓ¦µÄÓÅ»¯ÎÊÌâÐÎÊ½£¬´ó¼Ò¿ÉÒÔµ±×÷´ÓÁíÒ»¸öÊýÑ§
½Ç¶È¶ÔÍ¬Ò»¸öÎÊÌâµÄ²»Í¬ÃèÊö¡£
¶ÔÓÚÏßÐÔ»Ø¹éÄ£ÐÍ£¬¾ßÌå¼ûÊ½1-17¡«Ê½1-19¡£
yX¦Â¦Åt t t =+ (1-17) 
ÆäÖÐ£¬Xtº¬ÓÐ¸÷¸öÊ±¼äÐòÁÐ½âÊÍ±äÁ¿£¬¼´£º
Xt t t nt =....X X X1, 2, ,, ,..., (1-18) 
ÏòÁ¿¦ÂÔòÊÇXtµÄÏµÊýÏòÁ¿£¬Ôò£º
¦Â=[¦Â¦Â¦Â1 2, ,..., n]T (1-19) 
¦ÅtÊÇÎó²îÏòÁ¿£¬±íÊ¾ytÖÐÎÞ·¨±»Xt½âÊÍµÄ²¿·Ö£»¶ø¦ÂÔòÎª³£ÊýÏî¡£×¢ÒâÕâÀïÓëÇ°Ãæ½éÉÜ²»Í¬µÄÊÇ£¬
ÎªÁË¼ò½à·½±ã£¬³£ÊýÏî²¢Ã»ÓÐµ¥¶À±ê×¢³öÀ´¡£ÕâÊÇÒòÎª£¬Èç¹ûÔ­Ê¼Êý¾Ý¾­¹ý¹éÒ»»¯ºó£¬ÍùÍù²¢²»ÐèÒª
ÔÙÔÚ»Ø¹éÄ£ÐÍÖÐ°üº¬³£ÊýÏî¡£ÔÙÕß£¬Èç¹û³£ÊýÏîÊÇ±ØÐèµÄ»°£¬Ò²¿ÉÒÔÍ¨¹ýÔÚ¾ØÕóXtÖÐ²åÈëÈ«1ÁÐÏòÁ¿
À´ÊµÏÖ¡£ËùÒÔ´Ë´¦µÄ½²½âÖÐ¹ÃÇÒÏÈºöÂÔ³£ÊýÏîµÄ´æÔÚ£¬µ«¶ÁÕßÃÇÔÚÊµ¼ÊÓ¦ÓÃÖÐ»¹ÊÇÒªÊÓÇé¿ö¶ø¶¨¡£
Ê×ÏÈ£¬ÏßÐÔ»Ø¹éÄ£ÐÍµÄÓÅ»¯ÎÊÌâÐÎÊ½¿ÉÒÔÐ´³ÉÊ½1-20ËùÊ¾¡£
¦ÂyX¦Â* =.arg min 
¦Â¡Ê.
t t 2 (1-20) 
ÕâÀïµÄÓÅ»¯±äÁ¿ÊÇ»Ø¹éÏµÊý¦Â£¬ÓÅ»¯ÎÊÌâµÄÄ¿±êÊÇ×îÐ¡»¯Ä¿±êº¯ÊýyX¦Ât t.2 µÄÖµ£»¶ø¦Â* ÊÇ¸ÃÎÊ
ÌâµÄÓÅ»¯½â£¬Ê¹µÃyX¦Ât t.2 µÄÖµ×ã¹»Ð¡¡£¶øÕâÀïµÄÄ¿±êº¯ÊýÊµ¼ÊÉÏ¾ÍÊÇ²Ð²îÆ½·½ºÍ (sum of squares 
for error, SSE) ¡£
ÌØ±ðÒª½éÉÜÒ»ÏÂµÄÊÇ·¶Êý (norm) µÄ·ûºÅ2 
£¬±íÊ¾ÊÇl2 ·¶Êý¡£l2 ·¶ÊýÊÇlp·¶ÊýµÄÒ»ÖÖÌØÊâÇé¿ö£»
¶ÔÓÚÒ»¸öÏòÁ¿x =(xx x1 2, ,,.n)£¬lp·¶ÊýµÄ±í´ïÊ½ÈçÊ½1-21ËùÊ¾¡£
x p =..
..
..
¦²i=
n 
1 
xi 
p 
1 p 
(1-21) 
ÆäÖÐ£¬xi ÊÇÏòÁ¿xÖÐµÚi¸öÔªËØxiµÄ¾ø¶ÔÖµ¡£l2 ·¶Êý¾ÍÊÇµ±p=2 Ê±µÄÇé¿ö£¬¼´£º
x 2 =..
..
..
¦²i=
n 
1 
xi 
2 
12 
(1-22) 
ÆäËû³£ÓÃµÄl2 ·¶Êý»¹ÓÐl0 ·¶ÊýºÍl1 ·¶Êý£¬·Ö±ð¶ÔÓ¦p=0 Ê±µÄÇé¿ö¡£

MATLAB½ðÈÚ·çÏÕ¹ÜÀíÊ¦FRM 
| 
½ðÈÚ¿Æ¼¼FintechÓ¦ÓÃ
x 0 =..
..
..
¦²i=
n 
1 
xi 
0 
0 
(1-23) 
ÒÔ¼°p=1 Ê±µÄÇé¿ö¡£
x 1 =¦²i=
n 
1 
xi (1-24) 
ÔÚMATLAB ÖÐ¿ÉÒÔÖ±½Óµ÷ÓÃnorm(A, p) º¯ÊýÀ´¼ÆËãlp·¶Êý£¬¡°A¡±ÎªÊäÈëµÄÏòÁ¿£¬¡°p¡±¶¨Òå·¶Êý
µÄ¼¶Êýp¡£
¶ÔÓÚ·¶ÊýµÄ¸ÅÄî£¬´ó¼Ò¿ÉÄÜ¾õµÃ²¢²»ÊìÏ¤£¬µ«ÊÇ×ÐÏ¸¹Û²ìÒÔÉÏ¸÷¸ö·¶ÊýµÄ¼ÆËã¹«Ê½£¬Êµ¼ÊÉÏ¾Í
ÊÇ¶ÔÏòÁ¿ÔªËØ|xi|¾ø¶ÔÖµ·Ö±ðÈ¡p´ÎÃÝ£¬ÔÙÇóºÍ£¬È»ºó¿ªp´Î·½¸ù¡£ÈçÍ¼1.6 ËùÊ¾£¬ÒÔÒ»¸öÏòÁ¿xA = (4, 3) 
ÎªÀý£¬ÔÚ¶þÎ¬Æ½ÃæÖÐ£¬Ëü¿ÉÒÔ±íÊ¾µãAµÄ×ø±ê¡£xAµÄl0·¶ÊýxA 0 ÖµÎª2£¬