因子模型举例：主成分分析-CDA数据分析师官网

热线电话：13121318867

因子模型举例：主成分分析

2018-08-26

因子模型举例：主成分分析

我之前提到的因子风险主要包括经济的(知利率)、基本面的(如账面市值比率)和技术的(如前期收益率)。获得一个包含大童股票的投资组合因子风险的历史数据，并用于对因子模型进行回测，对于独立交易员来说是非常昂贵且不切实际的。不过，有一种因子模型，其构建只依核于历史收益率。这个方法叫做主成分分析(PCA)。

用主成分分析构建因子风险和因子收益率，必须假设因子风险在估计的时间段内是不变的(时间独立)。(这排除了表示均值回归或惯性的因子，因为这些因子风险都与前期收益率有关)。更重要的是，如果假设因子收益率之间“不相关”，协方差矩阵bbT就是对角矩阵。如果用协方差矩阵RRT的特征向量作为APT方程R=Xb+u中矩阵X的列向量，可知bbT的确是对角矩阵，并且矩阵RRT的特征值正好扰是因子收益率b的方差。但是，如果因子数量与股票数量相等，我们就不需要使用因子分析了，因为只要选取几个具有较大特征位的特征向黄就能构成矩阵X。特征向量的个数是一个需要优化的交易模型参数。

下面的MATLAB程序展示了一个对S&P60。小盘股使用主成分分析的可能交易策略。这一策略仅设因于收益率具有惯性，即从本期到下期。因于收益率的值保持不变。因此，可以买入基于这些因子的期望收益率最高的股票，卖出期望收益率最低的股票。如果发现这一策略的平均收益率为负，表明对收益率具有惯性的假设是不合适的，或者策略的特有收益率太大了以至于策略失效。

clear;

%使用回望交易日作为佑计区间(训练集)，以此来决定因子风险

%回望期交易日为252天，因子5个

%交易策略为：购买下一个交易日期望收益率最高的50只股票topN = 50；

%选用SP600小盘股做测试(此MATLAB二进制辑入丈件包含交易日，股票，开盘价，最高价，最低价，收盘价)

load('IJR 20080114');

mycls=fillMissingData(cl);

positionsTable=zeros (size(cl));

写dailyret的行是在不同时间段上的观察值

dailyret=(mycls一lagl(mycls))/lagl(mycls)；

for t=lookback+1:length(tday)

% R的列是不同的观刻对象

R=dailyret(t-lookback+一:t.:)’;

%不考虑所有收益率缺失的股票

hasData=find(all(isfinite(R)，2));

R=R(hasData,:);

avgR=smartmean(R,2);

%移去均值

R=R-repmat(avgR，[1 size(R,2)]);

%计算不同股票收益率的协方差拒阵

covR= smartcov(R')；

% X是因子风险矩阵，B是因子收益率的方差

%用covR的特征值作为X的列向量

[X,B]=eig(covR);

%保留的因子数为numFactors

X(:，1:size(X，2)-numFactors) =[];

% b是从时间t-1到t的因子收益率

results=ols(R(:，end)，X);b= results.beta;

% Rexp是假设因子收益率保持常数时。下一个时间段的期望收益率

Rexp=avgR+X*b;

[foo idxSort]=sort(Rexp，'ascend');

%做空期望收益率最低的50只股票

positionsTable(t，hasData(idxSort(1:topN)))=-1;

%做多期望收益率最高的50只股票

positionsTable(t,. ..

hasData(idxSort(end-opN+1:end)))=1;

end

%计算交易策略的每日收益率

ret=...

smartsum(backshift(1，positionsTable).*dailyret,2);

%计算交易策略的年化收益率

avgret=smartmean(ret)*252%收益率很低

%avgret=

%-1.8099

程序中使用了smartcov函数来计算多只股票日收益平向量的协方差矩阵。与MATLAB内置的cov函数不同，smartcov函数忽略了收益率缺失的交易日(包括NaN值)。

function y=smartcov(x)

% n个有限元素的协方差

% 行为观测值，列为变量

% 用N标准化，而非N-1

y= NaN (size(x,2) , size(x, 2 ));

xc= NaN(size(x));

goodstk=find(～all(isnan(x)，1));

xc(:，goodstk)=...

x(:,goodstk)-repmat(smartmean(x(:,goodstk)，1)，...

[size(x,1)1];%移去均值

for m=1:length(goodstk)

for n=m:length(goodstk)

y(goodstk(m),goodstk(n))=...

smartmean(xc(:，goodstk(m)).

*..xc(:，goodstk(n)));

y(goodstk(n),goodstk(m))=y(goodstk(m) ,goodstk(n));

end

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

特征特征向量 PCA

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇趁热再说几句区块链

下一篇如何让用户留下来并产生价值

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

因子模型举例：主成分分析

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】主成分分析（PCA）实战全解析：从原理简 ...

【CDA干货】解析数据分析中基准比的本质：离基准值 ...

CDA数据分析师：驾驭业务数据分析全步骤，赋能业务 ...

【CDA干货】信贷违约率的统计分布特征与测算方法研 ...

【CDA干货】业务效果AB增量评估体系：搭建、实操与 ...

CDA数据分析师：以战略分析方法为翼，赋能企业长远 ...

【CDA干货】复杂抽样的统计描述：方法、要点与实操 ...

【CDA干货】详解聚合函数：可一次使用多个吗？实操 ...

CDA数据分析师视角：战略数据分析与业务数据分析的 ...

【CDA干货】详解B+树叶子节点指针：双向还是单向？ ...

【CDA干货】警惕！REPLACE(UUID(), '-', '')用于INS ...

CDA数据分析师与商业数据分析总体流程：全链路实操 ...

【CDA干货】通过标准差与平均值关系衡量数据波动性 ...

【CDA干货】基于GB标准的t检验、F检验与显著性差异 ...

CDA数据分析师与统计制图：以可视化赋能数据叙事与 ...

【CDA干货】箱线图上下限在线计算：原理、工具与实 ...

【CDA干货】多重共线性下的变量保留策略：平衡信息 ...

CDA数据分析师与六种核心分析方法：从工具到价值的 ...

【CDA干货】特征重要性分析：从模型到业务的核心决 ...

【CDA干货】关联分析之支持度：核心指标的本质、应 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载