1、下载的数据文件
barra 提供 ftp, https 等下载方式。每天有两个压缩数据文件需要下载。以 20230602 为例,需下载下面两个压缩文件:
SMD_CNE5_X_ID_230602.zip
:代码映射表文件。SMD_CNE5S_100_230602.zip
:数据文件。
其中代码映射表文件SMD_CNE5_X_ID_230602.zip
解压后会有 2 个文件:
CHN_X_Asset_ID.20230602
:交易所代码和 SEDOL 代码到 barra 代码的映射表CHN_Asset_Identity.20230602
:用处不大。
数据文件SMD_CNE5S_100_230602.zip
解压后会有下面文件:
CNE5S_100_Asset_LSR.20230602
CNE5S_100_Asset_Data.20230602
CNE5S_100_Covariance.20230602
CNE5S_100_DlyFacRet.20230602
CNE5S_100_Asset_Exposure.20230602
CNE5_Daily_Asset_Price.20230602
CNE5_100_Asset_DlySpecRet.20230602
CNE5_Rates.20230602
CNE5_ESTU_POR.20230602
2、文件的文本格式
对于代码映射或基础数据等文件,内部都是文本。第一行标记数据日期,第二行标记每一列的含义,中间的数据行为|
隔开的数据。最后还有一行[End of File]
标记数据结束:
!ReleaseDate:20230602
!Barrid|AssetIDType|AssetID|StartDate|EndDate
CHNCCR1|LOCALID|CN600030|20021219|20751231
CHNCCR1|SEDOL|6579355|20021219|20751231
CHNCCR2|LOCALID|CN600030|20141117|20751231
CHNCCR2|SEDOL|BP3R2J5|20141117|20751231
[End of File]
如果是模型计算出来的数据文件,前面还会多一行标记模型类型,其它格式和上面是一模一样的:
!ModelVer:100
!ReleaseDate:20230602
!Barrid|Factor|Exposure|DataDate
.......
[End of File]
3、文件内容
3.1、CHN_X_Asset_ID
代码映射表
这个文件里保存了交易所代码和 SEDOL 代码到 barra 代码的映射表。在 barra 的数据文件里都是直接用 barra 代码。所以需要从代码映射表里找到该代码实际对应的股票代码。
在使用中,我们还需要注意因为陆股通使得 barra 的 ID 和数据重复问题。
!ReleaseDate:20230602
!Barrid|AssetIDType|AssetID|StartDate|EndDate
CHNCCR1|LOCALID|CN600030|20021219|20751231
CHNCCR1|SEDOL|6579355|20021219|20751231
CHNCCR2|LOCALID|CN600030|20141117|20751231
CHNCCR2|SEDOL|BP3R2J5|20141117|20751231
[End of File]
3.2、CNE5S_100_Asset_Exposure
因子敞口数据
因子敞口数据是 barra 最重要的数据,给出每个股票每天在各个因子上的敞口。CNE5S 模型有 10 个风格因子,加上每个股票都有的一个行业和国家因子,每个股票每天有 12 行数据。
!ModelVer:100
!ReleaseDate:20230602
!Barrid|Factor|Exposure|DataDate
CHNCCR1|CNE5S_BETA|0.91|20230602
CHNCCR1|CNE5S_MOMENTUM|0.57|20230602
CHNCCR1|CNE5S_SIZE|1.208|20230602
CHNCCR1|CNE5S_EARNYILD|0.439|20230602
CHNCCR1|CNE5S_RESVOL|-1.572|20230602
CHNCCR1|CNE5S_GROWTH|-0.036|20230602
CHNCCR1|CNE5S_BTOP|0.945|20230602
CHNCCR1|CNE5S_LEVERAGE|0.845|20230602
CHNCCR1|CNE5S_LIQUIDTY|0.652|20230602
CHNCCR1|CNE5S_SIZENL|-0.657|20230602
CHNCCR1|CNE5S_DVFININS|1|20230602
CHNCCR1|CNE5S_COUNTRY|1|20230602
[End of File]
3.3、CNE5S_100_DlyFacRet
因子收益率
因子收益率也是 barra 最重要的数据,给出每天每个因子的收益率。CNE5S 模型有 10 个风格因子、1 个国家因子和 32 个行业因子。CNE5S_100_DlyFacRet
每天的文件会给出历史所有记录(从 19900129 年以来的)。
!ModelVer:100
!ReleaseDate:20230602
!Factor|DlyReturn|DataDate
CNE5S_BETA|-3.443859E-05|19990129
CNE5S_MOMENTUM|-1.564585E-04|19990129
CNE5S_SIZE|-1.047402E-03|19990129
CNE5S_EARNYILD|-1.453471E-03|19990129
CNE5S_RESVOL|-1.843232E-03|19990129
CNE5S_GROWTH|-3.709701E-04|19990129
CNE5S_BTOP|6.569393E-04|19990129
CNE5S_LEVERAGE|-1.739708E-04|19990129
CNE5S_LIQUIDTY|-7.664097E-04|19990129
CNE5S_SIZENL|-1.863131E-03|19990129
CNE5S_ENERGY|1.994788E-03|19990129
CNE5S_CHEM|4.399217E-04|19990129
CNE5S_CONMAT|-2.044277E-03|19990129
CNE5S_MTLMIN|-1.174190E-03|19990129
CNE5S_MATERIAL|-1.770242E-03|19990129
CNE5S_AERODEF|-8.989575E-03|19990129
CNE5S_BLDPROD|-7.176786E-03|19990129
CNE5S_CNSTENG|-1.473432E-03|19990129
[End of File]
3.4、CNE5S_100_Covariance
因子协方差
因子协方差用来重构股票之间的协方差数据。这是一个年化的以 bp 为单位的数据。比如CNE5S_BETA
和自己的协方差数据为为 15.9 ,实际为万分之 15.9 ,这也表示该因子的年化波动率大约 4%。
!ModelVer:100
!ReleaseDate:20230602
!Factor1|Factor2|VarCovar|DataDate
CNE5S_BETA|CNE5S_BETA| 1.59053006E+01|20230602
CNE5S_BETA|CNE5S_MOMENTUM| 1.02944587E+00|20230602
CNE5S_BETA|CNE5S_SIZE|-2.84729723E+00|20230602
CNE5S_BETA|CNE5S_EARNYILD|-1.15448036E+00|20230602
CNE5S_BETA|CNE5S_RESVOL| 6.37676522E+00|20230602
CNE5S_BETA|CNE5S_GROWTH| 2.06186169E+00|20230602
[End of File]
3.5、CNE5_100_Asset_DlySpecRet
残余收益率
CNE5_100_Asset_DlySpecRet
里是每个股票除开因子可以解释外的剩余的收益率数据。
!ModelVer:100
!ReleaseDate:20230602
!Barrid|SpecificReturn|DataDate
CHNCCR1|-0.21|20230602
CHNCCR2|-0.21|20230602
[End of File]
3.6、CNE5S_100_Asset_LSR
残差风险
CNE5S_100_Asset_LSR
给出了股票的残差风险数据,单位是 bp。
!ModelVer:100
!ReleaseDate:20230602
!Barrid|RootID|Elasticity|RootSpecificRisk|DataDate
CHNCCR1|CHNCCR1|1|15.346459|20230602
CHNCCR2|CHNCCR2|1|15.346459|20230602
[End of File]
3.7、CNE5_Daily_Asset_Price
股票原始数据
CNE5_Daily_Asset_Price
里是一些股票的原始数据,包括价格、收益率、总市值等。
!ReleaseDateTime:20230602 18:40:57
!Barrid|Price|Capt|PriceSource|Currency|DlyReturn%|DataDate
CHNCCR1|20.19|2.4724099752E+11|MSCIBARRA|CNY|0.4478|20230602
CHNCCR2|20.19|2.4724099752E+11|MSCIBARRA|CNY|0.4478|20230602
[End of File]
3.8、CNE5_ESTU_POR
股份数据
这个文件也是基础数据文件,保存了每个股票的股本数据。和其它基础数据不一样,会多一个第一行标记 Vendor。
!Vendor:MSCIBARRA
!ReleaseDate:20230602
!Barrid|Shares
CHNAAA2|317109630
CHNAAB2|1961325774
CHNAAC2|710914605
[End of File]
Q. E. D.