barra 数据文件格式解析

作者: , 共 4490 字 , 共阅读 0

1、下载的数据文件

barra 提供 ftp, https 等下载方式。每天有两个压缩数据文件需要下载。以 20230602 为例,需下载下面两个压缩文件:

  • SMD_CNE5_X_ID_230602.zip:代码映射表文件。
  • SMD_CNE5S_100_230602.zip:数据文件。

其中代码映射表文件SMD_CNE5_X_ID_230602.zip解压后会有 2 个文件:

  • CHN_X_Asset_ID.20230602:交易所代码和 SEDOL 代码到 barra 代码的映射表
  • CHN_Asset_Identity.20230602:用处不大。

数据文件SMD_CNE5S_100_230602.zip解压后会有下面文件:

  • CNE5S_100_Asset_LSR.20230602
  • CNE5S_100_Asset_Data.20230602
  • CNE5S_100_Covariance.20230602
  • CNE5S_100_DlyFacRet.20230602
  • CNE5S_100_Asset_Exposure.20230602
  • CNE5_Daily_Asset_Price.20230602
  • CNE5_100_Asset_DlySpecRet.20230602
  • CNE5_Rates.20230602
  • CNE5_ESTU_POR.20230602

2、文件的文本格式

对于代码映射或基础数据等文件,内部都是文本。第一行标记数据日期,第二行标记每一列的含义,中间的数据行为|隔开的数据。最后还有一行[End of File]标记数据结束:

!ReleaseDate:20230602
!Barrid|AssetIDType|AssetID|StartDate|EndDate
CHNCCR1|LOCALID|CN600030|20021219|20751231
CHNCCR1|SEDOL|6579355|20021219|20751231
CHNCCR2|LOCALID|CN600030|20141117|20751231
CHNCCR2|SEDOL|BP3R2J5|20141117|20751231
[End of File]   

如果是模型计算出来的数据文件,前面还会多一行标记模型类型,其它格式和上面是一模一样的:

!ModelVer:100
!ReleaseDate:20230602
!Barrid|Factor|Exposure|DataDate   
.......
[End of File]   

3、文件内容

3.1、CHN_X_Asset_ID 代码映射表

这个文件里保存了交易所代码和 SEDOL 代码到 barra 代码的映射表。在 barra 的数据文件里都是直接用 barra 代码。所以需要从代码映射表里找到该代码实际对应的股票代码。

在使用中,我们还需要注意因为陆股通使得 barra 的 ID 和数据重复问题

!ReleaseDate:20230602
!Barrid|AssetIDType|AssetID|StartDate|EndDate
CHNCCR1|LOCALID|CN600030|20021219|20751231
CHNCCR1|SEDOL|6579355|20021219|20751231
CHNCCR2|LOCALID|CN600030|20141117|20751231
CHNCCR2|SEDOL|BP3R2J5|20141117|20751231
[End of File]   

3.2、CNE5S_100_Asset_Exposure 因子敞口数据

因子敞口数据是 barra 最重要的数据,给出每个股票每天在各个因子上的敞口。CNE5S 模型有 10 个风格因子,加上每个股票都有的一个行业和国家因子,每个股票每天有 12 行数据。

!ModelVer:100
!ReleaseDate:20230602
!Barrid|Factor|Exposure|DataDate     
CHNCCR1|CNE5S_BETA|0.91|20230602
CHNCCR1|CNE5S_MOMENTUM|0.57|20230602
CHNCCR1|CNE5S_SIZE|1.208|20230602
CHNCCR1|CNE5S_EARNYILD|0.439|20230602
CHNCCR1|CNE5S_RESVOL|-1.572|20230602
CHNCCR1|CNE5S_GROWTH|-0.036|20230602
CHNCCR1|CNE5S_BTOP|0.945|20230602
CHNCCR1|CNE5S_LEVERAGE|0.845|20230602
CHNCCR1|CNE5S_LIQUIDTY|0.652|20230602
CHNCCR1|CNE5S_SIZENL|-0.657|20230602
CHNCCR1|CNE5S_DVFININS|1|20230602
CHNCCR1|CNE5S_COUNTRY|1|20230602
[End of File]   

3.3、CNE5S_100_DlyFacRet 因子收益率

因子收益率也是 barra 最重要的数据,给出每天每个因子的收益率。CNE5S 模型有 10 个风格因子、1 个国家因子和 32 个行业因子。CNE5S_100_DlyFacRet每天的文件会给出历史所有记录(从 19900129 年以来的)。

!ModelVer:100
!ReleaseDate:20230602
!Factor|DlyReturn|DataDate
CNE5S_BETA|-3.443859E-05|19990129
CNE5S_MOMENTUM|-1.564585E-04|19990129
CNE5S_SIZE|-1.047402E-03|19990129
CNE5S_EARNYILD|-1.453471E-03|19990129
CNE5S_RESVOL|-1.843232E-03|19990129
CNE5S_GROWTH|-3.709701E-04|19990129
CNE5S_BTOP|6.569393E-04|19990129
CNE5S_LEVERAGE|-1.739708E-04|19990129
CNE5S_LIQUIDTY|-7.664097E-04|19990129
CNE5S_SIZENL|-1.863131E-03|19990129
CNE5S_ENERGY|1.994788E-03|19990129
CNE5S_CHEM|4.399217E-04|19990129
CNE5S_CONMAT|-2.044277E-03|19990129
CNE5S_MTLMIN|-1.174190E-03|19990129
CNE5S_MATERIAL|-1.770242E-03|19990129
CNE5S_AERODEF|-8.989575E-03|19990129
CNE5S_BLDPROD|-7.176786E-03|19990129
CNE5S_CNSTENG|-1.473432E-03|19990129
[End of File]   

3.4、CNE5S_100_Covariance 因子协方差

因子协方差用来重构股票之间的协方差数据。这是一个年化的以 bp 为单位的数据。比如CNE5S_BETA和自己的协方差数据为为 15.9 ,实际为万分之 15.9 ,这也表示该因子的年化波动率大约 4%。

!ModelVer:100
!ReleaseDate:20230602
!Factor1|Factor2|VarCovar|DataDate
CNE5S_BETA|CNE5S_BETA| 1.59053006E+01|20230602
CNE5S_BETA|CNE5S_MOMENTUM| 1.02944587E+00|20230602
CNE5S_BETA|CNE5S_SIZE|-2.84729723E+00|20230602
CNE5S_BETA|CNE5S_EARNYILD|-1.15448036E+00|20230602
CNE5S_BETA|CNE5S_RESVOL| 6.37676522E+00|20230602
CNE5S_BETA|CNE5S_GROWTH| 2.06186169E+00|20230602
[End of File]

3.5、CNE5_100_Asset_DlySpecRet 残余收益率

CNE5_100_Asset_DlySpecRet里是每个股票除开因子可以解释外的剩余的收益率数据。

!ModelVer:100
!ReleaseDate:20230602
!Barrid|SpecificReturn|DataDate
CHNCCR1|-0.21|20230602
CHNCCR2|-0.21|20230602
[End of File]

3.6、CNE5S_100_Asset_LSR 残差风险

CNE5S_100_Asset_LSR给出了股票的残差风险数据,单位是 bp。

!ModelVer:100
!ReleaseDate:20230602
!Barrid|RootID|Elasticity|RootSpecificRisk|DataDate
CHNCCR1|CHNCCR1|1|15.346459|20230602
CHNCCR2|CHNCCR2|1|15.346459|20230602
[End of File]

3.7、CNE5_Daily_Asset_Price 股票原始数据

CNE5_Daily_Asset_Price里是一些股票的原始数据,包括价格、收益率、总市值等。

!ReleaseDateTime:20230602 18:40:57
!Barrid|Price|Capt|PriceSource|Currency|DlyReturn%|DataDate
CHNCCR1|20.19|2.4724099752E+11|MSCIBARRA|CNY|0.4478|20230602
CHNCCR2|20.19|2.4724099752E+11|MSCIBARRA|CNY|0.4478|20230602
[End of File]

3.8、CNE5_ESTU_POR 股份数据

这个文件也是基础数据文件,保存了每个股票的股本数据。和其它基础数据不一样,会多一个第一行标记 Vendor。

!Vendor:MSCIBARRA
!ReleaseDate:20230602
!Barrid|Shares
CHNAAA2|317109630
CHNAAB2|1961325774
CHNAAC2|710914605
[End of File]

Q. E. D.

类似文章:
barra 提供的数据里存在重复。比如 600030.SH ,我们可以看到它有两个 barra 的 ID ,分别为 CHNCCR1 和 CHNCCR2。
经济金融 » barra, cne5s
BARRA 的 CNE5S 模型里有一个 MOMENTUM 动量因子。无论从它的因子名字还是下面的计算方法上看,它都是一个动量:
msci barra 开发的 CNE5S 模型是中国 A 股最常用的风格因子模型。它包含 10 个风格因子,分别是 BETA、MOMENTUM、SIZE、EARNYILD、RESVOL、GROWTH、BTOP、LEVERAGE、LIQUIDTY、SIZENL。
所有数据都来自于 msci barra 的 CNE5S 模型。
风险管理 » VaR Primer
在一个大型的组合中,有成千上万只不同的证券,但不同证券的价格可能受到同样的因素所驱动,比如同一个国家的债券几乎都受到该国的基准利率所影响。为了简化 VaR 的计算,通常将那些最根本的因素挑选出来,这些因素被称为风险因子。根据风险因子的状态,计算证券的价格被称为估值。
户外 » 亲子骑行
周末骑共享单车沿北京四环内环顺时针骑行了一圈,一路吃吃喝喝玩玩,花了 8 个小时,实际骑行时间大约 5 个小时。
编程 » django, html, http, axios
我们用访问网页动态数据时,经常会提交一些参数,比如用axios.get