1、量化出资的鼓起,源于经济展开到必定程度后对本钱商场发生的新需求,即在越来越杂乱的本钱商场环境中,出资要能发生长时刻安稳的报答。作为许多出资办法中的一种,量化出资的根本过程是获取海量的数据、依据数据开掘和剖析拟定买卖战略、然后履行买卖战略获取收益。相较于片面出资,具有不受人道缺陷影响、持股数量多且涣散、职业装备均衡、不会被板块轮动和职业风格切换影响的特色。
2、多因子量化模型的呈现,是出资范畴思维办法的一次革新。多因子量化模型注重影响股价走势的要素,将这些要素进行体系化处理,构成包含微观、职业、上市公司根本面、买卖面等不同类型的因子,经过对因子进行不同办法的装备,到达获取本钱商场某种类型收益的效果,这一思路简化了问题的剖析办法,操作上直指问题中心。依据多因子量化模型能够衍生出Alpha战略、商场中性战略、指数增强战略、CTA战略等,因而成为量化出资组织研讨与实践的柱石战略。
3、经过比对私募产品中量化选股战略和自动办理战略的绩效发现,量化出资在获取更高的收益、操控动摇和回撤等方面的确是具有必定优势。无论是公募基金仍是私募基金,量化出资战略的研讨和产品发行在曩昔的三年都取得了长足的展开,全体成绩逾越基准,体现杰出。
4、多因子量化模型因为具有时效性问题,致使职业界竞赛加重,“内卷”严峻。战略同质化的效果是战略买卖拥堵,导致战略动量溃散,进而使超量收益大幅回撤。为防止这一问题,许多出资组织开端测验新办法,包含活跃寻觅不同频率的因子、加强机器学习与深度学习等AI办法的运用、选用特殊数据开发战略等。鉴于量化出资在国内的展开方兴未已,新的数据类型、新的战略和新的技能的不断运用,预计会推进量化出资有更好的展开。
量化出资,是指经过数量化办法构建模型,并由核算机程序自动化买卖,以获取安稳收益为意图的出资办法。其在海外展开已有30多年前史,因为成绩相对安稳,商场规划和比例不断扩展,得到越来越多出资者的认可。
从经济学的视点看问题,供应与需求是一项根本的剖析办法。假如咱们运用这种办法看待量化出资或许说量化买卖的呈现与昌盛,实乃是瓜熟蒂落之事。
美国在上世纪80年代,跟着人均可支配收入的前进、养老金入市,在个人和组织的联合推进下,本钱规划敏捷扩张,有权益财物装备的需求。同期阶段,美国股票商场大展开,构成了多元的结构化本钱商场。1975-1990年,美国GDP从1.68万亿美元添加至5.96万亿美元,CAGR为8.79%。经济添加带来居民财富的沉积堆集,个人可支配收入也显着提高,从1975年的1.22万亿美元添加至1990年的4.32万亿美元,CAGR为8.78%。美国经济向好,公司运营效益提高,居民财富快速堆集,寻求财富增值需求提高。
美国在上世纪八九十年代养老金入市与一起基金展开相辅相成。美国一起基金分别在1979-1981年以及1984-1986年有两轮高速添加,到1990年,美国一起基金净值规划打破万亿到了1.06万亿美元,较1975年添加超20倍,CAGR为23.3%。同期,IRAs规划扩张,养老金逐渐入市。一起基金占IRAs出资财物比重(IRAs出资一起基金规划/IRAs总规划)从1980年的4.2%提高至1990年的22.3%,规划也从10亿美元添加至1420亿美元。从一起基金规划构成视点(IRAs出资一起基金规划/一起基金总规划),1990年IRAs账户贡献了一起基金总规划的13.3%。
以养老金为代表的组织出资者鼓起,因为资金特色原因,对出资方针提出了新要求,即能获取长时刻、安稳的收益。面对本钱商场标的数量飙升、办理规划急剧扩展,传统片面出资办法很难处理这一问题,而量化出资办法对此能方便的处理。
供应要素首要有几个方面:1)现代金融理论的展开供给了理论支撑;2)核算机技能的遍及和广泛运用供给了技能支撑;3)买卖成本的快速下降使量化出资变得切实可行。
现代金融理论肇始于1960年代,由威廉·夏普、林特纳等提出的CAPM定价模型,对本钱商场均衡状况下财物危险与预期收益率联系给出清晰界说。传统财物定价首要依据现金流贴现法,精度虽高,但无法处理折现模型中每个参数估量都具有很大随机性的缺陷。CAPM等金融定价模型跳过了杂乱易错的现金流猜测模型,能敏捷给成百上千股票预算预期收益率,搭档更着重危险对收益率的影响。
互联网的鼓起,让核算机和金融严密交融。核算机技能的前进使得海量数据处理成为或许,挑选出能带来超量收益的各类“大概率”事情,模型化为因子经查验后构建战略,然后经过自动化买卖来严格履行战略。全球化与金融组织间的竞赛,推进了买卖费率的下降,且这一趋势有不断连续的或许。
综上,用更为直白的话来说,量化出资的鼓起,是因为本钱商场上股票多了,资金也多了,用传统人工办法股票欠好选、资金也难办理。新的金融理论告知咱们,用数学、核算机的办法能处理这些问题,又恰逢买卖成本下降,量化就应运而生了。
哲学家高清海在给弟子做序时说了一句话,“这个世界上,有什么的改动,能比人类思维办法的改动更让人激动人心吗?”。从对股票的注重,转为对因子的注重,也是出资范畴思维办法的一次重要革新。
多因子定价模型(Multifactor Pricing Model)的提出,起先是为了处理财物定价的问题,理论的中心是认为财物的收益能够被其他要素所解说,如未来预期收入、消费品价格走势等,这些要素也被称为因子。跟着金融业的展开,学者和从业者们发现该模型相同也可用于股票的定价,即认为股价的动摇能够用多个根本面因子或技能面因子来解说,多因子模型也由此被广泛的运用于股票定价。
多因子模型极大的下降了猜测作业量。关于一个包含N只股票和K个因子的体系而言,咱们运用多因子模型,实质的作业是将关于N只股票的收益—危险猜测,转变成关于K个因子的收益—危险猜测。以一个1000只股票和20个因子组成体系而言,猜测从1000只股票的预期收益和危险转换为对20个因子的预期收益和危险的猜测。特别是关于危险的猜测,若对1000只股票估量协方差矩阵,需求猜测N*(N-1)/2=4950个相联系数。协方差矩阵中包含的独立参数太多,假如选用前史数据的样本方差和协方差,估量值既不安稳也不合理。因为选用前史数据进行估量,采样时刻长度为T,要求TN(即T1000)。
按照多因子模型最惯例的月度频率,需求的数据逾越80年,这显着不现实,一起也不合理,因为公司根本面数据是在不断发生改变的。假如咱们转为对20个因子构成的体系进行核算,跟着猜测杂乱程度的下降,猜测的精度大幅提高。
为了更好地了解多因子模型,按照理论开展的先后顺序,对相关的定价模型做一个扼要整理。
1、本钱产定价模型(CAPM)。是由美国学者夏普等人于1964年提出,理论首要以马科维茨的出资组合理论和本钱商场为根底展开起来的,是现代金融商场价格理论的支柱。代表性公式为:
2、APT模型。金融学者Ross认为,CAPM用单一的商场因子来解说股票的收益问题或许不完全反响现实状况。为处理这一问题,Ross于1976年提出了套利定价模型(Arbitrage Pricing Theory,简称APT)。APT模型认为,套利行为是现代有用商场(即商场均衡价格)构成的一个决定要素,假如商场未到达均衡状况的话,商场上就会存在无危险套利时机,套利行为会使得商场从头回到均衡状况。APT模型用多个要从来解说危险财物的收益,并依据无套利准则,得到危险财物均衡收益与多个要素之间存在(近似的)线性联系。APT模型用简练的公式为能够表明为:
3、多因子定价模型。股票或许组合的预期收益率是与一组影响它们的体系性要素的预期收益率线性相关的,这是APT模型的中心思维。多因子模型(Multiple-Factor Model, MFM)正是依据APT模型的思维展开出来的完好的危险模型。与APT有所不同的是,包含了之后有详细因子呈现的定价模型,比方Fama-French三因子和五因子便是多因子模型中的代表。以Fama-French三因子模型为例,公式能够简练的表明为:
Barra结构化危险模型是现在全球最闻名的多因子模型之一。依据Barra手册的内容,多因子模型被分为两部分,收益模型和危险模型。
关于个股收益的两个组成部分,不同的出资办法寻求不同的部分。定量办理首要从核算的视点研讨因子收益率的改变规则,而且从组合的视点对因子露出进行办理以逾越基准;定性办理首要研讨个股的残差收益率,即从因子视点无法解说的超量收益率。定量办理首要研讨
已知股票在每个因子上的露出,经过多因子的收益猜测模型,估量各个因子的因子收益率,然后得到股票的预期收益率,这便是多因子收益模型的首要思路。
多因子危险模型的根本思路为,经过估量因子的协方差矩阵描写股票池未来的动摇危险。然后对选股效果以及装备仓位进行二次优化,一般表达形式为:
依据对理论头绪的整理和经典模型的回忆,能够对多因子模型的构建流程做一个扼要的表述。
1)根底数据收集:首要需求确认原始因子调集,然后按照原始因子调集逐一进行因子原始数据的收集和核算作业;
2)数据标准化:因为原始数据的量纲不一致,为确保数据之间的可比性和可叠加性,要对原始数据进行标准化、去量纲的作业;
3)辨认有用因子:原始因子调集是在逻辑上被认为与股票收益率存在关联性的要素,实证中并不是每个原始因子和股票收益率都存在相关性,因而需求对原始因子进行有用性查验,扫除跟收益率相关性不高的因子。
大类因子是指在逻辑上具有必定相似性的因子,在实证中这些因子之间也很有或许体现出很强的相关性,即共线性问题。为尽量多的保存有用信息,需求首要依据因子所属大类对其进行处理,比方进行因子组成,或许尽量选择效果显着,而且相关性不高的因子调集进行保存。
假如因子之间存在显着的多重共线性,那么进行多元线性回归时,会使得模型的估量失真或许难以估量精确,所以在进行多元线性回归之前需求进行因子共线性剖析,除掉相对不重要可是会对模型构成共线性搅扰的因子。
假如回归的残差项具有不同的方差,则称回归模型存在异方差。假如存在异方差,则传统的最小二乘回归得到的参数估量量不是有用估量量,所以在进行多元线性回归之前有必要进行残差的异方差剖析。依据Barra的文档,能够选用个股流转市值的平方根作为权重进行加权最小二乘法回归,经实践在大部分截面期上能够消除异方差的影响。
因为因子每期收益或多或少存在不安稳性,为确保模型的安稳性,需求对因子前史收益序列进行剖析,给出下一期因子收益的合理预期值。因为许多因子存在清晰的经济意义和出资逻辑,所以因子收益的方向(±号)需求进行束缚。
依据因子收益和每个股票的因子载荷核算出个股的预期收益率。公式表明为,预算出T+1期的因子收益率向量后
1)核算因子收益率协方差矩阵:依据因子收益率的前史序列,核算出因子的协方差阵;
1)确认组合的收益方针:能够是两种,一种是确认方针收益,然后最小化危险;别的一种是确认危险方针,然后最大化收益。
3)职业权重束缚:依据危险方针确认职业危险的露出。假如组合存在基准组合,则需求依据基准组合在各个职业的权重散布,确认职业违背束缚。
4)因子露出束缚:多因子模型自身是一个寻求宽度的模型,所认为防止在某些因子上露出过大导致危险过高,需求对因子露出进行必定的束缚。
5)个股上下限束缚:因为卖空束缚以及防止在个股上露出过高的危险,所以需求对个股权重的上下限进行束缚。
6)二次规划求解组合权重分配:依据股票预期收益、因子收益率协方差矩阵和残差危险估量获取的个股预期危险—收益数据集,以及职业束缚、因子露出束缚和个股上下束缚的条件,选用二次规划的办法,核算组合中的个股权重。
7)模仿成绩回溯:依据每期确认的组组成份股及权重分配,对模型进行模仿成绩回溯。综上所述,根本流程总结成图标1所示的多因子剖析结构图。
量化多因子模型构建过程中每一步都很重要,但找到有用的因子,是重中之重。有用因子应该满意两个条件:第一是在逻辑上应该和收益率存在必定的相关性;第二是在实证中的确和收益率存在比较显着的相关性。
商场危险、职业危险、风格危险是影响股票收益最首要的三种要素,在验证风格因子有用性时,有必要考虑商场因子和职业因子的影响。关于商场因子和职业因子的处理办法有两种:1)商场因子和职业因子一起归入模型;2)仅归入职业因子,而将商场因子包含在职业因子中。
所谓有用因子,便是和收益率存在很显着相关性的因子,即满意前面的t的第一点和第二点。依据第三点,能够大致将有用因子分红收益类因子和危险类因子。收益类因子:即因子收益率序列的t值显着不等于0,因子收益率的方向性相对清晰,这类型的因子,用前史序列对下一期的因子收益进行猜测时,相比照较精确,所以称之为收益类因子。危险类因子:即因子收益率序列的t值在0邻近,因子收益率的方向性相对不清晰,这类型的因子,用前史序列对下一期的因子收益进行猜测时,危险比较大,所以称之为危险类因子。
收益类因子是多因子模型超量收益的首要来历,在模型中是需求危险露出相对多的因子。而危险类因子也需求要点注重,因为危险类因子是进行危险操控的要点,需求危险露出尽量少。
在实践核算中,因子k的IC 值一般是指个股第T期在因子k上的露出度与T+1期的收益率的相联系数。因子IC 值反映的是个股下期收益率和本期因子露出度的线性相关程度,是运用该因子进行收益率猜测的稳健性。在运用IC值点评因子有用性时,能够预先对因子进行提纯,扫除职业、市值等重要要素的影响,使效果更清楚。注要点如下:1)IC值序列的均值及绝对值均值:判别因子有用性;2)IC值序列的标准差:判别因子安稳性;3)IC值序列大于零(或小于零)的占比:判别因子效果的一致性。
按照因子值对股票进行打分,构建出资组合回测,是最直观的衡量目标好坏的手法。一般来说,关于比较有用的因子(如市净率),分红3~5层进行回测,各个出资组合的终究净值一般能够保序。分红N层(N5)进行回测时,能够用终究净值的秩相联系数来衡量因子的好坏(秩相联系数的绝对值越挨近1时效果越好)。
分层回测办法比较直观但无法确保其对其他因子的露出中性。需求结构纯因子模型,即对单一因子露出为1,关于其他露出为0的模型。
其间,X为因子露出矩阵,由1个国家因子、S个职业因子和M个风格因子构成。假定横截面标的数为N,则是一个N×(1+S+M)阶的矩阵。w为职业全体活动市值,参加该约束条件是因为在回归方程中引入了国家因子,而职业因子之和为1,这会导致解的不仅有性。所以需求参加职业市值权重的约束,确保解的仅有。为处理异方差性,在回归时运用根号活动市值为标的加权,构建N×N阶对角矩阵V,
该矩阵的每一行对应一个纯因子组合,运用该组合乘以标的当期超量收益率即可得到当期的纯因子收益率。
对量化模型绩效的调查,首要从收益和危险两个视点来调查。收益方面,能够调查年化收益率、年化超量收益率等;危险方面,能够调查年化动摇率、最大回撤、夏普比率等。依据这些目标,也衍生出许多的衡量战略绩效的目标,不再赘述。一起,对多因子模型的收益和危险也需求进行剖析,探明来历。
(1)Fama-French三因子模型:该模型是依据Fama and French(1992)的效果构建的。因为CAPM不能解说某些所谓的金融异象,学界和业界对其不断提出质疑。Fama and French在1992年将各种CAPM无法解说的异象进行了整合,完全推翻了人们对CAPM的观点:他们在传统CAPM的根底上参加了价值因子(High-Minus-Low,即HML)和规划因子(Small-Minus-Big,即SMB),提出了Fama-French三因子模型,然后成为多因子模型的开山祖师。
(2)Carhart的四因子模型:因为Fama-French的三因子模型在“适用性”上仍然有许多约束,特别是无法解说许多异象中的截面动量异象。Carhart在1997年论文中,将截面动量因子参加到Fama-French三因子模型,然后提出了Carhart四因子模型。
(4)Fama-French五因子模型:Fama和French在2015年,在以往三因子模型的根底上添加了盈余和出资两个因子,提出了新的五因子模型
有用因子都有一个时效性问题。跟着量化买卖规划的快速添加,量化多头赛道益发拥堵,战略同质化问题逐渐闪现,想要获取超量收益困难重重。量化多头战略的超量收益首要来历于选股,而选股需求不计其数个因子。当最有用的因子被越来越多的头部组织发现并运用时,本来行之有用的因子就会面对失效的问题。私募之间的,尤其是头部私募,运用各种手法寻觅有用的因子,不断加速战略的迭代,期望能够抢占盈余的先机。
因子与战略同质化促进组织不断测验新的办法。2021年3季度开端,国内的指数增强基金的超量收益快速回落,2022年10月又一次呈现相似状况。背面的原因便是当战略不断同质化时,战略拥堵导致动量溃散并进而带来超量收益的大幅回撤。战略同质化成为公募、私募展开量化买卖有必要要注重的问题。许多组织现已作出一些活跃的测验。例如,机器学习和深度学习等新技能在量化出资范畴的运用日益多起来了。
近年来,跟着特殊数据供给商的不断添加,数据全体质量有了显着提高。也有越来越多的组织出资者开端测验将一些特殊数据运用到出资实践中。这些依据特殊数据的战略显着不会像传统战略那样拥堵,也将有用地改进战略拥堵的问题。展望未来,新的数据类型、新的战略、新的技能的不断运用,将有用处理因子买卖拥堵、战略拥堵的问题。
多因子模型是量化出资的柱石。提及量化出资时,就会不得不提“多因子模型”,因为多因子模型是组织进行量化出资的重要组成部分。多因子模型的构建涉及到选股、财物装备、仓位办理、危险操控等方方面面的内容,对多因子模型稍加改造,就能够得到Alpha战略、CTA战略、商场中性战略、指数增强战略等。多因子模型的优势在于,能够经过有限的因子对很多个股进行有用挑选,下降了选取标的的难度,经过合理猜测做出判别。
多因子选股战略尽管选用了量化出资的办法,但背面体现的是基金司理的自动选股思路。与传统的自动选股基金比较,多因子模型与选股战略以其共同的优势,被越来越多的国内量化出资者所选用。
从收益与危险操控才能两个视点调查量化型私募产品的成绩。依据国金证券的核算,在近3年,私募基金产品中,量化选股战略(中高频)与股票自动战略比照,前者相应指数在3年内累计收益水平为64.14%,最大回撤为-24.48%;后者相应指数在3年内累计收益水平为30.53%,最大回撤为-32.20%。从盈余才能和操控危险才能两方面考虑,量化出资办法具有必定的优势。
因为2022年权益商场全体走弱,私募证券出资基金的存续规划呈现萎缩。依据基金业协会数据,存续总规划从2021年末的61247.38亿元萎缩到了2022年末的55622.85亿元,同比削减了9.18%。存续私募证券出资基金产品数量稳步攀升,从2021年末的76839只上升到了2022年末的92604只,同比添加20.52%。
在当时的私募证券出资商场中,约有20%的资金是经过量化办法办理,2019年至2021年是国内私募量化高速展开时期,规划敏捷攀升。在2022年增速放缓,大部分头部量化私募的规划有所削减。百亿量化私募是商场注重的焦点。据招商证券核算,到2022年末,有办理规划在百亿以上的头部量化私募27家,算计办理规划逾越国内悉数量化私募办理规划的50%。
在产品成绩方面,相同是据招商证券核算,2022年CTA战略产品体现好于权益类产品收益。其间,CTA量化套利战略的归纳收益为4.42%、CTA趋势战略的收益为2.19%;权益类产品,中性战略的收益为0.66%,而量化多头战略收益则为-11.02%。私募量化产品一般选用多战略运转,很难简略将某只产品划分为量化多因子类型的战略,也正如前面所述,多因子战略是根底型战略,衍生出各种其他类型战略。从终究的出资形式来看,量化多头战略与多因子战略或许最为附近。考虑到沪深300等重要商场表征指数在2022年均有-20%以上的跌幅,量化多头战略全体-11.02%的收益率,现已是远超商场走势了,体现可谓杰出。
公募基金相关数据相对简单取得。到2022年末,公募量化产品总计434只,包含自动量化产品219只,指数增强产品191只,对冲型产品24只。公募量化产品的总规划达2447.11亿元,包含自动量化产品685.89亿元,指数增强产品1636.79亿元,对冲型产品124.44亿元。相较于2021年末,公募量化产品数目添加34只。在规划方面,2022年度公募量化产品全体规划比2021年末削减380亿元。
要点调查自动量化型基金的收益状况。该类型基金在2022年均匀收益为-20.14%,收益的中位数为-20.22%。收益最高为12.23%,收益最低为-43.98%。将调查期间放宽,曩昔3年和曩昔5年自动量化基金的均匀年化收益分别为7.55%和5.43%。与首要宽基指数比照来看,其曩昔5年的均匀年化收益高于除创业板指以外的首要商场宽基指数,体现杰出。
量化出资的鼓起,是源于经济展开到必定程度后对本钱商场发生的需求。它与片面出资相同,是许多出资办法的一种,根本过程便是获取海量的数据、依据数据开掘和剖析拟定买卖战略、然后履行买卖战略获取收益。相较于片面出资,具有不受人道缺陷影响、持股数量多且涣散、职业装备均衡、不会被板块轮动和职业风格切换影响的特色。
多因子量化模型注重影响股价走势的要素,将这些要素进行体系化处理,构成包含微观、职业、上市公司根本面、买卖面等不同类型的因子,经过对因子进行不同办法的装备,到达获取本钱商场某种类型收益的效果,这一思路简化了问题的剖析办法,操作上直指问题的中心。依据多因子量化模型能够衍生出Alpha战略、商场中性战略、指数增强战略、CTA战略等,因而成为量化出资组织研讨与实践的柱石战略。
经过比对私募产品中量化选股战略和自动办理战略的绩效能够发现,量化出资办法在获取更高的收益、操控动摇和回撤等方面的确是具有必定优势。无论是公募基金仍是私募基金,量化出资战略的研讨和产品发行在曩昔的三年都取得了长足的展开。全体成绩逾越基准,体现杰出。
职业界竞赛加重导致多因子量化模型时效性问题益发严峻。量化出资范畴的剧烈竞赛,致使新的有用因子一旦为商场开掘,会有许多量化组织开发依据该类型因子的出资战略。战略同质化的效果是战略买卖的拥堵,导致战略的动量溃散,进而使超量收益大幅回撤,因子有用应的持续时刻也会相应缩短。为防止这一问题,许多的出资组织开端测验新的办法,包含活跃寻觅不同频率的因子、加强机器学习与深度学习等AI办法的运用、选用特殊数据开发战略等。鉴于量化出资在国内的展开方兴未已,新的数据类型、新的战略和新的技能的不断运用,预计会带来量化出资的更好展开。