1.5 国内常用的量化交易策略_Python量化交易-QQ阅读男生科幻网

书名：Python量化交易
作者名：张杨飞
本章字数：16100字
更新时间：2025-02-16 17:08:38

1.5 国内常用的量化交易策略

本节简单地介绍国内常用的量化交易策略，分别是期货CTA策略、股票Alpha策略、期权波动率套利策略，以及高频交易策略。

1.5.1 期货CTA策略

商品交易顾问（Commodity Trading Advisor，简称CTA）是指通过为客户提供期货、期权方面的交易建议，或者通过受管理的期货账户参与实际交易，来获得收益的机构或个人。1949年，美国证券经纪人理查德·唐川（Richard Donchuan）设立第一个公开发售的期货基金，标志着CTA基金的诞生。1971年，管理期货行业协会（Managed Future Association）的建立，标志着CTA正式成为业界所接受的一种投资策略。传统意义上，CTA基金的投资品种仅限于商品期货，但近年已扩展到包括利率期货、股指期货、外汇期货在内的几乎所有的期货品种。CTA基金因为很好的业绩稳定性和与其他策略的低相关性，赢得了快速的发展。

广义上，CTA策略基本上能够分三大类，其中，趋势跟踪策略约占70%、均值回归（有时也叫价差套利）占25%左右、逆趋势或趋势反转占5%左右。但是由于趋势跟踪策略所占比重巨大及国内习惯把趋势跟踪策略等同于CTA策略（狭义理解），故在以后的章节中讲述的CTA策略特指趋势跟踪策略。

1．趋势跟踪策略

趋势跟踪策略是基于市场并非有效的假设，基本面变化的信息需要一定的传递时间，资产价格不能立即反映基本面的变化，价格向合理方向逐渐变化的过程所表现出的趋势。与正态分布相比，资产收益率的分布通常具有“尖峰肥尾”的特点，“肥尾”提供了趋势跟踪策略的收益。趋势跟踪策略的赢利与市场的波动性密切相关，存在亏损的可能，因此，趋势跟踪策略交易者要注意及时止损。趋势跟踪策略在一定程度就是“追涨杀跌”的策略，通过快速止损实现“大赢小亏”，从而在整体上获利。一般情况下，国内习惯把趋势跟踪策略简称为CTA策略。

该策略是以某资产价格的历史信息为基础，要么设置一个价格正常波动的范围（即通道），当价格突破这个范围时采取策略；要么通过长短期均线的相对运动趋势采取策略。这类策略在本质上都是一种基于市场波动强度的投资策略，在市场波动剧烈时容易获利，在市场波动较小时，收益率较低。并非每次交易都能获利，及时止损从而实现“大赢小亏”，才是趋势跟踪策略的目标。

根据所跟踪趋势级别的不同，趋势跟踪策略可分为日内短线策略和日间中长线策略。

（1）日内短线策略

日内短线策略要求所有开仓头寸都必须在日内交易时段结束前平仓出局，这种策略下资金暴露在风险中的时间最短，能获得稳定的利润收益，但也要求所选择的投资品种必须在日内有较大的波动和成交量，故这种策略选择的投资品种多为豆粕、螺纹钢、橡胶等商品。在本书之后的章节会详细地介绍由vn.py官方实现的几种经典日内短线策略。

（2）日间中长线策略

日间中长线策略主要把握市场或标的品种的中长期趋势，不同于短线策略主要依赖短期技术模型的胜率优势，建立在中长期趋势至上的量化交易策略，不仅关注技术分析，而且设定一套针对期货或其他金融品种基本面分析的基本面模型，或者两者结合。当然，这种量化交易策略的实际获利，也不会像短线策略那样被快速反映在账面之上，实际量化模型的有效性和收益率情况，也往往需要更长时间的验证。

2．价差套利策略

价差套利策略，通过捕捉市场的不合理价差，买入被低估的资产，卖出被高估的资产，获得回归收益，达到资本赢利或避险的目的。套利交易风险小、回报稳定，对于大资金而言，如果单边重仓介入，将面临持仓成本较高、风险较大的不足；反之，如果单边轻仓介入，虽然可能降低风险，但其机会成本、时间成本也较高。因此整体而言，大资金单边重仓或单边轻仓介入期市，均难以获得较为稳定和理想的回报。而大资金如以多空双向持仓介入期市，也就是进行套利交易，则既可回避单边持仓所面临的风险，又可能获取较为稳定的回报。

价差套利进一步细分为跨期套利、期现套利、跨品种套利、跨市场套利这四种。

（1）跨期套利

跨期套利是指在同一市场上同时买入、卖出同种商品不同交割日的期货合约，以期在有利时机同时将这两个交割月份不同的合约对冲平仓而获利。跨期套利是套利交易策略中最普遍的一种，可以通过对冲和交割两种方式平仓。导致配对资产价格差的主要原因是资金的不均衡和季节性因素，两合约上资金的不平衡，使得某个合约的波动速度要明显快于其他合约，从而出现套利机会。跨期套利在同一交易所内完成配对资产的交易，不需要划转资金，容易实现账面平衡。

通常情况下，跨期套利只发生在期货价格大于现货价格的情形下，因为期货价格小于现货价格时，相应操作属于投机而不是套利。以对冲进行套利时，若市场处于牛市，会导致近月合约价格上升幅度大于远月，或近月合约价格下降小于远月，此时应“买近卖远”；若市场处于熊市，会导致近月合约价格上升幅度小于远月，或下降幅度大于远月，此时应“卖近买远”。

跨期套利主要涉及季节性波动套利，而季节性波动主要是由供需的季节性变化导致的。只要供需结构不发生较大的变化，季节性波动套利的模式就有可操作性。具体到期货品种，可以考虑螺纹钢、铁矿石、焦煤、焦炭、鸡蛋、豆粕、棕榈油、白糖、塑料、玻璃和沥青期货。

季节性波动套利的焦点在于不同月份合约的强弱变化，关注的合约组合是1月和5月组合，以及9月和1月组合。以塑料为例，每年的2月到3月为春季地膜的消费旺季，9月到10月为秋季地膜的消费旺季，1月与5月合约价差在四季度走强，9月与1月合约价差在三季度走强，因此可以在地膜消费旺季到来之前开始布局价差套利策略。

（2）期现套利

期现套利是指某种商品期货合约，当期货市场与现货市场在价格上出现差距，从而利用两个市场的价格差距，低买高卖而获利，如图1-1所示。理论上，期货价格是商品未来的价格，现货价格是商品目前的价格，按照经济学上的同一价格理论，两者间的差距，即“基差”（基差=现货价格-期货价格）应该等于该商品的持有成本。一旦基差与持有成本偏离较大，就出现了期现套利的机会。其中，期货价格要高出现货价格，并且超过用于交割的各项成本，如运输成本、质检成本、仓储成本、开具发票所增加的成本等。期现套利主要包括正向买进期现套利和反向买进期现套利两种。

图1-1 期限套利

当期货价格大于现货价格时，称为正向市场。当期货价格对现货价格的升水大于持有成本时，套利者可以实施正向买进期现套利。即买入（持有）现货的同时卖出同等数量的期货，等待期现价差收敛时平掉套利头寸或通过交割结束套利。

当期货价格小于现货价格时，称为反向市场。反向套利是构建现货空头和期货多头的套利行为（在期现套利中就是做空基差），由于现货市场上不存在做空机制，反向套利的实施会受到极大的限制。

（3）跨品种套利

跨品种套利是利用存在相关性的两种商品的期货合约价格差进行套利交易，即买入某一交割时间某种商品的期货合约，同时卖出另一相同交割时间、相关联的商品的期货合约，以期在合适时机将这两种合约同时对冲平仓从而获取利润。跨品种套利的本质是寻找价格差具有相对稳定关系的相关性的商品，并捕捉两者价格差偏离正常状态的情形，采取相关的反向操作获取利润。

跨品种套利的品种一般有两类：一是选择产品与原材料，二是选择能互相替代的产品。具体国内市场而言，跨品种套利一般可以在以下品种中进行。

● 螺纹钢与铁矿石、焦炭

钢铁生产中最重要的原料就是铁矿石，其次是焦炭。钢铁生产的技术流程现已十分成熟，没有大的变化。生产1吨生铁，大约需要1.5～2吨的铁矿石、0.4～0.6吨的焦炭。因此，钢铁的价格基本上取决于铁矿石与焦炭的价格。钢铁与铁矿石的相关性很强，与焦炭的相关性次之。

● 大豆与豆油、豆粕

豆油是常用的食用油，而豆粕则可以作为动物饲料。压榨加工大豆，可以产出豆油并剩下豆粕，因此这三者之间可以进行跨品种套利。一般而言，100%大豆=18.5%豆油+80%豆粕+1.5%消耗。

● 焦煤与焦炭

焦煤是焦炭的上游产业，按照现在的生产技术，1.3吨焦煤可以产出1吨焦炭。因此，二者价格相关性强，可以进行跨品种套利。

● 热轧卷板与螺纹钢

热轧卷板是一种钢板，以板坯为原料，加热之后进行粗轧和精轧后产出。热轧卷板作为一种重要的钢材，广泛应用于基建、船舶、汽车等领域。

热轧卷板与螺纹钢同为钢材，原材料成本相近，因此两者价格具有较好的相关性。然而，由于下游消费市场具有差异，两者短期的供需关系会有不同，也就有了套利机会。

● 豆油、棕榈油与菜籽油

豆油、棕榈油与菜籽油均为食品添加剂，互为替代品。一般情况下，豆油与棕榈油、豆油与菜籽油的相关性较强，而棕榈油与菜籽油的相关性则相对弱些，因此推荐使用豆油与其他两个品种进行套利。

豆油的原料大豆主要产自美国、巴西及阿根廷，而棕榈油则一般产自印度尼西亚和马来西亚。由于不同地区的气候差异等因素，豆油与棕榈油的价差往往会出现波动，为投资者提供了套利机会。

由于菜籽油营养更为丰富且原料价格高，菜籽油的价格一般高于豆油，两者的价差一般较为稳定。同样，价差受到季节性气候等的影响，会出现一些跨品种套利机会。

● 强麦与玉米

强麦指强筋小麦。小麦和玉米是世界范围内重要的两种农作物，在粮食和饲料市场中占据相当大的份额。两者互为替代品，价格具有同涨同跌的大趋势。但由于两者的收获季节不同，受气候等因素的影响也不同，因此价差会出现波动，提供跨品种套利机会

● 沪深300指数与上证50指数、中证500指数

由于沪深300指数、上证50指数、中证500指数成分股之间存在差异，所表现出的市场走势特征有所不同。根据2007年以来市场实际走势来看，整体而言沪深300指数及上证50指数走势的相关性极强，无论是长周期或短周期，在上涨阶段或下行阶段，或震荡阶段，沪深300指数及上证50指数走势的相关性均在95%以上。而中证500指数与其他两大指数的相关性较弱，由于成份股的差异性，中证500及上证50指数的相关性最弱。

据兴证期货研发中心统计，沪深300指数及中证500指数的相关性在市场处于上涨阶段时相对较强，相关系数至78%；在市场处于下跌阶段时，中证500指数及其他两大指数的相关性较弱；在市场处于震荡阶段时，沪深300及上证50指数的相关性更强，走势相关性达99%以上。

（4）跨市场套利

跨市场套利即对同一期货品种在不同市场间进行套利。国内3个商品期货交易所并没有重复的品种，因此跨市场套利一般在国内和海外的期货交易所之间进行。对于同一种商品，交易所与原产地的距离会影响价格。

对于国内投资者而言，主要有以下几个海外市场可供套利。

● 芝加哥期货交易所（CBOT）

芝加哥是美国最大的谷物集散地，而芝加哥期货交易所早期也已有农产品的交易，如大豆、玉米、小麦。经过漫长的发展，现在的交易系统已经非常稳定和成熟。因此，我国大连商品交易所（简称大商所）的大豆、玉米及郑州商品交易所（简称郑商所）所的强麦，均可与其进行跨市场套利。

● 伦敦金属交易所（LME）

伦敦金属交易所成立于1876年，是世界上最大的有色金属交易所。伦敦金属交易所采用国际会员资格制，绝大多数的交易来自海外市场。交易所的交易品种有铜、铝、锌、铅等有色金属，可以与上期所相应的金属期货进行跨市场套利。

● 马来西亚衍生品交易所（BMD）

马来西亚衍生品交易所有世界上最具流动性和运作最成功的毛棕榈油期货（FCPO）合约，可与我国大商所的棕榈油期货进行跨市场套利。

● 纽约商品交易所

纽约商品交易所分为NYMEX和COMEX两个部分，其中NYMEX主要进行能源类商品的交易，而COMEX主要进行金属类商品的交易。COMEX具有全球最大的黄金期货交易市场，同时也有银、铜、铝等期货和期权合约。我国上海期货交易所（简称上期所）的多个金属类期货可以与其进行跨市场套利。

● 东京工业品交易所（TOCOM）

东京工业品交易所成立于1984年11月1日，是一家综合商品交易所，曾经是世界上最大的橡胶交易所。橡胶期货合约（RSS）于1952年12月12日上市交易，是世界上最早的天然橡胶期货合约。日本作为橡胶的消费国，RSS合约至今仍有足够的成交量。因此，可与我国上期所的橡胶期货进行跨市场套利。

3．反趋势策略

趋势跟踪策略追踪趋势，反趋势策略则预测拐点。反趋势策略通常运用头肩形态、突破形态、交易量等反转指标来发现趋势的转折信号，建立头寸。但是在实际运用中，反趋势策略非常小众。

不管怎样，反趋势策略提供一种与趋势跟踪策略同样有效的系统性的、保守的交易框架，使用的却是完全相反的方法。与趋势跟踪策略相比，反趋势策略通常交易区间更短，成功率更高一些，成功/失败比率更小一些。一个典型的反趋势策略将会比趋势跟踪策略交易更频繁一些，成功率在55%～60%之间，成功交易与失败交易的比率小于1.5。

大部分反趋势模型寻找卖掉短期内超买的和买入短期内超卖的机会。这有点像在等待橡皮筋拉伸到它的极限时机，打赌它们会回弹到一个相对松弛的状态。这些行为使得反趋势交易模型在市场缺乏方向性或者波动性很大时斩获颇丰，并能够在市场拐点出现的时候迅速反应。反趋势模型的缺点是在稳定的、趋势性较强的市场环境中交易经常不顺，也就是常说的“赢小钱亏大钱”。

一个短期的反趋势模型想要成功，价格必须要在指数的长期趋势或者某些其他的显著的价格点附近不断摇摆。这种市场反应意味着市场价格移动包含足够的噪声及波动性，从而带来反趋势交易的赢利机会。

1.5.2 股票Alpha策略

股票对冲策略通过做多/做空两种方式来投资股票及其衍生品（如股指期货、融资融券等）。投资范围可以是全市场，也可以专注于某些特定行业、主题。不同的基金在净风险敞口、融资杠杆、持有期、持股集中和持有股票价格范围方面有很大的差异。国内比较常见的是Alpha策略，即运用复杂的量化方法从技术面、基本面角度分析未来价格变动趋势，以及不同股票间的相关性，进而买入低估值股票的同时卖出高估值股票，或者通过股指期货对现有投资组合头寸进行完全（或部分）对冲，隔离系统风险，获取Alpha收益。该策略的成功取决于量化选股模型的有效性、对冲的覆盖程度，选股模型越有效，系统风险对冲得越好，策略效果越好。

1．Alpha的含义

拓展的资产定价模型（CAPM）如下所示。

Rs=a+Rf+βs(Rm-Rf)+ϵs

其中，Rs为现货组合的预期收益率，Rf为无风险利率，Rm为市场指数的预期收益，ϵs为误差项，α衡量了非系统性风险，βs衡量了系统性风险。投资者在市场交易中同时面临着系统性风险和非系统性风险，Alpha策略通过对系统性风险进行度量并将其分离，从而获取超额绝对收益。

（1）Alpha和Beta的关系

市场上常见的指数基金表现为：如果整个市场涨了，业绩也跟着涨，但如果整个市场跌了，业绩也跟着跌。因为它的Beta系数一般在1左右，它的收益主要来源于Beta。

若把投资组合收益率分解成Alpha和Beta两部分以后，发现一个最重要的事实，这两部分的价值是不一样的。简单地说，Alpha很难得，Beta很容易。只要通过调节投资组合中的现金和股票指数基金（或者股指期货）的比率，就可以很容易地改变Beta系数，即投资组合中来自整个市场的收益。

因此Beta很便宜，Alpha却很贵。指数基金和ETF基金是购买纯Beta的工具。因为只有Beta，所以它们一般只收取很低的管理费。没有Alpha，所以它们一定不会收取基于利润的分成费。在主动型公募基金，基金经理试图获得更好的绩效，也就是除Beta以外还想得到更多的Alpha。想获得Alpha靠的是真本领。Beta只是随大势，但“水可载舟，亦可覆舟”。国内的许多基金都只有Beta，当然这在很大程度上是因为缺乏金融工具的选择，比如在融资融券出台之前不可以沽空。大盘开始暴跌的时候，也就是“股神”神话破灭的时候。业内人士有个比喻：Alpha是肉，Beta是面。指数基金全是Beta，卖的是馒头；主动型公募基金卖的有肉有面，是包子；而对冲基金卖的就是纯肉。肉比包子贵，包子比馒头贵，贵表现在其收费模式是“2-20”，即2%基础管理费和20%业绩提成。

（2）Alpha策略的基本思想

Alpha策略是典型的对冲策略，通过构建相对价值策略来超越指数，然后通过指数期货或期权等风险管理工具来对冲系统性风险。Alpha策略属于市场中性策略，但是Alpha策略的约束更小，其Alpha来源可能是行业的、风格的或者其他的。Alpha策略注重选股，属于主动投资，相比之下，Beta策略注重对投资时机的选择，属于被动投资。

虽然量化策略的最终目标是通过各种手段获取稳定的Alpha，但是由于当今市场政策，完全对冲Beta成本过大，而且期权标的物都是大盘股，不能代表整个市场。以上种种原因导致产品无法进行完全对冲，所以现实中多数产品的收益是由Alpha与Beta两部分组成的。Beta提供的收益来源于产品对市场及风格（大小盘、成长价值等）的敞口，Alpha提供的收益来源于产品管理人的管理能力，是产品收益剔除了Beta带来的收益后所剩余的部分。所以很多打着“Alpha策略”标志的产品最终的业绩表现实际上是由Alpha与Beta共同决定的。通过量化的手段，产品仅能够获取稳定的Alpha，但是Beta带来的收益并不稳定。只有在产品Beta敞口与市场偏好相符时，Beta才会进一步增强产品的收益。反之，Beta敞口会明显削弱产品的收益。考虑到Beta对于收益的影响强于Alpha，市场整体表现的变化或者市场风格的切换都可能对于产品最终的业绩表现产生明显的影响。

（3）Alpha策略的分类

在实际中经常使用的Alpha策略主要有多因子、风格轮动、行业轮动、资金流、动量反转等。

多因子是应用最为广泛的一种策略，该策略选择一系列因子来搭建模型。通过这些因子筛选股票，满足则买入，不满足则卖出。多因子的最大优势在于，在不同的市场和行情下，因子库中总有一些因子能够发挥作用。

风格轮动是指利用市场的风格特征进行投资。市场有时会偏好小盘股，有时偏好大盘股。通过观察某些指标来判断市场的倾向性，在风格转换的初期介入，可获得较大的超额收益。

行业轮动是指市场在经济周期的作用下对各个行业产生不同的偏好。在经济周期中，我们可以按照顺序依次对各个行业进行资产配置，从而获取相比于“买入-持有”策略的超额收益。

资金流是根据资金的流向来进行选股。对于一只股票，资金流入时，股票的价格应该会上涨；资金流出时，股票的价格应该会下跌。通过观察资金流的情况，我们可以预测未来股价的变化。

动量反转是指股票的强弱变化情况，过去一段时间强的股票，在未来一段时间继续保持强势，过去一段时间弱的股票，在未来一段时间继续弱势，这叫作动量效应。过去一段时间强的股票在未来一段时间走弱，或者过去一段时间在弱的股票在未来一段时间走强，这叫作反转效应。通过判断动量反转的有效性，筛选出应该购买的股票。

（4）Alpha策略的优势

Alpha策略有三大优势：一是回避了择时这一难题，仅需专注于选股；二是波动较单边买入持有策略要小；三是在单边下跌的市场下也能赢利，Alpha与市场的相关性理论值为0。在熊市或者盘整期，可以采用“现货多头+期货空头”的方法，一方面建立能够获取超额收益的投资组合的多头头寸，另一方面建立股指期货的空头头寸以对冲现货组合的系统风险，从而获取正的绝对收益。

2．因子的分类

下面开始介绍最常见的Alpha策略：多因子策略。

对于因子的分类方法很多，整体而言，因子可以被分为基本面因子和技术面因子。基于对一只股票的不同特征的刻画，一般而言，可以将因子更加细致地分为：赢利性、估值、现金流、成长性、资产配置、价格动量和技术面因子。

（1）赢利性

与赢利性相关的因子主要反映了公司利用现有资源实现收益的能力。公司的赢利能力可以通过许多方法来衡量，例如投入资本回报率（ROIC）、已利用资本回报率（ROCE）、净资产收益率（ROE）、总资产收益率（ROA）、边际利润、人均收入、经济利润、投资增额收益率。整体而言，赢利性因子是一类效果较好的因子，即赢利性好的公司股票具有显著的正超额收益，而赢利性差的公司股票具有显著的负超额收益。

（2）估值

估值因子主要反映了股票作为一种资产的价值与其价格的相关性，但其决定性因素是该公司为其客户创造价值的多少。估值可以通过许多方法得到，但都包括了一定的定性分析和对未来的预测。常见的估值因子有：自由现金流价格比、外部融资总资产比、企业价值与EBITDA比（EV/EBITDA）、市盈率、股息率等。

市销率可以说是美国股市最有效的因子，但是在中国股市却失效。国内分析师团体更倾向于用市盈率来进行估值，主流研报上市盈率也更有市场，故市盈率可以说是中国最有效的估值因子。

（3）现金流

现金流可以分为经营性、投资性和融资活动三类。其中，经营性现金流，包括从商品销售和服务得到的现金减去生产这些产品和提供这些服务需要支付的现金流出，包括为利润支付的现金税和为债务融资支付的利息。一个公司产生的经营性现金流水平是衡量未来股市回报的一个重要指标。常见的现金流因子有：自由现金流和营业收入之比、投入资本现金回报率等。

（4）成长性

成长性因子在市场中通常获得的超额收益较为微弱。这主要因为成长性投资更多是定性而非定量的，更加依赖投资者独到且有前瞻性的眼光而非精确的数据分析，更加偏向于“艺术”而非“量化”。尽管如此，成长性仍然是我们因子库中重要的一部分。正如成长性投资者们所说的：“我所知道的投资中最大的一个错误，就是对那些最伟大公司和其他普通公司一视同仁。”在实际使用成长性因子的过程中，我们常常和其他因子结合使用，以弥补其预测性不足的劣势。常见的成长性因子有：每股自由现金流、每股盈余等。

（5）资产配置

资产配置主要涉及一家公司资本资源的使用情况，主要考虑现金来源和现金使用两方面的内容。现金来源主要包括业务经营、资产和投销售收入、发行股票和发行债券等。现金使用主要包括经营费用、业务投资、业务收购、项目或证券投资、支付现金股利、偿还债务及回购股份等。常见的资产配置因子有：净回购股份与投入资本比、一年流通股减少量、一年长期债务减少量、外部融资和总资产比、三年平均资本支出和投入资本比、收购与投入资产比等。

（6）价格动量

价格动量因子能够在一定意义上反映市场周期和投资者情绪，并依此对未来进行预测。衡量价格动量的一般指标是价格变化的速度，或一段时间内价格的变化率。正的价格动量意味着某只股票的买家数量正在不断增加，需求大于供给；负的价格动量则意味着供需平衡向卖家倾斜，供给大于需求。常见的价格动量因子有：相对强弱、价格范围、相对强弱指数等。

（7）技术面因子

技术面因子相比于基本面因子，数据更新时间快，更加注重市场的微观结构，而非股票的价值。常见的技术面因子有：强弱指标（RSI）、随机指标（KD）、趋向指标（DMI）、平滑异同平均线（MACD）、能量潮（OBV）等。由于技术面因子的Alpha往往不稳定，所以在实际应用中较为少见。

3．因子的筛选和评价

因子筛选的前提是获取充足的历史数据，包括基本的股价历史行情、基本面数据、分析师情绪指数、宏观经济数据等，可用Tushare获取各种免费或收费的历史数据，对数据质量要求更高的可用Wind或者Bloomberg获取。通过对这些海量数据进行分析，力求从中找出具有显著超额收益的因子。

（1）因子筛选的整体思路

上市公司的数据多而复杂，在对这些数据进行处理之前，我们需要对数据进行选择，即对因子进行初步的筛选。筛选因子的主要原则有：

● 数据的准确性和真实性；

● 数据的完整性；

● 数据来源的稳定性。

（2）因子评价的整体思路

在完成了因子的初步筛选之后，需要对因子进行进一步的评价。因子评价的整体思路是研究各个股票的超额收益和因子参数之间的关系。我们试图找出这样的因子：对于绝大多数股票而言，当该因子参数越大/越小时，超额收益越大/越小，或者恰好相反。总之，我们试图找出那些能够有效预测一只股票未来超额收益的因子，无论两者是正相关还是负相关。

研究股票超额收益和因子参数之间关系的方法主要有两种：

● 根据因子参数的大小对股票进行分组，计算每组的平均超额收益，并依次进行因子胜率、t检验。

● 在每一个时间点上，计算全体股票截面上的超额收益率和因子参数大小的相关系数，以及信息比率。

4．因子的组合

（1）冗余因子的剔除

由于很多因子内在的驱动原因大致相同，所以通过这些因子选出的股票往往很相似，即统计学意义上的自相关性，因子不能相互独立。所以需要剔除掉一些有效但是信息冗余的因子，即在同类的因子中只需要保留收益最好、区分度最高的那一个。

剔除冗余因子的一般方法如下：

● 取出各个有效因子在各个时间点上关于分组的序列；

● 计算这些序列的相关性矩阵；

● 得到相关性矩阵的时间序列，并求该时间序列的均值；

● 通过这个均值矩阵挑出相关性较大的因子组；

● 对于每个因子组，挑选其中有效性最好或者收益最好的一个因子作为最终的因子。

（2）因子的降维

在多因子模型的实际应用中，希望将有效的因子加以组合和处理，减少模型中变量的个数，这种减少自变量的过程叫作降维。降维有利于防止过拟合，过拟合就是把历史数据的噪声也拟合过来了，所以因子并不是越多越好。

像牛顿第二定律 F=ma，仅仅2个因子就解析万物的运动规律；爱因斯坦的质能方程E=mc2，尽管推导的过程非常复杂，用到的数学工具非常高深，但最终结论却如此之简洁漂亮；“股神”巴菲特的投资方法也被后人总结成仅仅靠6个因子就可以战胜市场。

降维的主要方法有：因子简单平均降维法、因子历史平均收益率加权平均降维法、逐步回归分析、主成分分析等。

● 因子简单平均降维法：因子简单平均降维法就是对同类的因子进行简单的等权平均处理，对因子参数求平均，作为新的复合因子。

● 因子历史平均收益率加权平均降维法：加权平均降维法就是对同类的因子按照历史平均收益求加权平均，因子的历史平均收益取各个时间点分组的第一组的收益。

● 逐步回归分析：在实际的多元回归问题中，我们总试图找到所谓“最优”回归方程，主要是指希望在回归方程中包含所有对因变量 y影响显著的自变量而不包含对 y影响不显著的自变量的回归方程。逐步回归分析正是根据这种原则提出来的一种回归分析方法。它的主要思路是在考虑的全部自变量中按其对 y的作用大小、显著程度大小或者说贡献大小，由大到小地逐个引入回归方程，而那些对 y作用不显著的变量可能始终不被引入回归方程。另外，已被引入回归方程的变量在引入新变量后也可能失去重要性，而需要从回归方程中剔除出去。引入一个变量或者从回归方程中剔除一个变量都是逐步回归的一步，每一步都要进行F检验，以保证在引入新变量前回归方程中只含对y影响显著的变量，而不显著的变量已被剔除。

● 主成分分析：主成分分析的基本思路是将原来具有相关性的一些指标组合成一组新的互相无关的综合指数来代替原来的指标。一般情况下，用原来指标的线性组合作为新的综合指标。我们认为一个综合指标的方差越大，其包含的信息也就越多。因此，在所有线性组合中，用方差最大的那一个作为第一主成分。如果认为第一主成分不能有效地反映原来的信息，我们就取另一个和第一主成分相关系数为0的线性组合作为第二主成分，依此类推。

（3）因子权重的确定

在完成了因子的筛选和降维之后，需要确定因子权重。对因子赋权的方法有很多，在此简要介绍三种：等权赋值、回归赋值、IC-IR因子赋值。

● 等权赋值：等权赋值是指在组合各个因子时对各个因子赋以相等的权重。

● 回归赋值：回归赋值是指在组合各个因子时，我们对某个时间区间上的收益率和参数因子进行最小二乘法回归，回归所得的系数向量即为各个因子的权重向量。

● IC-IR因子赋值：IC-IR因子赋值是指在组合各个因子时，考虑因子的IC序列，优化因子组合的IR值，取使得IR值最大的组合权重为最终的权重。

5．基于因子库选股

在完成了因子的筛选和组合之后，就基本建立起了自己的Alpha因子库。基于这个因子库，可以筛选出这些因子较为突出的股票，并通过这些股票实现因子的超额收益。常见的选股方法有两种，分别是打分法和回归法。

（1）打分法

打分法就是根据各个因子的大小对在一定时间内（如每2周）对一篮子股票进行打分，按照一定的权重相加得到一个总分，通过分数的高低进行股票的筛选，如购买前50名股票。基于周期打分循环，每2周调一次仓位。打分法的特点是比较稳健，不易受到特殊值的影响。

（2）回归法

回归法就是用过去的股票收益率对多因子模型进行回归，得到回归方程，把最新的因子值代入回归方程中得到一个对于未来股票值的预测，根据这个预测来进行股票的筛选。回归法的优点是能够比较及时地调整股票对各个因子的敏感性，但是回归法比较容易受到极端值的影响，导致选股失败。

1.5.3 期权波动率套利策略

期权的套利可分为无风险套利和风险套利。

无风险套利以平价公式套利为核心，辅以贴现套利、盒式套利等，其原理主要是捕捉市场交易价格与其理论价值之间差异的交易机会，并通过行权机制予以套利空间锁定的保障。由于机构投资者的大量参与及市场交易机制效率的提升，无风险套利的应用空间已大幅缩窄，策略市场容量也相对较少。

风险套利原则上都是在试图尽可能剥离掉其他因子的影响后，对期权组合中的某一风险因子进行“低买高卖”实现获利目的，如波动率、相关性及时间价值等，因此对于风险因子高低程度及未来变化趋势判断正确与否决定了此类策略的最终损益，其中要数期权波动率套利策略最为常见。

1．期权的特性

波动率交易听起来很奇怪，它是由期权本身独特的属性导致的。首先，期权是非线性衍生工具，其价值由两部分组成：内在价值和时间价值。内在价值取决于标的物的价格相对行权价的涨跌；而时间价值与到期日密切相关，它是随着持有时间增加而衰减的。

根据Black--Scholes期权定价公式，期权的价值由5个因素组成，每一个因素的改变都会导致期权价格的改变，对期权价格影响最大的是标的价格（S），其次是隐含波动率（σ），下面详细介绍一下这5个因素。

● 标的价格（S）：标的价格上涨会增加看涨期权价值，但它们的关系并非线性，即标的上涨1%，看涨期权Call可能会上涨1.5%，期权上涨由Delta和Gamma两个部分组成。

— Delta衡量标的资产价格变动时期权价格的变化幅度，当标的价格上涨s%时，Delta对看涨期权Call的贡献是增加s×Delta。

— Gamma衡量的资产价格变动时Delta的变化幅度，期权价格变动相对于标的物价格变动的二阶导数。Delta和Gamma的关系类似于速度和加速度的关系。当标的价格上涨s%时，Gamma对看涨期权Call的贡献是增加0.5×s2×Gamma。

● 执行价格（K）：执行价格上涨，会降低看涨期权Call的价格，即随着 K的上升，Call的类型会逐渐从实值期权（ITM）过渡到平值期权（ATM），再到虚值期权（OTM）。需要注意的是，执行价格是合约一开始就定下来的，不存在执行价格变化的风险。

● 隐含波动率（σ）：标的价格波动增大会增加看涨期权的价值，因为波动率越大，意味着标的物可能涨得更快，因此能获利更多。Vega衡量标的资产价格波动率变动时，期权价格的变化幅度，当标的价格波动率上涨 σ%时，Vega对看涨期权Call的贡献是增加 σ×Vega。一般而言，远月合约相对流动性不足，敏感度更大，因此，Vega适合远月合约操作。

● 无风险利率（r）：利率改变也会影响期权价格。Rho衡量利率转变对期权价格变化幅度。由于中国是利率管制国家，所以利率变化风险可以忽略不计。

● 到期时间（T-τ）：期权存在时间价值，随着到期日临近，该价值会逐渐衰减。Theta衡量时间变化对期权理论价值的影响，表示时间每经过一天，期权价值会损失多少。

总之，期权波动率交易，本质上就是对Delta，Gamma，Theta和Vega的管理。

2．交易波动率的优势

交易期权的策略主要可以分为两大类：交易标的方向和交易波动率，也就是常说的方向性交易和波动率交易。

在方向性交易中一般是不用考虑希腊值（Delta，Gamma，Theta和Vega）的，但是会暴露更大的风险。例如买入看涨期权或看跌期权来做一个方向性的交易，Gamma基本上没有什么用，因为这时候你肯定已经很清楚你买入了正值的Gamma。这个正值的Gamma在标的资产价格上涨时会增加看涨期权的Delta，在标的资产价格下跌时会增加看跌期权的Delta。正值的Gamma会使得期权头寸在越来越实值的过程中Delta越来越大，从而增加赢利能力。简单地说，在方向性交易中，正值的Gamma在赚钱的时候会让你加速赚钱，在亏钱的时候会让你减速亏钱。

波动率交易对于交易方向的优势就是更低的风险和更大的收益。大量的学术研究表明，股票的价格基本属于随机游走的状态，波动率是标的物（即期货）对数收益率的方差，而且存在均值回归，即可以通过研究历史隐含波动率来预测未来波动率的大小。一句话总结：标的物是涨是跌太难猜了，波动率变化更好猜。从概率上看，波动率交易比方向性交易的胜率更大，

3．波动率套利

波动率套利的收益不依赖于标的资产的价格变动方向，而依赖于标的资产的价格波动情况，其核心是寻找期权的隐含波动率和市场的实际波动率的价差，并对其进行相应交易。换句话说，如果预测的波动率与期权的隐含波动率有显著不同，就可以通过相应的期权交易进行获利。需要补充的是，预期波动率指期权交易者根据市场情况与历史数据对未来的价格波动率做出的一种预测，是对未来波动率的一种估量；隐含波动率是指实际期权价格所隐含的波动率。它是利用Black-Scholes期权定价公式将期权实际价格以及除波动率σ以外的其他参数代入公式而反推出的隐含波动率。期权的实际价格是由众多期权交易者竞争而形成的，因此，隐含波动率代表了市场参与者对于市场未来的看法和预期，从而被视为最接近当时的真实波动率。

在众多波动率套利策略中，又以Gamma Scalping策略最为常见（简单）：通过对波动率的预测，每天对冲Gamma以获得高抛低吸的利润。

首先需要用到当月或者近月的平价期权（ATM）通过对冲Delta的方式构造跨式期权。平价期权拥有更大的Gamma值，但是近月合约由于有更好的流动性，其敏感程度相对于远月合约要小得多，即Vega相对较小，即Gamma负责赢利，Theta负责亏损。跨式期权具有0Delta、正Gamma、负Theta和正Vega的特点。

若预测近期股市会出现暴涨暴跌行情，即预期波动率大于隐含波动率，则买入跨式期权。该策略的利润源自Gamma贡献的价值足够大来覆盖Theta的时间成本，也就是说（0.5×s2×Gamma - Theta）>0。当行情真的有大波动时，其实现波动率要大于隐含波动率，Gamma Escaping策略就会赢利。反之，若预测错误，Gamma的赢利覆盖不了Theta的时间成本，策略就会出现亏损。

总的来说，就是：

● 预期波动率>隐含波动率，做多Gamma。预测对了，当日赢利，反之亏损。

● 预期波动率<隐含波动率，做空Gamma。预测对了，当日赢利，反之亏损。

4．动态对冲

与买股票价格上涨，平仓获利离场一样，当Gamma的贡献足够大时，也需要对冲Delta，获利离场（假设当天建仓Delta为0，Gamma会在第二天产生新的Delta）。相对于50ETF期权，对冲物有3种，分别是50ETF、上证50股指期货和看涨看跌期权合成期货。效果最好的是用期权合成期货来对冲，其优势是杠杆高、成本低、流动性好。

有了对冲物之后，可以考虑如何进行动态对冲了。常见的有以下3种动态对冲方法。

（1）定时对冲：在一定时间周期内进行对冲，可以是每天收盘前对冲，也可以每隔15分钟或30分钟对冲来锁定部分日内波动。

（2）阈值对冲：通过自动对冲算法，设定Delta阈值，突破时瞬间对冲锁定短时间波动赢利，例如等Delta冲到5000时全部对冲，让Delta归零、再次积累。

（3）智能对冲：通过CTA信号或高频信号来实时判断标的物的涨跌方向，当仍然有趋势时智能判断对冲Delta的数量，这样可以捕捉到更大赢利机会，而且节省手续费。

1.5.4 高频交易策略

高频交易（High Frequency Trading，简称HFT）是指从那些人们无法利用的、极为短暂的市场变化中寻求获利的自动化程序交易，比如某种证券买入价和卖出价差价的微小变化，或者某只股票在不同交易所之间的微小价差。这种交易的速度如此之快，以至于有些交易机构将自己的“服务器群组”安置到了离交易所的服务器很近的地方，以缩短交易指令通过光缆传送的时间。一般是以高频做市商/套利算法进行非常高速的证券交易，从中赚取证券买卖价格的差价。

总的来说，HFT可以概括为5方面：

● 依据市场高频数据，使用复杂的计算机程序和算法生成订单，并将订单送到指定的市场上去。

● 具有超低的网络信息延迟，这通常通过“联位服务”或者“接近主机服务”将交易系统托管到交易所的数据中心实现。

● 在极短的时间内完成建仓、持仓、清仓，通常整个过程的时间为几秒钟，最多不超过数分钟。

● 在短时间内提交并撤销大量的订单。

● 市场中性，不隔夜持仓。

1．高频交易策略的类型

（1）高频做市商

高频做市商策略是在交易所挂限价单进行双边交易以提供流动性。所谓双边交易，是指做市商手中持有一定存货，同时进行买和卖两方交易。这种策略的收入包括买卖价差、交易所提供的返佣和固定佣金。

每交易一笔都有返佣，返佣的数值一般很小（远远小于价格最小变动单位，比如若设价格最小变动单位为一分，那么报价只能取100.1元或100.2元），但如果交易笔数巨大，积少成多，便可以成为不菲的收入。通过赚取返佣，做市商只需要保证每笔交易不赔即可，并非一定要追求低买高卖，反而要保证自己的委托单尽可能多地被执行，以争取更大的流量。为了做到这一点，下单和改单的速度是个关键，这也是为什么这一行如今被以速度见长的高频交易商把持的原因。

佣金比返佣更吸引人。做市商只需保证每月或每天参与一定规模的交易，就可以再额外从交易所处获取一笔不小的收入。这种模式的好处在于，做市商不仅不用追求买卖价差，甚至连流量也不需争抢，只要完成限定的额度即可，难度大大降低。

（2）高频套利

套利策略注重两种高相关性的产品之间的价差。比如说一个股指ETF的价格，理论上应该等于组成该ETF的股票价格的加权平均。但因为种种原因，有时会发现市场上这两种价格并不一致，此时即产生套利机会，可以买入价低一方，同时卖出价高一方，以赚取差价。随着市场流动性的增强，这种机会发生的次数越来越少，规模越来越小，并且机会经常转瞬即逝，因此往往需要借助高频交易的技术来加大搜寻的规模和把握交易时机。例如，其应用场景可以是跨市套利。

（3）短趋势策略

短趋势策略即意味着预测一定时间内的价格走势。相对于低频的趋势策略，高频交易的主要数据源是比Tick级别数据更精确的交易委托账本（Order Book Events），所以可以在委托单的粒度上进行分析和预测来抓大单的动向。Tick级别数据其实就是一种对交易委托账本的降采样，其前提假设是：最佳买卖价是最重要的信息，以丢弃其他相对不如这个重要的信息为代价，缩减数据规模，让数据处理变得更容易。

2．高频交易策略的特征

（1）低延时

高频交易对网络延时极度敏感。解决办法是采用近邻等方法缩短交易主机与交易所之间的空间距离，通过高速或专有通信网络/网卡降低通信延时。联位服务（Co-location）是交易所提供的主机托管服务，把客户的主机放在交易所的数据中心，通过减少物理距离的方法以期获得订单到达交易所的最小延时。

国内四大期货交易所都有自己的机房，中金所是数讯机房，上期所在张江机房和上期大楼，大商所和郑商所在其本地也有自己的机房。只有期货公司可以租用交易所的托管机房机柜，并为量化客户提供托管服务。国内期货交易所的交易数据为每500毫秒一次快照，提前收到数据，可以更快做出反应，有很大优势。高频机构自购设备，自行调优后，经期货公司同意，放到租用机柜内进行交易，通过承担单独席位和柜台的成本，以达到市场最快层次的反应速度。

网络架设方案有光纤和微波。微波比光纤的延时要低很多，延时敏感的应用一定要选择这种线路。这个差距首先受制于光在光纤中的传播速度只有在空气中的2/3左右。另外，在大城市建筑密集地区，光纤的复杂布线会进一步增大延时，差距可能增至2到3倍。微波技术有两个主要的缺点：第一是微波在空气里传播受天气影响很大，刮风下雨都会导致通信受损；第二是带宽太小，如果是跨交易所的业务，不可能通过微波来转移大流量的市场数据，只能用来收发下单指令。所以采用微波线路时一般光纤作为备用线路。网卡要求是其网络栈上的I/O延时，收包、发包加起来能达到2～3微秒。

（2）专用性硬件

硬件上，新式的刀片（Blade）服务器被大规模地部署为高频交易主机。刀片服务器通过精简的空间设计与整合，能够大幅度地缩小主机空间，单机便能够安置64个CPU，使得一个典型的数据中心能够部署上万个CPU。这极大地降低了算法主机代管的成本，提高了近邻部署算法主机的经济性。

而专用芯片的发展进一步提升了通用性芯片的计算能力，特别是图形处理器（GPU），以及现场可编程门阵列（FPGAs）等专用芯片在高频交易领域得到重视。GPU具有多个芯片核心和极强的运算能力，现阶段单个GPU具有500个核。通过优化程序，即可方便地利用GPU实现大规模运算。而FPGAs芯片省却了传统计算机中内存与CPU之间指令通信，直接实现算法与芯片之间的联系，具有极好的运算和执行优势。当前国内只允许用FPGAs来接收行情，用FPGAs来交易是违法的。

（3）先进的算法

为了快速、实时地分析和处理海量数据，在算法设计上需要借助于一些先进、有效的方法。比如，Hadoop即能够有效地利用多台（上万台）服务器对PB量级（1PB≈1000TB≈1百万GB）的金融数据进行分割处理。同时，分析计算的方法也逐渐由传统的解析统计过渡至非参统计。新式工具和方法使得高频交易的算法系统不再单一地依靠价格、交易量等信息，进一步地结合语义分析、数据挖掘等构建更为“智能”的系统。