何绪纲:AI算法技术很大程度上解决了投资效率问题

    来源: 和讯期货 作者:佚名

    摘要: 12月10日,由华泰期货主办的“新格局再启航2021衍生品市场年会”在杭州开幕。此次活动由上海期货交易所、郑州商品交易所、大连商品交易所和华泰证券(601688,股吧)支持。和讯期货参与图文直播。

      12月10日,由华泰期货主办的“新格局 再启航 2021衍生品市场年会”在杭州开幕。此次活动由上海期货交易所、郑州商品交易所、大连商品交易所和华泰证券(601688,股吧)支持。和讯期货参与图文直播。

      据了解,此次年会聚焦基于大类资产配置的以期货衍生品为特色的财富管理,以及黑色建材、贵金属有色、能源化工、农产品(000061,股吧)、金融科技共六大主题,力邀国内衍生品市场领军人物、大宗商品研究与实践专家、头部实体企业负责人等,共同展望2021年投资之道及中国衍生品市场发展之未来。

      12月10日上午的金融科技分论坛上,华泰期货研究院量化研究总监何绪纲出席论坛并以“投研科技最新之AI技术初音——乘风破险”为主题发表演讲。

      何绪纲:AI算法技术很大程度上解决了投资效率问题

      何绪纲表示,目前AI模型的学习方式是场景学习的概念。面对复杂的金融市场,既有Alpha的影响,也有未能够明显觉察的弱Alpha因子影响,通过在一个尺度进行分解,寻找不同因子的维度,与历史进行对比,就可以看除历史上发生了什么。在相同的条件下,他主要描述的敞口点就是我们现在主要描述的一个截面的回归因子,通过对历史的学习,对现在做出判断,并且对未来作出一定的猜测。

      另外一些商品的多因子实际为基础多因子+截面多因子,解决了商品投资有无的问题,如何进行投资,如何对风格进行暴露,如何又对不同风格的敞口进行管控,模型的落地实际上是很大程度上帮我们解决了,这是一个很好的起点。同时我们又是数据的基础,正是算法的基础最主要的口粮来源,目前算法技术的发展和应用,实际上很大程度上解决投资的效率的问题。

      以下为文字实录:

      非常感谢侯峻院长的介绍,希望我也能够吸粉做一点贡献。谢谢主持人,谢谢到场的各位领导嘉宾,以及线上的各位听众。

      今天非常荣幸能参加华泰期货举办的2021年的衍生品市场的年会,我今天的主题比较明确就是投研科技最新之AI技术初音,我这边的主要的报告给大家的话题就是AI技术在金融领域的应用,具体到期货市场的应用,这边主要会介绍策略开发里面获得的一些经验和教训,跟大家一起做一个分享。

      我简要介绍一下今天我的主讲内容:

      因为AI技术本身算是新兴的技术,我具体我们的AI技术在做什么?很可能是一片空白,这样我就分了几部分做一个介绍,会在第一部分简单介绍人工智能的发展历史;和重要的事件目前其应用最为成功的领域,以及在金融领域的跨界借鉴角的一些度。

      了解到人工智能的发展的历史以后,我们就想知道,我们在金融领域如何点开AI棵科技树如何点开呢?我我会取一些模型的核心算法逻辑介绍我尝试将一些复杂的问题能够简单的给大家介绍清楚,让大家有一个背景的知识了解,这样便于我们在下面部分的内容的理解。

      第三部分讲到数据与建模,数据是最关键的核心因素旨意,这里我们要着重强调,新技术的应用并不都具有排他性。实际上,AI类型模型是在另一个应用的层面上整合了现有的大量金融数据,以及多种有效的数据处理方法。就我们现在的研发进展来看,我们相信AI技术的成熟应用将会是与新技术现有金融科技高度融合,最终达成的一种全新业态。

      当我们这是一个探索性的东西,我们今天的课题也是叫做AI技术应用的初音。我这边篡改了一位我非常喜欢的德国哲学家的名言,一位德国哲学家曾经说过:他这样考虑人性的问题,我很难从自己的身上找到困难,但是除此之外,我无处可寻。我相信这一天也会到来,我们想在一步一步的走,它终就在人类身上学会了智慧。

      第一章讲一下人工智能的发展历史,其实这边的一个发展历史的话,大家会看到一个比较多的历史事件,但是从我们的想提示的一个角度,实际上我们注意两个比较重要的特征,可能就是比较有趣的,首先第一点人工技术最早的发展,实际上来自于1950年,最初他的一个设计的思路是这样的,他希望能够通过人工智能技术让机器模仿人的思维方式,那么如何去模仿以及怎么样的一个互动实际上就是对人类语言的一个理解,所以在最初的时候,几乎所有的AI技术都在倾向于设计出一套技术和系统,他能够通过灵实验,学这个尝试持续了很长时间,并且主导了AI技术的发展,在AI进入冬天前面的这一段时间,几乎都是在做这样的努力,当然到了近期这一步已经获得了突破性的进展,我们知道语音识别AI技术实际上是在人工智能这个技术的应用,是具有突破性的一个领域。同时我们也会发现实际上在金融领域哪她们有相当好的应用我记得两三年前我还在美国工作的时候,业内大家会有这样的探讨,那个时候比较稳定盈利的AI技术的策略就是自然语言识别策略这样的话会运用到舆情分析的角度,当然现在今时不同往日,我们看到有很多成功的案例。

      在AI冬天结束的时候有标志性的事件,国际围棋大师输给了机器人。那就是AlphaGO他是什么样的学习模式是怎么样战胜人类棋手的呢?他实际上对于模式的识别,他会寻找模式中不同的成功的概率,寻找到最有机会取胜的模式在下棋,这一点我们在应用AI的模型里面最至关重要的一点,我想稍微澄清一下,我们现在在业内交流的时候,大家都会尝试有新技术的突破和发展我们可不可以拿来用?我们对这一点表示怀疑,AI技术有明确的有时点,他本质的特征是对模式的识别,我们在金融领域里面我们需要识别什么样的模式?有什么样的复杂价格传导模式需要我们去探索?这是我们在应用AI技术的切入点,实际上我们对于具体使用什么样模型并不关心,我们关心的在使用过程中在金融数据过程中处理的时候发生了效果。

      因为他是作为一个算法的出现他大量的应用或者是突破性的领域基本上都是法密集应用的领域。我们大家可能也都比较熟悉了,无人驾驶汽车—自动驾驶作,其实这是一个非常有趣的案例,这边有一个非常重要的理解的模式,可以揭示出我们如何去设计AI的模型。我们看到无人驾驶汽车结合一种场景类型的学习,需要分析路况,需要分析驾驶者处于的一个目标是什么样的目标,他需要去收集以及符合自己的决策是符合交通规则的,那么实际上他有多样化的限制和多种的特征限制这个算法并且在这样的框架下达到最优的算法。这在我们考虑到金融市场的时候具有很强的类别的特征,也就是他使用的是一种场景学习的模式,他学习大量的一个驾驶的场景,这个时候他就有机会得到了一个最优的驾驶的操作的模式,金融市场也是这样。

      前面陈辰提到的,我们华泰期货最近刚刚研发成功的商品模型,商品多因子模型,这个实际上就是描述市场的角度。而另外描述市场的角度像大家比较熟知的,技术指标,行情的盘点数据,他们都是对市场的不同角度的描述,都是限制和约束的条件,如何在这样的条件下能学到有用的价格传导的模式做出最优的选择,这样的逻辑才是我们模型切入的逻辑。范围广泛,深入到各个领域,基本上也多以我们前面提到的几类算法应用为主。

      金融业应用最早的是在反欺诈领域。因前面王总已经提到了,欺诈的甄别在这个角度的话实际上是非常有趣的一个模型的优势的体现,是什么?因为AI模型识别的是一种模式或者是partn,他最终做到的对大量的情形的一种分类,不管你在什么样的情形可以做一个有效的分类可以做聚类的变化。

      如果我们想甄别哪一些客户可能具有欺诈的可能?而哪一些客户是真实的投资者?而哪一些客户是产业的投资者?整个模型的类型可以保证我们做分类模型的同时也可以把这一类的模型应用到客户的服务当中来,这非常有助于我们做定制化的服务的推送的工作,到后面我也会详细的介绍。所以我们看到AI模型有他一定的通用性,有对庞大的数据做处理的良好的功能,这是我们主要的方向和角度。

      如何点开这个AI的科技树?我们如何找到金融领域的一个切入点?或者是从我们自身来看,找到一些量化的策略,制作的一些突破点呢?

      我们首先简单的介绍一些比较常用的模型,我们会发现在这些模型中他主要的一些特征或者是主要实现的功能实际上是对应到我们在期货的一些投研,在金融投资的一些领域是具有非常贴合的一些效果的。那这些比较贴合或者有类别的效果我们是希望有这样的一些模式的借鉴。

      我们首先来看一看一个大类的AI策略,这一类策略我们归为度学习—的策略,包括:决策树的优劣、最终的回归均值,或裂解到最后节点的分类。

      这一类模型都是在国际建模比赛中会经常出现的。浅度学习和深度学习是有区别的,浅度学习不包含深度隐藏层,他不做抽象的处理,主要是做聚类,我们可以在聚类里面寻找均值,做回归也是可以,主要的应用特征不做深度化的学习,但是可以做有效的分类和回归化的应用。

      我们稍微详细的介绍一下这个模型的使用,这个和我们后面的一些数据上面的应用会比较密切的关系,我们来看一看决策树是首先采取一个对数据选取一个样本空间,随机的选取一些特征,作为数目节点备选分裂的特征,有一个标准,哪一些特征可以达到他的目标函数比如投资的利益最大化,或者是我这样投资的他的风险是最小化,他面对这样的目标函数就会选取最合适的备选特征做节点的分裂,这样的节点分裂可以持续下去,一直持续到不可以再分裂为止。他对特征做分裂的时候,越重要的特征就会越早的进入分裂,我们不管他最后的分类质量和精度有多高,他只要能够越早的进入分类的选取这样的因素就越重要。

      我们就利用这样的决策树的拓扑的特征寻找因素的重要性和重要性的判断,我们会看到这样的判断是相当的稳定有很好的利用价值。实际上我们今年的服务已经利用到这样的一些特征了,我稍候会介绍到。我们建立多棵的决策树,我们就会得到随机森林,这个大家多少有所耳闻在算法方面可能会有关注,我们利用大量的决策树最终得到的结果,他统计的效应是在分类问题上面是有显着的表现的。

      这是我们觉得随机森林所具有的最重要的特征,其实我在这边还想稍微跟大家分享一下,我们在应用一些AI策略去进行研究的时候,我们实际上是通过不同策略他的优势,和他最重要的特征来进行使用的,我们真正的完整的解决一个问题或者是系统性的设计一个完整的解决方案,针对不同的方案或者是比较大型的方案我们在不同的一些部件和模块上面都会使用到不同的模型,这边我们会看到一些量化研究的策略是高度的结合了浅度学习、深度学习,甚至深度学习中不同的计算模块来做的试验。

      我们现在来介绍一下深度学习的模型,这方面的介绍对我自己也是一个挑战,因为这并不是一个简单的问题,我们现在采用的方法是我让大家先忘掉我们的入参、出参,我们介绍一下在全连接神经网络是目前应用非常广泛,在很多的初步的测试或者是建立模型的初期都会反复的被使用,然后都会以一种本题mark的角度使用了先进的模型之后再做对比,这个基础的模型是我们做各类研究的一个基础。我们看到他实际上的逻辑很简单,他就建立多层的连接一层一层的做信息的抽象化,当我信息进来的时候我可能有三个节点、四个节点的信息,但是我做抽象化我可能只会有一个输出,这样信息的叠加实际上非常有利于我们对信息中最关键部分的提取,对噪音部分的屏蔽,我们觉得数据的过程就是信息抽象化的过程,这个过程本质上就是类比人类的思维过程,在我们的视觉接受各种思维信息,比如人在看盘的时候我们看不同的技术指标和K线的状态,哪些信息是关键的、重要的,值得我们注意的,这就是抽象化的过程,这个过程就是在全连接模型里面信息抽样化的关键的过程,这是最核心的构建。

      我们再看另外一个比较常用的,中间层的应用,实际上就使用了卷积神经网络,他做什么样的事情?他用滤波的一个角度来切入,他会拍摄到照片的一大块的一部分,就像我们右上角的图,这一块部分做一个信息的抽象化,他可以取在这一个3乘3这样的模块,取均值,保留的模块是对前面信息的抽样华,通过这样的方式可以学习图象的模式,在AlphaGO发到《自然》杂志上面的文献中,他通过图象的识别,学习棋形,就会有若干中选择的途径优化他的棋形,这样的逻辑跟金融领域是非常非常接近的,我们也会收集到大量的因素的数据,这样的因素的数据哪些是关键、哪些是重要,他是非现行的关系就需要做抽象化得到若干个最关键的因素,这样的逻辑,包括全连接和卷积神经网络,这样学习的路径是我们最愿意去关心、借鉴和实现在金融领域中的关键逻辑。

      当然我们是做策略的,大家必然会关心时间序列的特征,在AI中有相当多的,这方面的发展非常的快,这块的实现也是非常的高效,整个的研究和业界的连接也是非常的紧密的,这样也是一个促使我们去时不我待,努力学习的一个角度。我们看一看传统的时序的模型LST,我们看一下最简单的STM是在做什么样的事情?他在假设系统中有一个状态,简单的列两种状态,市场要涨或者跌,这时候把信息做一个录入,他会选择性的记忆市场行情,选择性的遗忘另外一部分的市场行情,这就是抽象化行情,他想记住决定性的因素,想屏蔽市场上的噪音,他就有区分,什么是记住,什么是遗忘?另外一条路径是原始数据输入,我们这个原始数据输入也做了一些数据的过滤和处理,市场的状态,上一个时刻的状态和最新数据的结合,最终就会计算得到我们当前市场的状态。

      所以从这个角度来说,我们实际上是在跟踪市场的一个状态,并且通过参数的调整,我们选择性的保留最关键的市场的一些价格波动等等的特征,而放弃或者以往掉一些对市场无关但是又真实出现的噪音,通过这样的方式我们是可以在训练过程中不断的去强化学习获取我们有用的一些知识,变为一些模型的遗忘参数或者是保留的一个记忆参数,这样能够形成时间序列上用有用信息的特征,具有外化的特征,也具有了一定的预测性。

      最后说到科技树,对我们金融领域的工作人来说,有挺大的压力,我们也希望转化成动力,全球对于AI策略的国家性投资的一个测算。这个是一个比较有可信度的世界经合组织发布的最新的2020年的报告的数据,这里面我列出了两类的数据,一类从国家政府的角度来探讨这个地区和国家,政府有国家性质的投入,在AI模型的发展方面,我们可以看到,最主要的一些法家中美还有欧洲、德国等等,包括像印度他们现在都有国家层面的一些投资对AI技术的支持以及AI技术落地的一些应用的一个帮扶。

      其他的很多国家即使现在没有他们也在迎头赶上,也包含了不少发达国家,我们可以看到澳大利亚、新西兰,他们也将要有落地或者成型的一些AI的计划,大家注意这是在国家层面上,国家层面上大家都意识到竞争的激烈性,这方面的技术的推进是非常的迅速的,我们看到2020年其实对我们的金融科技领域是很大的冲击,我们看到AI领域一定是欢喜的,整个的投入有爆发性的增长。这个我们其实结合AI的简要发展史我们可以发展,AI历史发展过程中经历了很长的撼动,近些年来由于技术的突破和进展,我相信在业界的转化大家都是希望能够齐头并进的。经过介绍这一颗AI科技树不是我们想不想点的问题,而是我们要抓紧什么时候点开的问题了。

      系统深入到AI模型的应用来看,依然是模型的数据,模型的数据其实是有不同的层次来考虑,因为现在的金融数据是种类非常的繁多有标准化、非标准化,有行情内的数据、标准类的数据,还有基本面的数据,包括我们现在主打推出的在截面因子的回归型的数据,这一块的数据刚才陈辰主要介绍了一下商品的截面因子数据,我们这边在股票的截面因子的数据也已经做的差不多了,也都做了一个one by one的对等的比较。如何把那么多的一些数据做一个整合、收集和管理,得到我们输出想要的一些目标呢?

      那么我们就会有一个迷失,我们会不会以为中间是一个黑盒子,会自动处理数据,然后得到我们想要的数据,这样的迷失是因为我们对整个的模型是不了解的,在我们看来,这样的一个数据的处理是非常关键的,也就是不同类型的数据如何做一个整合,如何有模型高效的应用,如何为AI的模型提供口粮这才是我们非常关心的,AI模型的开发领域有一个非常有名的数据科学家他提到过AI模型最后的质量有你数据的质量来决定,假如我们有高质量的数据的话,数据中没有真正蕴含到复杂的模式或者是一个可供我们学习的一个信息的话,再好的模型也是没有用的,在这个角度我们实际上是结合了我们自身的一个优势,我们对于数据的理解和金融数据的处理和工具结合了这方面的优势来做一个整合。

      我们会看到我们在利用数据做分析的时候我们自主研发的多周期的数据分析的方法,当然这部分的方法我们也是借用了海外的一些先进的经验,我们在这方面是做了一个落地的实现,我们将数据分解成多个周期,简单来讲可以划分为短中长三个周期的拆解,我们做这样的拆解目的是什么?如果我们具有一定的金融学的尝试知道,金融类的数据任何一个标的物他其实都是非常不同的投资者结构在不停和对手方的交易的过程中不断的形成价格,交易的参与是本身的投资目的、风险偏好都是有巨大的差异并且是显着不同的,这个时候我们就要考虑在其中价格所反映出来的因素我们就要清醒的认识到是多种周期的特征叠加的过程。

      简单的来看我们短周期的数据特征我们依然看到了比较高的一个噪音体系或者是波动的体系,可是走上了中周期、长周期实际上数据的特征会变的越来越明显,这是对我们做期货行业的人来说是非常明确的,因为期货由于合约换月的特征,比如市场价格CPI指数更敏感的特征他实际上具有的规律应该是比较明确的,可是为什么我们看不到他,主要的原因在于很多的周期的规律都是叠合在一起的。

      我们想一想,昆仑周期至少4个月,苏格拉周期5个月左右,所有不同的周期尺度的特征,叠合在一起的时候我们是很难发现他精确的规律性的。我们看一看,我们现在做的数据分解,当我们不做数据分解的时候,实际上我们在把他数据转化到频率空间以后我们就会发现整个数据时候实际上是没有特别明显的主导周期特征的,而且数据里面充满噪音,这个符合大家的人认识,我们很难跳过数据随机游走的概念。

      但是当我们做了数据分解以后,在中周期和长周期上明显的出现了主导特征,一开始非常震惊能够发生这样的特征的,大量的金融数据都是像左下角这样没有明确特征的,我们就开始思考一个问题,就是如果我们找到这样明确的数据特征,这样的数据特征的信息是否能够通过AI技术学习到,我们可以有一些精确的模型处理这种线行的特征,可是我们使用AI是否可以达到更长的,我们是不是可以看到中长周期或者是借宽周期的特征呢?我们做了数据分解以后才能够有机会更容易发现数据里面的一个信息传导的特征。

      据我们所了解现在AI技术本质上很难对金融数据做一个明确的或者是一个比较可靠的降噪的处理或者是分解的处理,可能在一些非精度学习里面有一些进展但是我们会认为这方面的应用的话还是有一段路要走的,在原有的模型和非常有力的分析工具实际上是非常愿意将这样的工具和AI模型进行叠合,这个模型之间也是互相博弈和不同进步的过程,这是我们数据处理的一个逻辑。

      我们看到这样的数据处理分周期的模型我们可以做各种的金融降噪,也许在座的各位做量化的金融数据研究员最为关心的问题,我们交易的行情是低信号的体系,我们的信号是非常不明显的,噪音非常大,我们能否用刚才的数据分解的特征找到他主要的累计型的波动变化的特征?我们为什么想做这样的事情?我们这样的话得到的信号更加明确,AI更有机会学到这样的特征,AI模型实际上还有一个深度学习和抽象化的过程。

      无论如何我们可以看到我们现在使用的数据分解的特征其实达到的非常好的效果,我们分解得到了一个最终的数据信号是非常明确的,而且实际上他的波动率也就是他的不确定、不稳定性是远远小于原始数据的特征,但是我们在做了一个累计收益率的比较以后可以看到非常平滑的贴合在一起,我们做的数据并没有对原始的数据在整个中长周期或者是累计的尺度造成太大的扭曲,但是实际上他依然能够很好的反映出来一个数据的一个主要的走势特征,所以这也是我们相信我们现在所使用的比较成熟的,有效的数据分析的模型,他是能够很好的结合在一起。

      我们现在就来说一下重点,我们现在就是在一块看到显示的一个结果,就是利用前面陈辰所介绍的我们最新推出的商品的截面因子的指数,来判断这些因子对我们所要投资的标的物也就是华泰商品板块指数他的解释力的强弱。我们这边使用的一个词大家小心一点,我们使用的是因子的影响力或者是因子的重要性的判断,这个实际上在线性模型里面的暴露是有相当大的区别,这样的结果反映的是价格的相应复杂的传导模式,因为因子重要,但是不代表他是线性的影响的关系,寻找的就是因子的重要性就是标的物的影响力、解释力、以至对外推的预测能力。

      我们这边使用的数据证明来进行回归分析,建立回归分析以后我们可以通过在最终的节点上面的预测数据的误差值来判断因子是否重要,我们采用的方法其实蛮简单的,我们考虑某一个因子去掉他和保留他的对应的效果有多大差异我们如果去掉某一个因子之后,他的预测效能大大的降低,他的误差值迅速的上扬,这样的因子就是非常重要的。我们评判能力的标准相对来说是比较简单的,我们看到现在的结果是这样的,我其实想请大家注意几点,第一点的话,大家可能已经注意到了,为什么我们的数据对因子的重要性判断会分成左右两边,这边是因为在商品国家因子实际上对整个市场的影响是非常大的,这边其实在陈辰也提到过,我们在做截面因子以后我们是可以得到国家因子的,这样的国家因子对全市场的解释力非常强的,在股票领域的话我们得到的国家股票因子和沪A300的指数相关性很高,我们为什么把他排除?涉及到技术面的应用,假如我们的因子影响力很强,会会影响因子的效果力的判断,我们在做判断的时候会把这样的因子放在一边,然后测试剩下的因子,从算法的角度来看速度更快。

      我们再注意其他几件事情,我们在因子排序的前面几位,靠左边,我们看到中国CPI因子上图和下图,我们一般会觉得CPI并不是一个带有牵制性或者领先的指标,我们更大的作为把他当做验证型的指标,我们认为他是经济发展到一定的阶段以月为达到做出来的统计的数据,换句话说就是市场已经实现了一定的结果。刚才陈辰在介绍的时候我们都知道,我们实际上已经实现了把一些低频率的宏观因子甚至是统计类型的,国家发布类型的指数转换成了以市场数据来构建的一个高频的因子,这样的因子在我们的商品体系里面体现出了很强的重要性,至少这边的因子重要性就可以看到排名很靠前。

      我再提醒大家注意另外一个因子,大家可以看到在右上角第三类的柱状图中其中我们可以看到在短周期上原材料板块因子他的影响力是排在短周期的第三位,他并不是商品因子,我们发现了在股票领域非常相关的一个板块实际上对我们的商品期货市场是有相当好的一个解释力的,其实这样的角度就是我们做股期联动的连接的角度。顺便说一下商品国家因子和股票国家因子相关性也是很高的,近几年持续的升高,我们理解为股期的联动,背后的一些商品的配置是在逐步的加强的,这时候我们看到一个比较高层次的优质的角度看到这样的效果。

      我们得到了这些数据以后实际上我们就比较容易知道我们现在AI模型的口粮是什么?我们找到了重大的风险敞口,我们可以看看这些敞口对我们的数据预判有多大的影响。我们这边的一个测试是只用到了现在目前所使用的截面回归因子,并没有使用全市场的各种类型的因子,像技术力指标、敞口类的数据并没有使用到,我们这边更多的探讨Beta类型的因子有多好的预判和测试的效果。

      这边我们使用了另外一种方法,在决策树的裂解过程中可以使用拓扑的性质判断性质,分类结点越靠上越重要,这个拓扑的性质跟我们最后到深层的一个叶子部分和根部的数据的预测是有相关的,我们可以知道前面的结果并没有太大的差异,同样的国家商品因子是最重要的,短周期上面有中国的CPI因子、动量的因子等等我们都知道这是商品期货领域里面应用的最为广泛也是大家比较熟知的一些价格的驱动因子。

      有了这套数据以后我们就可以通过他们作为一个树的数据来对模型进行输入,这个时候我们就会思考这样的问题,我们具有多种的AI模型,甚至在不同领域里面有模型的分类,这时候选用什么样的模型来构建我们的策略呢?这是一个关键的问题,我们会觉得这边最核心的策略是我们设计模型的一个拓扑结构是一个非常好的能够解读数据里面的信息学到数据里面的信息,这是我们最为关心的一点。

      我举个例子我们下午上盘,我们的短周期和长周期数据分别输入,经历了一段时间的并行学习,我们就希望他在不同的周期数值上找到对我们的标的物最有影响力的一个数据抽象化,我们得到了长周期的主导因素节点也得到了短周期的主导因素节点,这样的数据还可以进行整合,这个整合的下一步的过程实际上做传导他们之间的相关性或者价值的传导或者是比较复杂的非线性的一个价格波动的一个模式。这个本质上我们是比较难去探寻他学到了什么模型,这也是AI模型的缺点,假设我们非常好的考虑到数据的特征并且有力的利用我们的数据特征在建模的过程中贴合数据的方式来建立隐藏层或者深度学习的过程,整个数据的抽象化是比较有利于让我们去提取到有力的信息并且做到有效的预测。

      这边我想请大家注意一点:我们左边的模型和右边的模型其实几无区别,但是有一个最大的差别在于,左边的模型是单独的输出,右边的话可以多模输出,我们在AI模型的理解中知道,AI模型比较强大的数据处理特征他可以大量的吸入数据,同时他还有多个出产,多个结果针对不同的目标进行优化,这对我们来说非常有利。我们考虑到用户的需求,结合到市场的数据对于市场行情的预判,同时我们可以输出针对某些不同的客户最优的投资方案的解决,我们觉得这样的多输出的模型框架是非常有利于我们去建立一个有效的一个AI模型或者是AI模型在这个领域的一个落地。

      说了那么多我们这边实际上会应用一些简单的结果,我们的多个输出实际上会对下一步还有再下下步的一个数据的预测,我们谈一谈他预测的效果。我们看对下一步的预测的效果,外推的预测的效果,我们这边测试数据是使用了我们刚才提到的华泰的五个商品板块指数,这个商品指数的话我们是使用多投的策略来做的,他整个的数据的支出的形成是行情数据来组合而成的,考虑了一些权重的配置。

      我们现在得到的结果来看仿佛我们的浅度学习和深度学习互相之间都所胜负,我们就会理解成为,他们实际上学习的模式很可能是有所差异的,这本身是数据之间的特征是有所联系的。我举个例子,贵金属指数在浅度学习里面只能达到49%的胜率,在深度学习可以达到57%,他是全球性的金融资产商品,他有可能出现海外的价格的传导,有可能是本国的一些买卖的一个驱动力会作为一个互动和国际的价格的变动做一些互动的工作,本身他价格的走势和风格实际上是相当复杂的,这就是我们觉得在随机商品在浅度学习方面很难学习到复杂的加工模式,不能够进行更多的抽象化的学习。

      可是深度学习就不一样了,整个预测的效能都差不多,贵金属似乎还是中等偏上,他很有可能在使用的比较有限的商品因子里面已经能够发现到一些价格传导的因素。我们宏观因子指数里面包含USD的,我们再看另外一个结果,这是我们继续用深度学习来探索,我们预测下一步的胜率,也可以预测下两步下三步的胜率,大家可以说我们的胜率没有很高,大家知道我们使用的数据的框架是非常有限的,我们是希望在一个有限的框架里做一个同等地位的对比。

      我们看到第一步有一个相当好的预测效果,并且他整个的差异性不算很大,预测到第二步的话第一步的预测是有所下降,我们惊奇的发现第二步的预测胜率似乎没有太多的下降,我们看第三步更奇怪,我们看1、2、3步,都没有太大的下降,这有一点点违反我们的做量化人的研究的,他衰减的速度是非常快的,如果没有信号的话,我们很难在做模型的时候对步骤和未来做一个很好的预测,但是在这里我们可以看到他可以做到这一点。

      我们现在理解深度学习确实学到了一些比较复杂的价格传导模式,而这个价格的传导不是在于第一步或者第二步或者短期的延续,他是一个长期的,这个概念在下一步进行扩展。现在AI策略在发展策略,我们的农业化工是没有办法做出很有效的策略。

      最后我们来说一下我们对AI科技的一些应用以及他未来的一些展望。在这个角度的话我们会说一下华泰期货的研究。我们2019年进行了研究,我们整篇年报都在研究黄金等贵金属的研究,他的研究可以通过大量的学习得到预测的效能。那时候取了市场交易的数据做了数据的输入,我们也做了数据的分解,分成三个周期的数据分解分别做了一些预测,我们做把他作为一个合并这是2019年,这是2019年的9月份,他有相当客观的一些预测的效果,那么我们再看使用随机森林也就是右边的部分,这一部分我们当时出示了一个层次网,我们用随机森林进行预测,涨水就要做多,空的话就空仓,而且是月度的效果,我们认为他是比较客观的投资的效果,最大的风险持续的时间也较短。

      在今年我们继续做这方面的研究,以及落地的服务,我们可以看到对原油的宏观因子的重要因子的排名,国债期货的排名也取得了好的效果,也符合我们对金融体系的认识。

      最后我想说一下我上面所说的所有的内容,包括我们的AI模型的一些学习的方式最终他其实落实到一个场景学习的概念,也就是我们最开始提到的我们如何类比到自动驾驶,我们现在要面对的金融市场是非常复杂,他有Alpha的影响,他还有很多我们没有能够明显觉察到弱Alpha的因子的影响,如何提取这些信息?实际上我们首先做的事情很可能是在一个尺度上进行分解,我们寻找不同因子的维度,我们和历史进行对比也就相当于我们在用场景进行学习,我们可以看到历史上他发生了什么的变化?在相同的条件下,他主要的描述的敞口点就是我们现在主要描述的一个截面的回归因子,通过对历史的学习,我们对现在做出判断,并且对未来作出一定的猜测,这是我们现在主力在做的工作。我们也希望业界的朋友京东数科有学习和合作的机会。

      我们这边采用的一个角度就是,客户的一个学习的模块他可以是对客户的分类,我们对市场行情的了解可以说是对市场的一个学习,而这两个不同的学习或者模块实际上在AI的应用领域里面,也可以进行整合,整合最终的一个目标很可能我们就可以做更优的对客户需求给出一个服务的解决方案,这边我们提到我们现在在做产业的风控方案,包括商品的配置,前面也提到了我们的风格因子投资实际上我们有两个指数已经发布一年多了,我们还有股期的联动方面还有一个进一步的推动。

      最后我做一个简单的总结,其实我们在前面的陈辰的报告中可以看到,我们实际上做一些商品的多因子实际上在一个基础多因子+截面多因子,解决了商品投资有无的问题,如何进行投资,如何对风格进行暴露,如何又对不同风格的敞口进行管控,他模型的落地实际上是很大程度上帮我们解决了,这是一个很好的起点,同时我们看到又是数据的基础,正是我们算法的基础最主要的口粮来源,我们现在算法技术的发展和应用,实际上很大程度上解决投资的效率的问题,所以在这个方向我们又迈出了我们的前景,我们希望有更好的推进。我们整个的研究的策略或者是逻辑,是希望结合到一个应用场景是完整的给客户提供一个解决方案,无论是在投资还是在风控领域。

      这就是我今天的一个跟大家的一个分享报告,谢谢大家。

    关键词:

    AI,模型

    审核:yj159 编辑:yj127

    免责声明:

    1:凡本网注明“来源:***”的作品,均是转载自其他平台,本网赢家财富网 www.yjcf360.com 转载文章为个人学习、研究或者欣赏传播信息之目的,并不意味着赞同其观点或其内容的真实性已得到证实。全部作品仅代表作者本人的观点,不代表本网站赢家财富网的观点、看法及立场,文责作者自负。如因作品内容、版权和其他问题请与本站管理员联系,请在30日内进行,我们收到通知后会在3个工作日内及时进行处理。

    2:本网站刊载的各类文章、广告、访问者在本网站发表的观点,以链接形式推荐的其他网站内容,仅为提供更多信息供用户参考使用或为学习交流的方便(本网有权删除)。所提供的数据仅供参考,使用者务请核实,风险自负。

    版权属于赢家财富网,转载请注明出处
    查看更多
    • 内参
    • 股票
    • 赢家观点
    • 娱乐
    • 原创

    2024年买什么?大咖发声

    2023年12月20日,中欧基金举办2024年投资策略会。窦玉明、周蔚文、许文星、罗佳明等多位业界大咖发声,分享对2024年投资市场的最新研判。中欧基金董事长窦玉明表示,对于...

    最后时限 量化私募等需在12月29日前提交股票程序化交易报告

    按监管要求,10月9日前已开展股票程序化交易的投资者,应当在《关于股票程序化交易报告工作有关事项的通知》正式施行后六十个交易日内,即12月29日前完成向交易所的报告...

    蜂助手:12月19日高管丁惊雷、韦子军、马大亮增持股份合计2.89万股

    消息,根据12月20日市场公开信息、上市公司公告及交易所披露数据整理,蜂助手(301382)最新董监高及相关人员股份变动情况:2023年12月19日公司董事,高管丁惊雷、董秘,董...

    新大正:12月19日高管翁家林增持股份合计3000股

    消息,根据12月20日市场公开信息、上市公司公告及交易所披露数据整理,新大正(002968)最新董监高及相关人员股份变动情况:2023年12月19日公司董秘翁家林共增持公司股份...

    2023年12月20日赢家江恩早盘题材消息百度发布Apollo开放平台9.0

      上证指数目前处于下跌趋势中,依据赢家江恩价格工具得出:当前支撑位:2885.09点,当前阻力位:2949.14点、3018.56点,由赢家江恩时间周期工具展示得出:下一个时间...

    2023年12月19日赢家江恩早盘题材消息 开展网络安全技术应用试点

      上证指数目前处于下跌趋势中,依据赢家江恩价格工具得出:当前支撑位:2885.09点,当前阻力位:2949.14点、3018.56点,由赢家江恩时间周期工具展示得出:下一个时间...

    股指配资是什么?股指配资有何风险?它和股票配资的区别在哪里?

    相信长期在金融圈的朋友应该对股票有所了解。今天小编给大家简单介绍一下股指配资的相关消息,对这方面感兴趣的朋友来看看吧。

    一般风险准备的介绍以及一般准备与一般风险准备的区别

    一般风险准备指的是从事证券业务的金融企业按照规定从净利润中提取的用于弥补亏损的风险准备金。提取风险准备金时,贷记本科目,弥补亏损时,借记本科目。一般风险准备的...