submitted to ACM,随便看看,使用深度学习炒股
论文题目:
Stock Market Prediction via Deep Learning Techniques: A Survey
摘要
现有的股票市场预测研究往往侧重于传统的机器学习方法,而不是深度学习方法,这促使我们对股票市场预测的研究进行结构化和全面的概述。我们提出了四个详细的股票市场预测子任务,并提出了一种新的分类方法来总结基于深度神经网络的最新模型。此外,我们还提供了股票市场常用的数据集和评估指标的详细统计,最后,通过对股票市场预测的一些新观点,指出了未来的发展方向。
1介绍
金融市场在塑造全球经济发展中发挥着至关重要的作用,随着股票市场在经济领域中的地位越来越突出,它越来越受到公众的关注。一种解释金融资产定价和股票市场波动背后原因的理论是有效市场假说,有效市场假说认为,在一个法律健全、运作良好、透明、竞争激烈的股票市场中,理性的投资者能够对所有市场信息做出迅速而理性的反应。因此,股票价格将准确、充分、迅速地反映所有重要的事实,包括公司的现在和未来价值。然而,股票价格的波动受到一系列复杂因素的影响,包括公司收益报告、国家政策、有影响力的股东以及对时事的专家猜测。因此,有必要利用机器学习技术进行股票市场预测任务,如股票运动预测、股票价格预测、投资组合管理和交易策略。
股票市场具有不确定性和可变性的特点,这使得准确预测市场趋势具有挑战性,机器学习技术已被用于股票价格预测,以提高预测的准确性并缓解这些困难。历史上,传统模型如基于决策树的模型和支持向量机(SVM)已被用于股票市场预测。
随着深度学习模型的发展,用于预测股票市场的方法已经从传统技术转向先进的深度学习技术,如循环神经网络(rnn)、长短期记忆(LSTM)、门控制循环单元(gru)、图神经网络(gnn)和卷积神经网络(cnn)。最近,研究人员也开始探索在股票市场预测中使用基于Transformer的模型和强化学习(RL)模型。尽管有大量的股票市场预测调查,但现有的调查存在局限性。例如,一些调查集中在传统技术上,而没有严格检查最新的进展,例如Transformer模型。此外,一些调查对模型的分类是模糊的,没有使用权威的标准。此外,以前研究中确定的许多挑战和悬而未决的问题已经得到解决。本调查旨在通过对股票市场预测的最新技术和趋势提供全面而深刻的概述来填补这些空白。通过回顾来自顶级会议的高质量论文,本调查总结了Transformer和RL等技术的最新进展,并提供了深入的分析和讨论。它旨在为研究人员、从业者和教育工作者提供一个系统的概述,并全面了解相关的深度学习技术和未来最有希望的研究方向。
本调查旨在通过对模型进行分类和分析其出版年份,深入了解股市预测的进展,此外,调查的目的是提供一个详细的结构和每个模型在股票市场预测应用的了解。
本调查的三个关键贡献如下:
•在本调查中,我们彻底检查了股票市场预测,其中包括四个不同的任务:股票走势预测,股票价格预测,投资组合管理和交易策略,为了进行这项研究,我们收集了94篇论文,重点关注这些高度相关的主题。
•本调查介绍了一种新的深度学习分类系统,用于预测股票市场表现,根据这一分类整理的综述文献探讨了各种深度学习模型,如RNN、CNN、GNN、Transformer和RL,此外,调查汇编了这些研究中使用的数据集、评估技术和模型输入的摘要。
•在本研究中,我们深入研究了基于深度学习的股票市场预测所面临的未解决的挑战,并对该领域潜在的未来研究提供了透彻的见解。
本调查分为八个部分,调查的层次结构如图1所示,第一部分概述了股票市场预测的背景、研究动机和目标。在第2节中,回顾了关于该主题的先前调查,并确定了其局限性和需要改进的领域,第3节详细介绍了用于审查论文的方法,包括分类标准,如会议、模型和出版年份,在第4节中,讨论了用于股票市场预测的各种深度学习模型,并根据模型类型对论文进行了分析,在回顾的方法中使用数据集和模型的输入特征将在第5节中讨论,第6节介绍了股票市场预测中常用的评估指标,第7节侧重于该领域尚未解决的问题和潜在的未来发展,调查以第8节的总结结束。
2相关工作
在过去的库存预测研究中,传统的支持向量机、回归、KNN等方法被广泛使用。然而,随着神经网络的发展,在股票预测研究中已经转向使用神经网络。Atsalakis和Valavanis对100篇有关股市预测的论文进行了调查,重点关注神经和神经模糊技术。他们通过比较不同的股票市场、输入变量、预测方法和评估指标,对1990年至2006年发表的论文进行分类和分析。Li和Ma发表了一项关于将人工神经网络应用于金融市场的调查,包括股票价格预测和期权定价。Ballings等人关注于股票价格预测集成方法的分类器模型和单分类器模型,集成方法包括Random Forest、Adaboost和Kernel Factory,而单分类器模型包括Neural Networks、Linear Regression、SVM和K-Nearest Neighbors,这是第一个建立广泛基准的研究。Tkac和Verner系统综述了1994年至2015年间发表的412篇关于人工神经网络在金融行业商业应用的论文,主要应用包括财务困境、破产问题和股票价格预测的决策支持,重点是分类任务。Cavalcante等人回顾了2009年至2015年在金融应用中使用各种机器学习算法的有影响力的论文,并讨论了该领域的挑战和未解决的问题,主要的机器学习方法包括人工神经网络、支持向量机、混合方法、优化方法和集成方法。其应用包括对金融数据进行预处理和聚类、预测未来市场趋势、挖掘金融文本信息等。Li等调查了2007 - 2016年229篇研究网络媒体与股票市场关系的论文,提出了进一步研究的方向,他们提出了一种分类法,将机器学习技术分为统计模型、回归模型和基于机器学习的模型,神经网络模型包括贝叶斯分类器和支持向量机。Xing、Cambria和Welsch调查了将自然语言处理方法应用于财务预测任务的论文,主要集中在三个方面:不同类型的文本来源、算法和基于不同评估指标的结果,文本来源包括新闻、社交媒体、财务报告和留言板,模型类型包括回归、支持向量机、集成学习和CNN。Nti、Adekoya和Weyori回顾了2007年至2018年的论文,重点关注了三大类分析:技术分析、基本面分析和组合分析,模型有限,只讨论了三种技术:决策树、支持向量机和人工神经网络。Ersan, Nishioka和Scherp也关注了三种预测模型:KNN, ANN和SVM。这项调查的目的是在DAX 30和标准普尔500指数的日和小时水平上对各种机器学习方法进行比较。
最近关于股市预测的调查主要集中在深度学习技术上,如CNN、RNN和GNN。Jiang b在其他研究中脱颖而出,因为它考虑到了研究的实施和可重复性,具体来说,强调了用于实现的主要工具,包括Keras, TensorFlow, PyTorch, Theano和scikit-learn,还调查了几篇论文的数据和代码的可用性,以证明可重复性,重点介绍了深度学习方法在股票市场预测中的最新进展。Thakkar和Chaudhari研究了各种基于深度学习的神经网络方法用于股市预测,研究以2017 - 2020年的论文为基础,对需求、挑战和未来方向进行总结和分析。Kumbure等人对2000年至2019年间发表的138篇有关股市预测的期刊文章进行了文献综述,调查特别关注数据集中的特征和唯一变量,该调查将深度学习方法分为两类,有监督和无监督机器学习方法。然而,一些调查仍然缺乏最新的技术,如Transformer和预训练的BERT模型,这些也在本调查中进行了回顾。
以前的调查广泛地涵盖了传统方法和较旧的神经网络技术,在了解当前的研究趋势方面留下了空白,最近的调查还没有完全更新以包括最新的技术。此外,一些现有的调查没有根据目标对论文进行充分分类,或者只关注股票市场预测任务。鉴于需要更新调查,结合最新的股票市场预测技术,本调查提出了一种新的深度学习模型分类方法,旨在提供更全面和最新的分析,重点将放在最新的论文和最新的技术上。
3 .审查方法和标准
3.1审查方法
在本研究中,我们主要关注与股票市场预测有关的文献,为了全面收集论文,我们实施了如下策略,我们将时间限制在过去十年,接下来,我们确定了领先的自然语言处理(NLP)和人工智能(AI)会议,包括ACL, EMNLP, AAAI, IJCAI, ICAIF, NeurIPS和KDD。在这些会议中,我们使用搜索引擎谷歌Scholar搜索股票预测、市场、金融和投资组合等特定关键词。我们还将深度学习模型的名称作为关键字,如RNN、LSTM、GNN、Transformer和RL。通过使用这些关键词,我们能够找到与股票市场预测、金融、交易和投资组合相关的论文,然后,我们使用机器学习来过滤预测股市的论文,经过筛选,我们选择了42篇与股票预测相关的高质量论文。在排除内容少于两页的论文后,筛选了39篇论文,通过阅读这39篇论文中的被引论文,我们还将来自期刊和会议的排名靠前的论文纳入了我们的研究论文列表,总的来说,这项调查包括94篇高质量的论文,涵盖了各种深度学习方法。
3.2入选论文统计
本节通过各种图表展示了调查中包括的股票市场预测论文的统计数据,首先,论文按顶级会议分组,图2(a)显示了ACL1、NAACL2、EMNLP3、AAAI4、IJCAI5、ICAIF6、NeurIPS7、ICML8、ICLR9、KDD10等顶级会议的论文数量,如图2(a)所示,本次调查共纳入39篇高质量论文,ACL和AAAI会议上关于股市预测的论文最多。图2(b)显示了使用五种不同模型的论文的比例,本次调查涵盖了所提到的所有类型的模型,每个模型都有15篇以上的论文。该调查包括先进的模型,如基于transformer和RL模型,分别占18.9%和24.2%。图2(c)显示了按出版年份划分的论文数量,本次调查中发表的论文比例最大的年份是2021年,共有24篇论文,2012 - 2016年5年间共发表论文11篇。
4 .机器学习中的股市预测
4.1股票预测相关任务
在深入研究深度学习模型的细节之前,我们将首先定义四个关键的股票市场预测任务,并概述与每个任务相关的概念。这些任务包括股票价格预测、股票走势预测、投资组合管理和交易策略,这些类别概括了大多数现有的股市预测任务。
•股价预测 股票价格预测的目的是利用时间序列数据预测股票和金融资产在交易所交易的未来价值。这个预测的最终目的是实现可观的利润。此外,各种因素也会影响预测过程,包括心理因素以及理性和非理性行为,所有这些因素共同作用,使股价充满活力和波动性。
•股票走势预测 股票走势预测的任务通常将股票趋势分为三类:上升趋势,下降趋势和横盘,这项任务通过分析某一特定交易日内调整后的股票收盘价之间的差异来形式化。
•投资组合管理 投资组合管理涉及到以实现财务目标为目的的投资集合的战略选择和监督,投资组合管理的目标是以一种最大化回报同时最小化风险的方式分配资源。
•交易策略 交易策略是一套预先建立的指导方针和标准,用于做出交易决策,它是买卖股票的一种有系统的方法。交易策略可以从简单到复杂,投资风格(例如,价值vs增长)、市值、技术指标、基本面分析、投资组合多样化水平、风险承受能力和杠杆等因素都要考虑在内。
在利用深度学习的股票市场预测任务中,常见的交易策略包括事件驱动、数据驱动和策略优化,以上任务围绕股票市场预测过程展开。为了全面理解基于深度学习的方法,图3说明了预测过程,第一步涉及处理输入数据,包括股票数据、图表和文本,然后,选择和收集相关的股票特征,下一步是将提取的特征输入到深度学习模型中进行训练,最后,对模型的实验结果进行分析。
4.2基于深度学习的模型
我们根据模型对论文进行分类,并在图4中展示了不同的模型,图5提供了用于股票市场预测的主流深度学习模型的总体概述。这些模型包括:基于rnn的模型(图5(a))、基于cnn的模型(图5(b))、基于gnn的模型(图5(c))、RL模型(图5(d))、基于transformer的模型(图5(e)),以及其他独特的方法。这些模型的输入可以是与股票价格相关的数据、文本数据和公司之间的关系,模型根据论文中概述的目标生成输出。
4.3基于循环神经网络的模型
RNN是一种可以有效处理序列数据的深度学习模型,股票市场数据通常表示为时间序列,这使得RNN成为通过对历史数据建模进行预测的理想选择。然而,rnn在处理长期数据时存在梯度消失的缺点,为了解决这个问题,已经开发了几种RNN的变体,包括LSTM , GRU和双向LSTM (Bi-LSTM)。rnn可以被认为是多个相同网络单元的循环组合,其中每个单元的输出单元作为下一个单元的输入,每个单元格包含一组输入、隐藏和输出单元。LSTM单元有三个门,分别是更新门、遗忘门和输出门,用于控制短时记忆和长时记忆。GRU模型是对LSTM模型的改进,它将输入门和遗忘门组合成一个更新门,并增加一个重置门来控制被遗忘的信息,这些模型改进了rnn,并在股票市场预测方面取得了重大进展。
循环神经网络(RNN) RNN是一种成熟的深度学习模型,已应用于股票预测。然而,近年来,研究人员试图通过探索其与其他机器学习技术的混合应用来提高RNN的性能。Agarwal和Sastry提出了一种新的鲁棒混合预测模型(HPM),该模型结合了三种预测模型:RNN、指数平滑(ES)和自回归移动平均模型(ARMA),他们还使用遗传算法通过提供最优权重来优化模型,从而显著提高预测精度。Zhang、Aggarwal和Qi提出的另一种方法是基于RNN的状态频率记忆(State Frequency Memory, SFM),它能够从股票市场中捕获股票价格波动背后的多频率交易模式。
长短期记忆(LSTM) LSTM模型拥有有效处理文本和时间序列数据的能力,使其成为股票市场预测的理想选择。LSTM通过使用梯度方法解决了在较长时间间隔内保持信息的问题,这是对RNN模型的改进。例如,Akita等人提出了段落向量方法来表示文本信息,并利用LSTM进行预测模型,将10家公司表示为10篇文章,其中文章向量表示为,这些公司的价格在单个时间步长表示为{1,2fi,10},并连接为股票价格向量,LSTM的输入为< 0.05 >和< 0.05 >。LSTM在开盘价预测方面明显优于基线、多层感知器(MLP)、支持向量回归(SVR)和Simple-RNN。另一个例子,Ma等人提出了News2vec模型,其中密集向量表示新闻特征,他们使用LSTM和自我注意机制作为预测模型,该文本嵌入模型News2vec有助于揭示新闻与其事件元素之间的潜在关系。Nelson, Pereira和Oliveira使用LSTM进行股票走势预测,但模型输入是数值信息,包括股票价格和成交量。
在股票预测研究中,通常将股票价格作为时间序列分析来处理,但很少有研究者考虑到数据潜在的时间依赖性。Zhao等提出了一种带趋势回调的时间加权LSTM模型,该模型根据数据与待预测数据的时间接近度为数据分配权重,混合模型是LSTM与其他模型的结合,用来提高预测性能。
Polamuri等提出了基于生成对抗网络的混合预测算法(GAN-HPA)来实现基于gan的框架开发的Stock-GAN,该框架接受各种输入,例如股票数据集和超参数。使用线性和非线性模型从数据集中提取特征,并将超参数和预处理结果作为LSTM的输入。将生成器的输出和原始数据提供给鉴别器,并使用贝叶斯近似调整参数和更新预测结果。Wang等人提出了一种从交易数据中动态提取金融市场趋势潜在表征的方法,做出了重大贡献,他们提出了一种基于混合卷积lstm的变分序列到序列注意模型(CLVSA),该模型由卷积LSTM单元和具有自注意和互注意机制的序列到序列框架组成。
Nguyen和Yoon开发了一个名为关联股票信息深度转移(DTRSI)的框架,该框架考虑了股票关系来预测股价走势,为了实现这一目标,作者在大规模数据的预训练期间使用LSTM单元来优化参数,然后使用小函数对基本模型进行微调获得最终模型的目标数据量,这种方法解决了由于样本量小而导致的过拟合问题,并解释了股票之间的关系。
对抗性训练可以通过引入扰动来模拟股票价格波动,从而提高股票走势预测的准确性。2019年,Feng等人提出了一种结合关注LSTM和对抗训练的方法来预测股市走势,另一种同时预测多只股票价格的方法是Ding和Qin提出的关联网络模型,该模型由三个分支组成,分别预测开盘价、最低价和最高价。
Chen等人使用Bi-LSTM将股票数据和财经新闻表示编码到他们的模型中,即结构化股票预测模型(SSPM)和多任务结构化股票预测模型(MSSPM),他们还结合了由事件角色嵌入组成的交易事件的表示,这些事件角色嵌入是使用操作系统提取的主体和客体。MSSPM模型在股票预测和事件提取任务上进行了唯一的训练,因为作者认为这两个任务具有内在的关系,准确的提取结果将有利于股票预测结果。为了进行有时间意识的预测,Sawhney等提出了一种名为FAST的分层学习方法,根据预期利润对股票进行排名,该模型使用时间感知LSTM来模拟新闻和推文中的时间不规则性,FAST模型在标准普尔500指数和中国a股指数的模拟中证明了考虑文本细粒度时间不规则性的积极作用。Li和Pan提出股票价格受到多种因素的影响,并提出了LSTM和GRU相结合的集成深度学习模型,他们还通过咨询心理学和经济学理论来确定文本信息的窗口大小,以解释新闻的持久或短暂影响。
门控循环单元(GRU) gru是lstm的一种变体,在股票市场预测中表现良好,他们解决了梯度消失的问题,并通过减少单元数量来提高训练速度。受Qin等人提出的基于双阶段注意力的RNN用于时间序列预测的工作启发,Yang等人提出了使用GRU网络进行股价预测的双阶段注意力机制。该机制根据对股价的影响为不同的财经新闻标题分配不同的权重,重点是解释预测的原因并避免自然语言处理工具的错误。同样,Li、Shen和Zhu提出了一种新的多输入LSTM (MI-LSTM)模型,该模型利用注意力来区分主因素和辅助因素,并对这些输入赋予不同的权重,以防止不相关因素对最终结果的影响。为了应对混乱新闻的挑战,Hu等人开发了一种混合注意力网络(HAN),该网络包含了一种自定节奏的学习机制,这种方法兼顾了财经新闻的可信度和全面性,包括两个注意层,一个在新闻层面,另一个在时间层面。
双向GRU层也被用来编码语料向量的时间序列,经过回测,模拟交易的年化收益率显著提高。同样,Wang等人提出了一个纳入专家意见的股票预测框架,多视图融合网络立场检测模型(MFN)框架利用多视图文本特征和相关金融领域知识来确定文本的上行和下行投资意见,然后使用立场聚合模块基于动态专家挖掘过程来识别和聚合高质量的意见,最后,使用股票预测模块,利用前两部分输入的专家意见指标预测个股的未来趋势。预测组件利用GRU对时序特征序列进行编码,并利用时间感知关注机制动态地整合股票中的隐藏状态,该模型使用真实世界的数据集进行了验证,证明了其在提供投资建议和个股预测方面的有效性
为了解决非平滑动态和复杂的市场依赖性导致的股票趋势预测困难,Wang等引入了一种新的分层自适应时间关系网络(HATR)来描述和预测2021年的股票演变。HATR模型通过使用扩展的因果卷积和门控路径,从股票交易序列的多尺度局部组合中捕获短期和长期过渡特征。该模型建立在他们之前的工作基础上,在之前的工作中,他们使用了双重注意机制,其中包括霍克斯过程和目标特定查询,以检测基于单个股票特征的关键时间点和尺度。此外,为了揭示股票之间隐藏的相互依赖性,作者结合了一个多图交互模块,该模块将先前的领域知识与数据驱动的自适应学习相结合。
4.4基于卷积神经网络的模型
cnn因其在计算机视觉(CV)和自然语言处理(NLP)任务中的有效性而被广泛研究。CNN模型由多个用于特征提取的卷积层和池化层组成,传统的卷积层使用二维滤波器(核)和激活函数来处理图像特征,然而,在股票预测领域,cnn用于处理一维特征的时间序列数据。为了适应数据形状的这种差异,cnn对时间序列使用一维过滤器,该过滤器以数据粒度决定的步幅在时间序列上滑动。
人们普遍认为,cnn擅长通过使用卷积层捕获重要特征,从而有效地预测股票波动。Selvin等支持这一观点,此外,Ding等人对事件嵌入方法进行了改进,加入CNN对输入历史事件嵌入进行训练,池化层有效提取具有代表性的事件历史特征,使用分层方法训练基于通用cnn的预测器(U-CNN pred),其中子cnn层依次进行预训练,直到所提出的模型结构完成。该模型显示出合理的结果,并且由于其浅结构,由于需要学习的权重较少,因此降低了过拟合的风险,被证明是有效的。
为了充分利用劳资关系中包含的信息,一些模型将知识图与cnn相结合,以提高其性能。其中一个模型是由Deng等人提出的知识驱动的时间卷积网络(KDTCN),该模型利用Open IE提取与知识图相关的事件,并做出可解释的股票预测。传统一维卷积层的一个常见问题是数据泄漏,其中时间−1和+ 1的信息可能影响时间的数据,为了解决这个问题,KDTCN模型采用了因果卷积,它只使用了前一层中当前和以前的时间步长的信息,通过提取价格时间序列中的重要特征,KDTCN模型已被证明在解释价格突变方面是有效的。
CNN和LSTM的结合可以进一步增强时间序列的预测能力,Lu等提出了CNN-LSTM模型预测每日收盘价,其中CNN分量从10天的历史数据时间序列中提取特征,LSTM分量进行价格预测。在随后的研究中,Lu等提出了一种CNN-BiLSTM-AM模型,该模型结合了注意力机制来捕捉历史上股票波动对价格时间序列的影响,提高了基于cnn的模型的性能。Wang等也提出了一种用于股票收盘价预测的CNN-BiLSTM模型,并通过在Bi-LSTM的输出门中加入tanh函数来改进模型的性能。Mehtab和Sen提出了一种单变量卷积LSTM模型用于预测印度股票的开盘价,并通过将10天的时间序列划分为两个5天的数据序列来提高模型的性能,使卷积层能够提取更多的历史数据特征。
此外,GRU的使用最近也被证明在处理任务方面是有效的。Zhou, Zhou, and Wang提出了一种基于特征选择的由CNN和Bidirectional GRU组成的集成股市预测模型,CNN负责特征提取,GRU负责处理时间序列数据,他们使用股票市场的收盘价作为模型输出,所有其他数据作为输入,得到的结果比其他基本模型误差更小。
最近的一些研究探索了知识图、LSTM和CNN在股票预测中的集成。Wu等人开发了一个基于cnn的框架,利用历史股票价格和未来数据,如领先的财务指标。在他们随后的工作中,他们提出了一种基于图的CNN-LSTM模型,该模型使用由期权图像、未来图像和历史图像组成的组合图像。此图像包含30天的信息,包括某只特定股票的股票价格和财务指数,组合图像的行表示时间序列的变化,而列表示输入CNN-LSTM模型的特征。为了解决模糊系统的过拟合和慢收敛问题,Chandar开发了一个鲁棒股票交易模型,该模型从历史股票数据中提取10个技术指标作为特征向量,通过设置数据范围,提高了收敛速度。然后将这些特征向量转换成图像并用作CNN模型的输入,以获得标记的销售点、购买点和持有点,CNN模型中添加的dropout层有助于防止过拟合,通过准确性和f1评分来衡量模型的有效性。
4.5基于图神经网络的模型
GNN是一种以图的形式处理数据的人工神经网络,它们在股票市场预测中发挥着至关重要的作用,因为它们能够处理不规则的结构化数据,而不像cnn是为欧几里得结构化数据设计的。GNN的结构由节点和边组成,这使得它可以对实体之间的关系进行建模,在股票市场预测中,节点通常代表公司或股票,边代表它们之间的关系。例如,关联公司的股价经常同时波动,例如当一条好消息发布时,相应的股票立即飙升。这突出了在进行预测时考虑关系的重要性,本章将探讨四种主要的基于图的模型:GNN、图卷积网络(GCN)和图注意力网络(GAT)。
图神经网络(GNN) Matsunaga、Suzumura和Takahashi采用知识图谱整合公司信息和GNN模型作为预测个股表现的手段,知识图的使用允许在股票市场预测的背景下表示代表公司的实体之间的关系,主要贡献之一是通过滚动窗口分析利用回测方法。类似地,Ding等人在他们之前的事件驱动工作的基础上,引入了知识图神经张量网络(NTN)模型,该模型对表示抽取事件实体之间关系的实体向量进行编码,并将其输入到事件嵌入学习过程中,解决了事件嵌入在揭示事件之间语法或语义关系方面的局限性。Xu等通过引入层次图神经网络(HGNN)解决了股票价格限制预测的挑战,该模型通过构建股票市场关系图,分层次从节点视图、关系视图、图视图等多角度提取信息,考虑了市场状态的各种属性。HGNN在对跌停股票类型进行分类方面取得了优异的成绩,并提高了投资回报率。类似地,Li等人提出了一种基于gnn的模型,通过融合多源异构子图来预测股票市场,使用了三种类型的数据集子图来表示股票市场指数、股票市场新闻和图形指标之间的关系,然后将这些子图的融合转换成一个完全连接的分类层来进行预测。Ang和Lim利用图形编码模块跨公司关系传播多模态信息,此外,他们还引入了一个注意力模块,用于捕获公司内部关系和不同模式之间的全局和本地信息,该模型在三个预测任务和两个实际数据集的应用中表现稳健。
图卷积网络(GCN) GCN是一种专门为处理图数据而设计的深度学习模型,它使用图卷积层从图中提取特征,并根据图中节点之间的关系进行预测,GCN通常与其他深度学习模型相结合。例如,Chen和Wei提出了一个管道预测模型,该模型使用GCN模型集成了企业之间的关系,在这个模型中,每个公司在图中被表示为一个节点,边表示公司之间的关系,这些边的权重表示持股比例,此外,基于lstm的编码器层用于对公司的历史特征进行编码,从而提高了性能。类似地,Li等人提出了一种LSTM关系图卷积网络(LSTM- rgcn)模型,该模型可以处理股票之间的正相关和负相关。公司之间的相关矩阵是基于历史市场数据计算的,在RGCN层中加入LSTM机制有助于缓解预测隔夜股价走势时的过度平滑问题,还引入了一种新的门控时间卷积来学习股票特征的时间演化,现有的几个模型旨在捕捉股票价格和新闻信息之间的时间依赖性。
然而,他们没有充分利用来自其他高度相关股票的信息,为了解决这一差距,Yin等人引入了一种集成GCN和GRU的图卷积网络模型,GCN从具有高度相似性的股票中提取特征,然后将其输入GRU模型以捕获时间依赖性。另一种考虑股票之间关系的方法是Feng等人提出的关系股票排名(RSR)框架,RSR框架由三层组成:使用LSTM的顺序嵌入层、关系嵌入层和预测层,此外,他们还提出了一个时序图卷积模型来解决排序问题。Sawhney等人提出了时空超图卷积网络(STHGCN),这是一种使用超图结构来模拟股票之间关系并应用空间超图卷积的著名方法,这是第一个超图学习方法。
由于公司运营和国民舆论等各种因素的影响,预测个股的价格走势可能是一项艰巨的任务。然而,股票市场指数提供了一种更可靠的手段来了解股票市场中特定行业或公司的整体趋势,因为它们受单个公司变量的影响较小。在最近的一项研究中,Wang等使用GCN分析了股票趋势预测中指标的相关性,他们引入了MG-Conv模型,该模型基于多图卷积神经网络,并利用使用股票数据构建的指数之间的静态图。此外,他们基于不同投资组合策略的指数之间的趋势相关性创建了动态图,并基于这两个图定义了多图卷积操作。
图注意网络(GAT) 图注意网络(GAT)结合了GNN和注意力的优势来提高大规模图的性能。注意机制有助于将注意力集中在最关键的节点上,减少复杂背景噪声的影响,提高信噪比。此外,注意力允许利用节点之间的互联性和分层连接来增强手头任务的相关信息。Kim等人提出使用分层注意网络(HATs)来预测个股价,HATs采用LSTM和GRU作为各自任务的特征提取模块,通过聚合不同类型的数据并将这些信息添加到每个表示中,从而获得比以前的方法更好的结果。同样,Sawhney等人提出了一种多管齐下的股票预测注意力网络(MAN-SF),该网络融合了来自财务数据、社交媒体和股票间关系的信息,使用分层注意力来训练GAT。
预测特定公司趋势的一种方法是使用基于公司之间预先建立的关系的GCNs。然而,走势溢出可以通过各种企业联系发生,其重要性可以随着时间的推移而变化。Cheng和Li等人引入了一个属性驱动的图注意网络(AD-GAT)来捕捉这些属性驱动的走势溢出,该网络利用揭露注意力机制,利用基于张量的特征提取模块来推断市场信号中的动态公司关系。在使用标准普尔500指数三年数据的实验中,发现所提出的模型比GCN、eLSTM和TGC更准确,AUC更高。
4.6Transformer模型
cnn擅长通过创建二维信息的内部表示来处理空间数据,此外,rnn更适合于涉及时间或顺序数据的任务,例如金融新闻、tweet和股票价格时间序列。然而,rnn在处理长序列时可能会遇到困难,因为模型可能会忘记远处位置的内容或混淆附近位置的内容。Transformer通过利用自关注机制和位置嵌入来处理句子来解决这个问题,因此,Transformer模型在各种股票市场预测任务中显示出令人满意的结果。
基于Transformer的模型 为了增强股票波动模型,Ramos-PÃľrez等人实现了机器学习和深度学习技术,他们提出了Multi-Transformer模型,这是现有Transformer模型的一种变体,该模型利用随机选择各种训练数据子集的策略,并结合多注意方法来提高注意过程的稳定性和准确性。类似地,Ding等人引入了分层多尺度高斯Transformer来预测股票走势,在传统的Transformer算法的基础上,采用多尺度高斯先验和局部优化,并实现正交正则化,防止多注意力下的学习头冗余,此外,他们为Transformer开发了Trading Gap Splitter,以帮助学习高频金融数据的结构层次。
Transformer模型已经被证明可以有效地捕获长期依赖关系,使它们非常适合处理与时间依赖相关的问题。Li等人提出了一种新的Transformer encoder attention (TEA)框架,该框架利用注意机制来解决金融数据中的时间依赖性问题,并揭示与社交媒体文本相关的股票价格中的隐藏信息,TEA模型利用特征提取器和级联处理器架构,由Transformer编码器、注意机制和规范化技术组成。特征提取器有效地从过去的文本和股票价格的五个日历天收集信息,以提取关键信息。同样,Zhang等人引入了基于transformer的注意力网络(TEANet)架构来处理利用五个日历日数据的时间相关问题,TEANet框架包括一个深度文本特征提取器,它利用Transformer和一个连接处理器来有效地合并和平衡各种元素的影响,例如tweets和市场价格。Yoo等人通过利用多个股票之间的联系提高了预测准确性,为了实现这一点,他们引入了具有多级上下文的数据轴转换器(DTML),DTML模型以端到端方法构建非对称和动态相关性,以学习股票之间的相关性,并为所有个股提供最终预测。
许多研究利用基于transformer的模型将文本信息作为输入来理解股票相关新闻媒体中的情绪,财经新闻情绪分析的目标是预测市场对文本中潜在信息的反应。Li等认为,社会情绪在反映公众对股票走势的看法方面起着至关重要的作用,为了收集这些信息,从社交平台和财经新闻文章中收集了社会情绪和专业意见,然后将这些数据输入张量转换器进行模型训练,这有助于消除噪声并捕获更多的内在关系,经过训练的模型可以用来利用各种来源的数据来探索社会情绪的影响和功能。Liu等人认为,现有的基于社交媒体的股票预测算法只考虑了个股的语义和相关性,但未能考虑到大量社交媒体平台上存在的相互矛盾的信息,他们提出了一个基于Transformer Encoder (CapTE)的Capsule网络作为解决方案,其中包括一个Transformer Encoder来捕获tweet之间的深层语义特征和结构化关系。Yang等人提出了一种分层的、基于Transforme的多任务(HTML)模型,用于预测短期和长期资产波动,此外,他们还使用音频数据以及普通新闻和财经报道来进行预测。
Chen等人介绍了Three-Tower Transformer(GT3)作为提取和积分多元股票时间序列的解决方案,为了解决有限接受域的挑战,他们实现了移位窗口编码器(CWTE),用于从数据嵌入中捕获信道特征,为了提取和聚合多尺度时间信息,该团队开发了具有多时间聚合功能的移位窗口编码器(SWTE)。对于复杂的文本特征提取,团队使用了一个普通的Transformer编码器作为text Tower encoder (TTE)。此外,为了帮助模型理解市场趋势和社交媒体内容所传达的含义,实施了跨塔注意方法,然后通过自适应栅极层融合来自CWTE, SWTE和TTE的特征,以获得高效和准确的结果。
预训练语言模型 BERT是一种基于Transformer体系结构的语言模型,它已经成为自然语言处理任务中预训练的流行选择。该模型利用两种独特的训练方法,即掩模语言建模(MLM)和下句预测(NSP),来理解词之间的关系和句子之间的长期依赖关系,此外,BERT的预训练模型可以被微调以适应特定的用例。
财经新闻被认为是股票市场分析的重要信息来源,其对股票收益的影响已被充分证明。Dong等人提出了BERT-LSTM模型,该模型利用BERT提取基于社交媒体新闻的股票价格方向,而自回归LSTM则将信息特征作为协变量集成,该模型还利用历史价格趋势来预测未来的股价走势。Sonkiya等采用BERT模型对苹果公司的新闻和标题进行情感分析,从分析中获得的情感得分被用作GAN的输入向量,该GAN由GRU和CNN组成,分别作为生成器和鉴别器,GAN能够连续生成数据,并区分真实和生成的股票价格样本,从而达到预期的预测效果,通过使用情绪得分作为输入,优化了模型的早期收敛性。Colasanto等人利用AlBERTo(一种基于transformer的模型)对意大利社交媒体进行情绪分析,从而改进了股票预测,该模型计算市场中可能影响股票的各种事件新闻的情绪值。
一些研究人员提出,新闻评论可以影响投资者的情绪,最终影响他们对市场趋势的估计和投资决策,而不是仅仅依靠文本中的情绪来预测股市。Li等使用BERT预训练模型对新闻网站上的投资者评论进行评估和分类,他们采用了回归分析方法来验证投资者情绪和股票回报之间的关系,利用两步横截面回归验证来消除数据中异方差和一致性的任何潜在问题。Zhao等人也承认专家股票评论对于准确的股票预测的重要性,因此选择利用BERT对现场专家的评论进行更全面和准确的翻译。他们指出,BERT的固定长度文本输入会导致在探索长文本信息时表现不佳,为了克服这一限制,他们采用滑动窗口技术来分割原始文本,增加样本量并减少过度拟合,以从冗长的文本中捕获所有信息,此外,他们从BERT模型的每一层提取输出特征,并应用消融策略从这些特征中提取有用的信息。
BERT在股票市场中的应用不仅限于预测价格或走势,Zhou等提出了一种基于bert的双层模型,用于检测预定义的交易事件,并通过纳入广泛的金融文本进一步增强了该模型,低级模型是一个多标签令牌分类器,用于标识每个短语中每个令牌的事件。高级模型将低级模型的输出与整篇文章结合起来,以确定每个事件发生的可能性,最后的交易策略是基于识别的时间和股票,利用字符串匹配来检测事件。Hsu等人采用选择性扰动掩蔽(SPM)方法进行基于方面的情感分析,SPM分析句子中每个单词的值,并使用两种替换策略替换不重要的单词,而不影响方面级极性来解决可读性和语义一致性问题。作者将SPM用于股票价格和风险变化预测作为情感分析的真实场景进行了测试,并进一步在方面项情感分类(ATSC)和方面项提取(ATE)等子任务中对其进行了评估。
4.7强化学习模型
在股票市场中,RL被用来设计交易策略和管理投资组合,RL是一个框架,它允许通过与环境的交互进行学习,如图6所示。强化学习中的关键概念包括马尔可夫决策过程(MDP)、代理、环境和奖励信号,RL问题可表述为:代理通过与环境的交互来优化其策略,具体来说,agent由状态和策略组成,由和时间t表示。当agent与环境交互时,收到奖励,并且agent的状态更新为+1,如果下一个状态完全依赖于当前状态,则认为决策过程是马尔可夫的。
MDP也可以定义为元组的形式:M = {S, a, R, T, },其中状态和动作分别用S∈R和a∈R表示,函数R: S×A→R表示奖励,函数T: S×A→S表示下一个状态,因子用于减少未来奖励的影响,强化学习的目标是优化策略,使预期收益最大化。
一般的交易过程,包括高频交易和投资组合管理,如图6所示,这个过程可以形式化为一个决策过程,用MDP M = S, a, R, T, 表示。在这个MDP中,国家包含了企业的基本信息和市场数据,以及代理所持的立场,动作是一个连续或离散向量,表示在给定时间步长交易的股票数量,每个时间步骤的奖励是该步骤获得的利润,状态转换T由状态和动作共同决定,RL算法的目标是找到一种策略,使期望收益在轨迹上最大化。
4.7.1无模型强化学习 无模型强化学习算法是近几十年来发展起来的一个成熟的分支,其中代理直接与环境交互,在无模型环境下,策略梯度、q学习和混合算法在金融市场上被广泛使用。
策略梯度 RL的目标是最大化预期回报,一种直接的方式是最大化目标函数()=∼[()],这个函数的梯度,称为∇(n),称为策略梯度,通过使用对数导数技巧,可以将梯度变换为:
强化算法是基本的策略梯度算法,A2C算法通过增加基线来减少方差和评论家来估计状态值来改进强化,这可以评估动作令牌。为了提高A2C的效率,提出了Asynchronous Advantage Actor-Critic, A3C算法,该算法使用多个智能体异步训练参与者-评论家网络。Trust Region Policy Optimization (TRPO)和Proximal Policy Optimization Algorithms (PPO)分别对旧策略与新策略之间的差异程度设置KL-Divergence和clip约束,并在这些约束下采取最大改进步骤。
强化算法由于能够通过梯度上升进行优化,在金融交易领域受到了广泛的关注。例如,Liang等人在对抗性训练环境中评估了三种不同的强化学习算法(包括DDPG、PPO和REINFORCE)的有效性,发现REINFORCE表现最好,这些实验是在中国股票市场上进行的,作者认为基于政策梯度的方法特别适合于金融场景。此外,通过使用循环网络的策略梯度将历史信息合并到状态中也是一种很有前途的方法。Jiang, Xu和Liang开发了一个用于投资组合管理的无模型金融RL框架,该框架结合了CNN, RNN和LSTM,并建立在确定性政策梯度(DPG)之上,该框架在加密货币市场上进行了测试,并被证明优于其他方法。
基于行为者批判的方法已被证明是有效的,通过纳入状态值来减少政策差异。Li, Rao, and Shi和Ponomarev, Oseledetsa, and Cichocki分别采用行动者批评方法(A2C和A3C)结合cnn分别分析了中国股市和RTS指数的未来。在他们的研究中,Li、Rao和Shi发现,他们提出的深度参与者批评交易(DACT)策略优于其他方法,如买入并持有、DQN和强化。与此同时,Ponomarev、Oseledetsa和Cichocki取得了令人满意的结果,即使考虑到佣金费用,年收益率也达到66%。
一些研究试图通过利用不同股票之间关系的信息来提高量化交易的表现,而不是仅仅专注于改进RL算法。例如,Wang等人开发了AlphaStock方法,该方法利用尖锐的比率导向政策梯度方法来解决投资组合管理中的挑战,如平衡利润和风险,避免极端损失。该方法融合了资产之间关系的信息,并且是第一个使用深度强化学习(DRL)实现可解释交易策略的方法。该算法在美国和中国股票市场上进行了测试,结果表明该算法具有有效性、鲁棒性和泛化能力,它倾向于选择那些有上升趋势和低波动性的股票。Wang等人在AlphaStock的基础上提出了一种新的策略梯度交易算法,称为DeepTrader,用于投资组合管理。它包括一个资产评分单元(ASU)和一个市场评分单元(MSU),ASU分别使用扩张CNN和注意机制提取跨资产的时间和空间特征,并引入gcn来表示资产之间的相互关系和因果关系,MSU控制着多头和空头的整体头寸,其主要网络是一个提取历史市场代表性的LSTM。DeepTrader在不同的股票市场进行了测试,与基线相比,风险更小,盈利能力最强。
Q学习方法 Q-learning是一种通过更新动作状态值(以表示)来获得最优策略的方法。Bellman更新用于更新,直到它收敛到最优值,然后可以通过贪婪地搜索值来找到最优策略。深度Q学习网络(Deep Q-learning Network, DQN)的出现,通过使用深度神经网络来近似Q值,将Q学习提升到了一个新的高度。在DQN出现之前,许多金融交易研究都使用了表格式q -学习算法,基于dqn的模型在这一领域已经显示出很好的结果。Carapucco Neves和Horta使用基于dqn的RL代理进行外汇交易,从而实现了稳定的学习和环境构建。Lucarelli和Borrotti提出了一种用于加密货币交易的Double Dueling DQN,并评估了不同奖励函数的性能,如利润奖励函数和锐比奖励函数。Theatre和Ernst使用有限的股票市场数据集开发了一种基于dqn的交易算法,并引入了新的评估指标,包括夏普比率(Sharp ratio)、Sortino比率(Sortino ratio)和盈亏比率(profit or loss ratio)。
由于DQN具有处理时间序列数据的能力,研究人员越来越多地关注DQN与循环网络的变体。Huang[提出了一个结合时间、市场和仓位特征的股票交易MDP模型,并利用具有小重播记忆和动作增强的循环DQN来求解模型。Chen和Gao还使用了DQN的一种变体,即深度循环q -网络(DRQN),用于标准普尔500指数ETF数据的自动交易,与其他方法相比,取得了更好的性能。此外,Tsantekidis等人将循环DQN应用于外汇市场,并使用了一种新的奖励函数,该函数结合了价格跟踪、利润、夏普比率和最大回调,以提高算法的简单性和有效性。
预测市场行为的循环算法,如RNN、LSTM和GRU,通常只依赖于价格信息。然而,正如Carta等人所指出的那样,仅使用价格信息和监督方法来预测未来的市场行为是极具挑战性的,为了解决这个问题,作者提出了一个多层的和利用DQN的基于集成的交易代理,该算法利用不同的元学习器来最大化奖励,并在不同的迭代中生成交易信号。此外,所有的学习者都被融合在一起做出交易的最终决定,该算法在期货市场和股票市场进行了测试,并发现其表现优于考虑的基线。
混合方法 混合强化学习算法同时学习策略和Q函数。其中一个例子是确定性策略梯度方法,它包括诸如深度确定性策略梯度(DDPG)、双延迟DDPG (TD3)和SAC等变体。特别是,DDPG利用off-policy方法从Q函数中学习Q值和策略。TD3结合了诸如剪切双Q学习、延迟策略更新和目标策略平滑等技术来防止Q值的高估。另一方面,SAC将熵正则化与Clipped Double-Q学习相结合,并使用Polyak平均更新q -网络。
由于DDPG能够在连续行动空间中结合政策梯度和q学习的优势,因此在金融市场中的应用得到了研究人员的广泛研究。Xiong等将DDPG算法应用于由30只道琼斯工业平均指数成分股组成的自定义环境,以制定股票策略。通过比较道琼斯工业平均指数和传统的最小方差投资组合配置策略来评估代理的绩效,结果显示,所提议的代理显示出卓越的盈利能力。此外,Sawhney等人引入了PROFIT模型,这是一种基于深度学习的方法,利用时间感知文本分析来模拟市场信息并优化交易行为,该模型在标普500指数和中国a股指数的盈利能力和风险管理方面优于竞争对手的方法。
强化学习算法有潜力用于股票交易,然而,创建和训练一个实用的强化学习算法可能是具有挑战性的,而且容易出错。为了解决这个问题,Liu等人开发了FinRL库,该库专注于无模型RL算法,并为用户简化了实现过程。该库包括教程和各种金融环境,如纳斯达克-100,道琼斯工业平均指数,标准普尔500指数,恒生指数,上证50和CSI 300,以及流行的DRL算法,如DQN, DDPG, PPO, SAC, A2C和TD3,此外,FinRL还包括公平和客观评估的回测指标。
4.7.2基于模型的强化学习 近年来,基于模型的算法在强化学习领域受到越来越多的关注。这些算法利用一个参数化的近似器,表示为-,来模拟由状态和动作S, a的集合定义的MDP的动态。该模型允许在给定特定的状态和动作的情况下,对奖励和下一个状态进行近似。与无模型的强化学习算法相比,基于模型的方法有几个优点。首先,它们可以通过解决与现实世界数据采样相关的挑战来提高数据效率,例如耗时或对硬件敏感的过程。其次,参数化模型允许有趣的探索策略,此外,基于模型的方法可以通过结合局部规划和全局学习来提高性能,此外,动态模型可以部署在新的任务中,使它们在迁移学习场景中非常有用,此外,该模型捕捉因果关系的能力可以帮助解决干预问题(解决特定行为的影响)和反事实问题(解决特定情况下不同行为的潜在结果)。
基于模型的强化学习已被用于开发几种交易算法,因为它有可能改善动态转换模型的性能。Yang、Yu和Almahdi等研究人员已经注意到投资者情绪在市场中起着重要作用,因此他们试图使用高斯逆RL方法设计包含这种情绪的交易系统。这种方法旨在揭示投资者情绪对市场状况的内在映射,并预测未来的市场趋势。虽然不是基于模型的方法,但Yang等人的研究提供了在交易中使用这种方法的潜力。Wei等人采用了不同的方法,他们使用每0.17秒一次的频率限制订单簿数据训练世界模型。通过使用动态转换模型,RL代理可以与模拟世界进行交互,而不是与真实环境进行优化。作者还声称,使用该模型训练的交易策略可以直接转移到现实环境中,并且具有稳定的盈利能力。基于模型的强化学习也被应用于投资组合管理任务。Yu等人提出了一种架构,其中包括预测模型、生成对抗数据增强模型和策略克隆模型,当与DDPG算法相结合并对每小时价格数据进行训练时,该模型显示出了盈利能力和鲁棒性。Briola等人也采用了基于模型的方法,使用PPO算法构建端到端DRL代理。代理学习过渡动态并实施计划以实现长期回报。该算法使用有限的订单数据,并选择具有显著价格变化的训练样本,结果表明,在非平稳市场中,所提出的代理能够产生稳定的利润。
4.8其他深度学习方法
在事件驱动的股票预测领域,与指标数据源的使用相关的两个关键问题是:(1)单个数据源的可靠性低;(2)缺乏对多个数据源之间相互作用和相关性的理解。为了应对这些挑战,Zhang等人开发了一种耦合矩阵和张量分解方法。该方法涉及定量特征矩阵的创建、矩阵的构造、事件和情感的提取以及耦合矩阵和张量分解的应用。所得到的模型能够有效地填补稀疏张量中的缺失值,允许通过使用分解的低秩矩阵对市场运动进行准确预测。
在高度随机的股票市场中,股票走势预测具有挑战性,为了解决这个问题,Xu和Cohen通过他们新颖的深度生成模型Stocknet提出了一个解决方案。该模型利用Twitter数据中的文本和价格信号以及前五天的价格数据来预测第六天的股票走势。Stocknet模型由三部分组成:市场信息编码器(MIE),它对推文和价格进行编码;变分走势解码器(VMD),用于解码股票走势;注意时间辅助(ATA),它通过注意机制整合时间损失。
为了解决由于数据和模型的不确定性导致的泛化不足问题,Wang等引入了一种基于copula的对比预测编码(Co-CPC)方法。Co-CPC考虑股票类别、行业和相关宏观经济变量之间的依赖关系,并以自我监督的方式从微观角度学习股票表示,这允许将库存特征映射到广义嵌入空间。该系统将微库存环境与多种宏观经济因素结合起来,并通过最小化数据和模型中的不确定性的自我监督目标来捕获耦合。同样,Duan等人提出了一种新的针对特定目标的抽象引导新闻文档表示模型,用于提取最具信息量的内容,该模型使用新闻摘要的目标敏感表示来权衡新闻内容中的句子,允许选择和组合最具信息量的句子进行市场建模。
因子模型是量化投资策略中常用的资产定价模型,构建高效因子模型的主要障碍之一是金融数据中存在的低信噪比。为了解决这个问题,Duan等人引入了FactorVAE,它将动态因子模型与使用变分自编码器进行噪声建模相结合,通过用未来信息近似因子后验因子模型,FactorVAE可以有效地指导学习过程。
5 .数据集和模型输入
在股票预测领域,机器学习模型所使用的数据集因不同股票市场的视角而异,最受关注的两项任务是预测股价和价格走势。此外,许多利用强化学习(RL)的研究都围绕着制定交易政策展开。当涉及到模型中使用的输入特征时,数据集可以大致分为两组:内在数据和外在数据。内在数据主要包括从股票数据本身提取的信息,如历史股票价格、财务指数和其他技术分析数据。由于股票数据本质上是时间序列的,因此内在数据通常由时间序列数据组成。此外,外部数据可以是多种多样的,可能包括文本、基础数据、工业知识图等信息。此外,在这一研究领域中使用的数据集可以涵盖广泛的时间段,从几个月到十年或更长时间。
数据集的另一个显著特征是,它们通常来自不同的地区,其中大多数是基于美国市场,但也包括来自中国、日本和印度的市场。表1列出了包含国家信息的常用股票市场缩写,表2提供了被评审论文中使用的数据集和模型细节的概述。
(1)股票价格 股票价格被认为是股票市场表现的最直接反映,通常在各种模型中既用作输入特征,又用作预测目标。在本次调查审查的论文中,股票价格的使用是普遍的,但它是利用各种形式,如开放,高,低,和封闭的数据,取决于模型设计。
(2)技术分析工具 传统股票分析中常用的技术分析工具与股票市场表现有很强的相关性,这些工具考虑了汇率、账面市值比率、交易量和其他相关财务指标等因素。
(3)宏观经济数据 宏观经济数据反映了一个特定地区的经济状况,与股市相关的两个常用指标是消费者价格指数(CPI)和国内生产总值(gdp)。这些指数提供了对当前市场状况的洞察,并表明股票市场是在增长还是在下降。
(4)基础数据 基础数据是指一个经济实体的全面信息,包括财务状况、公司结构以及与股东共享的任何其他信息。然而,当涉及到在深度学习模型中利用这些数据时,由于报告频率低和非结构化文本信息等限制,只有一小部分被利用。
(5)知识图谱 不同的行业可能有内在的联系,比如同一条供应链上的公司受到同一条新闻的影响。最近的实验表明,将来自开放资源的知识图与传统股票数据结合可以提高模型的性能。
(6)文本信息 文本信息包含广泛的来源,包括但不限于新闻文章、报告、社交媒体帖子和用户评论。鉴于大多数信息是非结构化的,情感分析是一种广泛使用的技术,用于通过深度机器学习提取见解。可以将数据分类为各种类别,例如正面、中性或负面,以便进一步分析和利用。
5.1输入特征
根据预测目标和数据集构成提取和组织输入特征,将其大致分为四组:时间序列、文本、知识图等。
(1)时间序列 时间序列数据在股票预测中是一种普遍的输入,因为许多模型依赖于对股票价格随时间变化的建模,预测的特定时间框架(如日内或日内)可以决定所使用数据的粒度,范围从分钟级到日级。此外,在强化学习的背景下,可以将时间序列数据转换为特征可以被识别的环境用于创造状态和奖励,这允许代理与环境交互,并不断改进其决策策略。
(2)文本 文本信息包括广泛的信息源,如新闻和文章,这类信息被认为会对投资者的情绪产生连锁反应,然而,在模型中使用文本信息之前,它必须经过预处理和结构化,因为它可能来自各种语言和来源。
(3)图 工业知识图谱被广泛使用,不仅可以显示企业之间的直接联系,还可以揭示上下游供应链等内部关系。
(4)其他 在库存预测任务中使用了不同的数据源,每种数据源都提供了独特的视角。这些包括图像数据和音频数据,这些数据被用作补充信息,例如,声音特征,如音调,可以表明说话者的情绪。
6评估
评价指标在评价股票市场预测模型的表现中起着至关重要的作用,它们被用来将不同模型的预测结果与实际值进行比较。分类模型常用的评估度量包括基于精度的度量,而基于误差的度量(如MAE和RMSE)通常用于回归模型。在本文中,我们将现有的评估指标分为三类:基于准确性的、基于错误的和基于回报的的。当它们的值较大时,基于精度和基于返回的度量被认为更好,而当它们的值较小时,基于错误的度量被认为更好,表3提供了使用这三种评估指标的论文的摘要。
6.1基于准确性的评估指标
在本节中,我们将阐明贯穿始终的几个关键术语,首字母缩略词TP代表“True Positive”,表示实际类和模型预测都为正的场景。TN,即“真负”,表示实际类和模型预测都为负的情况。FP,即“False Positive”,指的是当模型预测一个正的类,但实际的类是负的。最后,FN,或“假阴性”,表示实际类为正,但模型的预测为负。
准确性 准确性是分类任务中最常用的度量,它评估正确分类的预测与预测总数的比例,它可以用方程:=+/+++。
在多分类混淆矩阵中,正确分类的样本表示在从左上到右下的对角线上。这个度量,称为准确性,评估模型在识别样本方面的整体性能。如Hu et al 的研究使用Accuracy来衡量年化收益率,Chen et al的研究使用Accuracy来评价股价预测的结果。然而,重要的是要注意,准确性可能不是具有不平衡类的数据集的适当度量为了更准确地反映模型的性能,应该采用额外的指标。
Precision, Recall, F-measure 精度、召回和F1-score方程可以表示成
在多分类任务中,每个类别的性能可以使用精度、召回率和f1分数来评估。精度是指二值分类器预测的真阳性情况的数量,该指标反映了模型在正确识别阳性样本方面的可靠性。召回,另一方面,测量由二值分类器预测的测试集中的真阳性情况的数量,它表示模型检测阳性样本的能力。f1分数是精度和召回率的结合,在最近的研究中被广泛使用,f1分数的目的是在准确率和召回率之间取得平衡,以便对模型进行公平的评估。然而,需要注意的是,当使用精度、召回率和f1分数来评估模型的性能时,可能会导致不平衡,忽略了真正的负面情况,因此,也可以引入马修斯相关系数(MCC)作为一种可能的评价策略。
马修斯相关系数 马修斯相关系数(MCC)是评估单值分类模型性能的有用工具。它提供了包含在混淆矩阵中的信息的摘要,混淆矩阵是用于表示分类模型结果的矩阵,混淆矩阵通常用以下格式表示
MCC是预测样本和实际样本之间相关性的度量,其取值范围从-1到1。值为1表示完全正相关,值为-1表示完全负相关,这是在分类器错误分类时发生的。与基于准确性的指标相比,MCC对不平衡的类别更为稳健,一些研究已经使用MCC来评估他们的预测结果。
6.2基于错误的度量
评估预测模型的性能可以通过将预测值与实际值进行比较来完成,最广泛使用的方法之一是测量两者之间的误差,错误值越小,性能越好。在股票市场预测的背景下,通常使用各种基于误差的评估指标。这些误差包括平均绝对误差、均方误差、均方根偏差和平均绝对百分比误差,在这些指标中,值越高表示预测越好。
平均绝对误差(MAE) MAE的度量,即平均绝对误差,计算预测值和实际值之间的绝对差的平均值。一些研究采用MAE作为评估实际值与预测值之间差异,公式如下
均方误差(MSE) MSE(均方误差)是一个度量,用于确定实际值与预测值之间的平均平方距离。与计算绝对误差的平均绝对误差(MAE)不同,MSE通过使用误差的平方和将误差放大到最大。一些研究已经使用MSE方法来评估实际值和预测值之间的差异。MSE的计算公式表示为
均方根误差(RMSE)是一种常用的度量,通过测量预测值和实际值之间差异的第二个样本矩的平方根来评估预测的准确性。它类似于均方误差(MSE),唯一的区别是包含了平方根。因此,确定哪一个评价指标更优是一项挑战。RMSE的方程表示为:
平均绝对百分比误差(MAPE) 平均绝对百分比误差(MAPE)是用来评估预测模型准确性的度量,它计算预测值和实际值之间绝对百分比差的平均值。该方法在文献中被广泛使用。MAPE的公式可以表示为:
6.3基于回报的评估指标
评估股票市场预测的准确性可以有效地使用基于回报的评估指标,金融领域评估收益的两个常用指标是回报率和夏普比率,这些指标的值越高,预测就越好。
投资回报率(IRR) 内部收益率(IRR)是用来衡量投资业绩的指标,计算方法为:某项资产当前值()与前一时刻值(−1)之差除以前一时刻值(−1)的百分比。
平均年收益(AAR)。平均年回报率(AAR)是衡量共同基金历史平均回报率的一个指标,与内部收益率(IRR)不同,AAR以年为基础计算回报。它对于评估长期投资的表现特别有用。Wang等在他们的研究中使用了2010 - 2017年7年的数据集,并将AAR作为评估指标之一确定年平均收益率的方法。
夏普比率(SR) 夏普比率(SR)同时考虑了收益和风险,并计算了相对于无风险利率的每单位波动率的平均收益。用公式表示:
其中为收益率,为无风险率,σ为收益率的标准差,一些研究利用SR作为评估指标来评估收益率的表现。
7 .未来发展方向和开放性问题
股票市场预测任务极大地促进了机器学习的发展,特别是在自然语言处理(NLP)和强化学习(RL)领域。然而,为了进一步完善和发展这一领域,仍有几个潜在的研究方向和悬而未决的问题需要解决。
提高股市预测的泛化能力 机器学习模型准确分类或预测未知数据的能力被称为泛化。在股票市场预测的背景下,深度学习模型必须同时具有高度的永恒性和较强的泛化能力才能有效。然而,之前的一些方法很难很好地推广到现实世界的交易场景,或者在某些看不见的数据子集上表现不佳。最近的研究表明,将自监督学习任务纳入分类任务可以提高泛化,如等工作所证明的那样。在这方面的进一步研究,无论是探索现有的方法还是开发新的方法,都可能是股票市场预测任务的一个有希望的方向,一种增强泛化的自我监督方法可能值得在未来进行研究。
在线学习是一种利用在线训练结果作为反馈来优化模型的训练方法 这种方法在减轻股票市场的波动性、不确定性和高噪声因素的影响方面特别有用。它在股票市场投资策略中的应用是有价值的,因为投资者必须根据股票价格的变化不断调整他们的投资计划,在线学习可以同时更新模型,并自动控制预测结果与期望值之间的差异。在线学习方法的其他应用领域包括处理突然变化的时间序列。例如,Habibi提出使用贝叶斯设置进行在线变化点检测,考虑到道琼斯工业平均指数每日结果的突然变化,虽然这项工作有助于及时检测变化点,但它不能为变化的交易策略提供反馈。我们认为,将在线学习和机器学习相结合,在股市预测方面具有巨大的潜力。
改进股票市场预测的评估和数据集 目前,许多股票市场预测模型只评估股票走势预测精度等中间指标。然而,目前尚不清楚这些模型能在多大程度上支持一个实际的交易系统,而且对盈利能力也缺乏统一的评估标准,每篇论文通常在不同的数据集上使用不同的评估指标。因此,新的股市预测模型应该能够评估与财务相关的指标,这些指标可以分为三类:利润标准,包括年化收益率(ARR);风险准则,包括最大回撤率(MDD)和年化波动率(AVol);风险收益标准,包括卡尔玛比率(CR)、索蒂诺比率(SoR)和年化夏普比率(ASR)。此外,目前股票市场预测任务比较分散,缺乏统一的基准数据集和明确的任务描述,极大地阻碍了该领域的发展。
改进时间序列异常检测的股票市场预测 从市场上成千上万的股票中快速有效地识别出表现不佳的股票是一个现实的命题。金融市场不稳定给投资者带来重大风险;不稳定的例子包括系统性风险导致的市场崩溃,以及人为夸大宣传造成的股价异常波动,在没有考虑异常异常值存在的情况下,最常见的股市预测模型未能捕捉到最佳交易点。时间严重异常检测有助于股票市场预测,捕捉股票市场交易价格中的异常值,帮助投资者调整投资策略,降低投资风险。此外,该模型可用于对多个财务时间序列数据集进行建模,并捕获感兴趣公司的异常情况。为此,在现实世界中交易时,设计一种基于时间序列异常检测任务的更好的机制来捕获预测任务的最佳交易点是一种有前途和必要的异常检测。
任务合一:持续学习股票市场预测 持续学习是一种技术,用于连续训练多个任务上的模型,同时保留从以前的任务中学到的信息,即使这些任务的数据不再可用。这使得神经网络能够不断积累知识,减轻诸如股票预测等任务中的“灾难性遗忘”。然而,目前用于股票预测的深度学习模型通常是在静态的、均匀分布的数据上训练的,这些数据不能随着时间的推移而适应或扩展。据我们所知,目前还没有专门为股市预测设计的持续学习模型,因为股市环境的波动需要模型自主地获得新的技能,适应新的情况。现有的股票市场预测方法在单个数据集上评估单个任务,这可能导致最近输入数据的过拟合。持续学习方法(例如基于参数隔离的方法)可以通过在学习每个任务后冻结部分参数来克服这个问题,从而允许更准确、更有效地为新任务更新模型。
利用分布式RL进行股票交易 由于金融市场的波动性和噪声,量化交易算法仍然在努力平衡利润和风险。一个潜在的解决方案是使用分布式RL,这是由Bellemare等人在他们的论文中首先提出的。分布强化学习超越了传统的值,它利用一个定义好的随机变量,其期望代表状态-作用值,形成分布Bellman方程。在-Wassertain距离的度量下,证明了这个方程是收缩的。RL中许多最先进的q学习算法都是分布式的,如C51、分位数回归DQN (QR-DQN)[23]、隐式分位数网络(IQN)和完全参数化分位数函数(FQF)。分布式强化学习可以提供更多关于收益分布的信息,这可以帮助算法降低风险或提高鲁棒性。之前的研究已经证明了分布式强化学习在雅达利游戏中的有效性,其中算法的得分高于人类玩家。然而,对分布式学习在金融交易中的应用的探索有限,因此,分布式强化学习在这一领域的潜力值得研究。
将股票交易视为部分可观察马尔可夫决策过程 如本节所述,强化学习算法已广泛用于金融交易。这些方法包括无模型方法,如策略梯度、q学习和混合方法。然而,这些方法假设了一个完全观察到的MDP,这并不能准确反映金融市场的开放性和不断变化的性质。为了解决这个问题,未来的研究有两种可能的解决方案,第一种解决方案是收集所有事务以使动态完全被观察到,这可能需要大量的存储和计算资源。例如,Briola等人使用了小规模的交易数据,这是未来研究的潜在方向。另一个解决方案是使用基于模型的强化学习方法来近似动态。Wei等人、Yu等人、Liu等人等研究人员已经证明了过渡动力学模型的有效性,因此,基于模型的方法在金融交易中的应用具有相当大的潜力,值得探索,通过使用过渡动态模型,策略可以进行更长远的规划
8 结论
在本文中,我们对利用深度学习进行股票市场预测的最突出的研究进行了全面的检查,为了帮助理解和组织这一领域以前的研究,我们提出了一个分类系统来对类似的作品进行分类和分组,此外,我们还提供了当前主要方法的概述,评估指标,以及用于股市预测的数据集。我们还探讨了股票市场预测中机器学习研究的开放问题,并强调了有希望的未来方向,通过这次调查,我们的目的是让读者对深度学习在股票市场预测中的应用有一个全面的了解