人工智能越來越成為人類生活中不可或缺的一部分,深度學習作為人工智能中的主要算法,是對以往機器學習方法的一種拓展。目前,深度學習主要運用在計算機、工程學以及醫學等領域,包括:語音識別,圖像識別以及無人駕駛等。但將深度學習方法運用在金融市場預測領域還處于探索階段,通過對以往文獻的梳理,整理出深度學習在金融預測領域的主要研究方向,并對其優點和難點進行分析,最后對未來的深度學習研究進行展望。
關鍵詞:深度學習;金融市場預測;優點與難點
一、引言
金融市場預測,尤其是對股票市場的預測一直以來都是學者們研究討論的熱點之一。在對股票市場進行預測時,傳統的方法是將股票超額收益看成是由幾個重要因子的組成的函數關系,利用Fama-Macbeth回歸,估計出參數然后對未來收益進行預測,或者是使用動量效應進行未來趨勢的預測。動量策略在發達國家市場上可以獲得較為顯著的收益回報,但是在發展中國家的股票市場,動量策略能否產生顯著收益依舊是一個存在爭議的問題。幾個特征因子顯然無法準確預測龐大且復雜的股票市場,且Fama-French三因子模型在我國股票市場比五因子模型更適用。這些問題就更加說明我國的股票市場同發達國家股票市場存在著很大差異,使用這些模型對金融市場進行預測具有一定借鑒作用,直接拿來使用可能收獲不到期望的效果。金融市場預測又有其重要地位,它對防范系統性金融風險,管理市場以及監督市場等方面都起著重要作用。深度學習作為機器學習的一種,可以處理復雜的數據類型,適合處理金融市場數據。
二、深度學習的定義
金融市場的數據一般是時間序列數據,計量金融模型多建立在這些時間序列數據上,與傳統計量模型不同,機器學習(Ma-chineLearning)發源于計算機領域,綜合計算機科學、工程學以及統計學等學科的知識,它也是一類算法的總稱,被廣泛應用于計算機、工程以及醫學等領域,但在金融領域的應用仍處于探索階段。深度學習是傳統機器學習的延伸,一般指加深了層的深度神經網路,通過傳統的機器學習方法(如神經網絡),增加隱藏層,就可以創建深度學習網絡。深度學習方法克服了原來機器學習會產生梯度消失、過度擬合以及無法解決復雜系統結構的問題,而金融市場具有復雜的結構特征,使用深度學習方法會更加有效。深度學習方法是一類模型的總稱,常見的深度學習模型有:卷積神經網絡(ConvolutionalNeuralNetwork,CNN),深度信念網絡(DeepBeliefNetworks,DBNs),堆棧自編碼網絡(stackedauto-encodernetwork),循環神經網絡(RecurrentNeuralNetwork,RNN),長短期記憶網絡(LongShortTermMemoryNetwork,LSTM)等。
三、深度學習與金融市場預測
深度學習對金融市場進行預測一般有以下幾種途徑:
(一)通過對時間序列數據的建模
金融市場(如匯率,期貨,股票等)數據多為時間序列數據。傳統的線性建模方法一般為建立GARCH族或者ARIMA模型,而金融市場數據,尤其是股票市場多表現為非線性的特征,所以一般線性建模方法在股票市場并不適用。張承釗(2016)提出經驗模態分解、主成分分析和神經網絡綜合在一起的FEPA模型(FTSEMD-PCA-ANN),將該模型運用于滬深300指數的預測,獲得的精度高于傳統線性模型和傳統機器學習算法[1]。曾志平(2017)利用DBN模型在識別圖像方面的優勢,將原始時間序列數據轉化為時序數據曲線,將數學模型轉化為圖像識別問題,使得預測的準確率達到90%[2]。Kraussetal(2017)利用1992年~2015年標普500的所有成分股構建等權重集(ENS1)———深度神經網絡(DNN)、梯度提升樹(GradiantBoostTree)和一個隨機森林構成的集合,其中做多每日收益前十的股票,做空收益后十名的股票,每日可以獲得0.45%的樣本外收益[3]。Fischeretal(2018)利用1992年~2015年標普500的成分股構建長短期記憶網絡(LSTM),發現該模型能有效的從嘈雜的金融序列中提取到有效信息,且預測準確度高于隨機森林法、標準深度網絡和logistic回歸[4]。Hiranshaetal(2018)利用印度國家證券交易所(NSE)和紐約證券交易所(NYSE)的股票數據建立線性和非線性模型,發現卷積神經網絡(CNN)的預測精度要高于其他模型的預測精度[5]。
(二)通過文本數據來挖掘信息
上市公司會進行公開披露,新聞也會報道行業信息,如何從這些海量文本中挖掘出有用的信息并進行分析,是收益預測的另一種方法。傳統的機器學習通過提取文本中的關鍵詞,語氣詞構建相關指標,用來解釋市場超額收益。而傳統的機器學習方法無法捕捉文本中復雜的非線性特征,所以深度學習方法又提供了解決思路。Dingetal(2015)發現在股票市場預測上,結構性事件的特征決定其預測效果優于一般文本詞匯。將張量神經網絡和卷積深度神經網絡結合成新的深度學習模型,對標普500中的個股進行股價預測,首先使用張量神經網絡提取文本中的事件,通過對文本內容的有機結合,形成具有邏輯的結構性事件,這與傳統機器學習單一的提取一類詞語有著明顯的不同。將提取出的事件輸入到卷積神經網絡中進行訓練,卷積神經網絡提取事件重要特征,并且考慮到事件的歷史影響,最后得到個股預測準確度比標準前饋神經網絡(RNN)得出的結果高出6%[6]。
(三)將深度學習運用到量化投資
量化投資一般是指建立先進的數學模型,通過電腦代替人腦進行證券市場操作,避免在市場波動情況下投資人進行非理性投資。Zhu(2014)利用深度信念網絡(DBNs)深入學習股票交易歷史數據,對未來一段時間的股價進行粗略估計,利用灰色關聯度來確定影響股市的因素權重,再引入振蕩箱理論進行決策。利用標普500中的400只股票進行檢驗,發現該選股系統的確可以為股票交易者提供建議[7]。李斌等(2017)利用ML-TEA方法選擇了19個指標,對864只可融資融券標的股票構造量化投資組合,該方法包含三種投資策略:一是支持向量機和技術分析策略(SVM-TEA),二是基于神經網絡和技術分析的策略(NN-TEA),三是基于Adaboost集成的神經網絡和技術分析的策略(Ada-TEA)。最后發現該策略構造出來的投資組合,無論是在風險還是收益方面,都超過其他策略方法[8]。李斌等(2019)利用1997年~2018年A股市場96個異象因子構建了12種機器算法,在這些算法構建的量化投資模型中,發現深度前饋神經網絡能夠獲得最高的月度收益[9]。
四、深度學習的優點與難點
總體上可以看出,深度學習算法在金融市場預測方面具有以下優點:一是深度學習算法預測精度優于計量經濟模型以及一般機器學習算法,學者們多使用深度學習算法與其他模型作比較,并通過不斷地改進深度學習算法提高預測精度。二是深度學習在處理股票市場等復雜系統上具有先天優勢,神經網絡本身可以仿照人腦進行建模分析,而深度學習屬于加深了一般神經網絡的層數,使其在處理復雜數據上更有效果。三是深度學習拓寬了金融市場預測的數據類型。以往金融市場預測大多使用的是金融時間序列數據,或者是使用文本數據中某些關鍵詞構成指標進行預測分析。深度學習可以使用圖片、或者提取事件的方法,這突破以往數據的局限性,為研究金融市場提供了一種新的思路。目前使用深度學習進行金融市場預測的學者多以提升預測精度為目標,而深度學習在金融領域的應用尚處于探索階段,金融領域逐漸趨向于智能化,智能投顧、智能投研以及智能投資逐漸出現在我們的生活中,但若想完全實現這些則需要更加復雜的深度學習算法。所以深度學習方法也存在一些難點:
(一)構建隱藏層數
金融市場數據多以時間序列數據為主,時間序列數據通常有時間依賴性,金融市場數據會隨時間而發生變化,并且具有很強的季節性。而金融市場數據,尤其是股票市場數據具有復雜的非線性特征,其通常具有很大的噪音和很高的維度,使用降維方法又可能導致部分信息的損失。傳統線性模型以及機器學習方法使用在這些數據上得出的結果并不是很理想。對于深度學習方法,恰好可以滿足這種復雜條件的需求,但就模型的構造上來說,堆疊的層數也是深度學習模型建立的難點,使用堆疊的層數越多,所構造的模型就越復雜。但究竟多復雜才適合在金融市場數據上建立模型呢?往往多增加一層堆疊,就會加劇運算所需要的時間和空間。
(二)預測模型的穩健性
深度學習在面對不同類型或頻率的數據會識別不同的特征,從而導致模型容易發生變化。在對同一市場不同頻率和維度下的檢驗,仍然需要大量反復的實驗,才能確定某一模型是否符合金融實際。
(三)在金融學上的意義
傳統計量模型要求參數的顯著性,通過顯著性來確定變量之間是否有相關性。然而深度學習不再將模型參數當作重點,其更加關注模型自身的結構特征以及隨時間推移而形成的動態變化。例如金融市場預測時,深度學習更關注模型對未來預測的精度,它關心的是:相比于其它模型,構造出的深度學習模型是否能預測的更準確。卻很少考慮參數是否顯著,得出的結果是否穩健。
五、結論和啟示
深度學習的方法已經在計算機、醫藥等行業廣泛使用,在圖片識別、語音識別等各個領域發揮了重要作用。其研究方法無疑為金融市場研究提供了一種新的思路,目前,使用深度學習的方法對中國金融市場研究的學者還很少。未來深度學習在金融市場的研究可以從以下幾個方面入手:一是將傳統金融研究方法與深度學習方法相結合,提高模型預測準確性。深度學習在實證過程中可能會遺漏掉重要經濟變量,從而使得模型參數產生偏誤,所以在使用深度學習算法的同時還應該結合傳統計量方法和金融實際。二是可以使用圖片和文字等數據進行深度學習分析,挖掘可以使用的信息并進行預測。金融數據往往以趨勢圖的形式出現在人們生活中,圖片觀察起來更加直觀,從圖片中可以提取到金融市場運動的趨勢。三是更新深度學習的算法,縮短對大數據的計算時間。深度學習增加了模型的復雜程度,即便是使用計算機進行學習,依舊會花費大量的運算時間,所以優化算法也是未來深度學習需要改進的一個方向。
作者:范凱隆 單位:蘭州大學經濟學院
相關論文