ニューラルネットワークを使用したプライスの予測

よく知られているチャートのテクニカル分析から最新のニューラルネットワークまで、マーケットデータを解析する技術の歴史を短時間で紹介する。

記事

price-forecasting-using-neural-networks
MQL4のコミュニティで次の記事を見つけた。
「ニューラルネットワークを使用したプライスの予測」
http://articles.mql4.com/461

以下抜粋して日本語訳を書くことにする。

初めに

過去数年間にわたり、我々はニューラルネットワークへの関心が急速に広がり、ビジネス、医薬開発、工学、地質学、物理学などの異なった分野でうまく利用されるのを見てきた。
ニューラルネットワークは予測や分類、経営などが要求される分野で幅広く利用されている。
このような印象的な成功は次のようないくつかの理由によるものだ。

多くの可能性

ニューラルネットワーク(以下NNと略)はとてもパワフルなモデリングツールであり、限りなく複雑な関係の再生産を可能にしている。
特徴としてNNはもともと非線形という性質をもつ。
長い年月の間、線形のモデリングが大部分の分野での主な手法であった。
これは線形モデリングについての最適化の手順がうまく開発されていたからである。
しかし線形の概算は不十分であり、線形モデルはうまく機能しなかった。
それに対してNNは「次元の呪い」といわれる”多数の変数があるケースでは線形関係としてモデリングすることができない”問題を解決している。

NNは例から学習する。
NNの使用者は代表的なデータを対象に選びそしてトレーニングのアルゴリズム(自動的にデータ構造を理解する)をスタートさせる。

もちろん使用者はデータの選び方・準備の仕方・適切なネットワーク構造の選択の仕方・結果の解釈の方法についての一通りの経験的知識をもっていなければならない。

しかしNNをうまく使うのに必要な知識の量は、伝統的な統計手法を使うのに必要な知識と比べてかなり少ないのである。

NNは直感的な見解から魅力的である。
これはNNが原始的な生物学の神経系モデルを元にしているためである。
将来、神経生物学的モデルの発展が本当の知的コンピュータの製作をリードする可能性がある。

金融の時系列の(プライスの)予測はあらゆる投資における主要な活動となっている。

投資についての考え”将来利益を得るために今マネーを投資する”は将来を予測するという考えが元になっている。
したがって金融の時系列を予測することは投資産業(すべての株式交換と店頭市場(OTC))の根源なのだ。

よく知られていることとして、すべての取引のうち99%は投機すなわち実際の取引を目的としたものではなく、”安く買って高く売って利益を得る”目的で行われている。

これらは取引参加者がプライスの動きを予測することがベースとなっている。
ここで重要なことは、取引参加者同士の予測はお互いに正反対のものとなっていることだ。
そのため投機的取引の取引高は市場参加者同士の予測の違いを表している。実際、金融の時系列は予測不能である。

マーケットの時系列の最も重要な特徴はL.Bachelier氏が1990年に書いた記事”効率的”市場理論の背景となっている。

この記事によれば投機家は、NY取引所のダウ・ジョーンズやSP500のようなインデックスにより算出される「平均的マーケットの収益性」のみを信頼することができる。

あらゆる投機的利益はランダムな自然現象から得られるものであり、ギャンブルのようなものである(何かしらの引きつけるものがある)。

マーケットのチャートが予測不可能である理由は、なぜマネーが公衆のためにめったに使われないのか(あまりに多くの人々が望んでいるのに)という理由と同じである。

当然、効率的市場論はどこかに転がっていないかマネーを探す市場参加者には支持されていない。
彼らの多くは、確率的(ランダム)であるように見えるにもかかわらず、すべての時系列には隠された規則性がある、つまり少なくとも部分的には予測可能であると考える。

波動の法則を発見したR.Elliotは1930年代の彼の記事の中でそういった隠された経験的規則性の発見を試みた。

1980年代に入るとこの考えが新しく現れた動的カオス理論により思いがけず支持されることとなった。
この理論は無秩序状態とは反対であり確率性(無作為)に基づいている。
無秩序の連続はランダムに見えるだけであり、ある決定論的な動的プロセスであるため、短期間の予測が可能である。

予測可能な範囲は結局は予測の限界によって制限されるが、これは予測により実際に利益を得るには必要十分なことであろう。(Chorafas,1994年)。
そしてノイジーな無秩序の連続から規則性を抽出するベストな数学的方法を使用する人々が、彼らより知識の少ない人々の支出から大きな利益を得ることができる。

最後の10年間はテクニカル分析”マーケットの動きを示す複数の異なる種類の指標を基にした経験上の法則の集まり”の流行の永続的な発展と特徴づけられる。

テクニカル分析は他の有価証券から離されたこの金融商品特有の振る舞いに焦点が当てられる。
しかしテクニカル分析はとても主観的でありチャートの本当のエッジつまり”我々が必要とするプライスの動く方向を正確に予測する”ように機能するには非効率的である。

これがニューラルネットワーク解析がより人気を得ている理由であり、テクニカル指標とは反対にNNは入力する情報の種類にどのような制限もしていない。
これは他の金融商品の動きの情報と同じように一連の特定の指標と同等の性質をもつ指標であるのかもしれない。

だがNNは幅広く使われており(例えば巨大な年金資金ファンド)、大きなポートフォリオで活用され、異なる市場間の関係を調べるのに大変重要な位置を占めている。

純粋なNNモデリングはデータのみを元にしており、前記したいかなる論説も使っていない。
これはNNの強みであり同時に弱点でもある。

利用可能なデータはトレーニングに使うには不十分であり、潜在的な入力項目の量(入力に必要な量)が多すぎるのだ。

これが正しい予測を行うために大規模な機能性をもつニューロパッケージを使う理由である。

データの準備

NNを使うためにはデータを準備する必要があり、その精度が成功に80%の影響を与える。
NNの専門家は「エントリーとエグジットとして相場の数値Ctを使ってはならない。」と言っている。

何がほんとうのシグナルかといえばそれは「相場の変化」である。
この変化の大きさは相場自体よりも小さいひとつのルールのようなものであるが、(時系列的に)隣り合った値同士には強い相関が存在する、つまり相場の次の値として最も可能性のあるのは、1つ前の値

C(t+1) = C(t) + delta(C) = C(t)

である。

同時にトレーニングの質を高めるためには、エントリーの統計的独立を目指す、つまり相関を避けなければならない。

エントリーの変数として統計的に最も独立した値を選ぶことは筋が通っており、例えば相場の値の変化であるdelta(C)や相関の増減を対数にした

log( C(t) / C(t+1) )

などがある。

後者の値は長い時間系列で値の増減がはっきりしているときに(前者よりも)適している。
このような単純なケースでは時間系列の値の変化は実際にその時間単位の大きさによって異なる。

これとは反対に、連続した値同士の関係は測定する時間単位には依存せず一定の大きさである。

その結果として時間系列の大きな定常性は、長いヒストリカルデータを使ってトレーニングすることを可能にし、よりいいトレーニングへとつながる。

遅延空間に集中することの不利な点はネットの”視野”を狭めることである。
それとは反対に、テクニカル分析は(少し前までの)過去に時間範囲を固定することなく、時に古い時系列の値を使うことがある。

例えば、かなり前の時系列の最高値と最安値でさえトレーダーを不安にさせるだけの大きな影響力をもつため、それらは予測するのに役に立つ。

遅延空間への不十分な範囲の投入からはそのような情報は得られないため、当然予測への影響は弱いものとなる。
その一方でより過去へと視野を拡大させはるかに長い時系列の値を含んだものにすることは、ネットの次元を増加させ、ニューロネットの予測精度はより悪い結果となってしまう。

この膠着したように思える状態から抜け出る手段は、時系列の過去のふるまいをコーディングする代替えの方法である。

直感的に、時系列データをより過去に遡るにつれ、予測結果に影響するのはその値動きの詳細ではなく大まかなものであることがわかる。
これはトレーダーが過去を主観的に洞察する際の心理が背景にあり、彼らトレーダーが実際に未来(の値動き)を作るといえる。

結果的に我々は(精度を選択可能な)時系列の動きが表しているものを見つける必要がある。
より先の未来ほどその詳細はぼやけるが、その曲線は全体の形状を保ち続ける。

ここでかなり有望なツールとしてウェーブレット分解がある。
情報量の大きさの点では遅延投入に等しいが、より簡単にデータ圧縮に適応し、任意の精度で過去を表現できる。