Исследование динамики финансовых рынков нейросетевыми методами

Новизна проблематики состоит в анализе финансовой динамики нейросетевыми методами в комбинации с подходами, развитыми в эконофизике. Нейросетевой подход к анализу и прогнозированию финансовых временных рядов, использованный в настоящем разделе, основывается на парадигме теории сложных систем и ее применимости к анализу финансовых рынков. Использованный нами подход является оригинальным и отличается от подходов других авторов в следующих аспектах:
При выборе архитектуры сети и способа прогнозирования мы проводили глубокую предварительную обработку данных, используя методы теории сложных систем: фрактальный и мультифрактальный анализ, вейвлет-анализ, методы нелинейной и хаотической динамики. В настоящей работе мы не описываем этапов и методов этой предварительной обработки данных. Однако предварительный анализ позволил оптимизировать параметры нейросети, определить горизонт прогноза и провести сравнение качества предсказаний для временных рядов из различных секторов финансового рынка. В частности, для сравнения качества предсказания различных финансовых рядов нейросетью одной и той же архитектуры мы нормировали исходные данные к одинаковой дисперсии.

1. Постановка задачи нейросетевого анализа.

Рассмотрим динамические процессы на валютном, денежном, капитальном рынках в краткосрочные периоды, прогнозируя дневную динамику методами нейронных сетей.

Анализируемые в настоящем разделе финансовые инструменты– это фьючерсы:
• на курс доллар США – немецкая марка (обозначен как DM);
• на ставку процента ЛИБОР по евродолларам (ED);
• на фондовый американский индекс Стэндарт-энд-Пурс S&P500 (SP)

Данные по всем фьючерсам за период 04/01/95-31/08/1999 гг. взяты из Free Historical Futures Data, поставляемых Turtle Trader Company.

Цель данного исследования – показать, что нейронные сети способны находить скрытые динамические закономерности в данных, на которых они обучаются, и (на этой основе) прогнозировать динамику, статистически оценивая результаты прогноза.

Следует отметить, что хорошо обученная нейронная сеть часто находит в данных закономерности , не доступные человеку-аналитику.

Отметим две особенности нейросетевого анализа. Если в данных, на которых обучалась нейросеть, не отражены ценовые изменения, обусловленные экзогенными факторами (начало, окончание войн, реформа валютной системы, неожиданные результаты выборов президента, последствия террористических атак), то нейросеть не сможет предсказать похожие ценовые изменения в будущем.

В то же время нейронные сети эффективны для предсказаний финансовых крахов, паник, если они порождены эндогенными факторами (искаженное распространение информации, рост курсов из-за больших покупок, падения из-за больших продаж, изменение ликвидности рынков, нелинейность корректировки курсов).

2. Методы нейросетевого анализа и прогнозов.

Нейронные сети – это системы искусственного интеллекта, способные к самообучению в процессе решения задач.
Обучение сводится к обработке сетью множества примеров, состоящих из:
• набора пар входов и выходов (обучение с учителем) ;
• набора только входов (обучение без учителя).

В первом случае сеть по заданным входам генерирует свои выходы и сравнивает последние с выходами из обучающего набора. Для максимизации выходов, попадающих в допустимый интервал отклонения от обучающих, нейронная сеть модифицирует интенсивности связей между нейронами, из которых она построена, и таким образом самообучается. Прогонка обучающих примеров проводится, пока не достигается желаемая точность совпадения реальных и обучающих выходов. С этого момента нейросеть считается обученной, и может быть применена к обработке данных, похожих на обучающие, но не совпадающие с ними.

Модель любой нейронной сети состоит, таким образом, :
• из элементов, обрабатывающих сигналы (нейронов);
• связей между нейронами;
• обучающих схем или правил.

Каждый нейрон сети обладает собственным весом (положительным, отрицательным) и так называемой функцией активации. Нейрон обрабатывает входные сигналы, суммируя входы с весами и трансформируя полученный результат в выходной сигнал с помощью функции активации (линейной, нелинейной, стохастической).

Нейроны сети взаимодействуют друг с другом в зависимости от топологии связей. Последние бывают полными (каждый с каждым), частичными (противоположность полной связи), с петлями обратных связей, без таковых. В каждой задаче требуется свой выбор архитектуры сети. Наличие обратных связей влияет на обучаемость сети (улучшая ее), тогда как степень внутренних связей определяет параллелизм вычислений.

Когда нейросети стали популярны, они состояли из одного или двух слоев нейронов – входного и/или выходного. Круг задач, решаемый такими сетями, был ограничен. Современные многослойные нейросети мощнее, в частности, из-за того, что они формируют внутреннее представление задачи в так называемых скрытых слоях. Иерархические сети используются для распознавания образов. При этом внутренние слои играют роль «детекторов выученных свойств», поскольку активность паттернов в скрытых слоях есть кодирование того, что сеть «думает» о свойствах, содержащихся во входах.
Наиболее популярный обучающий алгоритм – это обратное распространение ошибки, состоящее из взаимосвязанных процессов. В прямом процессе входной сигнал проходит через сеть, генерируя определенный выход. В обратном процессе ошибка (разница между желаемым и полученным выходом) передается от выходных слоев к входным с одновременной модификацией связей нейронов так, чтобы (при последующем прогоне информации через сеть) ошибка на выходном слое уменьшилась. В этом состоит обучение сети.
Опишем методику нейросетевого прогнозирования рассматриваемых в статье финансовых инструментов.
Успех нейросетевых предсказаний зависит от типа информации, подаваемой на вход, и от того, какие характеристики выходных данных значимы в задаче прогноза. В построенной сети на один из входов подавались значения дневных доходностей анализируемых финансовых инструментов, выраженные следующим образом: изменению 1,5 % соответствовало значение 1,5. На другой вход подавались дневные доходности, усредненные за последние 5 дней. Использование сглаживающих средних было необходимо в связи с высокой шумовой компонентой в данных. Выходом сети было сдвинутое на 1 день назад значение 5-дневного скользящего среднего. Таким образом, сеть давала прогноз сглаженного 5-дневного среднего на один день в будущее.
Из всевозможных конфигураций нейросетей была выбрана рекуррентная нейросеть с обратной связью от скрытого слоя ко входному.
Этот тип сетей с обучением методом обратного распространения ошибки успешно использовался для предсказания финансовых рынков, поскольку именно рекуррентная сеть выучивает закономерности в последовательности величин, что необходимо для работы с временными рядами. Недостатком такой сети является длительное время обучения. Послойные сети, обучаемые этим методом, на каждый идентичный входной паттерн отвечают одним и тем же паттерном на выходе. Рекуррентные сети могут отвечать на один и тот же входной паттерн по-разному, в зависимости от того, какой паттерн был предшествовавшим. Таким образом, для них существенна последовательность обучающих примеров. Иными словами, рекуррентные сети могут быть обучены так же, как стандартные сети с обратным распространением ошибки, однако обучающие примеры должны быть упорядочены и не могут предъявляться сети в случайно выбранном порядке. Существенная разница с послойными сетями заключается в наличии у сети Элмана-Джордана дополнительного блока, хранящего информацию о предыдущих входах. Он может быть интерпретирован как блок долговременной памяти нейросети.
Нейроны скрытого слоя сети Элмана-Джордана имеют логистическую функцию активации f(x)=1/(1+exp(-x)), тогда как нейроны выходного слоя обладают линейной функцией активации. Такая комбинация позволяет аппроксимировать любую функцию с конечным числом разрывов с заданной точностью. Мы использовали симметричную логистическую функцию активации f(x)=(2/(1+exp(-x)))-1. Это не влияло на предсказательные свойства сети, но приводило к более быстрой сходимости алгоритма обучения для данного типа временных рядов. По сути, единственным требованием к сети было достаточное число нейронов в скрытом слое, поскольку их число должно возрастать пропорционально сложности анализируемых данных (сложность данных оказалась такой, что удалось ограничиться 100 нейронами в скрытом слое).
Наиболее трудным в использовании нейросетей является выбор момента остановки обучения. Если сеть обучать недолго, то она не выучит выборку обучающих примеров. Если сеть обучать слишком долго, то она выучит примеры с шумами со сколь угодно высокой точностью, но окажется неспособной обобщать примеры (т. е. будет действовать схожим образом на данных, не входивших в обучающее множество). Для преодоления этой трудности мы использовали процедуру калибровки с тем, чтобы оптимизировать сеть, применяя ее к независимому тестовому множеству примеров в процессе обучения. Калибровка позволяет найти оптимум нейросети на тестовом множестве, означая способность сети к обобщению, т. е. получению хороших результатов на новых данных. Это достигается вычислением среднеквадратичной ошибки между реальными и предсказанными выходами. Мы использовали среднеквадратичную ошибку как стандартную статистическую меру качества фитирования.

3. Нейросетевые прогнозы доходностей.
Опишем необходимые технические детали, связанные с обучением и прогнозом использованной нами нейросети на описанных выше данных.

Из каждого временного ряда выделялось 3 подмножества:
• тренеровочное (примеры, на которых обучалась сеть) – первые 900 значений для всех фьючерсов;
• тестовое (примеры, которые служили для предотвращения переучивания сети или калибровки) – значения фьючерсных рядов с 901 по 1100;
• рабочее (примеры, которые сеть не видела) – последние 200 значений для фьючерсных временных рядов.

Эффективность предсказаний нейросети проверялась сравнением фактического значения и предсказанного нейросетью.
Критериями качества предсказания служили следующие параметры: – Число эпох и время обучения – показатели, как долго сеть способна улучшать предсказания на тестовом множестве. Под эпохой обучения понимают однократное предъявление сети набора обучающих примеров. Число эпох и время обучения меняются в зависимости от заданных темпа обучения и момента, устанавливаемых из желаемой точности предсказания. Чем меньше их значения, тем более точен результат и тем дольше обучается нейросеть. В использованной сети оба параметра имели значение 0,003. – Коэффициент Q сравнивает точность нейросетевой модели с точностью модели, в которой предсказания одинаковы и совпадают со средним значением всех примеров. Для последней модели коэффициент Q равен нулю. Самый лучший результат достигается, если Q принимает значение 1, для очень хорошего результата Q близок к 1, для очень плохого – в окрестности 0. Если нейросетевое предсказание оказывается хуже, чем предсказание на основе среднего по всем примерам, то значение Q может оказаться меньше 0. – r-квадрат – коэффициент детерминации, равный отношению дисперсии предсказанных значений к дисперсии фактических, показывая, какая часть дисперсии предсказанных значений объясняется уравнением регрессии. – Средняя ошибка – усредненный по обработанным примерам модуль разности между предсказанным и фактическим значениями. – Максимальная ошибка – это максимальный модуль разности между предсказанным и фактическим значениями среди всех обработанных примеров. – % правильного предсказания знака изменения – это отношение числа примеров, для которых знак реального и предсказанного значения совпадают, и общего числа обработанных примеров, умноженное на 100.
Ниже с их помощью оценена эффективность нейросетевых предсказаний динамики фьючерсных котировок для SP, ED, DM. Результаты сведены в таблицу 1. Она состоит из трех блоков. Второй содержит статистику, относящуюся ко всем данным по трем временным рядам, а именно, к 1173 отсчетам для S&P500 и по 1170 отсчетов для марки ФРГ и евродоллара. Третий блок отражает статистику по рабочим множествам: из 77 отсчетов для S&P500 и 74 отсчетов для марки ФРГ и евродоллара.

Следует отметить, что несмотря на одинаковое качество обучения нейросети на SP, ED, DM (см. значения коэффициента Q в первом блоке табл.1), сеть обучалась на SP в 5 раз дольше, чем на DM, а на DM – в 4 раз дольше, чем на ED. Это, по-видимому, означает, что найти скрытые закономерности, содержащиеся во фьючерсных котировках на SP, значительно сложнее, чем соответствующие закономерности в DM и тем более в ED. В то же время, как отмечено выше, наилучшее качество прогноза достигается как раз на SP, а наихудшее – на ED. Все вместе это свидетельствует о том, что скрытые закономерности, обнаруженные нейросетью в SP, сохраняют свой характер на более длительных интервалах времени по сравнению с ED или, иными словами, фьючерсы на ED более подвержены смене внутренних закономерностей, что и приводит к наихудшему качеству прогноза.

Таким образом, отражая современные тенденции в финансовом мире, междисциплинарный подход в экономике и финансах является прорывом в комбинировании различных методов теории сложности, таких, например, как методы нелинейной и хаотической динамики, мультифрактальный анализ и нейротехнологии. Интегральной задачей этого синтеза является дизайн, развитие и построения адаптивных интеллектуальных систем, помогающих практикам выигрывать в жесткой конкурентной среде.

Л.А.Дмитриева, Ю.А.Куперин, И.В.Сорока

Физический факультет, Санкт-Петербургский государственный университет
Факультет менеджмента, Санкт-Петербургский государственный университет
Балтийское финансовое агенство

Обсудить на форуме | опубликовано: 14.08.06