Федотов Владислав Харитонович: другие произведения.

Мягкое прогнозирование фондового рынка

Сервер "Заграница": [Регистрация] [Найти] [Рейтинги] [Обсуждения] [Новинки] [Помощь]
  • Оставить комментарий
  • © Copyright Федотов Владислав Харитонович (fvh@inbox.ru)
  • Обновлено: 10/03/2012. 18k. Статистика.
  • Статья: Россия
  •  Ваша оценка:

    УДК 004.9.:У(075.8)

    Мягкое прогнозирование фондового рынка

    В.Х. Федотов

    Аннотация. Проведен сравнительный анализ экспертных свойств различных мягких моделей прогнозирования применительно к российскому фондовому рынку.

    Мягкие модели применяются в качестве искусственных экспертов в разных предметных областях [1]. Цель работы - сравнение экспертных свойств различных мягких моделей на коротких и длинных выборках котировок "голубых фишек".

    Короткие выборки. Исходные данные приведены в табл.1.

    Таблица 1. Суточная динамика цен (котировок) акций Сбербанка РФ (руб.) по данным [2]

    Љ Дата Открытие Высшая Низшая Закрытие Љ Дата Открытие Высшая Низшая Закрытие
    1 03.01.2012 80,12 82,5 80,12 82,41 11 17.01.2012 84,81 85,65 84,19 84,66
    2 04.01.2012 82,44 84,48 81,91 83,52 12 18.01.2012 84,7 85,56 83,95 84,7
    3 05.01.2012 83,5 84,44 82,05 82,55 13 19.01.2012 85,45 86,04 84,76 85,7
    4 06.01.2012 82,51 84,38 81,67 83,2 14 20.01.2012 85,97 86,28 84,82 85,13
    5 09.01.2012 82,59 84,22 82,42 83,88 15 23.01.2012 84,95 85,67 83,82 85,02
    6 10.01.2012 84,36 87,25 84,24 86,81 16 24.01.2012 84,85 85,49 84,47 85,04
    7 11.01.2012 86,29 86,91 84,34 84,85 17 25.01.2012 85,56 87,87 85,56 87,05
    8 12.01.2012 85,2 86,38 84,04 84,3 18 26.01.2012 88,01 90,8 87,97 90,4
    9 13.01.2012 84,67 85,15 83,53 83,6 19 27.01.2012 89,67 91,28 89,63 90,8
    10 16.01.2012 83 84,21 82,55 83,95
    Мягкие модели в среде Statistica Neural Network (SNN) представлены множеством нелинейных архитектур - классический многослойный персептрон (MLP), гибрид персептрона и временного ряда (MLP+ Time series), радиальные базисные функции (RBF), вероятностные сети (PNN) и др.

    Многослойный персептрон (MLP). Нелинейный персептрон имеет трехслойную архитектуру "1-N-1", где N>0 - любое. В качестве входов выбраны цены открытия (известны в начале торгового дня), а в качестве выходов - остальные цены (максимум, минимум, закрытие). Данные за первые 16 дней использовались для обучения, остальные - для контроля. Метод обучения - Квази-Ньютона (Quasi-Newton, QN). Число эпох = 1000. Результаты прогнозирования приведены в табл. 2.

    Таблица 2. Нейропрогноз суточных цен акций Сбербанка в зависимости от цен открытия. Нейросеть MLP "1-8-1"

    Љ прогноза Дата

    прогноза Открытие Высшая Низшая Закрытие
    Факт Расчет Факт Ошибка Расчет Факт Ошибка Расчет Факт Ошибка
    0 25.01.2012 85,56 86.14569 87,87 -1.72 84.48708 85,56 -1.07 85.05031 87,05 -2.00
    1 26.01.2012 88,01 90,80 90,80 0,00 87,97 87,97 0,00 90,40 90,40 0,00
    2 27.01.2012 89,67 91,28 91,28 0,00 89,63 89,63 0,00 90,80 90,80 0,00
    3 Следующий 80,00 82,42 80,11 82,41
    4 Следующий 85,00 85,79 84,23 84,88
    5 Следующий 90,00 91,34 89,63 90,80
    6 Следующий 95,00 91,72 88,34 89,67
    Ошибка средняя / S.D. Ratio 0,58/0,06 0,36/0,09 0,67/0,08
    Основным показателем качества обучения (нейрорегрессии) является отношение стандартного отклонения ошибки прогноза к стандартному отклонению данных (S.D.Ratio) должно быть <<1. Средняя ошибка рассчитывалась как среднее арифметическое модулей ошибок. Для улучшения качества обучения обучающие и контрольные данные перемешивались (Shuffle). Как видно, качество нейропрогноза - не очень высокое. Основной причиной является небольшой размер обучающей выборки. При повторных запусках сети могут быть получены другие значения из-за неоднозначности решения задач регрессии и выбора параметров обучения. Кроме того, в этой модели все данные рассматриваются как независимые, т.е. не учитывается их экономический смысл.

    Гибридная нейросеть (MLP+ Time series). Экономическую динамику отражает модель временных рядов - предыдущие данные используются для расчета последующих. Для нее обучающие и контрольные данные перемешивать не следует так, как это исказит ход процесса во времени. Нелинейный персептрон для временных рядов содержит три слоя. Первый (входной) включает D обучающих нейронов (D глубина временного ряда), второй вдвое меньше, третий (выходной) - один. Первые 16 строк использовались для обучения, остальные - для контроля и прогноза, табл.3.

    Таблица 3. Прогноз суточных цен акций Сбербанка. Гибридная сеть MLP "16-8-1"+ Time series. Глубина D=16.

    Љ прогноза Дата

    прогноза Открытие Высшая Низшая Закрытие
    Расчет Факт Ошибка Расчет Факт Ошибка Расчет Факт Ошибка Расчет Факт Ошибка
    0 25.01.2012 85,56 85,56 0,00 87,87 87,87 0,00 85,56 85,56 0,00 87,05 87,05 0,00
    1 26.01.2012 88,01 88,01 0,00 90,80 90,80 0,00 87,97 87,97 0,00 90,40 90,40 0,00
    2 27.01.2012 89,67 89,67 0,00 91,28 91,28 0,00 89,63 89,63 0,00 90,80 90,80 0,00
    3 Следующий 89,90 92,50 91,41 92,33
    4 Следующий 89,13 91,34 90,43 90,80
    5 Следующий 88,12 91,32 89,73 90,71
    6 Следующий 89,53 91,00 89,48 89,11
    Ошибка средняя / S.D. Ratio 0,0/2e-8 0,0/1e-8 0,0/8e-8 0,0/1e-8
    Как видно, гибридная нейро-временная сеть на контрольных данных дает минимальные ошибки. Однако это не значит, что она лучше, т.к. с теоретической точки зрения задача анализа временных рядов является разновидностью регрессии. Можно добиться близких результатов и без использования логики временного ряда.

    Исследовано влияние глубины D на точность гибридного прогноза. Для каждого D строилась соответствующая сеть MLP "D-D/2-1". Первые D строк использовались только как входные данные, а остальные - как входные и выходные "одновременно". Расчеты показали, что глубина временного ряда оказывает влияние на нейропрогноз. Начиная с D=10, ошибка становится минимальной, и все прогнозы при D=12-16 практически равновероятны. С уменьшением D (<6) ошибки растут. С ростом D, ошибки уменьшаются. Наилучшими можно считать прогнозы при D =14-16.

    Нечеткие сети. Мягкие модели в среде MatLab Fuzzy Logic Toolbox (MFL) представлены следующими архитектурами - нечеткая сеть Мамдани (FIS Mamdani), нечеткая сеть Сугено (FIS Sugeno), гибрид нечеткой и нейронной сети (ANFIS), нечеткая кластеризация и др.

    Вначале были рассчитаны нечеткие прогнозы без использования логики временного ряда на основе сети Мамдани "1-3" с архитектурой "I-O", где I - число входов, N - число выходов. Вход - цены открытия, выходы - остальные цены. Максимальный период обучения 16 дней. Данные за последние дни использованы для контроля. Функции принадлежности гауссовы. Операции И и импликация - min, операции ИЛИ и агрегирование - max. Дефаззификация - центроид. Интервал входных значений 0-100, интервал выходных значений 80-100, табл. 4.

    Таблица 4. Нечеткий прогноз цен акций Сбербанка без логики временного ряда. Нечеткая сеть Мамдани "1-3"

    Дата

    прогноза Открытие Высшая Низшая Закрытие
    Факт Расчет Факт Ошибка Расчет Факт Ошибка Расчет Факт Ошибка
    25.01.2012 85,56 86,20 87,87 -1,67 84,66 85,56 -0,90 85,64 87,05 -1,41
    26.01.2012 88,01 86,50 90,80 -4,30 84,92 87,97 -3,05 85,80 90,40 -4,60
    27.01.2012 89,67 86,71 91,28 -4,57 85,16 89,63 -4,47 85,92 90,80 -4,88
    Ошибка средняя () 3,51 2,81 3,63
    Как видно, ошибки нечеткого прогноза без логики временного ряда сравнимы с аналогичными ошибками нейропрогноза. Перемешивание исходных данных или изменение архитектуры сети на "1-1" и "1-2" не влияло на результаты. Воспроизводимость сохранялась.

    Для сравнения построена база нечетких правил для скользящей логики временного ряда. Анализ показал, что ошибки нечеткого прогноза с логикой временного ряда сравнимы с аналогичными ошибками нейропрогноза. При изменении архитектуры результаты не менялись. Преимущество полная воспроизводимость, табл. 5.

    Таблица 5. Нечеткий прогноз цен акций Сбербанка с логикой временного ряда. Нечеткая сеть Мамдани "15-1".

    Дата

    прогноза Открытие Высшая Низшая Закрытие
    Расчет Факт Ошибка Расчет Факт Ошибка Расчет Факт Ошибка Расчет Факт Ошибка
    25.01.2012 85,39 85,56 -0,17 86,14 87,87 -1,73 84,61 85,56 -0,95 85,77 87,05 -1,28
    26.01.2012 85,53 88,01 -2,48 86,29 90,80 -4,51 84,70 87,97 -3,27 85,96 90,40 -4,44
    27.01.2012 85,90 89,67 -3,77 86,27 91,28 -5,01 84,84 89,63 -4,79 86,13 90,80 -4,67
    Следующий 85,93 86,26 84,87 86,36
    Ошибка средняя () 2,14 3,75 3,00 3,46
    Как видно, логика временного ряда (реализованная в виде базы правил, табл. 6) не оказала заметного влияния на качество нечеткого прогноза. Воспроизводимость результатов сохраняется.

    Длинные выборки. Рассмотрена более детальная динамика котировок акций той же компании (объемы выборок =72 и 1575) по данным [2].

    Гибридная нейросеть (MLP+ Time series). Сначала для обучения использовались 66 образцов, а остальные - для оценки экспертных свойств сети. Глубина временного ряда D=36, шаг =1, табл.6.

    Таблица 6. Нейропрогноз часовых цен акций Сбербанка. Гибрид MLP "36-18-1"+ Time series.Глубина D =36.

    Дата

    прогноза Время

    прогноза Шаг

    прогноза Открытие Высшая Низшая Закрытие
    Расчет Факт Ошибка Расчет Факт Ошибка Расчет Факт Ошибка Расчет Факт Ошибка
    10.02.12 13:00:00 0 93,33 94,34 -1,01 95,05 94,50 0,55 93,50 94,09 -0,59 94,67 94,25 0,42
    10.02.12 14:00:00 1 93,64 94,25 -0,61 94,39 94,30 0,09 94,09 94,00 0,09 93,70 94,08 -0,38
    10.02.12 15:00:00 2 93,71 94,07 -0,36 94,01 94,25 -0,24 93,88 93,86 0,02 93,43 94,12 -0,69
    10.02.12 16:00:00 3 93,08 94,16 -1,08 94,04 94,37 -0,33 94,37 93,73 0,64 93,78 94,13 -0,35
    10.02.12 17:00:00 4 93,83 94,13 -0,30 93,99 94,19 -0,20 94,07 93,78 0,29 93,81 93,90 -0,09
    10.02.12 18:00:00 5 93,66 93,89 -0,23 93,46 94,11 -0,65 94,13 93,71 0,42 93,76 93,94 -0,18
    Ошибка средняя / S.D.Ratio 0,60/ 0,00003 0,34/ 0,00017 0,34/ 0,00025 0,35/ 0,00001
    Как видно, статистики гибридного прогноза хорошие. С точки зрения фондового рынка - его также можно признать удовлетворительным, т.к. на графике "ловятся" моменты перелома ценовой тенденции (снижении, рост, полочка), хотя визуально ситуация выглядит несколько "хуже", рис. 1.

    Анализ показал, что изменение глубины временного ряда в интервале 34-40 не оказало заметного влияния на прогноз, хотя формальная статистика сети улучшалась.


    Рис.1.1. Часовые цены открытия акций Сбербанка (прогноз - нижняя линия) Рис.1.2. Часовые цены закрытия акций Сбербанка

    (прогноз - нижняя линия)
    Нейросеть (MLP). Для сравнения рассчитан негибридный нейропрогноз часовых цен. Первая половина данных использовалась для обучения, вторая - для контроля. Исходные данные перемешивались. Входы - цены открытия, выходы - остальные, табл. 7.

    Таблица 7. Нейропрогноз часовых цен акций Сбербанка в зависимости от цен открытия. Нейросеть MLP "1-16-1".

    Дата Время Шаг Открытие Высшая Низшая Закрытие
    прогноза прогноза прогноза Факт Расчет Факт Ошибка Расчет Факт Ошибка Расчет Факт Ошибка
    09.02.2012 17:00:00 0 95,37 95,67 95,91 -0,24 94,97 94,94 0,03 95,17 95,39 -0,22
    09.02.2012 18:00:00 1 95,37 95,67 95,74 -0,07 94,97 94,96 0,01 95,17 95,28 -0,11
    10.02.2012 10:00:00 2 94,57 94,87 94,93 -0,06 94,22 94,07 0,15 94,32 94,49 -0,17
    10.02.2012 11:00:00 3 94,49 94,79 94,55 0,24 94,14 93,63 0,51 94,26 93,75 0,51
    10.02.2012 12:00:00 4 93,76 94,06 94,40 -0,34 93,45 93,63 -0,18 93,77 94,34 -0,57
    10.02.2012 13:00:00 5 94,34 94,64 94,50 0,14 94,00 94,09 -0,09 94,19 94,25 -0,06
    Ошибка средняя / S.D.Ratio 0,17 / 0,19 0,13 / 0,17 0,19 / 0,26
    Как видно, с ростом объема обучающего множества (даже без логики временного ряда), прогноз стал точнее (см. табл. 2). Он оказался даже точнее, чем прогноз, учитывающий логику временного ряда (см. табл. 9). Однако еще раз отметим, что это не означает, что гибридная модель хуже (лучше), чем классическая нейросеть. С точки зрения теории (моделирующей мощности) они равносильны.

    Нечеткие сети. Первая половина данных использовалась для обучения, а вторая - для контроля. Входы - цены открытия (известны в начале часа), выходы - остальные. База нечетких правил составлена без учета скользящей логики временного ряда, табл. 8.

    Таблица 8. Нечеткий прогноз часовых цен акций Сбербанка без логики временного ряда. Нечеткая сеть Мамдани "1-3".

    Открытие Максимум Минимум Закрытие
    Дата Время Шаг Факт Расчет Факт Ошибка Расчет Факт Ошибка Расчет Факт Ошибка
    07.02.2012 10:00:00 0 94,00 92,56 94,09 -1,53 92,00 93,11 -1,11 92,30 93,15 -0,85
    07.02.2012 11:00:00 1 93,15 92,34 94,03 -1,69 91,81 92,85 -1,04 92,11 93,90 -1,79
    07.02.2012 12:00:00 2 93,94 92,54 94,45 -1,91 91,98 93,54 -1,56 92,29 93,60 -1,31
    07.02.2012 13:00:00 3 93,60 92,46 93,98 -1,52 91,91 93,33 -1,42 92,21 93,72 -1,51
    07.02.2012 14:00:00 4 93,73 92,49 93,98 -1,49 91,94 93,55 -1,61 91,94 93,73 -1,79
    07.02.2012 15:00:00 5 93,72 92,49 93,77 -1,28 91,93 93,27 -1,34 92,24 93,74 -1,50
    07.02.2012 16:00:00 6 93,73 92,49 93,75 -1,26 91,94 92,99 -1,05 92,24 93,25 -1,01
    07.02.2012 17:00:00 7 93,25 92,24 93,95 -1,71 91,83 93,09 -1,26 92,13 93,75 -1,62
    07.02.2012 18:00:00 8 93,75 92,49 93,87 -1,38 91,94 93,41 -1,47 92,24 93,46 -1,22
    08.02.2012 10:00:00 9 94,24 92,63 94,80 -2,17 92,06 94,22 -2,16 92,37 94,71 -2,35
    Ошибка средняя () 1,59 1,40 1,50
    Как видно, ошибки нечеткого прогноза по сравнению с суточными данными уменьшились. По сравнению с нейропрогнозами - точность снизилась. Воспроизводимость сохранялась.

    Мягкое управление стратегией брокера. Используем построенные модели для управления игрой на фондовой бирже. Для этого множество входов будем рассматривать как управляющие параметры) и отследим отклик для выходной (управляемой) переменной. Например, выберем в качестве управляющего параметра цену открытия и вычислим цены закрытия с любым шагом (рубли, копейки и т.д.) в любом интервале (не слишком удаляясь от обучающих данных), табл. 9

    Таблица 9. Прогноз часовых цен закрытия акций Сбербанка в зависимости от цены открытия, типа сети и объема выборки

    Цена открытия Цена закрытия (без логики временного ряда). Выборка = 72. Отклонение Выборка = 1575
    (дискретность = 1 руб.) Нейросеть "1-16-1" Нечеткая сеть "1-3" (Нейро - Нечеткая) Нейросеть "1-16-1"
    90 92,98 91,49 1,49 89,54
    91 91,42 91,69 -0,27 90,16
    92 92,21 91,88 0,33 90,68
    93 93,06 92,08 0,98 91,12
    94 93,96 92,30 1,66 91,50
    95 95,00 92,57 2,43 91,84
    96 95,83 92,84 2,99 92,15
    97 96,00 93,07 2,93 92,43
    98 95,29 93,21 2,08 92,68
    99 93,76 93,25 0,51 92,91
    100 91,58 93,15 -1,57 93,12
    Среднее отклонение 1,57
    По результатам анализа суточных (объем выборки = 19) и часовых (объем выборки = 72) котировок акций Сбербанка можно сделать управленческие выводы, более достоверные в интервале использованных исходных данных (цены открытия 90-95), рис. 2.1:

    1) Закрывающая часовая цена нелинейна по отношению к цене открытия.

    2) Максимальная цена закрытия может достигнуть 96 руб., а минимальная - 91,5 руб.

    3) Пиковые цены могут достигаться при цене открытия 96-97 руб.

    4) Нейропрогнозы подвержены больших колебаниям и плох воспроизводимы.

    5) Нечеткие прогнозы более стабильны, но хорошо воспроизводимы.

    6) Наиболее достоверными прогнозами можно считать средние между нейро- и нечеткими.

    Аналогичная стратегия брокера по акциям Сбербанка для минутных данных (объем выборки = 1575, интервал обучения 84-87, S.D.Ratio=0,04) приведена на рис. 2.2.


    Рис.2.1. Управление стратегией брокера. Объем выборки = 72. Рис.2.2. Цены минимум, закрытие и максимум. Объем выборки=1575.
    Сравнение фактических и прогнозных данных за последние 75 точек (соответствуют последним полутора часам работы биржи с 17-30 до18-00) приведено на рис. 3.


    Рис.3. Минутные цены закрытия акций Сбербанка. Нейросеть MLP "1-16-1". Объем выборки=1575.

    Заключение. Построены нейронные, гибридные и нечеткие мягкие модели фондового рынка. Выполнен сравнительный анализ их прогностических свойств на примере акций Сбербанка РФ. Показано, что для больших обучающих выборок нейронные, нечеткие и гибридные прогнозы сближаются. Преимущества нейронных моделей: 1) простота подготовки данных; 2) широкий выбор различных архитектур. Недостаток - плохая воспроизводимость результатов экспертизы. Преимущества нечетких моделей: 1) возможность обучения с помощью простых правил; 2) нетребовательность к объемам обучающих выборок; 3) воспроизводимость результатов; 4) неплохое качество; 5) невысокая стоимость разработки. Недостаток - сложность обработки больших объемов выборок и подготовки соответствующих правил.

    Основной проблемой при проведении мягкой экспертизы остается субъективность при выборе исходных гипотез, осуществляемом на основании интуиции экспертов.

    Литература

    1. Федотов В.Х. Нейронные сети в экономике/ В.Х. Федотов. Чебоксары: Изд-во Чувашского ун-та, 2006.

    2. Сайт FINAM. www.gks.ru/wps/wcm/connect/rosstat/rosstatsite/main/publishing/catalog/.

    Сведения об авторе. ФЕДОТОВ ВЛАДИСЛАВ ХАРИТОНОВИЧ к.х.н., доцент кафедры "Информационных систем", Чувашский госуниверситет им. И.Н. Ульянова, Россия, Чебоксары (fvh@inbox.ru).

  • Оставить комментарий
  • © Copyright Федотов Владислав Харитонович (fvh@inbox.ru)
  • Обновлено: 10/03/2012. 18k. Статистика.
  • Статья: Россия
  •  Ваша оценка:

    Связаться с программистом сайта
    "Заграница"
    Путевые заметки
    Это наша кнопка