Федотов Владислав Харитонович: другие произведения.

Мягкое прогнозирование фондового рынка

Сервер "Заграница": [Регистрация] [Найти] [Рейтинги] [Обсуждения] [Новинки] [Помощь]
  • Оставить комментарий
  • © Copyright Федотов Владислав Харитонович (fvh@inbox.ru)
  • Обновлено: 10/03/2012. 100k. Статистика.
  • Статья: Россия
  •  Ваша оценка:


    УДК 004.9.:У(075.8)

    Мягкое прогнозирование фондового рынка

    В.Х. Федотов

    Аннотация. Проведен сравнительный анализ экспертных свойств различных мягких моделей прогнозирования применительно к российскому фондовому рынку.

    Мягкие модели применяются в качестве искусственных экспертов в разных предметных областях [1]. Цель работы - сравнение экспертных свойств различных мягких моделей на коротких и длинных выборках котировок "голубых фишек".

    Короткие выборки. Исходные данные приведены в табл.1.

    Таблица 1. Суточная динамика цен (котировок) акций Сбербанка РФ (руб.) по данным [2]

    N

    Дата

    Открытие

    Высшая

    Низшая

    Закрытие

    N

    Дата

    Открытие

    Высшая

    Низшая

    Закрытие

    03.01.2012

    80,12

    82,5

    80,12

    82,41

    11

    17.01.2012

    84,81

    85,65

    84,19

    84,66

    04.01.2012

    82,44

    84,48

    81,91

    83,52

    12

    18.01.2012

    84,7

    85,56

    83,95

    84,7

    05.01.2012

    83,5

    84,44

    82,05

    82,55

    13

    19.01.2012

    85,45

    86,04

    84,76

    85,7

    06.01.2012

    82,51

    84,38

    81,67

    83,2

    14

    20.01.2012

    85,97

    86,28

    84,82

    85,13

    09.01.2012

    82,59

    84,22

    82,42

    83,88

    15

    23.01.2012

    84,95

    85,67

    83,82

    85,02

    10.01.2012

    84,36

    87,25

    84,24

    86,81

    16

    24.01.2012

    84,85

    85,49

    84,47

    85,04

    11.01.2012

    86,29

    86,91

    84,34

    84,85

    17

    25.01.2012

    85,56

    87,87

    85,56

    87,05

    12.01.2012

    85,2

    86,38

    84,04

    84,3

    18

    26.01.2012

    88,01

    90,8

    87,97

    90,4

    13.01.2012

    84,67

    85,15

    83,53

    83,6

    19

    27.01.2012

    89,67

    91,28

    89,63

    90,8

    16.01.2012

    83

    84,21

    82,55

    83,95

    Мягкие модели в среде Statistica Neural Network (SNN) представлены множеством нелинейных архитектур - классический многослойный персептрон (MLP), гибрид персептрона и временного ряда (MLP+ Time series), радиальные базисные функции (RBF), вероятностные сети (PNN) и др.

    Многослойный персептрон (MLP). Нелинейный персептрон имеет трехслойную архитектуру "1-N-1", где N>0 - любое. В качестве входов выбраны цены открытия (известны в начале торгового дня), а в качестве выходов - остальные цены (максимум, минимум, закрытие). Данные за первые 16 дней использовались для обучения, остальные - для контроля. Метод обучения - Квази-Ньютона (Quasi-Newton, QN). Число эпох = 1000. Результаты прогнозирования приведены в табл. 2.

    Таблица 2. Нейропрогноз суточных цен акций Сбербанка в зависимости от цен открытия. Нейросеть MLP "1-8-1"

    N прогноза

    Дата

    прогноза

    Открытие

    Высшая

    Низшая

    Закрытие

    Факт

    Расчет

    Факт

    Ошибка

    Расчет

    Факт

    Ошибка

    Расчет

    Факт

    Ошибка

    0

    25.01.2012

    85,56

    86.14569

    87,87

    -1.72

    84.48708

    85,56

    -1.07

    85.05031

    87,05

    -2.00

    1

    26.01.2012

    88,01

    90,80

    90,80

    0,00

    87,97

    87,97

    0,00

    90,40

    90,40

    0,00

    2

    27.01.2012

    89,67

    91,28

    91,28

    0,00

    89,63

    89,63

    0,00

    90,80

    90,80

    0,00

    3

    Следующий

    80,00

    82,42

     

     

    80,11

     

     

    82,41

     

     

    4

    Следующий

    85,00

    85,79

     

     

    84,23

     

     

    84,88

     

     

    5

    Следующий

    90,00

    91,34

     

     

    89,63

     

     

    90,80

     

     

    6

    Следующий

    95,00

    91,72

     

     

    88,34

     

     

    89,67

     

     

    Ошибка средняя / S.D. Ratio

    0,58/0,06

    0,36/0,09

    0,67/0,08

    Основным показателем качества обучения (нейрорегрессии) является отношение стандартного отклонения ошибки прогноза к стандартному отклонению данных (S.D.Ratio) -- должно быть <<1. Средняя ошибка ? рассчитывалась как среднее арифметическое модулей ошибок. Для улучшения качества обучения обучающие и контрольные данные перемешивались (Shuffle). Как видно, качество нейропрогноза - не очень высокое. Основной причиной является небольшой размер обучающей выборки. При повторных запусках сети могут быть получены другие значения из-за неоднозначности решения задач регрессии и выбора параметров обучения. Кроме того, в этой модели все данные рассматриваются как независимые, т.е. не учитывается их экономический смысл.

    Гибридная нейросеть (MLP+ Time series). Экономическую динамику отражает модель временных рядов - предыдущие данные используются для расчета последующих. Для нее обучающие и контрольные данные перемешивать не следует так, как это исказит ход процесса во времени. Нелинейный персептрон для временных рядов содержит три слоя. Первый (входной) включает D обучающих нейронов (D -- глубина временного ряда), второй -- вдвое меньше, третий (выходной) - один. Первые 16 строк использовались для обучения, остальные - для контроля и прогноза, табл.3.

    Таблица 3. Прогноз суточных цен акций Сбербанка. Гибридная сеть MLP "16-8-1"+ Time series. Глубина D=16.

    N прогноза

    Дата

    прогноза

    Открытие

    Высшая

    Низшая

    Закрытие

    Расчет

    Факт

    Ошибка

    Расчет

    Факт

    Ошибка

    Расчет

    Факт

    Ошибка

    Расчет

    Факт

    Ошибка

    0

    25.01.2012

    85,56

    85,56

    0,00

    87,87

    87,87

    0,00

    85,56

    85,56

    0,00

    87,05

    87,05

    0,00

    1

    26.01.2012

    88,01

    88,01

    0,00

    90,80

    90,80

    0,00

    87,97

    87,97

    0,00

    90,40

    90,40

    0,00

    2

    27.01.2012

    89,67

    89,67

    0,00

    91,28

    91,28

    0,00

    89,63

    89,63

    0,00

    90,80

    90,80

    0,00

    3

    Следующий

    89,90

     

    92,50

     

    91,41

     

    92,33

    4

    Следующий

    89,13

     

    91,34

     

    90,43

     

    90,80

    5

    Следующий

    88,12

     

    91,32

     

    89,73

     

    90,71

    6

    Следующий

    89,53

     

    91,00

     

    89,48

     

    89,11

    Ошибка средняя / S.D. Ratio

    0,0/2e-8

    0,0/1e-8

    0,0/8e-8

    0,0/1e-8

    Как видно, гибридная нейро-временная сеть на контрольных данных дает минимальные ошибки. Однако это не значит, что она лучше, т.к. с теоретической точки зрения задача анализа временных рядов является разновидностью регрессии. Можно добиться близких результатов и без использования логики временного ряда.

    Исследовано влияние глубины D на точность гибридного прогноза. Для каждого D строилась соответствующая сеть MLP "D-D/2-1". Первые D строк использовались только как входные данные, а остальные - как входные и выходные "одновременно". Расчеты показали, что глубина временного ряда оказывает влияние на нейропрогноз. Начиная с D=10, ошибка становится минимальной, и все прогнозы при D=12-16 практически равновероятны. С уменьшением D (<-6) ошибки растут. С ростом D, ошибки уменьшаются. Наилучшими можно считать прогнозы при D =14-16.

    Нечеткие сети. Мягкие модели в среде MatLab Fuzzy Logic Toolbox (MFL) представлены следующими архитектурами - нечеткая сеть Мамдани (FIS Mamdani), нечеткая сеть Сугено (FIS Sugeno), гибрид нечеткой и нейронной сети (ANFIS), нечеткая кластеризация и др.

    Вначале были рассчитаны нечеткие прогнозы без использования логики временного ряда на основе сети Мамдани "1-3" с архитектурой "I-O", где I - число входов, N - число выходов. Вход - цены открытия, выходы - остальные цены. Максимальный период обучения -- 16 дней. Данные за последние дни использованы для контроля. Функции принадлежности -- гауссовы. Операции И и импликация - min, операции ИЛИ и агрегирование - max. Дефаззификация - центроид. Интервал входных значений 0-100, интервал выходных значений 80-100, табл. 4.

    Таблица 4. Нечеткий прогноз цен акций Сбербанка без логики временного ряда. Нечеткая сеть Мамдани "1-3"

    Дата

    прогноза

    Открытие

    Высшая

    Низшая

    Закрытие

    Факт

    Расчет

    Факт

    Ошибка

    Расчет

    Факт

    Ошибка

    Расчет

    Факт

    Ошибка

    25.01.2012

    85,56

     

    86,20

    87,87

    -1,67

    84,66

    85,56

    -0,90

    85,64

    87,05

    -1,41

    26.01.2012

    88,01

     

    86,50

    90,80

    -4,30

    84,92

    87,97

    -3,05

    85,80

    90,40

    -4,60

    27.01.2012

    89,67

     

    86,71

    91,28

    -4,57

    85,16

    89,63

    -4,47

    85,92

    90,80

    -4,88

    Ошибка средняя (?)

    3,51

    2,81

    3,63

    Как видно, ошибки нечеткого прогноза без логики временного ряда сравнимы с аналогичными ошибками нейропрогноза. Перемешивание исходных данных или изменение архитектуры сети на "1-1" и "1-2" не влияло на результаты. Воспроизводимость сохранялась.

    Для сравнения построена база нечетких правил для скользящей логики временного ряда. Анализ показал, что ошибки нечеткого прогноза с логикой временного ряда сравнимы с аналогичными ошибками нейропрогноза. При изменении архитектуры результаты не менялись. Преимущество -- полная воспроизводимость, табл. 5.

    Таблица 5. Нечеткий прогноз цен акций Сбербанка с логикой временного ряда. Нечеткая сеть Мамдани "15-1".

    Дата

    прогноза

    Открытие

    Высшая

    Низшая

    Закрытие

    Расчет

    Факт

    Ошибка

    Расчет

    Факт

    Ошибка

    Расчет

    Факт

    Ошибка

    Расчет

    Факт

    Ошибка

    25.01.2012

    85,39

    85,56

    -0,17

    86,14

    87,87

    -1,73

    84,61

    85,56

    -0,95

    85,77

    87,05

    -1,28

    26.01.2012

    85,53

    88,01

    -2,48

    86,29

    90,80

    -4,51

    84,70

    87,97

    -3,27

    85,96

    90,40

    -4,44

    27.01.2012

    85,90

    89,67

    -3,77

    86,27

    91,28

    -5,01

    84,84

    89,63

    -4,79

    86,13

    90,80

    -4,67

    Следующий

    85,93

    ?

     

    86,26

     

     

    84,87

     

     

    86,36

    ?

     

    Ошибка средняя (?)

    2,14

     

     

    3,75

     

     

    3,00

     

     

    3,46

    Как видно, логика временного ряда (реализованная в виде базы правил, табл. 6) не оказала заметного влияния на качество нечеткого прогноза. Воспроизводимость результатов сохраняется.

    Длинные выборки. Рассмотрена более детальная динамика котировок акций той же компании (объемы выборок =72 и 1575) по данным [2].

    Гибридная нейросеть (MLP+ Time series). Сначала для обучения использовались 66 образцов, а остальные - для оценки экспертных свойств сети. Глубина временного ряда D=36, шаг =1, табл.6.

    Таблица 6. Нейропрогноз часовых цен акций Сбербанка. Гибрид MLP "36-18-1"+ Time series.Глубина D =36.

    Дата

    прогноза

    Время

    прогноза

    Шаг

    прогноза

    Открытие

    Высшая

    Низшая

    Закрытие

    Расчет

    Факт

    Ошибка

    Расчет

    Факт

    Ошибка

    Расчет

    Факт

    Ошибка

    Расчет

    Факт

    Ошибка

    10.02.12

    13:00:00

    0

    93,33

    94,34

    -1,01

    95,05

    94,50

    0,55

    93,50

    94,09

    -0,59

    94,67

    94,25

    0,42

    10.02.12

    14:00:00

    1

    93,64

    94,25

    -0,61

    94,39

    94,30

    0,09

    94,09

    94,00

    0,09

    93,70

    94,08

    -0,38

    10.02.12

    15:00:00

    2

    93,71

    94,07

    -0,36

    94,01

    94,25

    -0,24

    93,88

    93,86

    0,02

    93,43

    94,12

    -0,69

    10.02.12

    16:00:00

    3

    93,08

    94,16

    -1,08

    94,04

    94,37

    -0,33

    94,37

    93,73

    0,64

    93,78

    94,13

    -0,35

    10.02.12

    17:00:00

    4

    93,83

    94,13

    -0,30

    93,99

    94,19

    -0,20

    94,07

    93,78

    0,29

    93,81

    93,90

    -0,09

    10.02.12

    18:00:00

    5

    93,66

    93,89

    -0,23

    93,46

    94,11

    -0,65

    94,13

    93,71

    0,42

    93,76

    93,94

    -0,18

    Ошибка средняя / S.D.Ratio

    0,60/ 0,00003

    0,34/ 0,00017

    0,34/ 0,00025

    0,35/ 0,00001

    Как видно, статистики гибридного прогноза -- хорошие. С точки зрения фондового рынка - его также можно признать удовлетворительным, т.к. на графике "ловятся" моменты перелома ценовой тенденции (снижении, рост, полочка), хотя визуально ситуация выглядит несколько "хуже", рис. 1.

    Анализ показал, что изменение глубины временного ряда в интервале 34-40 не оказало заметного влияния на прогноз, хотя формальная статистика сети улучшалась.

    0x01 graphic

    0x01 graphic

    Рис.1.1. Часовые цены открытия акций Сбербанка (прогноз - нижняя линия)

    Рис.1.2. Часовые цены закрытия акций Сбербанка

    (прогноз - нижняя линия)

    Нейросеть (MLP). Для сравнения рассчитан негибридный нейропрогноз часовых цен. Первая половина данных использовалась для обучения, вторая - для контроля. Исходные данные перемешивались. Входы - цены открытия, выходы - остальные, табл. 7.

    Таблица 7. Нейропрогноз часовых цен акций Сбербанка в зависимости от цен открытия. Нейросеть MLP "1-16-1".

    Дата

    Время

    Шаг

    Открытие

    Высшая

    Низшая

    Закрытие

    прогноза

    прогноза

    прогноза

    Факт

    Расчет

    Факт

    Ошибка

    Расчет

    Факт

    Ошибка

    Расчет

    Факт

    Ошибка

    09.02.2012

    17:00:00

    0

    95,37

    95,67

    95,91

    -0,24

    94,97

    94,94

    0,03

    95,17

    95,39

    -0,22

    09.02.2012

    18:00:00

    1

    95,37

    95,67

    95,74

    -0,07

    94,97

    94,96

    0,01

    95,17

    95,28

    -0,11

    10.02.2012

    10:00:00

    2

    94,57

    94,87

    94,93

    -0,06

    94,22

    94,07

    0,15

    94,32

    94,49

    -0,17

    10.02.2012

    11:00:00

    3

    94,49

    94,79

    94,55

    0,24

    94,14

    93,63

    0,51

    94,26

    93,75

    0,51

    10.02.2012

    12:00:00

    4

    93,76

    94,06

    94,40

    -0,34

    93,45

    93,63

    -0,18

    93,77

    94,34

    -0,57

    10.02.2012

    13:00:00

    5

    94,34

    94,64

    94,50

    0,14

    94,00

    94,09

    -0,09

    94,19

    94,25

  • Оставить комментарий
  • © Copyright Федотов Владислав Харитонович (fvh@inbox.ru)
  • Обновлено: 10/03/2012. 100k. Статистика.
  • Статья: Россия
  •  Ваша оценка:

    Связаться с программистом сайта
    "Заграница"
    Путевые заметки
    Это наша кнопка