Анотація. У роботі проведено порівняльний аналіз деяких моделей авторегресії на прикладі нестаціонарних процесів у фінансово-економічній сфері.
Ключові слова: авторегресія, різницеві рівняння, процес з трендом, гетероскедастичний процес.
Економічні науки
УДК 336.72
Пугачов Олександр Миколайович
студент Научально-наукового комплексу
«Інститут Прикладного Системного Аналізу»
НТУУ «КПІ», м. Київ, Україна
АНАЛІЗ ДЕЯКИХ МОДЕЛЕЙ ДЛЯ ПРОГНОЗУВАННЯ НЕСТАЦІОНАРНИХ ПРОЦЕСІВ
Анотація. У роботі проведено порівняльний аналіз деяких моделей авторегресії на прикладі нестаціонарних процесів у фінансово-економічній сфері.
Ключові слова: авторегресія, різницеві рівняння, процес з трендом, гетероскедастичний процес.
На сьогоднішній день в спеціальній літературі описано досить велика кількість методів прогнозування лінійних та нелінійних процесів на основі використання часових рядів. Однак, практика показує, що одного, навіть досить універсального методу, недостатньо для досягнення повноти аналізу процесу. Так, коректний аналіз гетероскедастичних процесів вимагає застосування моделей спеціальної структури для описання умовної дисперсії, що не забезпечує МГВА[1, c.132]. Кожний метод має також свої недоліки і переваги щодо обчислювальних витрат та характеристик точності прогнозу. Так, висока точність прогнозу за допомогою МГВА або нейромережі іноді досягається за рахунок високих обчислювальних витрат. Суттєвий виграш можна досягти в такому випадку за допомогою простіших моделей авторегресії: АР, АРКС та АРІКС, перевагами яких є простота структури та можливості оперативної адаптації до характеристик процесу в реальному часі [5, c.116].
Метою даної роботи є проведення огляду найбільш актуальних моделей для побудови моделей фінансово економічних процесів, що можуть бути використані для оцінювання прогнозів та подальшого прийняття рішень.
Досліджувані процеси
Нехай процес описується змінною вигляду де дискретний час.
У випадку, коли , тобто математичне сподівання змінюється в часі, то такий процес називають процесом з трендом або інтегрованим процесом (по аналогії із характером зміни сигналу на виході інтегратора) або процесом з одиничними коренями (відповідного характеристичного рівняння).
При цьому під трендом будемо розуміти поточне середнє значення процесу, яке може бути отримане за допомогою процедури цифрової фільтрації. В простому випадку це може бути формула для обчислення поточного середнього значення.
Наявність нелінійного детермінованого тренду в процесі можна визначити шляхом оцінювання рівняння:
(1)
яке представляє собою поліном порядку т відносно часу. Якщо хоча б один із коефіцієнтів є статистично значимим, то гіпотеза щодо відсутності тренду відхиляється [3, c.124]. Крім того, тренд може бути логарифмованим, експоненціальним, і загалі, будь-якою функцією від часу. У даній роботі розглядається поліноміальний та експоненціальний тренд. Якщо тренд відносно швидко змінює свій напрям розвитку і для нього важко знайти адекватне функціональне описання, то застосовують моделі випадкових трендів, які ґрунтуються на комбінаціях випадкових величин.
Інший тип нестаціонарних процесів – гетероскедастичні – це процеси із змінною в часі дисперсією, а гомоскедастичними - процеси із сталою дисперсією на відрізку часу, що розглядається при моделюванні та прогнозуванні.
Дисперсію та стандартне відхилення часто використовують як міру ризику при дослідженні фінансово-економічних процесів, а тому цій проблемі приділяється значна увага в спеціальній літературі. При дослідженні фінансових процесів дисперсію та стандартне відхилення використовують як міру волатильності (мінливості) процесу.
В технічних процесах дисперсія - міра розсіювання вимірів. Вона може характеризувати поточний стан механізмів, технологічних процесів, інтенсивність випадкових збурень, що впливають на технічні системи; інтенсивність похибок (шумів) вимірів і т. ін., тому це надзвичайно важливий статистичний параметр з точки зору дослідження поточного та прогнозування майбутнього стану системи [3, c.125].
В соціальних дослідженнях дисперсію і стандартне відхилення використовують для порівняння між собою різних соціальних груп або різних множин індивідуумів, що відносяться до однієї й тієї ж соціальної групи.
Оскільки дисперсія може змінюватись у часі, то важливо мати таку математичну модель, яка дозволить коректно описувати поведінку дисперсії та прогнозувати її значення на один або більше кроків наперед. Це дасть можливість покращувати якість рішень по відношенню до управління процесами із змінною в часі дисперсією. Наприклад, коректно формулювати правила прийняття рішень щодо купівлі/продажу акцій на біржі, коректно оцінювати міру кредитного та інших ризиків в банківській діяльності. У технічних системах дисперсія та стандартне відхилення - це міри відхилення розмірів від заданих, ступінь зношеності механізму, рівень шуму і т. ін. Так, дисперсію та стандартне відхилення використовують в системах аналізу якості продукції при побудові контрольних карт, при визначенні точності розмірів і т. ін. [2, c.42].
Формально процес вважається гетероскедастичним (ГСП), якщо
(2)
Припущення щодо гомоскедастичності означає, що варіація кожної випадкової величини x(k) навколо її математичного сподівання залишається сталою величиною незалежно від значень факторів. Тобто дисперсія процесу не є функцією часу [3, c.135].
Різницеві рівняння
Різницеві рівняння - зручний інструмент для аналізу та прогнозування економетричних часових рядів. Так склалося історично, що різницеві рівняння посідають, фактично, центральне місце в процесі розв’язку практичних економічних задач. Застосування різницевих рівнянь забезпечує наступні переваги:
Деякі типи регресійних та різницевих рівнянь
Авторегресія (AP(p)): рівняння авторегресії описує пам‘ять процесу, тобто вплив значень попередніх станів на його поточний стан:
(3)
де — коефіцієнти моделі, які оцінюються на основі значень часового ряду;
— порядок авторегресії, який визначається числом затриманих в часі значень ряду, що використовуються в правій частині рівняння для описання динаміки змінної в момент
дискретний час;
випадкова величина, поява якої зумовлена наступними причинами:
Авторегресія з ковзним середнім (АРКС(p,q)):
(4)
де порядок ковзного середнього,
коефіцієнтиковзного середнього.
Авторегресія з інтегровним ковзним середнім (АРІКС(p,d,q)):
(5)
де оператор різниці часового ряду порядку
(послідовне взяття
разів різниць першого порядку – спочатку від часового ряду, потім від отриманих різниць і т.д.)
Авторегресійне рівняння з умовною гетероскедастичністю (АРУГ(p)):
(6)
де дисперсія процесу у момент часу
,
коефіцієнти моделі,
залишки моделі AP(p).
Для оцінки параметрів моделі використаємо метод найменших квадратів (МНК).
Результати
Проведемо дослідження на прикладі дослідження курсу валют долар до гривні [6]. Були узяті денні спостереження за останні 60 днів починаючи з 01.05.2016). Нижче приведений графік процесу:
Рисунок 1 – Нестаціонарний процес курсу валют долара до гривні
Побудуємо модель авторегресії: аналіз ЧАКФ (часткової автокореляційної функції) вказує про доцільність включення лагу 2 та 9 порядку:
Рисунок 2 – АР(9) модель
Тест ряду з квадратів залишків моделі АР(9) вказує на наявність гетероскедастичності, тому побудуємо модель АРУГ (3), опишемо умовну дисперсію вихідного процесу, оцінивши ряд з квадратів залишок моделі АР(9).
Рисунок 3 – АРУГ(3) модель
Таким чином, АРУГ(3) модель можна описати наступним рівнянням:
(7)
Для оцінки адекватності прогнозу візьмемо 54 значення і зробимо прогноз на наступні 6 днів (з 27.05.2005 по 01.06.2016). Результати приведені у таблиці:
Таблиця 1 – АРУГ(3) модель
Спостереження |
Реальне значення умовної дисперсії |
EViews |
|
Прогноз, грн. |
Похибка, грн. |
||
27.05.2016 |
0.027 |
0.0265 |
-0.0005 |
28.05.2016 |
0.019 |
0.0256 |
0.0064 |
29.05.2016 |
0.031 |
0.0305 |
-0.0001 |
30.05.2016 |
0.036 |
0.0304 |
-0.0060 |
31.05.2016 |
0.033 |
0.0267 |
-0.0061 |
1.06.2016 |
0.022 |
0.0215 |
-0.0002 |
САП |
|
1.3e-5 |
|
САПП, % |
|
35.4 |
Проведемо дослідження процесу ВВП США узявши поквартальні значення з 01.01.1947 по 01.01.2016 [7]. Нижче представлений графік процесу:
Рисунок 4 – Процес ВВП США
З малюнку видно чітко виражений тренд, побудуємо поліномуальну модель його опису та прогноз (перевірочна вибірка – 274 значення, наступні 6 – тестова).
Статистичний пакет EViews з використанням методу оцінки МНК дав наступні результати:
(8)
Оцінка адекватності прогнозу виявилась наступною:
Таблиця 2 – Поліноміальна модель
Спостереження |
Реальне значення, млрд $ |
|
|
МНК |
|||
Прогноз, млрд. $ |
Похибка, млрд. $ |
||
2015-1 |
17913.7 |
17770.8 |
-142.9 |
2015-2 |
18060.2 |
17893.8 |
-166.4 |
2015-3 |
18164.8 |
18016.3 |
-148.5 |
2015-4 |
18229.5 |
18138.3 |
-91.2 |
2016-1 |
|
18259.7 |
|
2016-2 |
|
18380.6 |
|
2016-3 |
|
18500.8 |
|
САП |
|
137,2 |
|
САШІ, % |
|
0.76% |
|
Таким чином, можна зробити висновок, що використання тієї чи іншої моделі певним чином залежить від конерктної задачі та попереднього аналізу нестацоінарного процесу. Авторегресійні моделі є найбільш простими з точки зору побудови та об’єму обчислювальних операцій і при цьому у більшості випадках модель процесу та прогнозу виявляється адекватною для особи, що приймає рішення.
Список використаних джерел