учебная программа

Продвинутый анализ волатильности: ансамблевые модели и альтернативные данные

Практический курс по применению методов машинного обучения в анализе волатильности рынков

2025 10 27 474 просмотров Казахстан
Продвинутый анализ волатильности: ансамблевые модели и альтернативные данные
стоимость 320 000 KZT

О программе

Почему одной модели недостаточно

Мурат Сейткали, старший аналитик в одной из казахстанских управляющих компаний, провёл полгода, настраивая LSTM для прогноза волатильности. Модель хорошо работала на тренировочном периоде и разваливалась на каждом кризисном эпизоде.

Проблема не в архитектуре — проблема в том, что один источник данных не даёт полной картины. Этот курс о том, как сочетать несколько моделей и несколько типов данных.

Альтернативные данные на практике

Новостной поток, данные опционного рынка (VIX и его аналоги), поисковые тренды — всё это несёт информацию о том, как формируется ожидаемая волатильность. Работаем с реальными API и учимся обрабатывать неструктурированный текст через NLP-методы.

Разбираем конкретно: как трансформировать тональность новостей в числовой признак и проверить, даёт ли он статистически значимый вклад в модель.

Стакинг и ансамблирование

Ансамбли работают, когда базовые модели делают разные ошибки. На курсе строим мета-модель, которая объединяет GARCH, Random Forest и простую регрессию — и разбираем, в каких условиях каждая из них надёжнее.

Отдельный акцент на интерпретируемости: риск-менеджер должен понять, почему модель сигнализирует о повышенном риске, а не просто получить число.

Снижение размерности для финансовых данных

PCA и UMAP применительно к портфелям из десятков активов. Как выделить скрытые факторы волатильности и связать их с макроэкономическими переменными — ставкой Нацбанка РК, ценами на нефть, курсом тенге.

Честные ограничения курса

  • Курс не учит торговать и не даёт торговых сигналов
  • Работа с альтернативными данными требует доступа к платным API (часть доступна бесплатно)
  • Результаты моделей зависят от периода и качества исходных данных

Средний участник предыдущего потока потратил около 6 часов в неделю на практику помимо занятий — это реальная оценка трудозатрат.

Программа обучения

Структура программы

  1. Блок 1. Ансамблевые методы
    • Стакинг моделей разных классов
    • Blending и его отличия от стакинга
    • Диагностика ошибок базовых моделей
  2. Блок 2. Альтернативные источники данных
    • Парсинг и обработка финансовых новостей
    • Sentiment scoring через ruBERT и FinBERT
    • Опционная волатильность как предиктор
  3. Блок 3. Снижение размерности
    • PCA для многофакторных портфелей
    • UMAP для визуализации режимов рынка
    • Связь латентных факторов с макро-переменными
  4. Блок 4. Интерпретируемость моделей
    • SHAP для ансамблей
    • Partial dependence plots
    • Как презентовать модель нетехническому руководству
  5. Блок 5. Финальный проект
    • Самостоятельная постановка задачи
    • Сборка полного пайплайна с альтернативными данными
    • Защита перед группой и разбор с куратором

Длительность: 10 недель. Формат: онлайн, живые сессии по средам и субботам. Требования: опыт работы с Python и базовые знания ML.

Была ли эта статья полезной?

Спасибо за ваш отзыв! Мы учтём ваше мнение при улучшении материалов.