МО для анализа волатильности рынка / трейдерам

О программе

Почему одной модели недостаточно

Мурат Сейткали, старший аналитик в одной из казахстанских управляющих компаний, провёл полгода, настраивая LSTM для прогноза волатильности. Модель хорошо работала на тренировочном периоде и разваливалась на каждом кризисном эпизоде.

Проблема не в архитектуре — проблема в том, что один источник данных не даёт полной картины. Этот курс о том, как сочетать несколько моделей и несколько типов данных.

Альтернативные данные на практике

Новостной поток, данные опционного рынка (VIX и его аналоги), поисковые тренды — всё это несёт информацию о том, как формируется ожидаемая волатильность. Работаем с реальными API и учимся обрабатывать неструктурированный текст через NLP-методы.

Разбираем конкретно: как трансформировать тональность новостей в числовой признак и проверить, даёт ли он статистически значимый вклад в модель.

Стакинг и ансамблирование

Ансамбли работают, когда базовые модели делают разные ошибки. На курсе строим мета-модель, которая объединяет GARCH, Random Forest и простую регрессию — и разбираем, в каких условиях каждая из них надёжнее.

Отдельный акцент на интерпретируемости: риск-менеджер должен понять, почему модель сигнализирует о повышенном риске, а не просто получить число.

Снижение размерности для финансовых данных

PCA и UMAP применительно к портфелям из десятков активов. Как выделить скрытые факторы волатильности и связать их с макроэкономическими переменными — ставкой Нацбанка РК, ценами на нефть, курсом тенге.

Честные ограничения курса

Курс не учит торговать и не даёт торговых сигналов
Работа с альтернативными данными требует доступа к платным API (часть доступна бесплатно)
Результаты моделей зависят от периода и качества исходных данных

Средний участник предыдущего потока потратил около 6 часов в неделю на практику помимо занятий — это реальная оценка трудозатрат.

Программа обучения

Структура программы

Блок 1. Ансамблевые методы
- Стакинг моделей разных классов
- Blending и его отличия от стакинга
- Диагностика ошибок базовых моделей
Блок 2. Альтернативные источники данных
- Парсинг и обработка финансовых новостей
- Sentiment scoring через ruBERT и FinBERT
- Опционная волатильность как предиктор
Блок 3. Снижение размерности
- PCA для многофакторных портфелей
- UMAP для визуализации режимов рынка
- Связь латентных факторов с макро-переменными
Блок 4. Интерпретируемость моделей
- SHAP для ансамблей
- Partial dependence plots
- Как презентовать модель нетехническому руководству
Блок 5. Финальный проект
- Самостоятельная постановка задачи
- Сборка полного пайплайна с альтернативными данными
- Защита перед группой и разбор с куратором

Длительность: 10 недель. Формат: онлайн, живые сессии по средам и субботам. Требования: опыт работы с Python и базовые знания ML.

Продвинутый анализ волатильности: ансамблевые модели и альтернативные данные