О программе
Почему одной модели недостаточно
Мурат Сейткали, старший аналитик в одной из казахстанских управляющих компаний, провёл полгода, настраивая LSTM для прогноза волатильности. Модель хорошо работала на тренировочном периоде и разваливалась на каждом кризисном эпизоде.
Проблема не в архитектуре — проблема в том, что один источник данных не даёт полной картины. Этот курс о том, как сочетать несколько моделей и несколько типов данных.
Альтернативные данные на практике
Новостной поток, данные опционного рынка (VIX и его аналоги), поисковые тренды — всё это несёт информацию о том, как формируется ожидаемая волатильность. Работаем с реальными API и учимся обрабатывать неструктурированный текст через NLP-методы.
Разбираем конкретно: как трансформировать тональность новостей в числовой признак и проверить, даёт ли он статистически значимый вклад в модель.
Стакинг и ансамблирование
Ансамбли работают, когда базовые модели делают разные ошибки. На курсе строим мета-модель, которая объединяет GARCH, Random Forest и простую регрессию — и разбираем, в каких условиях каждая из них надёжнее.
Отдельный акцент на интерпретируемости: риск-менеджер должен понять, почему модель сигнализирует о повышенном риске, а не просто получить число.
Снижение размерности для финансовых данных
PCA и UMAP применительно к портфелям из десятков активов. Как выделить скрытые факторы волатильности и связать их с макроэкономическими переменными — ставкой Нацбанка РК, ценами на нефть, курсом тенге.
Честные ограничения курса
- Курс не учит торговать и не даёт торговых сигналов
- Работа с альтернативными данными требует доступа к платным API (часть доступна бесплатно)
- Результаты моделей зависят от периода и качества исходных данных
Средний участник предыдущего потока потратил около 6 часов в неделю на практику помимо занятий — это реальная оценка трудозатрат.