Обсуждение статьи "Ложные регрессии в Python"

 

Опубликована статья Ложные регрессии в Python:

Ложные регрессии возникают, когда два временных ряда демонстрируют высокую степень корреляции чисто случайно, что приводит к вводящим в заблуждение результатам регрессионного анализа. В таких случаях, даже если переменные кажутся связанными, корреляция является случайной и модель может быть ненадежной.

Прежде чем погрузиться в сферу алгоритмической торговли с использованием машинного обучения, крайне важно выяснить, существует ли значимая связь между входными данными модели и переменной, которую мы хотим предсказать. В статье иллюстрируется полезность использования критериев единичных корней для остатков модели для проверки наличия такой связи в наших наборах данных.

К сожалению, можно построить модели, используя наборы данных, не имеющие никакой реальной взаимосвязи. Причем, эти модели могут давать впечатляюще низкие показатели погрешности, усиливая ложное чувство контроля и приводя к чрезмерно оптимистичным прогнозам. Такие ошибочные модели обычно называют "ложными регрессиями" (spurious regressions).

В этой статье мы начнем с формирования интуитивного понимания ложных регрессий. После этого мы сгенерируем синтетические данные временного ряда, чтобы смоделировать ложную регрессию и наблюдать ее характерные эффекты. Затем мы углубимся в методы выявления ложных регрессий, полагаясь на наши знания для проверки модели машинного обучения, созданной на Python. Наконец, если наша модель пройдет проверку, мы экспортируем ее в ONNX и реализуем торговую стратегию на MQL5.

Автор: Gamuchirai Zororo Ndawana

 
Очень интересная статья! Но трейдерам, не обладающим глубокими статистическими знаниями, было бы полезно вкратце объяснить основные термины, такие как остатки (разница с прогнозом), стационарность (вариация и среднее постоянны или нет) и т.д.
 
Carl Schreiber #:
Очень интересная статья! Но для трейдеров, не обладающих глубокими статистическими знаниями, было бы полезно кратко объяснить основные термины, такие как остатки (разница с прогнозом), стационарность (вариация и среднее постоянны или нет) и т.д.

Спасибо, Карл, вы правы, в следующий раз я буду помнить, что нужно быть кратким и милым, чтобы максимизировать полезность.

 

Возможно, это сложности перевода, но хотел бы уточнить. Стационарность в статье определяется для остатков, т.е. дельта между реальными ценами закрытия бара и его прогнозом? Я, возможно, плохо читал, но почему мы делаем выводы на тех же данных, что и обучались, не логично ли модель применить на отложенной выборке?

Из статьи создалось ощущение, что временные ряды котировок стационарны, но из всех источников нам сообщают обратное. Думаю, это ошибка восприятия материала.

Так же не освещён вопрос точности модели, как я понял, она вовсе не точна, а если так, то можно ли применять тогда разные тесты при таком сильном разбросе ошибок в ответах модели?

В идеале, было бы полезно видеть, как были исключены предикторы, по той или иной методике, и это повлияло на результаты регрессионной модели.

Думаю, требуется больше статей по данной тематике, которые можно реально применять в работе с котировками.

 
Aleksey Vyazmikin регрессионной модели.

Я думаю, что необходимо больше статей на эту тему, которые действительно можно применить к цитатам.

Алексей, как вы, вероятно, уже знаете, есть много разных способов решения любой проблемы. Я предпочитаю измерять остатки модели на тестовых данных, с которыми она раньше не сталкивалась. Однако в научной литературе, которую я читал в то время, мне показалось, что даже тренировочные данные, которые модель видела раньше, все равно подходят.


И я не знал, что то, как я написал, могло навести на мысль, что временные ряды рыночных котировок стационарны, мы все знаем, что они не стационарны, это не было моим намерением сказать это, и я, вероятно, мог бы сформулировать все лучше.

Вопрос о точности модели был за пределами моей сферы, потому что поддельные модели могут все еще получать высокие показатели точности.

Вы знаете, что это одна из первых статей, которую я написал для сообщества. С тех пор я многому научился и буду продолжать пополнять эту серию. На этот раз я буду писать четко и особенно наглядно покажу, как мы можем использовать это в своих интересах при торговле на финансовых рынках.