Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 295
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Много раз обсуждали вопрос взаимосвязи переменных.
Конечно, корреляция - это самый сомнительный, очень быстро начинает просматриваться корреляция с кольцами Сатурна, кофейной гущей...
Почему-то забыли об этом:
Тест Грэнджера на причинность (англ. Granger causality test) — процедура проверки причинно-следственной связи («причинность по Грэнджеру») между временными рядами. Идея теста заключается в том, что значения (изменения) временного ряда {\displaystyle x_{t}}, являющегося причиной изменений временного ряда {\displaystyle y_{t}}, должны предшествовать изменениям этого временного ряда, и кроме того, должны вносить значимый вклад в прогноз его значений. Если же каждая из переменных вносит значимый вклад в прогноз другой, то, возможно, существует некоторая другая переменная, которая влияет на оба.
В тесте Грэнджера последовательно проверяются две нулевые гипотезы: «x не является причиной y по Грэнджеру» и «у не является причиной x по Грэнджеру». Для проверки этих гипотез строятся две регрессии: в каждой регрессии зависимой переменной является одна из проверяемых на причинность переменных, а регрессорами выступают лаги обеих переменных (фактически это векторная авторегрессия).
А вот и код по этому случаю отсюда
Конечно, корреляция - это самый сомнительный, очень быстро начинает просматриваться корреляция с кольцами Сатурна, кофейной гущей...
Почему-то забыли об этом:
Никто ничего не забыл....
Вот когда google correlate будет спрашивать , а каким методом уважаемый юзер вы хотите мерить связь ?? вот тогда этот ваш пост будет актуальным , а пока не спрашивает гугл, да и не будет спрашивать, сервису уже 6 лет, если бы хотели сделать то сделали бы уже
и еще...
У гугла там миллиарды ВР в базе данных , всегда найдется сотня другая ВР которые оказались близкими чисто случайно, чисто из за того что база данных огромная и НЕ важно чем там близость мерили , примитивной корреляцией или чем то заумным и сложным.
Вопрос в другом , как отсеять случайное от не случайного
Вопрос в другом , как отсеять случайное от не случайного
Можно
1) разделить ряд евры на две части "1" и "2"
2) закинуть ряд "1" в гугл путь найдет все близкие ряды
3) запоминаем названия всех близких рядов
4) закинуть ряд "2" в гугл путь найдет все близкие ряды
5) запоминаем названия всех близких рядов
6) сравниваем названия рядов из пунктов 3) и 5) и ищем такой ряд который присутствует и в 3) и в 5)
Таким образом найдутся ряды которые не случайно коррелируют с еврой, это что то типа кросвалидации в самом примитивном виде
Но как вытащить эти название я не знаю, нужно парсить страницу наверное
Никто ничего не забыл....
Вот когда google correlate будет спрашивать , а каким методом уважаемый юзер вы хотите мерить связь ?? вот тогда этот ваш пост будет актуальным , а пока не спрашивает гугл, да и не будет спрашивать, сервису уже 6 лет, если бы хотели сделать то сделали бы уже
и еще...
У гугла там миллиарды ВР в базе данных , всегда найдется сотня другая ВР которые оказались близкими чисто случайно, чисто из за того что база данных огромная и НЕ важно чем там близость мерили , примитивной корреляцией или чем то заумным и сложным.
Вопрос в другом , как отсеять случайное от не случайного
Так и отсеивайте по тесту из всего мусора, который собрал гугл, - я это и имел ввиду.
Так и отсеивайте по тесту из всего мусора, который собрал гугл, - я это и имел ввиду.
Блин Саныч, давайте подумаем вместе, если одному западло :)
гугл после поиска вывалит сотню рядов которые отлично коррелируют с еврой, какой тест заумный не применяй все они покажут отличную связь так что толку от этих тестов в данной ситуации нет
какой тест заумный не применяй все они покажут отличную связь
В этом я сомневаюсь. Высокая корреляция трендов означает лишь что они в целом примерно одинаково растут и падают. Для начала хорошо бы искать корреляцию не трендов, а приростов, например можно сохранить в csv те похожие тренды что выдаст гугл, дальше самому найти лаги и пересчитать корреляцию, это будет уже гораздо объективней.
И корреляция совсем не гарантирует что из одной переменной можно предсказать другую. Вообще отбирать предикторы для предсказания по принципу высокой корреляции это неудачно. То что предложил СанСаныч я раньше не пробовал, но выглядит надёжней.
Можно
1) разделить ряд евры на две части "1" и "2"
2) закинуть ряд "1" в гугл путь найдет все близкие ряды
3) запоминаем названия всех близких рядов
4) закинуть ряд "2" в гугл путь найдет все близкие ряды
5) запоминаем названия всех близких рядов
6) сравниваем названия рядов из пунктов 3) и 5) и ищем такой ряд который присутствует и в 3) и в 5)
Таким образом найдутся ряды которые не случайно коррелируют с еврой, это что то типа кросвалидации в самом примитивном виде
Но как вытащить эти название я не знаю, нужно парсить страницу наверное
Это называется - тест ЧОУ.
На самом деле проверяет неоднородность выборки в контексте регресионной модели.
В этом я сомневаюсь. Высокая корреляция трендов означает лишь что они в целом примерно одинаково растут и падают. Для начала хорошо бы искать корреляцию не трендов, а приростов, например можно сохранить в csv те похожие тренды что выдаст гугл, дальше самому найти лаги и пересчитать корреляцию, это будет уже гораздо объективней.
Да я согласен, но гугл не выдает нам всю свою базу, а только то что коррелирует "по трендам", брать то что коррелирует по трендам и из этого делать приращения и мерить корр. тоже не есть объективно, наверное... :) нужно по всей базе смотреть
Это называется - тест ЧОУ.
На самом деле проверяет неоднородность выборки в контексте регресионной модели.
Почитал эту макулатурку http://www.mirkin.ru/_docs/dissert065.pdf и захотел поюзать NeuroShell Day Trader Pro