Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 370

 

Я не верю что анализ корреляции предиктора с таргетом хоть что-то даст.
Есть куча примеров когда близко коррелирующие величины вообще не зависят друг от друга, хотя кажется что можно из одного спрогнозировать другое, типа такого - http://pikabu.ru/story/lozhnyie_korrelyatsii_2287154 , тут на форуме ещё раньше вставлял статьи с хабра на эту-же тему.

Есть более интересный термин - кросс-энтропия. Это что-то из статистики, способ анализа подходит ли предиктор для переменной, нелинейная зависимость.

 
Дмитрий:


Есть пример?

Покажи ряды входящих и ряд исходящих данных - опубликуй

Для XOR датасет может состоять из 4х сэмплов, суть не изменится от этого. {x,y,z} x,y - фичи z - таргет

{-1,1,-1},{1,1,1},{1,-1-1},{-1,-1,1}

Считаем ковариацию первой фичи c таргетом: учитывая что мо = 0 имеем: ((-1*-1) + (1*1) +(1*-1) +(-1*1))/4 = (1+1-1-1)/4 = 0 очевидно что и корреляция тоже ноль, тоже будет и с второй фичей, можете проверить, однако для ниленейного классификатора обе фичи более чем валидны

 
Dr. Trader:

Я не верю что анализ корреляции предиктора с таргетом хоть что-то даст.
Есть куча примеров когда близко коррелирующие величины вообще не зависят друг от друга, хотя кажется что можно из одного спрогнозировать другое, типа такого - http://pikabu.ru/story/lozhnyie_korrelyatsii_2287154 , тут на форуме ещё раньше вставлял статьи с хабра на эту-же тему.

Есть более интересный термин - кросс-энтропия. Это что-то из статистики, способ анализа подходит ли предиктор для переменной, нелинейная зависимость.

Того же мнения, какая разница что эти кривульки показывают, если мы ищем нелинейные зависимости между набором фич и целевой. И про удаление высокоррелированных предикторов не явно.. Они мб коррелированные коррелированные да не выкоррелированные :) например, если подать набор индикаторов со смещением корреляция будит высокой, но и информативность тоже
 
Dr. Trader:

Я не верю что анализ корреляции предиктора с таргетом хоть что-то даст.
Есть куча примеров когда близко коррелирующие величины вообще не зависят друг от друга, хотя кажется что можно из одного спрогнозировать другое, типа такого - http://pikabu.ru/story/lozhnyie_korrelyatsii_2287154 , тут на форуме ещё раньше вставлял статьи с хабра на эту-же тему.

Есть более интересный термин - кросс-энтропия. Это что-то из статистики, способ анализа подходит ли предиктор для переменной, нелинейная зависимость.


1. никто и не анализирует корреляцию - речь идет о выборе предикторов.

2. ты своими словами повторил мою мысль тремя страницами ранее - "Зависимость - частный случай корреляции. Если две переменные зависят, то корреляция точно есть. Если корреляция есть, то не обязательно есть зависимость.".

3. кросс-энтропия точно так же как корреляция не даст ответ по наличию функциональной зависимости

 
Алёша:

Для XOR датасет может состоять из 4х сэмплов, суть не изменится от этого. {x,y,z} x,y - фичи z - таргет

{-1,1,-1},{1,1,1},{1,-1-1},{-1,-1,1}

Считаем ковариацию первой фичи c таргетом: учитывая что мо = 0 имеем: ((-1*-1) + (1*1) +(1*-1) +(-1*1))/4 = (1+1-1-1)/4 = 0 очевидно что и корреляция тоже ноль, тоже будет и с второй фичей, можете проверить, однако для ниленейного классификатора обе фичи более чем валидны


Два одинаково коррелированных предиктора - что выбрасываем на основании более низкой корреляции? Какой из них менее коррелирован?
 
Дмитрий:


1. никто и не анализирует корреляцию - речь идет о выборе предикторов.

2. ты своими словами повторил мою мысль тремя страницами ранее - "Зависимость - частный случай корреляции. Если две переменные зависят, то корреляция точно есть. Если корреляция есть, то не обязательно есть зависимость.".

3. кросс-энтропия точно так же как корреляция не даст ответ по наличию функциональной зависимости

 Обратная корреляция это не зависимость? как вообще можно говорить о зависимости по кривым корреляции, ниче не понимаю... какая может быть зависимость между кривой урожая попкорна на полях и между количеством вылупившихся птенцов у усидчивых трейдеров? Почему это будет лучше для нс, если случайная корреляция между несвязанными явлениями будет высокой?
 
Maxim Dmitrievsky:
 Обратная корреляция это не зависимость? как вообще можно говорить о зависимости по кривым корреляции, ниче не понимаю... какая может быть зависимость между кривой урожая попкорна на полях и между количеством вылупившихся птенцов у усидчивых трейдеров? Почему это будет лучше для нс, если случайная корреляция между несвязанными явлениями будет высокой?


Ничего не понял.

При чем тут обратная корреляция?

Есть коррелированные величины. Часть из них может иметь между собой функциональную зависимость, а часть - ложную корреляцию.

Еще раз - "Зависимость - частный случай корреляции. Если две переменные зависят, то корреляция точно есть. Если корреляция есть, то не обязательно есть зависимость."

 

И еще раз - на сегодняшний день методов различия функциональной зависимости от ложной корреляции нет.

Только аналитические.

 
Дмитрий:


Ничего не понял.

При чем тут обратная корреляция?

Есть коррелированные величины. Часть из них может иметь между собой функциональную зависимость, а часть - ложную корреляцию.

Еще раз - "Зависимость - частный случай корреляции. Если две переменные зависят, то корреляция точно есть. Если корреляция есть, то не обязательно есть зависимость."


ну если у двух переменных обратная корреляция то как? как у котировок франка с евро. Зависимость точно есть, а корреляции нет
 
Maxim Dmitrievsky:

ну если у двух переменных обратная корреляция то как? как у котировок франка с евро. Зависимость точно есть, а корреляции нет


Я так и не понял - обратная корреляция или корреляции нет?

Или, по твоему, если у двух случайных рядов коэффициент корреляции равен -1, то у них "нет корреляции"?

Ёклмн.....

Причина обращения: