Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1762

 

Что то вы недопоняли....

Aleksey Vyazmikin:

Если мы работаем с готовой выборкой, то это попытка вытянуть из собранных данных что-то полезное, но кто гарантирует, что данные собраны полезные?

Что значит собраны полезные данные? , начальные данные это ohlcv + time + Y (эти данные для всех одинаковы) они не могут быть полезны либо нет, они просто есть, это начальные признаки  , далее с этих данных мы уже сами генерируем признаки по критерию улучшения предсказания. Улучшили?  добавили  ohlcv+my.feature+....  отдали назад людям, другой взял открыл, придумал новый признак , проверил улучшает ли он ошибку на тесте  , добавил   ohlcv+my.feature+his.featue... отдал людям  итд..

Aleksey Vyazmikin:

По ZZ не знаю, что там у Вас за целевая - как из неё деньги извлечь? Ведь помимо разметки нужен и финансовый результат от действий классификации.

Я раньше был против ZZ но это все из за непонимания...  Смотрите вы говорите про фин. результат, идеал к которому надо стремиться это идеальная торговля, те максимум прибыли за единицу времени, если взять   ZZ то это как раз и есть та самая идеальная торговля, обучение АМО на  ZZ это и есть приближение к максимально эффективной торговли чем лучше мы приблизимся к  ZZ тем лучше тот самый финансовый результат

 
Aleksey Vyazmikin:

 Мне интересно в первую очередь работать со своими предикторами, иначе нет смысла тратить время.

Поэтому и должна разметка быть воспроизводимой каждым, что бы он мог добавить свои предикторы для обучения.

Работайте со своими фичами, но на общем датасете, в этом вся и суть, и там будут не только ваши фичи, а лучшие фичи, которые придумали остальные лучшие участники форума, представляете какая это синергия? Сколько новых идей? На сколько сильно это улучшит ваши фичи в сумме? 

И улучшения будут  не на словах как тут принято, одно пустое бла бла , а на деле ... Если знаешь что говоришь? докажи на деле, докажи на датасете, вот тебе ohlc вот тебе целевая , сделай лучшее приближение чем остальные... не можешь ? ну то пшнх и п.ди )) Понимаете о чем я ?

ZZ  воспроизводимый каждым

 
mytarmailS:

Что то вы недопоняли....

Что значит собраны полезные данные? , начальные данные это ohlcv + time + Y (эти данные для всех одинаковы) они не могут быть полезны либо нет, они просто есть, это начальные признаки  , далее с этих данных мы уже сами генерируем признаки по критерию улучшения предсказания. Улучшили?  добавили  ohlcv+my.feature+....  отдали назад людям, другой взял открыл, придумал новый признак , проверил улучшает ли он ошибку на тесте  , добавил   ohlcv+my.feature+his.featue... отдал людям  итд..

Так накой данные брать из дата сета, если их можно брать с чарта? К тому же не у всех целевая на каждом баре генерируется.

mytarmailS:

Я раньше был против ZZ но это все из за непонимания...  Смотрите вы говорите про фин. результат, идеал к которому надо стремиться это идеальная торговля, те максимум прибыли за единицу времени, если взять   ZZ то это как раз и есть та самая идеальная торговля, обучение АМО на  ZZ это и есть приближение к максимально эффективной торговли чем лучше мы приблизимся к  ZZ тем лучше тот самый финансовый результат

Фин результат - не идеал, а последствия принятия решения. И фин результат может быть разным при одной и той же целевой, если система не разворотная, а выход происходит по TP\SL.

И потом, я так и не понял, что за целевая у Вас - напишите подробней.

 
mytarmailS:

Работайте со своими фичами, но на общем датасете

Это неудобно.

 
Aleksey Vyazmikin:

Так накой данные брать из дата сета, если их можно брать с чарта? К тому же не у всех целевая на каждом баре генерируется.

Фин результат - не идеал, а последствия принятия решения. И фин результат может быть разным при одной и той же целевой, если система не разворотная, а выход происходит по TP\SL.

И потом, я так и не понял, что за целевая у Вас - напишите подробней.

Aleksey Vyazmikin:

Это неудобно.

Извините но судя по вашим вопросам вы вообще не врубаетесь о чем я тут толкую, вы знаете что такое kaggle ? вот что то подобное вернее в этом формате я хочу сделать. Ознакомитесь пожалуйста и у вас сразу отпадет куча нелепых вопросов типа..

Зачем нужен именно один дата сет для всех ?

Почему нельзя брать с чарта данные  ?  каждый у себя  ))

Почему нельзя генерировать целевую ? каждый у себя ))

итд....

 
mytarmailS:

Извините но судя по вашим вопросам вы вообще не врубаетесь о чем я тут толкую, вы знаете что такое kaggle ? вот что то подобное вернее в этом формате я хочу сделать. Ознакомитесь пожалуйста и у вас сразу отпадет куча нелепых вопросов типа..

Зачем нужен именно один дата сет для всех ?

Почему нельзя брать с чарта данные  ?  каждый у себя  ))

Почему нельзя генерировать целевую ? каждый у себя ))

итд....

Вы не понимаете, что конкурсы бессмыслены (об этом говорят сами победители и призеры конкурсов)?

Мне интересно работать над улучшением системы, а не над подгонкой под конкретный датасет.

 
Aleksey Vyazmikin:

Вы не понимаете, что конкурсы бессмыслены (об этом говорят сами победители и призеры конкурсов)?

Ну что за бред? Где они такое говорят? Эти конкурсы на столько бессмысленны что заказчики этих конкурсов платят за лучшее решение призерам по 5-50 тыс. дол. , дааа такие деньги платят именно за бессмысленные решение , угу, точно... 

Aleksey Vyazmikin:

Мне интересно работать над улучшением системы, а не над подгонкой под конкретный датасет.

А ваше улучшение не подгонка?  Объясните  мне тупому  почему ваше решение которое вы придумали это не подгонка, а если взять ваши исходные данные записать его в  csv и синтезировать из этих данных свое решение то это вдруг уже подгонка??  Вы не слышали о кроссвалидации ??

Классно....

Ладно, забейте, можете даже не отвечать ничего, разговор без смысла 

 
mytarmailS:

Ну что за бред? Где они такое говорят? Эти конкурсы на столько бессмысленны что заказчики этих конкурсов платят за лучшее решение призерам по 5-50 тыс. дол. , дааа такие деньги платят именно за бессмысленные решение , угу, точно... 

Платят за идеи в исходниках, которые проверяются потом и отбрасываются. Не факт, что берут в работу результаты победителя. Альтернативой исхода конкурса является предложение победителям настоящей работы над задачей, с полными данными и их интерпретацией.

mytarmailS:

А ваше улучшение не подгонка?  Объясните  мне тупому  почему ваше решение которое вы придумали это не подгонка, а если взять ваши исходные данные записать его в  csv и синтезировать из этих данных свое решение то это вдруг уже подгонка??  Вы не слышали о кроссвалидации ??

Классно....

Ладно, забейте, можете даже не отвечать ничего, разговор без смысла 

Вы читать внимательно можете - ранее я написал, что целевая может сниматься не на каждом баре, что препятствует получению промежуточных данных из CSV файла.

Почему Вы решили, что публичная целевая это будет Ваша целевая?

На выборке всегда будут подогнанные данные под выборку - проверка нужна на данных вне выборки, а для этого должна быть возможность создания новой выборки обучения.

Смотрите практичней на ситуацию без излишнего эгоизма. Да и в переговорах надо учиться уступать, ища путь к главной цели, а не хвататься за несущественные для уступки моменты.


Вот кстати видео и канал о конкурсах - посмотрите, что говорят участники.


 
Aleksey Vyazmikin:

Почему Вы решили, что публичная целевая это будет Ваша целевая?

Я счищаю что целевой должен быть зиг-заг потому что -

1) ЗЗ это эквивалент идеальных решений о направлении позиции, к этому идеалу надо стремиться .

2) Предвижу ваш вопрос, а как же другие целевые?  Дело в том что ЗЗ иерархически выше всех других целевых , их можно назвать "локальными", а ЗЗ "глобальной".

Что такое локальна целевая? это то все что вы можете придумать -- купить не купить когда стхастик>0,8 или купить не купить когда 16:00, ЗЗ объединяет все эти локальные целевые в себе, а обратное неверно.

Можно локальными целевыми улучшать прогноз глобальной целевой , ноне надо их путать и тем более сопоставлять 

Итак Я объяснил почему ЗЗ, если у вас есть лучшее решение с удовольствием выслушаю


Aleksey Vyazmikin:

Вы читать внимательно можете - ранее я написал, что целевая может сниматься не на каждом баре, что препятствует получению промежуточных данных из CSV файла.

Да снимайте хоть раз день

Это как раз и есть признак с локальной целевой

 Заверните ваше решение в вид признака/индикатора и добавляете в общий датасет , если он улучшить прогноз глобальной целевой  то гуд, если нет то это мусор !

 
mytarmailS:

Я счищаю что целевой должен быть зиг-заг потому что -

1) ЗЗ это эквивалент идеальных решений о направлении позиции, к этому идеалу надо стремиться .

2) Предвижу ваш вопрос, а как же другие целевые?  Дело в том что ЗЗ иерархически выше всех других целевых , их можно назвать "локальными", а ЗЗ "глобальной".

Что такое локальна целевая? это то все что вы можете придумать -- купить не купить когда стхастик>0,8 или купить не купить когда 16:00, ЗЗ объединяет все эти локальные целевые в себе, а обратное неверно.

Можно локальными целевыми улучшать прогноз глобальной целевой , ноненадо их путать и тем более сопоставлять 

Итак Я объяснил почему ЗЗ, если у вас есть лучшее решение с удовольствием выслушаю

Ничего я ещё не понял. Пишите конкретно, как определяете целевую. Это вектор ZZ на каждом бара? Смена вектора на следующим баре? Конкретизируйте, пожалуйста, а там обсудим - хорошо это или плохо.

Причина обращения: