Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2745
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Какой-то всплеск постов!
Еще раз.
Я ранжирую предикторы по ПРЕДСКАЗАТЕЛЬНОЙ СПОСОБНОСТИ.
Использую собственный алгоритм, так как алгоритмы из многочисленных пакетов слишком медленные - мой менее точный, но очень быстрый.
Предсказательная способность - это НЕ корреляция и НЕ результат выбора предикторов, которые дают модели.
Предсказательная способность - это информационная связь, а НЕ:
1. Корреляция - это "похожесть" одного стационарного ряда на другой, причем всегда есть некая величина, а значения "связь отсутствует" нет. Корреляция всегда имеет некое значение, поэтому с помощью корреляции запросто можно найти связь между учителем и кофейной гущей.
2. Фиче селекшин - это частота использования фич при построении моделей. Если взять предикторы, не имеющие отношения к учителю, то все равно получим ранжирование фич.
Аналогом моего понимания "предсказательной способности является например caret::classDist(), который определяет расстояния выборок Mahalanobis для каждого класса центров тяжести. Или woeBinning. Подходов много и много пакетов в R. Есть еще на основе теории информации.
вот и проверяйте прежде
Что проверять? есть ли у тебя ротация ??
Это уже даже не смешно..
Подытоживая теорию Саныча (поскольку он сам не смог нормально формализовать и привести примеры):
Совершенно все неверно
1. Выше написал о своем понимании "предсказательная способность"
2. Смыл не понят
3. Нет трейна в обычном понимании. Подгонка случайного леса. Объем выборки = 1500 бар, количество деревьев=150. Размер выборки подобран по графику ошибки подгонки. На этой выборке из 170 предикторов делается селекция и препроцессинг предикторов по разным критериям. В конечном итоге из 20-30 оставшихся предикторов по максимуму предсказательной способности отбирается от 5 до 10 предикторов, на которых подгоняется модель. По полученной модели предсказывается следующий бар. С приходом нового бара повторяется весь процесс построения модели.
Максимальная ошибка подгонки около 20%, но достаточно редко. Обычно около 10%.
4. Свой подход описал ранее.
Еще раз.
но целевая не зигзаг же?
Совершенно все неверно
1. Выше написал о своем понимании "предсказательная способность"
2. Смыл не понят
3. Нет трейна в обычном понимании. Подгонка случайного леса. Объем выборки = 1500 бар, количество деревьев=150. Размер выборки подобран по графику ошибки подгонки. На этой выборке из 170 предикторов делается селекция и препроцессинг предикторов по разным критериям. В конечном итоге из 20-30 оставшихся предикторов по максимуму предсказательной способности отбирается от 5 до 10 предикторов, на которых подгоняется модель. По полученной модели предсказывается следующий бар. С приходом нового бара повторяется весь процесс построения модели.
Максимальная ошибка подгонки около 20%, но достаточно редко. Обычно около 10%.
4. Свой подход описал ранее.
Уверенность, что будущие результаты будут такими же приличными, вытекает из статистики предсказательной способности, которая:
1. должна иметь достаточно высокое СРЕДНЕЕ значение
2. низкое значение sd.
Как обычно, если удается найти предикторы, имеющие sd менее 10%, то и вариации ошибки предсказания будут примерно такими же.
Мой вывод:
1. Надо взять (или разработать) один из алгоритмов "предсказательной способности"
2. Найти перечень предикторов, значения предсказательной способности различают в разы
3. Прогнать окно и получить статистику: среднее и отклонение от средней. Если повезет, то найдете такой перечень. Я нашел.
Модель не имеет значения. На моих предикторах RF, ada, GBM, GLM дают примерно одинаковый результат. Чуть хуже SVM. Совсем плохо nnet.
Весь успех находится в предикторах и их препроцессинга. А вы тут чепухой занимаетесь!
Так понятней. А целевые откуда берутся, по результатам кластеризации?
У меня знак обычных приращений.
Целевая вторична. Проблема целевой в предикторах: можно подобрать к конкретной целевой предикторы или нет.
У меня знак обычных приращений.
Целевая вторична. Проблема целевой в предикторах: можно подобрать к конкретной целевой предикторы или нет.
Какой-то всплеск постов!
Еще раз.
Я ранжирую предикторы по ПРЕДСКАЗАТЕЛЬНОЙ СПОСОБНОСТИ.
Использую собственный алгоритм, так как алгоритмы из многочисленных пакетов слишком медленные - мой менее точный, но очень быстрый.
Предсказательная способность - это НЕ корреляция и НЕ результат выбора предикторов, которые дают модели.
Предсказательная способность - это информационная связь, а НЕ:
1. Корреляция - это "похожесть" одного стационарного ряда на другой, причем всегда есть некая величина, а значения "связь отсутствует" нет. Корреляция всегда имеет некое значение, поэтому с помощью корреляции запросто можно найти связь между учителем и кофейной гущей.
2. Фиче селекшин - это частота использования фич при построении моделей. Если взять предикторы, не имеющие отношения к учителю, то все равно получим ранжирование фич.
Аналогом моего понимания "предсказательной способности является например caret::classDist(), который определяет расстояния выборок Mahalanobis для каждого класса центров тяжести. Или woeBinning. Подходов много и много пакетов в R. Есть еще на основе теории информации.