Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Добрый день.
Не только. Я применяю ada, randomForest ( в различных вариантах), С50 и др. Но лучшие результаты конечно у "ada" и rfNear() из COREleаrn. Очень хваленный svm не показал никаких преимуществ ( кроме того, что учится ну очень долго). Не умаляя его значения, может не смог правильно приготовить?
Последовательность работы такая.Проверка входных данных на значимость, определение оптимальных параметров для каждой модели . Расчет по трём различным моделям с калибровкой, решение простым голосованием. При начальной выборке в 1000 баров модели стабильно отрабатывает 250 баров без переобучения. Контроль и оценка по Accuracy.
В последнее время появились пакеты которые кроме оценки входных данных методов главных компонент оценивают влияние методов препроцессинга на результат и выбирают лучший. Еще не совсем освоил, нет времени. Но продолжу изучать.
Удачи.
Какие сигналы, подаваемые на вход, по-вашему, несут полезную информацию?:)
См. PDF в прикреплённом архиве: стр. 17 Редукция незначимых предикторов ...
Там есть простенький пример, где наглядно показано, что метод корректно понижает размерность только для тех входов, которые не являются объясняющими переменными в обучающей выборке.
Вот такое окно....
ХМ.. Интересно, скачал по ссылке из книги проект, Но как его запустить не знаю. Может подскажите???
Возможно, что версия Java на компе устаревшая? Я компилировал проект под версией 1.8.0_25
Скачать свежую версию Java2SE (JRE или JDK) можно на сайте: http://java.com/ru/
Отлично, всё запустилось, только вот непонятно в каком виде нужно подавать данные.... Понятно что .csv Ну а как они должны быть расположены и т.д.
Еслит есть возможность скинуть файл данных с примером....
Отлично, всё запустилось, только вот непонятно в каком виде нужно подавать данные.... Понятно что .csv Ну а как они должны быть расположены и т.д.
Еслит есть возможность скинуть файл данных с примером....
см. Прогнозируем банкротства
Там есть прикреплённый файл в формате CSV с примером для классификации.
Если вкратце, то:
Разделитель ячеек - точка с запятой.
Разделитель целой от дробной части для чисел: либо точка, либо запятая (все запятые автоматом заменяются на точки).
Первый столбец - идентификаторы примеров (в текстовом виде)
Последний столбец - значения зависимой переменной: 1 - принадлежность к заданному классу, 0 - принадлежность к незаданному классу (к какому-то иному классу, кроме заданного)
Первая строка - идентификаторы факторов (в текстовом виде)
Вторая строка - примечания к идентификаторам факторов, например, единицы измерений (в текстовом виде)
Остальные данные, расположенные ниже второй строки, правее первого столбца и левее последнего - числовые значения факторов (нечисловые не обрабатываются).
Понятно. Первое преобразование это нормализация входных данных, После нормализации я подставляю данные в формулу и получаю РЕЗУЛЬТАТ ЧЕГО? Тоесть в формулу я подставляю нормализованные данные. и получаю соотвественно кривую индикатора по формуле??? Зачем тогда знак >0 ставить???
Тут немного не понятно :-(