Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3415
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Вам иерархическая больше подойдет, если надо наподобие листьев
Вполне вероятно - надо пробовать.
Правда, на сколько я помню, там памяти много надо оперативной для промежуточных расчетов, а ещё не понятно - как переносить на MQL5, и есть ли там возможность применяться на новых данных...
Думаю эта формула участвует при обучении / поиске центров кластеров. Для прогноза нужно просто найти ближайший центр по С[]
В общем, надо посмотреть, что там в массиве...
Вы с AlgLib'om дружите - можете примитивный код показать, как провести кластеризацию и применить на новых данных?
Я, если честно, их сокращения в функциях недопонимаю - что подать на вход\выход...
мю - это середина отрезка, кластера в данном случае, я так понял
если бы была окружность, то формула подходит
Мю, как я понимаю - среднее значение для каждого предиктора, оказавшегося в кластере.
Дельта значения предиктора и кластера, а потом их суммирование, определяет близость к кластеру в многомерном пространстве.
По результату выбирается наиболее близкий кластер, как я понимаю. Т.е. надо делать расчет для всех кластеров получается.
При применении не пересчитываем среднее значение просто.
В общем, надо посмотреть, что там в массиве...
Вы с AlgLib'om дружите - можете примитивный код показать, как провести кластеризацию и применить на новых данных?
Я, если честно, их сокращения в функциях недопонимаю - что подать на вход\выход...
//| INPUT PARAMETERS: |
//| XY - dataset, array [0..NPoints-1,0..NVars-1]. | - массив [строк , столбцов]
//| NPoints - dataset size, NPoints>=K | - число строк
//| NVars - number of variables, NVars>=1 | число столбцов
//| K - desired number of clusters, K>=1 | - число кластеров, сколько хотите получить
//| Restarts - number of restarts, Restarts>=1 | - не понятно, попробуйте 1
//| OUTPUT PARAMETERS: |
//| Info - return code: |
//| * -3, if task is degenerate (number of |
//| distinct points is less than K) |
//| * -1, if incorrect |
//| NPoints/NFeatures/K/Restarts was passed|
//| * 1, if subroutine finished successfully |
//| C - array[0..NVars-1,0..K-1].matrix whose columns| - массив центров
//| store cluster's centers |
//| XYC - array[NPoints], which contains cluster | - номер кластера для каждой строки из XY
//| indexes |
Вроде все просто - см комментарии на русском.
Мю, как я понимаю - среднее значение для каждого предиктора, оказавшегося в кластере.
А что такое среднее от всех? Это и есть центр кластера по этому столбцу.
Будет ли тс зарабатывать на тесте да/нет
Типа датасет состоит из 1000 моделей с оценками их работы на новых данных? А зачем их классифицировать, можно же просто отсортировать
Нет, не правильно.. попробую еще раз обьяснить, забудь про модели пока вообще..
Есть у тебя много ТС оптимизированыйх на трейн и есть тест.
Создаем датасет для модели :
таргет = По тест мы смотрим работала ли ТС на тест (это целевая ДА/НЕТ)
дата = (признаки) это параметры ТС , кривая капитала, сделки, ФВ, шарп (если ТС на основе МО то кишки модельки)
Далее трейним уже как бы реальную модель отвечать будет работать конкретная ТС на тесте или нет
Баловство всё это. Пока не сможете детектить смещение вероятности в отдельно взятом листе - модели будут лить.
А для работы с листом или квантовым отрезком - нужно достаточно много откликов на истории, а этого нет, а без этого недостаточно стат данных... поэтому модели будут сомнительны...
Уже года 4 Алглибом не занимался.