Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1930

 
Maxim Dmitrievsky:

вариант 3 - через логистическую регрессию + генератор полиномиальных фичей. Тогда на выходе будет довольно короткая и легко интерпретируемая формула, подобная вашей

но я не шпрехаю в чем смысл воспроизводить условие через МО

тогда уж "не ферштею")))

впрочем, я тоже.

 
fxsaber:

Вопрос от нуба.

Есть три переменные A, B, C. Из них составлено руками какое-то условие. Например.

Хочется это условие воспроизвести автоматом. Находить его не надо, т.к. я его уже знаю. Но нужно иметь например десяток каких-то весовых коэффициентов, определенная комбинация которых в состоянии с высокой вероятностью попадать в это условие, когда туда (полином это или НС - не знаю, т.к. ноль) подставляя A, B, C, получается выполнение оригинального условия.

Меня интересует, какой вид и сколько входных весовых коэффициентов у искомой функции, чтобы подобные оригинальные условия можно было воспроизводить через веса?

Сетка с 1 скрытым нейроном способна научиться пересечению ма100 с ценой.

Это ее параметры, всего 103 штуки, на вход подаются приращения последних 100 баров. Нейрон с активацией tanh это функция tanh(x*W+b), по сути в скобках линейная регрессия, x - вход нейрона, W - матрица весов, b - смещение. В скрытом нейроне: W из 100 элементов, b из 1. И в выходном: W - 1 элемент, b - 1 элемент.

"Другой тестовый пример, пересечение ма и цены."

https://www.mql5.com/ru/forum/86386/page1879#comment_17365998

 
Aleksey Vyazmikin:

Итак, как получилось обучить деревья по кластерам, рассказываю и показываю.

кластеризированые признаки всегда будут работать хуже не кластеризированых! кластеризируя вы удаляете неминуемо часть информации. 

Есть сто примеров, мы объединили их в кластер - где больше информации? в ста примерах или в одной цифре(номер кластера)  ??

Aleksey Vyazmikin:

Как взять свой дата сет с предикторами и ценой закрытия и загрузить, указав колонку с ценой закрытия, а не использовать вариант генерации индикаторов в R?

Как я понимаю, раз целевая - вершки ZZ, то часть выборки с предикторами должна отфильтроваться, вот, а значит для подачи предикторов надо так же отфильтровать таблицу с предикторами, или как?

Ну вы же умеете загружать данные, я вам давал пример где читал ваш csv файл, в чем конкретно проблема?

Именно та целевая  - там знак ЗЗ не развороты, типичная целевая которую мы когда то насиловали

 
fxsaber:

Вопрос от нуба.


Есть три переменные A, B, C. Из них составлено руками какое-то условие. Например.


Хочется это условие воспроизвести автоматом. Находить его не надо, т.к. я его уже знаю. Но нужно иметь например десяток каких-то весовых коэффициентов, определенная комбинация которых в состоянии с высокой вероятностью попадать в это условие, когда туда (полином это или НС - не знаю, т.к. ноль) подставляя A, B, C, получается выполнение оригинального условия.


Меня интересует, какой вид и сколько входных весовых коэффициентов у искомой функции, чтобы подобные оригинальные условия можно было воспроизводить через веса?

Тоже нуб, но заинтересовала задача.)

Представим А, В, С, как случайно модифицированные экземпляры абстрактного объекта в некой однотипной среде. Наблюдением за А, В, С, мы выделяем их обще-значимое (особенное) свойство, значения которого меняются у всех трех на событиях среды, но по разному (в зависимости от различных состояний среды). Мы чувствуем закономерности, но сформулировать не можем. Однако, допустим, на событии появления нового экземпляра, отмечаются резкие всплески значений А, В, С, с сохранением определенных пропорций и среда расширяется. Нам понравилась эта закономерность и мы хотим описать условие, однако среда полна других объектов и свойств, поведение которых также загадочно и непредсказуемо. Тогда, решаем создать систему отмечающую различные закономерности параметров разнообразных объектов на множестве событий среды. Система должна фиксировать минимальное кол-во максимально значимых связей объектов (тип объектов, свойство, значения + произошедшее событие) и записывать их в массив, чтобы далее под эти условия мы строили алгоритмы поведения исскуственно внедряемых в среду синтетически-сфабрикованных параметрических комплексов.

Могут ли это сети?

 
mytarmailS:

кластеризированые признаки всегда будут работать хуже не кластеризированых! кластеризируя вы удаляете неминуемо часть информации. 

Есть сто примеров, мы объединили их в кластер - где больше информации? в ста примерах или в одной цифре(номер кластера)  ??

Не могу с Вами согласится, информация была не удалена, а наоборот - систематизирована, по сути вместо  3 изначальных классов было получено 3*4=12 новых классов.

Конечно, выборка сократилась условно в 4 раза, что осложнило обучение, но при больших выборках этот эффект должен быть менее значимым.

Думаю, что можно попробовать не убирать всю выборку, а забить её нулями в части относящейся к другим кластерам.

Другой вариант - более глубокое обучение, но думаю, что из-за малой выборки результат будет не слишком хороший.

Промежуточный итог кластеризации - рост Recall (полноты) на 34% и падение precision (точности) на 5%, т.е. большее обобщение данных произошло, что может быть полезным в некоторых случаях.

mytarmailS:

Именно та целевая  - там знак ЗЗ не развороты, типичная целевая которую мы когда то насиловали

А я то думал там развороты!

Всё же, Вы так ранее и не ответили на вопрос - можно ли автоматизировать сохранение картинки построенного пространства? Я хочу в цикле сделать перебор, допустим, тех же параметров ZZ и посмотреть, как меняются графические модели, в общем автоматизировать перебор целевых. Нет времени сидеть у компьютера.

 
Aleksey Vyazmikin:

Всё же, Вы так ранее и не ответили на вопрос - можно ли автоматизировать сохранение картинки построенного пространства? Я хочу в цикле сделать перебор, допустим, тех же параметров ZZ и посмотреть, как меняются графические модели, в общем автоматизировать перебор целевых. Нет времени сидеть у компьютера.

я не знаю, если в 3д то врятли, если в 2д то вроди можно из р-студии сохранять только зачем вам эта ДУРЬ!!! намного понятней, проще, лучше просто  смотреть ошибку на новых данных , на выходе у вас не абстрактная картинка ,  А КОНКРЕТНОЕ число с которым можно работать , сравнивать, сортировать итп

 
mytarmailS:

я не знаю, если в 3д то врятли, если в 2д то вроди можно из р-студии сохранять только зачем вам эта ДУРЬ!!! намного понятней, проще, лучше просто  смотреть ошибку на новых данных , на выходе у вас не абстрактная картинка ,  А КОНКРЕТНОЕ число с которым можно работать , сравнивать, сортировать итп

Какое число - не приметил ранее - в чем там смысловая нагрузка показателя?

Картинка всегда дает больше информации, чем просто цифра.

Пытаюсь запустить код, что скинули вчера.

Не понимаю, что за синтаксис 

d$X.CLOSE.
dt <- read.csv(file = way,header = T,sep = ";") # читаем файл
//Ранее так транслировали данные из столбца
target <- dt$Target_100 # целевую в отдельную переменную
//Теперь так - почему точка в конце - это название столбца такое у Вас? Почему d вместо dt? Что это? :)
clos <- d$X.CLOSE.
 
Aleksey Vyazmikin:

Какое число - не приметил ранее - в чем там смысловая нагрузка показателя?

Картинка всегда дает больше информации, чем просто цифра.

Пытаюсь запустить код, что скинули вчера.

Не понимаю, что за синтаксис 

потому что у меня данные назваться "d" ))

вставьте свое

clos <- dt$твоя цена закрытия 

 
fxsaber:

Вопрос от нуба.


Есть три переменные A, B, C. Из них составлено руками какое-то условие. Например.


Хочется это условие воспроизвести автоматом. Находить его не надо, т.к. я его уже знаю. Но нужно иметь например десяток каких-то весовых коэффициентов, определенная комбинация которых в состоянии с высокой вероятностью попадать в это условие, когда туда (полином это или НС - не знаю, т.к. ноль) подставляя A, B, C, получается выполнение оригинального условия.


Меня интересует, какой вид и сколько входных весовых коэффициентов у искомой функции, чтобы подобные оригинальные условия можно было воспроизводить через веса?

можно посчитать результат условия для диапазонов A,B,C
и посмотреть
красный - true
синий - false


 
Vladimir Suslov:

можно посчитать результат условия для диапазонов A,B,C
и посмотреть
красный - true
синий - false


Задача от fxsaber не совсем ясная. Он предложил три переменных в произвольном условии и, судя по всему, спросил можно ли это условие генерировать автоматически, если рассматривать значения переменных как веса внутри некой системы, обладающей закономерностью изменений своих параметров. 

Как вариант, для автоматического синтезирования условия нам нужно:

1. Выделить систему как комплекс параметров из среды объектов.

2. Анализировать взаимозависимости изменения внутри этого комплекса продолжительное врема, заостряя внимание при различных событиях среды.

3. В процессе наблюдения фиксировать условия - т.е. строить связи отмечая соотношения значений параметров и событий среды.

4. Классифицировать получаемые условия.

По идеи предназначения и возможностей НС, она должна справится с задачей.

Причина обращения: