Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3041

 
Maxim Dmitrievsky #:

ну manifold learning с теми же проблемами, что pca

запаришься подбирать для нестационарных рядов

А что там подбирать? там подбирать нечего , текущий паттерн преобразовал и другую размерность и все

 

сделал поприятнее картинку

p <- cumsum(rnorm(300,sd = 0.01))+100
n <- 10
p <- stats::embed(p,dimension = n)[,n:1]

library(dimRed)
emb <- embed(p, "HLLE", knn = 15)
pp <- emb@org.data[,n]
xx <- emb@data@data


gg <- cbind.data.frame(time=1:length(pp),xx,pp)
library(patchwork)
library(ggplot2)
p1 <- ggplot(gg, aes(x =time, y = pp, col=time)) +
  geom_point()  +
  scale_color_gradientn(colours = rainbow(4))
p2 <- ggplot(gg, aes(x = HLLE1, y = HLLE2, col=time)) +
  geom_point()  +
  scale_color_gradientn(colours = rainbow(4))
p1 + p2 + plot_layout(nrow = 2) 


 

Вычленяем нескольго "годных" правил/стратегий из данных..

Полный етап

1) преобразование и нармализация данных

2) тренировка модели

3) извлечение правил

4) фильтрация правил

5) визуализация

готовый код , просто подставьте свои данные

close <- cumsum(rnorm(10000,sd = 0.00001))+100
par(mar=c(2,2,2,2))
plot(close,t="l")

sw <- embed(x = close,dimension = 10)[,10:1] # make slide window data
X <- t(apply(sw,1,scale)) # normalase data

dp <- c(diff(close),0) # diff prices
Y <- as.factor( ifelse(dp>=0,1,-1) ) # target for classification

tr <- 1:500
library(inTrees)  # ?inTrees::getRuleMetric()
library(RRF)

rf <- RRF(x = X[tr,],y = Y[tr],ntree=100)
rule <- getRuleMetric(unique(extractRules(RF2List(rf),X[tr,])),X[tr,],Y[tr])
rule <- data.frame(rule,stringsAsFactors = F)
for(i in c(1,2,3,5)) rule[,i] <- as.numeric(rule[,i])
buy_rules <- rule$condition[ rule$pred==1 ]

plot(x = 1:1000,y = rep(NA,1000), ylim = c(-0.001,0.001)) 
for(i in 1:length(buy_rules)){
   cum_profit <- cumsum( dp[  eval(str2expression(buy_rules[i]))  ] )
   lines(cum_profit,col=8,lwd=1)
}
for(i in 1:length(buy_rules)){
  cum_profit <- cumsum( dp[  eval(str2expression(buy_rules[i]))  ] )
  ccor <- cor(cum_profit, 1:length(cum_profit))
  if(ccor>=0.9)  lines(cum_profit,col=i,lwd=2)
}
abline(h = 0,col=2,lty=2)



Вопрос  в том что, если в рандоме можно найти  "работающие ТС"  то какими способами можно доказать что найденые ТС на реальных данных  не являються рандомом?

Тут Алексей этим знимаеться , вот интересно , есть какой то статистический тест для задач такого рода?

 
Спроси у chatgpt, часто отвечает содержательнее чем человек :)

Хочу провести эксперимент - написать бота с нуля только через промпты.
 
Maxim Dmitrievsky #:
Спроси у chatgpt, часто отвечает содержательнее чем человек :)

Хочу провести эксперимент - написать бота с нуля только через промпты.

Зачем? Лилит переплюнуть? Хотя чем бы ..... ...  ... сь))) Реально крутой инстрУмент в умелых руках)

 
Valeriy Yastremskiy #:

Зачем? Лилит переплюнуть? Хотя чем бы ..... ...  ... сь))) Реально крутой инстрУмент в умелых руках)

Это метауровень программирования, плюс питон она знает великолепно. Еще делаю промпты голосом, лежа на диване. Часто бывает, что есть идеи, но катастрофически лень опять писать этот код :)
 
Maxim Dmitrievsky #:
Это метауровень программирования, плюс питон она знает великолепно. Еще делаю промпты голосом, лежа на диване. Часто бывает, что есть идеи, но катастрофически лень опять писать этот код :)

Согласен, правильно поставленный вопрос это метауровень)))

Ну и проверить правильность исполнения кода)
 
Valeriy Yastremskiy #:

Согласен, правильно поставленный вопрос это метауровень)))

Ну и проверить правильность исполнения кода)
Нейроинтерфейс мне дайте, чтобы ртом не шевелить 
 
А по моему это деградирование
 
mytarmailS #:

Вычленяем нескольго "годных" правил/стратегий из данных..

Полный етап

1) преобразование и нармализация данных

2) тренировка модели

3) извлечение правил

4) фильтрация правил

5) визуализация

готовый код , просто подставьте свои данные



Вопрос  в том что, если в рандоме можно найти  "работающие ТС"  то какими способами можно доказать что найденые ТС на реальных данных  не являються рандомом?

Тут Алексей этим знимаеться , вот интересно , есть какой то статистический тест для задач такого рода?

Основная проблема в применении матстата для таких задач в том, что поиск ТС осуществляется отбором из большого числа вариантов. Всегда можно из большого набора выбрать что-то очень красивое - на простом примере как-то показывал здесь, что моделируя цены как СБ, всегда можно "найти" хороший час недели для торговли. А это всего-то 120 вариантов для выбора.

При этом матстат не говорит, что отобранная ТС обязательно плохая, а говорит лишь о том, что подобный результат МОЖЕТ (А НЕ ОБЯЗАН) являться всего лишь результатом отбора из СБ.

Причина обращения: