Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 239

 
Andrey Dik:
Попробуйте описывать свечу двумя числами, каждое из которых в диапазоне [-1.0; 1.0]. Это положение O и С отностельно H и L. 
Из Вашего примера получится примерно так :
1. [-0.8; 0.8]
2. [-0.2; 0.2]
3. [-0.9; -0.1]
как такое делать?
 
mytarmailS:
как такое делать?
По высоте H это 1,  L это  -1, соответственно выразите O и C относительно H  и L.
Так чётко описывается форма независимо от размера свечи. 

 
Andrey Dik:
По высоте H это 1,  L это  -1, соответственно выразите O и C относительно H  и L.
Так чётко описывается форма независимо от размера свечи. 

тут не учитывается волатильность свечи, все расчеты идут как бы внутри свечи, а какая это свеча, геповая или маленький доджик МО не видит

думаю Самое нормальное  это таки % приращения, но что то я не верно их считаю

 
mytarmailS:

тут не учитывается волатильность свечи, все расчеты идут как бы внутри свечи, а какая это свеча, геповая или маленький доджик МО не видит

думаю Самое нормальное  это таки % приращения, но что то я не верно их считаю

волатильность как раз и не нужно учитывать. а от гэпов нужно избавляться (смещать свечи на расстояние гэпа) 
 
Andrey Dik:
волатильность как раз и не нужно учитывать. а от гэпов нужно избавляться (смещать свечи на расстояние гэпа) 
Напротив, гэпы надо запоминать - и учитывать. Поскольку статистически гэп закрывается все равно. Как-то искал какойнить индикато по гэпам - не нашел, сделал отлов сам, через фракталы. Но нужен все-таки хороший индикатор.
 
Парни есть такой индикатор называется  CandleCode, он кодирует свечи как раз таки одинаковые имеют одинаковый код с учётом разброса. Что вы всё велосипед придумываете, не пойму :-(
 
Vizard_:
Урок окончен)))

Спасибо, вроде понял. Кажется очень просто, не верю, но проверю.

Ещё странно что знак идёт отдельным предиктором, я бы просто размер свечи делал отрицательным если она вниз. Это тоже надо попробовать.

 
Dr.Trader:

Спасибо, вроде понял. Кажется очень просто, не верю, но проверю.

Ещё странно что знак идёт отдельным предиктором, я бы просто размер свечи делал отрицательным если она вниз. Это тоже надо попробовать.

а я вот что то ничего не понял(

как делалась целевая? 

откуда взялась формула?

 

Я продолжаю считать, что без отбора предикторов по их влиянию на целевую переменную, все остальное не имеет значения. Это самый первый шаг. Или мы удалим шумовые предикторы и тогда наши шансы на построение НЕ переобученной модели возрастают, или шумовые предикторы останутся, что обязательно приведет к переобучению. А так как поведение переобученной модели в будущем никак не связано с ее поведение в прошлом, то такая переобученная модель нафиг не нужна.

Еще один любопытный подход к определению важности предикторов. При этом многочисленные алгоритмы определения significance testing не используются.

Вот исполненный код из этого поста

 

 

> n <- 10000
>
> x1 <- runif(n)
> x2 <- runif(n)
> y <- -500 * x1 + 50 * x2 + rnorm(n)
>
> model <- lm(y ~ 0 + x1 + x2)
>

 

 


> # 1a. Standardized betas
> summary(model)$coe[,2]
        x1         x2
0.02599082 0.02602010
> betas <- model$coefficients
> betas
        x1         x2
-500.00627   50.00839

 

 


> imp <- abs(betas)/sd.betas
Ошибка: объект 'sd.betas' не найден
> sd.betas <- summary(model)$coe[,2]
> betas <- model$coefficients
> imp <- abs(betas)/sd.betas
> imp <- imp/sum(imp)
> imp
       x1        x2
0.9091711 0.0908289

 

 


> imp1 <- abs(model$coefficients[1] * sd(x1)/sd(y))
> imp2 <- abs(model$coefficients[2] * sd(x2)/sd(y))
>
> imp1 / (imp1 + imp2)
       x1
0.9095839

 

 


> imp2 / (imp1 + imp2)
       x2
0.0904161

 

 


> # 2. Standardized variables
> model2 <- lm(I(scale(y)) ~ 0 + I(scale(x1)) + I(scale(x2)))
> summary(model2)

Call:
lm(formula = I(scale(y)) ~ 0 + I(scale(x1)) + I(scale(x2)))

Residuals:
       Min         1Q     Median         3Q        Max
-0.0236475 -0.0046199  0.0000215  0.0046571  0.0243383

Coefficients:
               Estimate Std. Error t value Pr(>|t|)    
I(scale(x1)) -9.932e-01  6.876e-05  -14446   <2e-16 ***
I(scale(x2))  9.873e-02  6.876e-05    1436   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.006874 on 9998 degrees of freedom
Multiple R-squared:      1,     Adjusted R-squared:      1
F-statistic: 1.058e+08 on 2 and 9998 DF,  p-value: < 2.2e-16

 

 


> abs(model2$coefficients)/sum(abs(model2$coefficients))
I(scale(x1)) I(scale(x2))
  0.90958355   0.09041645

How important is that variable?
  • 2016.12.03
  • Andrés Gutiérrez
  • hagutierrezro.blogspot.nl
When modeling any phenomena by including explanatory variables that highly relates the variable of interest, one question arises: which of the auxiliary variables have a higher influence on the response? I am not writing about significance testing or something like this. I am just thinking like a researcher who wants to know the ranking of...
Причина обращения: