Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3043

 

Hay un gran paquete sobre optimización bayesiana...

Puedes hacer optimización multicriterio, optimización sobre funciones con ruido y muchas otras cosas, muy interesante el paquete.

Hice un ejemplo de juguete de cómo el algoritmo busca un mínimo en un vector unidimensional.

library(mlrMBO)

set.seed(123)
xx <- cumsum(rnorm(1000))
par(mar=c(2,2,2,2))
plot(xx,t="l")

fun = function(i){
  plot(xx,t="l",col=8)
  points(i,xx[i],col=4,lwd=4)
  return(xx[i])
}

obj.fun = makeSingleObjectiveFunction(name = "noisy_parable", 
                                      fn = fun,
                                      has.simple.signature = TRUE, 
                                      par.set = makeNumericParamSet("i", 1, 1, length(xx)),
                                      noisy = F)


ctrl = makeMBOControl(final.method = "best.true.y", final.evals = 10)
ctrl = setMBOControlInfill(ctrl, crit = crit.eqi)
ctrl = setMBOControlTermination(ctrl, iters = 40)

configureMlr(on.learner.warning = "quiet", show.learner.output = F)
res = mbo(obj.fun, control = ctrl, show.info = T)

points(res$x$i, xx[res$x$i] , col=2,lwd=5, pch=10)
Bayesian Optimization and Model-Based Optimization of Expensive Black-Box Functions
  • mlrmbo.mlr-org.com
Flexible and comprehensive R toolbox for model-based optimization (MBO), also known as Bayesian optimization. It implements the Efficient Global Optimization Algorithm and is designed for both single- and multi- objective optimization with mixed continuous, categorical and conditional parameters. The machine learning toolbox mlr provide dozens of regression learners to model the performance of the target algorithm with respect to the parameter settings. It provides many different infill criteria to guide the search process. Additional features include multi-point batch proposal, parallel execution as well as visualization and sophisticated logging mechanisms, which is especially useful for teaching and understanding of algorithm behavior. mlrMBO is implemented in a modular fashion, such that single components can be easily replaced or adapted by the user for specific use cases.
 
mytarmailS #:

Sigo sin entenderlo, no hay forma de decir con certeza si la res. fin. es estadísticamente significativa o no. ¿o no?

No mezcles dos cosas que están relacionadas con el uso del mismo indicador:

1) La evaluación del resultado de una ST mediante este indicador.

2) Selección de una ST entre un gran número de opciones maximizando este indicador.

En el primer caso, el valor del indicador puede ser estadísticamente significativo, pero en el segundo es poco probable.

 
mytarmailS #:

Sigo sin entenderlo, no hay forma de decir con certeza si la res. fin. es estadísticamente significativa o no. ¿o no?

1) ¿Los datos son los mismos que en el ejemplo?

2) Quizás en el nuevo R los nombres de los argumentos de las funciones han cambiado

1. sí

2. Quizás - encendí 3.5.0 - solicité la librería - la instalé y de nuevo algunos errores.

installing the source package ‘inTrees’

trying URL 'https://mirrors.tuna.tsinghua.edu.cn/CRAN/src/contrib/inTrees_1.3.tar.gz'
Content type 'application/octet-stream' length 16771 bytes (16 KB)
downloaded 16 KB

ERROR: dependency 'arules' is not available for package 'inTrees'
* removing 'C:/Users/S_V_A/Documents/R/win-library/3.5/inTrees'
In R CMD INSTALL
Warning in install.packages :
  installation of package ‘inTrees’ had non-zero exit status
 
Aleksey Vyazmikin #:

1. sí

2. Tal vez - encendido 3.5.0 - solicitó la biblioteca - instalación y de nuevo algunos errores.

ver que argumentos toma la función

?embed

en la versión que tenía el error con esta función.

¡Yo lo escribí!

 
Aleksey Nikolayev #:

No mezcles dos cosas que impliquen utilizar el mismo indicador:

1) Evaluación del resultado de una TC en este indicador.

2) Selección de una ET entre un gran número de opciones maximizando este indicador.

En el primer caso, el valor del indicador puede hablar de significación estadística, pero en el segundo, difícilmente.

En palabras sencillas, si evalúo una ST por su significación estadística, es buena,

si tengo 100 ST y elijo la mejor por el mismo criterio, ¿es mala?


¿Habré entendido algo mal? ¿Tampoco puede ser correcto?

 
Andrey Dik #:

Una de las direcciones puede ser la búsqueda no de los mejores, sino de los parámetros más estables de la ST, es decir, descartar aquellas variantes que presentan variabilidad de resultados en distintas partes de la historia.

Una forma es incluir indicadores de estabilidad de los resultados en los criterios de evaluación.

¿Cuál es su variante de evaluación de la estabilidad? Recientemente hemos debatido dos opciones.
 
mytarmailS #:

ver qué argumentos toma la función

en la versión en la que se produjo un error con esta función.

¡Yo lo escribí!

embed {stats}   R Documentation
Embedding a Time Series

Description

Embeds the time series x into a low-dimensional Euclidean space.

Usage

embed (x, dimension = 1)
Arguments

x       
a numeric vector, matrix, or time series.
dimension       
a scalar representing the embedding dimension.
Details

Each row of the resulting matrix consists of sequences x[t], x[t-1], ..., x[t-dimension+1], where t is the original index of x. If x is a matrix, i.e., x contains more than one variable, then x[t] consists of the tth observation on each variable.

Value

A matrix containing the embedded time series x.

Author(s)

A. Trapletti, B.D. Ripley

Examples

x <- 1:10
embed (x, 3)
[Package stats version 4.0.2 Index]
 
Aleksey Vyazmikin #:

Está bien, debería funcionar.

¿Estás seguro de que no has cambiado el código? Muéstrame el código donde se produce el error.

 
mytarmailS #:

Está bien, debería funcionar.

¿Estás seguro de que no has cambiado el código? Muéstrame el código donde se produce el error.

No, no lo cambié.


 
Aleksey Vyazmikin #:

No, no lo hice.

muy pequeño