Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2755

 
mytarmailS #:

Tal vez sea mejor simplemente tomar alguna situación del mercado con un nivel, luego encontrar situaciones similares, agruparlas y luego tratar de separar este grupo de todo lo demás.

Tal vez sea mejor. Este es un trabajo diferente, inicialmente se puede tomar un gráfico de noticias (al menos de alguna manera formalizado) y eventos (es necesario formalizar) y perseguir los mismos patrones, pero esto ya se ha hecho y se está haciendo. La cuestión es cómo formalizar, lo que tenemos hoy no da resultados rentables.

Es más rentable utilizar el mismo intervalo de tiempo.

Me sigue fascinando la idea de definir correctamente el estado. Sanych gustó la conclusión, el cambio de comportamiento muy a menudo drena el depósito sin advertencia))))) Mi conclusión, el precio cambia de comportamiento con bastante frecuencia y en un rango lo suficientemente amplio y al parecer con diferentes patrones antes de que el cambio de comportamiento. Todavía no puedo formular con más precisión lo que esto significa. En matemáticas, parece que se necesita un número infinito de patrones para describir el SB. En el caso del mercado, aún no disponemos de modelos suficientes para describirlo con suficiente precisión.

En general, lo que se debe contar en la fila, que calcularía correctamente el paso de la cuadrícula))))) Y con qué frecuencia cambiar el paso))))

¿Por qué rejilla, porque es una de las variantes más simples de control de estado, todo entre los niveles no es fijo, las transiciones de nivel a nivel, tendencia, retorno, significa extremum.... Bueno, como si hay problemas, pero tal formalización de roble del estado.
 
JeeyCi #:

Sí, me gusta esa palabra (algo tan nativo de la programación basada en eventos) -

en la variante expresada por SanSanych Fomenko -- algo como esto parece ser implementado: outlier -> significa entrada (o salida)... He mezclado un lío de dim_reduction y métodos de clasificación multidimensional (LDA, clustering) arriba... pero la esencia de Mahalanobis probablemente siempre ha sido principalmente en el espacio multidimensional como valores atípicos / detección de la novedad de todos modos ... por lo que la opción de operar con valores atípicos se ve muy bien (sólo feature_engineering debe hacerse correctamente, no un tonto conjunto de datos iniciales para buscar fs) ...

pero aún así la "ventana deslizante" es confusa (aunque el modelo autorregresivo habitual es común para el comercio de seguimiento de series temporales) .... - puede haber un lío allí también (en la ventana)... -- Supongo que los límites de la ventana son la entrada en el mercado de smarts, que por cierto utilizan en su portfolio_management -- Mean-Variance Optimisation... no sabemos su cartera por supuesto (sólo aproximadamente de SoTs retrospectivamente), pero dentro de esta varianza que probablemente hacen reequilibrio de su cartera --- mientras que la fijación o la carga sobre el comercio minorista...

operar con valores atípicos es sin duda una opción interesante, pero teniendo en cuenta quién se enfrenta a ellos - OTF o DTF (day traders) - también es importante interpretar correctamente el valor atípico...

p.s..

Bueno, o simplemente no tomes los valores atípicos de Mahalanobis, sino los deciles extremos de la distribución de predicción -- para el comportamiento de aceptación de riesgo (vs. evitación de riesgo), por ejemplo, actor'a (con el correspondiente cambio de su estado según los parámetros del entorno).

Sigue moviéndose en una ventana deslizante, independientemente de la forma y las propiedades que tenga o de los atributos que contenga. Sería una tontería negar lo evidente.

Hasta que la gente no aprenda lo básico, será imposible comunicar

El aprendizaje por refuerzo está ligado al hecho de que el agente afecta al entorno, salvo en ejemplos tabulares sencillos. Y hay finitamente muchas estadísticas, o las políticas cambian lentamente y no a pasos agigantados. Basado en esto es imposible implementar un agente en Forex, siempre obtendrás una clasificación regular.

En la forma se verá como wow, el agente hace algo en un entorno determinado. Y en esencia no se cumple, solo se categorizan instancias. Para robótica o juegos es más adecuado.

Si no se cumple esta condición, la RL puede verse como una optimización...
 
Maxim Dmitrievsky #:
El aprendizaje por refuerzo está ligado al hecho de que el agente afecta al entorno, excepto en el caso de ejemplos tabulares simples. Basándose en esto es imposible implementar un agente en Forex, siempre obtendrá una clasificación regular.

En forma parecerá guau, el agente hace algo en un entorno determinado. Y en esencia no se cumple, solo se categorizan casos. Para robótica o juegos es más adecuado.

Si no se cumple esta condición, la RL puede verse como una optimización.

De acuerdo... por lo que tiendo a pensar que el agente es OTF (gran capitalización, smarts) -- por ultra-alto volumen (como en VSA estándar) -- tanto la restricción y la violación de los volúmenes a formalise.... aquí es donde veo el propósito principal de ML en la preparación de datos -- para determinar lo que es uhv en un activo en particular ... y es el smarts que debe ser tratado como un actor, no el día traders.... aunque, por supuesto, la formalización sigue siendo necesaria....

 

por cierto, estoy tratando de mirar a través de su enlace en la inferencia causal - el enlace, por cierto, describe el significado del fenómeno en ruso bastante torpe.... pero los enlaces de él al libro y otros sugieren que estamos hablando de estudios de coeficientes de correlación parcial (para decirlo en ruso) - es decir, con factores fijos distintos de la que está bajo estudio.... es decir, se halla un coeficiente de correlación parcial (existen fórmulas matemáticas estadísticas en los círculos académicos o en cualquier libro de estadística estándar), se evalúa su significación mediante la hipótesis nula (H0) y se llega a una conclusión sobre la influencia o no influencia (es decir, dependencia o independencia de las variables seleccionadas), por ejemplo, en ruso:

при фиксированном качестве посевного материала, мин. удобрений и фин. затрат - продуктивность посевов не зависит от фондооснащённости

es decir, el fondo-equipo y la productividad de los cultivos son linealmente NO dependientes ... (esto es en términos de intervenciones)...

y es posible probarlo por un coeficiente privado de correlación de las estadísticas.... esta es exactamente la situación de probar que la correlación en el espacio multifactorial no sirve necesariamente como causalidad del fenómeno observado... es decir, en esencia, la Planificación estándar de Experimentos está diseñada para resolver tales problemas - para librar a las conclusiones lógicas sobre los resultados de estar plagadas de correlaciones insignificantes entre factores y resultados, que son elevadas injustificadamente al rango de fenómenos causales.

No leí el resto (sobre factores de confusión, etc.), pero de alguna manera los artículos para lectores masivos (no en el mejor sentido) y los artículos para relaciones públicas (para promover nuevas palabras sobre viejas verdades) están muy fuera de línea semántica y lógicamente con los argumentos para un argumento científico razonable (bueno, y prueba razonable de argumentos, es decir, relaciones causales, es decir, relaciones causales).es decir, las relaciones causa-efecto de ciertas dependencias probadas(!) por la CORRECTA planificación y puesta en marcha de una serie de experimentos)...

... para el comercio minorista (debido a la información incompleta sobre el mercado) - la inferencia causal es incomprensible en principio, para los institutos de investigación - indemostrable (por la misma razón debido a diversos elementos de secreto comercial), para el comité estadístico del nivel estatal, tal vez, hay algunas muestras representativas ... pero la estadística financiera, en cualquier caso, siempre se basa en el secreto comercial... y para los profesionales del marketing no es más que un juguete "para mirar en la cartera ajena a cualquier precio" -- por eso creo que tu enlace es más interesante como "juguete para los profesionales del marketing", pero en esencia, basado en la metodología estadística clásica -- sólo que para ellos es una metodología estadística clásica. metodología, -- es sólo que no siempre están interesados en la investigación científica clásica, la teoría y los métodos estadísticos matriciales y no siempre tienen acceso a toda la información para la modelización matricial completa, al igual que los psicólogos, sociólogos, etc. debido a la "ética de los experimentos" ...

>> así que citan "ejemplos de juguete" en sus artículos y libros, sobre los que se secan un gran número de cerebros - simplemente porque en la vida real ni se pueden realizar tales experimentos, ni se pueden obtener tales datos, ni se puede encontrar financiación para tal investigación, ni se puede encontrar tal lógica vacía sobre piscinas, y las empresas quieren explicaciones de cuándo y cómo nace la demanda.... así que se escriben artículos "shir.consum" para mercadotécnicos apesadumbrados que sueñan con cabalgar a lomos de la inflación - durante mucho tiempo y con ánimo de lucro... y los cerebros, secándose, intentan soldar estos ejemplos-juguete a la vida real....

un experimento científico real, científicamente fundamentado, lógicamente adecuado, sobre estas o aquellas dependencias implica una planificación adecuada del experimento para reunir la base de pruebas para esas/otras conclusiones lógicas, estadísticamente confirmadas... no el populismo de la estadística per se, sino en términos ingleses ...

eso me parecio a mi desde el obtuso enlace (( - asi que no te preocupes por no soldar ese articulo al analisis de mercado de inmediato ...

--- esta es mi Revisión

Speed vs. Accuracy: When is Correlation Enough? When Do You Need Causation?
Speed vs. Accuracy: When is Correlation Enough? When Do You Need Causation?
  • adam kelleher
  • medium.com
Often, we need fast answers with limited resources. We have to make judgements in a world full of uncertainty. We can’t measure everything. We can’t run all the experiments we’d like. You may not have the resources to model a product or the impact of a decision. How do you find a balance between finding fast answers and finding correct answers...
 
Es una especie de artículo introductorio o promocional, creo que había un enlace a la propia biblioteca.
Y había algo sobre inferencia para series temporales más adelante, aún no tengo tiempo de mirarlo. A lo mejor es un tema exagerado, no lo puedo descartar

Creo que tiene sentido buscar "clasificación de series temporales inferencia causal" y cosas así
 
Maxim Dmitrievsky #:
Es una especie de artículo introductorio o promocional, creo que había un enlace a la propia biblioteca.
Y más adelante había algo sobre inferencia para series temporales,

y era realmente promocional. y no en las mejores tradiciones del arte de la publicidad...

en la parte de series temporales del enlace hay una referencia a SUTVA, que es del libro.

El supuesto de no interferencia fue etiquetado como "no interacción entre unidades" por Cox (1958),

y se incluye en el "supuesto de unidad estable-valor de tratamiento (SUTVA)" descrito por Rubin (1980).

VanderWeele (2009) formalizó este punto como el supuesto de "irrelevancia de la variación del tratamiento", es decir, el supuesto de que pueden existir múltiples versiones del tratamiento, pero todas dan lugar al mismo resultado.

En presencia de interferencias, el contrafactual para un individuo i no está bien definido porque el resultado de un individuo depende de los valores de tratamiento de otros individuos.

Al igual que el supuesto de ausencia de interferencia, el supuesto de ausencia de versiones múltiples de tratamiento se incluye en el "supuesto de unidad de tratamiento-valor estable (SUTVA)" descrito por Rubin (1980).

Existe interferencia cuando el tratamiento de un individuo afecta al resultado de otros individuos de la población.

y más adelante en el libro - unas pocas líneas sobre la "transportabilidad [incluida la adverbialidad] de las inferencias causales entre poblaciones", pero al mismo tiempo "la estimación de cada método se basa en diferentes supuestos de modelización". - lo que es habitual en la modelización. A continuación, las esperanzas de los mercadólogos de "difundir rumores" en las poblaciones, mientras separan a los individuos de la población según su sugestionabilidad (los que creen, los que no creen, los que se resisten, los que se quejan, los que ceden), es decir, una nueva división para la clasificación..... a este paso pasaremos evidentemente de la modelización del movimiento de los precios a la modelización de las masas sociales, mientras soñaremos que el mercado es movido por el mismo sentimiento, y que no necesita ser modelizado - sólo necesita ser reunido en un montón y dirigido en la dirección (psicología de la multitud) por lo menos a la luna - a eso juegan los mercadólogos.... soñando con equipararse a los politólogos...

y hay muchas tecnologias de relaciones publicas y difusion de informacion en la sociedad - como manipulacion de la opinion publica... todo el mundo se "entrena" en difundir sus especulaciones, soñando con influir en el proceso de toma de decisiones de alguien... pero las decisiones tomadas sobre la base de las opiniones de la multitud rara vez son a largo plazo y siempre hay "niveles de parada" más allá de los cuales no se permitirá que la multitud vaya (¿por quién? - por el Regulador, si cumple con sus funciones)... Creo que es inútil estudiar el comportamiento plano (quién está en contra de quién y con qué medios, al menos SUTVA) -- si el objetivo es unirse a los listos y " seguir su cola".

el libro, por cierto, se llama What IF - harvard.edu (no he terminado de leerlo - ya leyendo en diagonal me hace sonreir).

p.d.

no, pero aún así no inventarán nada y lo llamarán cálculos de alta tecnología, de modo que en economía no distribuirán beneficios entre la gente, sino que darán el juguete a los vendedores, y distribuirán publicidad (sucedáneo de producto real, ficción, esperanza, sueño, autoengaño) - y estarán contentos de tener un trabajo tan "bueno" y "prometedor" - marketing.... Todavía estoy más cerca de la lógica normal basada en la ciencia, incluso si el comportamiento de la multitud.... pero no tomo decisiones comerciales basadas en el comportamiento de la multitud y no aconsejo a nadie...

así que el análisis de inferencia causal (quién empujó a quién en la multitud y cómo estalló la pelea) no se considera modelización del proceso de fijación de precios, sino modelización de la pelea... siempre hay un árbitro (y no es el marketing - ¡es la economía!, no hay signo de igualdad entre ellos), y es imposible tenerlo todo en cuenta (la modelización es siempre uno u otro Supuesto, si se modela un objeto, que no se puede estudiar hasta el final).

p.p.s..

No acepto argumentos sobre la igualdad de las tecnologías económicas y políticas... "campo socioeconomico" recuerda mas a las leyes terrestres que a las abstracciones linguisticas... aquí en la Tierra hay un "bien" (sea una pala u otra cosa), un "no_debo_necesitar", y una "utilidad marginal" de este bien, que se debe maximizar, pero hay limitaciones -presupuesto y otros recursos- esto es en los negocios.... pero en la vida hay un regulador... que obliga a la oferta y la demanda agregadas a expandirse o contraerse debido a las circunstancias... conclusión: "sígueles el rollo", pero no mezcles el marketing en sus peores tradiciones con la economía y la vida de la gente real (incluidos los fondos de pensiones, los fondos de cobertura, los fondos de inversión para servir el dinero de la gente - mercado de liquidez).

 
... eso es todo - después de la contra-publicidad, me voy ... sólo la dirección harvard.edu sitio web era un poco confuso ... al igual que el enlace a SUTVA en la sección timeseries
 
Bien, a la mierda, no voy a entrar en el tema yo entonces, hay otros temas interesantes para discutir

Me gusta tu expresión y análisis, te creo 😀 .

Pensaba que había alguna herramienta preparada en la biblioteca para poder deducir algo sin mucho esfuerzo.
 
Aleksey Nikolayev #:

Tengo una función que busca un patrón/secuencia en otra cadena grande , si lo encuentra entonces ITINA de lo contrario False

ilustración



Tengo una función en Rk pero es lenta para cálculos grandes, o mejor dicho hay varias funciones escritas en diferentes estilos....

Así se ven los datos de entrada, por cierto ambas cadenas pueden ser de longitud arbitraria.

dat <- sample(letters[1:20],size = 30,replace = T)
pat <- c('a',"c","g")

dat
 [1] "h" "c" "q" "a" "s" "a" "d" "b" "c" "n" "a" "t" "e" "q" "s" "k" "j" "t" "l" "j" "n" "t" "r" "m" "h"
[26] "b" "o" "e" "g" "h"
pat
[1] "a" "c" "g"

Aquí está la primera función s1 escrita en el estilo estándar, claro pero engorroso.

s1 <- function(pat , dat){  
  lv <- rep(F,length(pat))
  k <- 1     
  for(i in 1:length(dat)){        
    if(dat[i] == pat[k]) 
    {
      lv[k] <- TRUE
      k <- k+1 
    }       
    if(k==length(pat)+1) break
  }
  return(  all(lv)   )
}

o la más elegante s2.

s2 <- function(pat , dat) grepl(paste(pat, collapse=".*"), paste(dat, collapse=""))

ambas hacen lo mismo.

s1(pat = pat,dat = dat)
[1] TRUE
s2(pat = pat,dat = dat)
[1] TRUE

Tengo una pregunta/solicitud - ¿puedes escribir esta simple función en rcpp para mí?

 
Maxim Dmitrievsky #:
Pensaba que había algunas herramientas listas para usar en la biblioteca para que pudieras crear algo sin mucho esfuerzo.

como Reshetov hizo hace unas docenas de páginas.

(y no se trata de la biblioteca)