Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 968

 
SanSanych Fomenko:


En la programación, muy a menudo se elige lo que es más conveniente en lugar de lo que es útil, funcional, pero regar para hacer una elección extremadamente cuestionable no lo es.

Qué conveniencia hay, aquí Rattle - de nuevo se negó a leer un archivo para el modelo de prueba, mientras que divertido que lee el que el modelo fue construido (si se carga por separado), y similares no lee - y no se puede entender lo que tenía mal.

Bueno, estoy teniendo problemas con el multithreading: no hay suficiente memoria. He encontrado un artículo sobre cómo convertir algo allí, pero no entiendo cómo usarlo....

 
Maxim Dmitrievsky:

SanSanych, la única fuente de la distribución allí es el sitio web de python :)

Para la estadística y el aprendizaje automático, las extensiones IPython y anaconda. Vaya a la comunidad rusa de opendatascience o vea los vídeos de Yandex. No han oído hablar de R en absoluto. ¿Qué es lo que cuenta como norma? Pruebe python para formarse su propia opinión y comparar. Además saber python, como has dicho, te permitirá hacer algo más que estadísticas, y hacer otras cosas si es necesario.

Hay otras fuentes más autorizadas para las estadísticas de uso de las lenguas. Cito regularmente información de esas fuentes.

Tengo varias noticias sobre estadísticas, pero ninguna sobre python, así que no hay ningún incentivo para estudiarlo. Los textos R, en cambio, son regulares.


Hay una idea errónea de mí aquí en el sitio como un fan de R. No soy fan de ningún lenguaje de programación y de R en particular, para mí un lenguaje de programación es una herramienta. Pero estoy muy interesado en organizar un hangout especializado, de comerciantes, sobre estadísticas en este sitio, y R como "sistema de gráficos y estadísticas" se deriva de este interés. Y paso mi tiempo en este sitio para las estadísticas y R es una expresión absolutamente precisa de mis pensamientos en esta área y no más.

 
SanSanych Fomenko:

Hay otras fuentes más autorizadas para determinar las estadísticas de uso de las lenguas. Cito regularmente información de estas fuentes.

Tengo varias noticias sobre estadísticas - no hay python en ninguna parte, así que no hay incentivo para estudiarlo. Los textos R, en cambio, son regulares.


Hay una idea errónea de mí aquí en el sitio como un fan de R. No soy fan de ningún lenguaje de programación y de R en particular, para mí un lenguaje de programación es una herramienta. Pero estoy muy interesado en organizar un hangout especializado, para comerciantes, sobre estadísticas en este sitio, y R como "sistema de gráficos y estadísticas" se deriva de este interés. Y en este sitio me dedico a la estadística, mientras que R es una expresión absolutamente precisa de los pensamientos en esta área, nada más.

No, no tengo opinión.

Sólo escribo por mis propias sensaciones lo que más me ha gustado, porque no soy programador en absoluto y sólo me divierto por mí mismo. Por eso digo que me ha gustado

Me gusta este conector tal y como lo tienes, tendré que pedirlo también si voy a seguir. Por ahora no me importa porque la no estacionariedad no se puede matar con métodos estadísticos, como todos descubrimos, sino sólo con la Providencia de Dios y estrategias muy especializadas como el arbitraje o el trading nocturno.

 
Aleksey Vyazmikin:

Qué comodidad hay, aquí Rattle - de nuevo se negó a leer un archivo para el modelo de prueba, mientras que lo curioso es que lee el que el modelo fue construido (si se carga por separado), y no lee una similar - y no se puede entender lo que tenía un problema.

Bueno, estoy teniendo problemas con el multithreading: no hay suficiente memoria. He encontrado un artículo sobre cómo convertir algo allí, pero todavía no entiendo cómo usarlo....

Desde hace unos meses utilizo Rattle, es muy cómodo para comprobar mis pensamientos y no hay ningún problema. Es más conveniente escribir un script en R sobre la preparación inicial de los predictores, guardarlo en .RData, y luego cargar este archivo en rattle.

El multihilo es de aquí. Puede cargar todos los núcleos y los ordenadores vecinos también.

PS.

Consejos para aprender inglés. Es ridículamente fácil de aprender, a base de autodisciplina y conocimientos básicos de gramática.

0. Prepara trozos de papel de unos 4 * 5 cm

1. Toma un párrafo de cualquier texto y tradúcelo. Cada palabra nueva la escribes en un papel aparte: en inglés por un lado y en ruso por otro.

2. Varias veces al día revisa estos papeles desde ambos lados: una vez desde el lado inglés, la otra desde el lado ruso.

3. Esto debe hacerse regularmente.

4. Después de un par de semanas, memorizarás hasta 50 palabras al día.

5. Todo lo que necesitas es un par de miles de palabras para leer inglés con fluidez.


En un par de meses, no tendrás problemas con el inglés, y los problemas con el significado de las palabras, ya sea en ruso o en inglés, pasarán a primer plano.

CRAN Task View: High-Performance and Parallel Computing with R
  • cran.r-project.org
This CRAN task view contains a list of packages, grouped by topic, that are useful for high-performance computing (HPC) with R. In this context, we are defining 'high-performance computing' rather loosely as just about anything related to pushing R a little further: using compiled code, parallel computing (in both explicit and implicit modes...
 
Maxim Dmitrievsky:

Como todos hemos comprobado, la no estacionariedad no se mata con métodos estadísticos, sino sólo con la divina providencia y con estrategias muy especializadas como el arbitraje o el trading nocturno.

Si se trata de no estacionariedad, un gran número de publicaciones, la corriente principal es GARCH. Desde el comercio de alta frecuencia hasta el comercio diario.

 
SanSanych Fomenko:

Si se trata de inestabilidad, un gran número de publicaciones, la corriente principal es GARCH. Desde la alta frecuencia hasta la diurna.

He visto los artículos, no he visto los gráficos del real :)

 
Maxim Dmitrievsky:

He visto los artículos, no he visto los gráficos del mundo real :)

Bueno, ¿qué haces.... Una vez encontré un artículo sobre la variante GARCH de todas las acciones del S&P500.

Creo que la TS ideal es GARCH+MO. GARCH es especialmente interesante, ya que el modelo cubre los vacíos.

 
Maxim Dmitrievsky:

Una vez más me convencí de que R no es lo mío :) la sintaxis casi no se destaca, el código es ilegible, los errores casi no se destacan. El propio código y el lenguaje no son estéticamente agradables

aquí podrían estar sus contraargumentos

Sí, puedes entrenar un algoritmo en 3 líneas en lugar de 5 en python, eso es todo. La legibilidad en python sería mejor. No veo ninguna ventaja con los paquetes MO, es todo lo mismo.

Muéstrame un ejemplo. Lo tengo así en Rstudio/ Todo está ajustado y es personalizable según las preferencias del usuario

#--function-------------------------
 evalq({
  import_fun("InformationValue", optimalCutoff, CutOff)
  import_fun("InformationValue", youdensIndex, th_youdens)
  GetThreshold <- function(X, Y, type){
    switch(type,
           half = 0.5,
           med = median(X),
           mce = CutOff(Y, X, "misclasserror"),
           both = CutOff(Y, X,"Both"),
           ones = CutOff(Y, X, "Ones"),
           zeros = CutOff(Y, X, "Zeros")
    )
  }
}, env)

Y los errores se muestran al instante.

Kyegvshch

Lo he pedido más de una vez, escribe con modestia y no evalúes lo que no sabes usar.

Aprende lo básico.

Buena suerte

 
Vladimir Perervenko:

Muéstrame un ejemplo. Tengo esto en Rstudio/ Todo está retocado y ajustado a las preferencias del usuario

Y los errores se muestran al instante.

Te he pedido repetidamente que seas modesto y no evalúes lo que no sabes usar.

Aprende lo básico.

Buena suerte

Es inútil discutir, para mi gusto este editor se ve feo en cualquier esquema de colores, el lenguaje también

Creo que has visto el código en python, IDE vscode y jupiter notebook

 
Maxim Dmitrievsky:

SanSanych, la única fuente de la distribución allí es el sitio web de python :)

Para la estadística y el aprendizaje automático, la extensión IPython y anaconda. Vaya a la comunidad rusa de opendatascience o vea los vídeos de Yandex. No han oído hablar de R en absoluto. ¿Qué es lo que cuenta como norma? Pruebe python para formarse su propia opinión y comparar. Además saber python, como has dicho, te permitirá hacer no sólo estadísticas sino otras cosas, si es necesario.

También es un lenguaje interpretado, pero perfectamente resaltado y comprueba la sintaxis sobre la marcha, no sólo después de lanzar el script, + plegado de código, bloc de notas y un montón de otras cosas.

Estupidez sobre estupidez.

1. Los paquetes/módulos en Python pueden ser cargados usando pip install / conda install con el mismo nombre los paquetes pueden no coincidir en el contenido en absoluto. Y este perl " la única fuente de la distribución allí es el sitio de python :)" debe ser puesto en los anales.

2. Ni IPython ni anaconda son extensiones de MO. El primero es un simple editor con ejecución de código de línea/bloque mientras que anaconda es un sistema de gestión de paquetes (como un repositorio) y no sólo de Python sino también de R.

Si quieres presumir de conocimientos, hazlo. De lo contrario, está demostrando su amateurismo.

Sé modesto.