Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2831

 
Maxim Dmitrievsky #:

Y aquí voy a citar a Prado, pero no textualmente, ya que se me olvidaba que "El aprendizaje automático da más posibilidades, comparado con la estadística clásica, en el trading"

y las biblias de MO están muy bien desarrolladas para python, aunque otras como statsmodels también. Así que discutir con estos datos y demostrarnos algo unos a otros no tiene sentido.

A mi entender, R es para estudiantes y profesores y aficionados. Así que pueden citarse unos a otros y presumir de algo. Para profesores, tal vez algunos profesores que enseñan. Python para proyectos serios y producción. No he oído hablar de ningún gran proyecto de MO en R en producción.

¿Por qué discutes sobre algo que tú mismo dices desconocer?

Microsoft ha hecho algunos esfuerzos para hacer de R una herramienta para el desarrollo de grandes proyectos por un gran número de desarrolladores.

Esta es la lista de productos/servicios de Microsoft que nos permitirán trabajar con R:
.
  1. Microsoft R Server / R Server para Azure HDInsight
  2. Data Science VM
  3. Azure Machine Learning
  4. Servicios R de SQL Server
  5. Power BI
  6. Herramientas R para Visual Studio

¿Qué tipo de aficionados, qué tipo de profesores necesitan el ecosistema de Microsoft R Server?



¿Y las máquinas virtuales VM que permiten unificar todo y cualquier cosa?

Y el servicio en la nube Azura con sus paquetes de aprendizaje automático y herramientas de desarrollo colaborativo?


R es ahora un sistema industrial integrado por Microsoft en desarrollos propios y ajenos.


Y tú eres "para aficionados"...

 
СанСаныч Фоменко #:

¿Por qué especulas sobre algo que tú mismo afirmas desconocer?

Microsoft ha realizado algunos esfuerzos para hacer de R una herramienta para el desarrollo de grandes proyectos por parte de un gran número de desarrolladores.

Esta es la lista de productos/servicios de Microsoft que nos permitirán trabajar con R:
.
  1. Microsoft R Server / R Server para Azure HDInsight
  2. Data Science VM
  3. Azure Machine Learning
  4. Servicios R de SQL Server
  5. Power BI
  6. Herramientas R para Visual Studio

¿Qué tipo de aficionados, qué tipo de profesores necesitan el ecosistema de Microsoft R Server?



¿Y las máquinas virtuales VM que permiten unificar todo y cualquier cosa?

Y el servicio en la nube Azura con sus paquetes de aprendizaje automático y herramientas de desarrollo colaborativo?


R es ahora un sistema industrial integrado por Microsoft en desarrollos propios y ajenos.


Y tú eres "para aficionados"...

Está claro que "algo hay".

Hablo desde la experiencia de comunicarme con implementadores, incluso grandes, al menos en Rusia.

Todos ellos lo hicieron en python.

Microsoft tiene sdk para machine learning en C# y Asure, pero nadie los usa.

Así que hiciste un gran proyecto en R, lo pusiste en un servidor. ¿Y quién lo va a mantener? Nadie, porque no hay especialistas en tal cantidad y nadie quiere aprender R por una estadística.

Para python, contrata a cualquier estudiante por un palo de chorizo y te irá bien.

"nadie" es la palabra para que NADIE escriba en R, bajo ningún pretexto. Porque existe python.

y llevas a los tradduns a escribir en R para que pierdan el tiempo en un lenguaje inútil.

 
mytarmailS #:

También está la cuestión de qué entendemos por encontrar el máximo en una función ruidosa...

Según he entendido la definición - "optimización de una función ruidosa" significa que la función es compleja y es difícil encontrar el máximo en ella, los algoritmos de gradiente no son aplicables, etc. .... A grandes rasgos, no es gran cosa, se aplica el algoritmo de optimización global y se va a buscar el máximo global....


Pero yo lo veo de otra manera, quiero encontrar el máximo de una función ruidosa pero con el ruido eliminado, no el máximo global en una función ruidosa, sino el máximo global en una función desruido....

(Y no es trivial, porque no se conoce la función y no se conocen los parámetros del ruido....

Se necesita información a priori sobre el ruido. Además, se necesita un modelo matemático claro del ruido: aditivo, multiplicativo o de otro tipo. No se puede hacer un filtro sin un modelo. Y este modelo debe ser similar a los datos reales.

Quizá deberías buscar métodos de procesamiento de geodatos que funcionen con datos bidimensionales o tridimensionales. O algo como la transformada de Fourier, como en las imágenes jpg, o wavelets - como en la nueva versión de jpg, o splines multidimensionales, etc.

 
Maxim Dmitrievsky #:

Yo citaría el eslogan "lucha y busca - encuentra y escóndete".

establecer cualquier criterio como métrica personalizada, en particular estos estándar. Seguirá optimizando por logloss, pero se detendrá en estos criterios personalizados, lo que probablemente tenga algún sentido.

y de hecho lo tiene, porque parar en el mismo bousting siempre se basa en algún criterio de reparto como la precisión.

Hasta ahora, supongo, sólo así. También puede hacer la poda de árboles por un criterio personalizado.

 
Maxim Dmitrievsky #:

está claro que "hay"

Hablo por experiencia en la comunicación con los ejecutores, incluidos los grandes, al menos en la Federación Rusa

todo se hizo en Python

microsoft tiene sdk para machine learning en C# y Asure, pero nadie los usa

Así que hiciste un gran proyecto en R, lo pusiste en el servidor. ¿Y quién lo va a mantener? Nadie, porque no hay especialistas en un número tan grande y nadie quiere aprender R por una estadística.

y para python, contrata a cualquier estudiante por un palo de chorizo y te irá bien.

"nadie" es la palabra para NINGUNA de las personas que escriben en R, bajo ninguna pretensión. Porque existe python.

y tu llevas a los tradduns a escribir en R, para que pierdan el tiempo en un lenguaje inutil.

RF es un mal ejemplo, porque es extremadamente inactivo en el sentido de matstat. Nuestro foro está lleno de técnicos, pero la mayoría de ellos tienen ideas extremadamente pobres sobre matstat. En los institutos los profesores enseñan matstat en Excel) Todo esto caracteriza extremadamente mal a nuestra escuela científica y técnica - las soluciones serias de los tiempos de la URSS se compran mucho más a menudo ya hechas en el extranjero, en lugar de desarrollarlas en el país.

 
Aleksey Nikolayev #:

Se respondió correctamente que se necesita información a priori sobre el ruido. Además, se necesita un modelo matemático claro del ruido: aditivo, multiplicativo o de otro tipo. No se puede hacer un filtro sin un modelo. Y este modelo debe ser similar a los datos reales.

Quizá deberías buscar métodos de procesamiento de geodatos que funcionen con datos bidimensionales o tridimensionales. O algo como la transformada de Fourier, como en las imágenes jpg, o wavelets - como en la nueva versión de jpg, o splines multidimensionales, etc.

Puedo hacer un modelo sin problemas, cualquier descomposición, incluso PCA y adelante...

Pero ¿y los datos? No existen, es una función desconocida, e incluso multidimensional....

TODOS los datos son los puntos dispersos de los resultados de la búsqueda de AO (eso si los guarda).

No es una serie temporal, no hay estructura ni orden.

 
Aleksey Nikolayev #:

RF es un mal ejemplo, porque es extremadamente estúpido en el sentido de matstat. Nuestro foro está lleno de tecnólogos, pero la mayoría de ellos tienen ideas extremadamente pobres sobre matstat. En los institutos los profesores enseñan matstat en Excel) Todo esto caracteriza muy mal a nuestra escuela científica y técnica - las soluciones serias de los tiempos de la URSS se compran mucho más a menudo ya hechas en el extranjero, en lugar de desarrollarlas en el país.

Excel les será más útil más adelante :D

 
mytarmailS #:

Puedo hacer un modelo sin problema, cualquier descomposición, incluso PCA y adelante.

Pero que pasa con los datos, no existen, es una función desconocida, y es multidimensional....

Los datos son los puntos dispersos de la búsqueda AO (si los guarda).

No es una serie temporal, no hay estructura ni orden.

Bueno, lo primero que se me ocurre es dividir el espacio por una cuadrícula con celdas no demasiado grandes ni pequeñas (el tamaño lo determina el modelo de ruido). Se empieza por alguna celda (elegida al azar, por ejemplo), unos cuantos puntos en ella determinan la dirección del gradiente de la función suavizada y se pasa a la siguiente celda y así sucesivamente hasta que no haya transición ni bucle. La posición del extremo se establece con precisión al tamaño de la celda, por lo que no debe ser demasiado grande, pero al mismo tiempo debe dar la posibilidad de suavizar, por lo que no es demasiado pequeño. Y debemos aceptar el hecho de que, en principio, no existe una posición exacta del extremo, ya que variará en función del método de suavizado.

 
Aleksey Nikolayev #:

Bueno, lo primero que se me ocurre es dividir el espacio por una cuadrícula con celdas no demasiado grandes ni pequeñas (el tamaño lo determina el modelo de ruido). Se empieza con alguna celda (seleccionada al azar, por ejemplo) - unos pocos puntos en ella determinan la dirección del gradiente de la función suavizada y se pasa a la siguiente celda, etc. hasta que no haya transición o bucle. La posición del extremo se establece con precisión al tamaño de la celda, por lo que no debe ser demasiado grande, pero al mismo tiempo debe dar la posibilidad de suavizar, por lo que no es demasiado pequeño. Y debemos aceptar el hecho de que, en principio, no existe una posición exacta del extremum, porque variará en función del método de suavizado.

Parece mucho trabajo).

 

El acolchado entre R y la silla es demasiado fino.

otra fantasía no realizada