Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 387

 
Dr. Trader:

¿Y se puede retirar este dinero?
 
Dr. Trader:

que una forma de ganar dinero.

Si quieres ganar dinero, los numerae han lanzado su propia criptomoneda. Sus titulares tienen en cierto modo la oportunidad de participar indirectamente en la inversión.

No puedo decir más detalles, quiero descubrirlo, pero no puedo hacerlo.

 
Dr. Trader:

Curiosamente, el logloss 0,690 - 0,691 en los datos de validación casi todos mostraron un buen resultado en los nuevos datos, no tengo idea de lo que se trata.

Lo más probable es que no sea codicioso, que no se complique en exceso el modelo y por lo tanto no se sobreajuste, aunque había como un tipo con ~0,65 en alguna gira, que en vivo ~0,68 +.

Estoy más confundido en sus datos mezclados muestras, "era" con id desconocido no puede reproducir sus cálculos sobre las giras pasadas. Así que no sé qué demonios hay en el conjunto de entrenamiento, estaría bien que desde las últimas rondas se pusieran muestras en vivo y se pudiera entrenar un modelo para este conjunto de datos de prueba, al menos para entender por qué va tan diferente. IMHO es como si acumularan puntos de hace mucho tiempo y luego dieran un subconjunto aleatorio de ellos como un tren, y los id's no reflejan la cronología de la acumulación del conjunto de datos, y luego los puntos vivos, que se necesitan para vanguear, no se dan por separado para corregir los modelos y conseguir un "dedo en el cielo" que pinche la oportunidad.

Espero que lo arreglen :)

 
¿Puede alguien confirmar que es mejor utilizar bosques aleatorios para la clasificación binaria? ¿En el caso general, o es posible escoger una red neuronal en el caso especial que dé un error ligeramente menor?


 
pantural:
¿Y se puede retirar este dinero?

Sí, retiro instantáneo en bitcoins a la tasa actual.


Combinador:

Si quieres ganar dinero, Numerae ha lanzado su propia criptomoneda. Sus titulares tienen en cierto modo la oportunidad de participar indirectamente en la inversión.

No diré más detalles, quiero averiguarlo, pero no lo encuentro.

Sí, ahora dan su cripto a los ganadores junto con los dólares. Por ejemplo, tengo 300 NMR (Numeraire), pero no pueden retirarlos o hacer algo con ellos ahora mismo. En general, no han empezado a facturar, sólo lo hacen hasta ahora.

NMR en sí es un cripto token de Ethereum(https://github.com/ethereum/EIPs/issues/20), y la inversión que ofrecen se basa en las posibilidades de Ethereum también. Más concretamente, ni siquiera se trata de una inversión, sino de una oportunidad para poner dinero en sus predicciones. Subes tus pronósticos, haces una apuesta en NMR, y luego el algoritmo en ethereum a tiempo define los ganadores y reparte los premios(https://numer.ai/whitepaper.pdf). Casino, en definitiva.


Maxim Dmitrievsky:
¿Puede alguien confirmar que es mejor utilizar bosques aleatorios para la clasificación binaria? ¿En el caso general o puedo coger la red neuronal en el caso especial que dará un poco menos de error?
En artículos publicados aquí he leído que el mundo de la clasificación se rige por el gradient binning (tipo especial de bosque), en el paquete R gbm por ejemplo.
 
Dr. Trader:

Sí, retiro instantáneo en bitcoins a la tasa actual.

Hmmm... raro.

La pregunta que surge es por qué los fondos de cobertura estadounidenses, con el patrocinio del tío de Renaissance, donde como los quants más cool en la Tierra, con salarios en $ 200-300k y bonos de seis cifras, estos predichos de los fans de ML mundo (Rusia, India, China ...), por el precio de los salarios de un programador promedio de Moscú para toda la multitud (>300 personas) ?????

Como si no tuvieran sus propios cuants para eso. O los quants de Harvard no quieren hacerlo, sólo se comunican con los inversores y subcontratan los modelos....

Hmmm... cómo no van a pagar por esa falta de previsión...

 
Dr. Trader:


He leído en artículos publicados aquí que el mundo de la clasificación se rige por el gradient boosting (un tipo especial de bosque), en el paquete de R gbm por ejemplo.

Dicen que también se ajustan demasiado... pero voy a leer más... En fin, mejor que MLP. Por cierto, los árboles de decisión potenciados dan un error ligeramente peor que los árboles de decisión simples en el estudio
 
Maxim Dmitrievsky:

Dicen que también sobrealimentan... Pero voy a echar un vistazo... Al menos mejor que MLP. Por cierto, los árboles de decisión potenciados producen un error un poco peor que los árboles de decisión simples en el


ada es un poco mejor que randomforest. Pero caret tiene algún lío con ada (no recuerdo cuál), así que no merece la pena.

lo más prometedor es la selección de predictores. Es todo nuestro.

En este hilo se ha utilizado un gran número de predictores, pero todos derivados de un único par de divisas.

¿Por qué un par y no muchos?

¿Y por qué un par de divisas y no los predictores?

¿Y dónde quedaron los datos macroeconómicos?


Hasta ahora mi error en el nuevo archivo es algo menos del 30%. El 20% no se puede conseguir con ningún truco, la sustitución de modelos no lleva a ninguna parte.

Pero no tengo fuerzas para intentar responder a las preguntas anteriores.

 
SanSanych Fomenko:


ada es ligeramente mejor que randomforest. Pero en caret hay cosas raras con ada (no recuerdo cuáles), así que no merece la pena.

lo más prometedor es la selección de predictores. Son todos nuestros.

En este hilo se ha utilizado un gran número de predictores, pero todos derivados de un único par de divisas.

¿Por qué un par y no muchos?

¿Y por qué un par de divisas y no los predictores?

¿Y dónde quedaron los datos macroeconómicos?


Hasta ahora mi error en el nuevo archivo es algo menos del 30%. El 20% no se puede conseguir con ningún truco, la sustitución de modelos no lleva a ninguna parte.

Pero no tengo fuerzas para intentar responder a las preguntas anteriores.


Ya tengo predictores, curiosamente. Tengo un bot listo, que está parado en uno real, lo escribí en menos de un mes. Lo más importante, los predictores, está fuera de toda duda. Por ejemplo, con mi inflamada imaginación los pronósticos se recogen en un santiamén, yo trabajo como analista desde hace 5 años :) Creo que la selección de predictores no es una tarea tan difícil como el estudio de las arquitecturas de las SN, lo principal es sentarse y elegir uno, tarda 2-3 semanas :)

En particular, lo último que es popular ahora es LSTM, son muy exigentes en cuanto a potencia de cálculo, pero dan resultados impresionantes. Ahora estoy pensando en conseguir un PC gaming potente, al menos para el cálculo de la tarjeta de vídeo, como mucho para la NVidia tesla.

Por experiencia con los ns pequeños - necesitan ser reentrenados en automático o ser reentrenados, este es un proceso obligatorio. El uso de GA para seleccionar los parámetros de los mismos predictores para NS es también una necesidad. Todo esto requiere energía, pero realmente vale la pena. Ya tenemos una especie de IA que tiene en cuenta estos tres componentes. Sobreentrenamiento+genética+poderes

 

SanSanych Fomenko:

A día de hoy tengo un error en el nuevo archivo de algo menos del 30%. El 20% no se puede conseguir con ningún truco, la sustitución de modelos no conduce a nada.

Un resultado muy alto incluso para HFT, ¿podría comprobar el conjunto de datos en csv, que dio tales resultados, quiero asegurarme de que no es overfitting.

Desde lo alto y lejos a veces se hizo eco de que incluso Renacimiento minuto predice la precisión no más de 65-70%, dado que son entrenados por miles de características impensables, incluyendo las características de procesamiento de imágenes de satélite y los datos de la actividad de la infraestructura urbana de las megaciudades de todo el mundo, todo lo que hace la naturaleza y las multitudes de personas en el planeta - los datos.