L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 387

 
Dr. Trader:

Et cet argent peut-il être retiré ?
 
Dr. Trader:

qu'un moyen de gagner de l'argent.

Si vous voulez gagner de l'argent, les numéraires ont en quelque sorte lancé leur propre crypto-monnaie. Ses détenteurs ont en quelque sorte la possibilité de participer indirectement à l'investissement.

Je ne peux pas donner plus de détails, je veux le découvrir, mais je ne peux pas le faire.

 
Dr. Trader:

Il est intéressant de noter que les logloss 0.690 - 0.691 sur les données de validation ont presque tous montré un bon résultat sur les nouvelles données, je n'ai aucune idée de ce que cela signifie.

Très probablement pas gourmand, pas trop compliqué le modèle et donc pas trop adapté, bien qu'il y ait eu comme un gars avec ~0,65 sur une tournée, qui en direct ~0,68 +.

Je suis plus confus dans leurs données des échantillons mélangés, "ère" avec l'id inconnu ne peut pas reproduire leurs calculs sur les tours passés. Je ne sais donc pas ce qu'il y a dans l'ensemble d'entraînement, il serait bien que les échantillons LIVE des dernières séries soient présentés et qu'il soit possible d'entraîner un modèle pour cet ensemble de données de test, au moins pour comprendre pourquoi il est si différent. IMHO, c'est comme s'ils accumulaient des points depuis longtemps et qu'ils distribuaient ensuite un sous-ensemble aléatoire comme un train, les identifiants ne reflètent pas la chronologie de l'accumulation des données, et ensuite les points vivants, qui avaient besoin d'être à l'avant-garde, ne sont pas donnés séparément pour corriger les modèles et avoir un "doigt dans le ciel" en train de fouiller dans la nature, au hasard.

J'espère qu'ils vont le corriger :)

 
Quelqu'un peut-il confirmer qu'il est préférable d'utiliser les forêts aléatoires pour la classification binaire ? Dans le cas général, ou est-il possible de choisir un réseau neuronal dans le cas particulier qui donnera une erreur légèrement inférieure ?


 
pantural:
Et cet argent peut-il être retiré ?

Oui, retrait instantané en bitcoins au taux actuel.


Combinateur:

Si vous voulez gagner de l'argent, les numéraires ont en quelque sorte lancé leur propre crypto-monnaie. Ses détenteurs ont en quelque sorte la possibilité de participer indirectement à l'investissement.

Je ne dirai pas plus de détails, je veux le découvrir, mais je ne le trouve pas.

Oui, maintenant ils donnent leur crypto aux gagnants avec les dollars. Par exemple, j'ai 300 NMR (Numéraire), mais ils ne peuvent pas les retirer ou faire quelque chose avec eux pour le moment. En général, ils n'ont pas vraiment amorcé un turnover, ils ne font que le donner jusqu'à présent.

NMR est lui-même un jeton cryptographique d'ethereum(https://github.com/ethereum/EIPs/issues/20), et l'investissement qu'il propose est également basé sur les possibilités de l'ethereum. Plus précisément, il ne s'agit même pas d'un investissement, mais d'une opportunité de mettre de l'argent sur leurs prédictions. Vous téléchargez vos prédictions, faites un pari en NMR, puis l'algorithme en ethereum définit à temps les gagnants et distribue les prix(https://numer.ai/whitepaper.pdf). Le casino, en bref.


Maxim Dmitrievsky:
Quelqu'un peut-il confirmer qu'il est préférable d'utiliser les forêts aléatoires pour la classification binaire ? Dans le cas général ou puis-je choisir le neuronet dans un cas particulier qui donnera un peu moins d'erreur ?
Dans des articles postés ici, j'ai lu que le monde de la classification est régi par le binning de gradient (type spécial de forêt), dans le package R gbm par exemple.
 
Dr. Trader:

Oui, retrait instantané en bitcoins au taux actuel.

Hmmm... bizarre.

La question se pose de savoir pourquoi un hedge-fund américain, avec le patronage d'un oncle de Renaissance, où comme les quants les plus cool de la Terre, avec des salaires de 200-300k $ et des bonus à six chiffres, ces prédiches des fans de ML monde (Russie, Inde, Chine...), pour le prix des salaires d'un programmeur moyen de Moscou pour toute la foule (>300 personnes) ? ????.

Comme s'ils n'avaient pas leurs propres quants pour ça ? Ou bien les quants de Harvard ne veulent pas le faire, ils ne communiquent qu'avec les investisseurs et sous-traitent les modèles.....

Hmmm... comment peuvent-ils ne pas payer pour un tel manque de prévoyance...

 
Dr. Trader:


J'ai lu dans des articles postés ici que le monde de la classification est régi par le gradient boosting (un type spécial de forêt), dans le package R gbm par exemple.

On dit aussi qu'ils sont trop ajustés... mais je vais lire davantage... Bref, c'est mieux que MLP. À propos, les arbres de décision boostés donnent une erreur légèrement plus mauvaise que les arbres de décision simples en studio
 
Maxim Dmitrievsky:

Ils disent qu'ils sont suralimentés aussi... Mais je vais regarder... Au moins mieux que MLP. D'ailleurs, les arbres de décision boostés produisent une erreur un peu plus mauvaise que les arbres de décision simples dans le cadre de l'analyse de l'impact de l'environnement.


ada est un peu meilleur que randomforest. Mais caret a des problèmes avec ada (je ne me souviens plus lequel), donc ça ne vaut pas la peine de s'en occuper.

le plus prometteur est la sélection des prédicteurs. Ils sont tous à nous.

Ce fil de discussion a utilisé un grand nombre de prédicteurs, mais tous dérivés d'une seule paire de devises.

Pourquoi une paire et pas plusieurs ?

Et pourquoi une paire de devises et non les prédicteurs ?

Et où sont passées les données macroéconomiques ?


Jusqu'à présent, mon erreur sur le nouveau fichier est légèrement inférieure à 30 %. Les 20% ne sont pas réalisables par n'importe quel artifice, remplacer des modèles ne mène nulle part.

Mais je n'ai pas la force d'essayer de répondre aux questions ci-dessus.

 
SanSanych Fomenko:


ada est légèrement meilleur que randomforest. Mais dans caret il y a des choses bizarres avec ada (je ne me souviens plus lesquelles), donc ça ne vaut pas la peine.

le plus prometteur est la sélection des prédicteurs. C'est à nous.

Ce fil de discussion a utilisé un grand nombre de prédicteurs, mais tous dérivés d'une seule paire de devises.

Pourquoi une paire et pas plusieurs ?

Et pourquoi une paire de devises et non les prédicteurs ?

Et où sont passées les données macroéconomiques ?


Jusqu'à présent, mon erreur sur le nouveau fichier est légèrement inférieure à 30%. 20 % n'est pas réalisable par n'importe quel artifice, remplacer des modèles ne mène nulle part.

Mais je n'ai pas la force d'essayer de répondre aux questions ci-dessus.


J'ai déjà des prédicteurs, bizarrement. J'ai un robot prêt à l'emploi, qui se tient sur le terrain, je l'ai écrit en moins d'un mois. La chose la plus importante - les prédicteurs, c'est hors de question. Par exemple, avec mon imagination enflammée, les prédicteurs peuvent être repérés sur place, je travaille comme analyste depuis 5 ans :) Je pense que la sélection de prédicteurs n'est pas une tâche aussi difficile que l'étude des architectures NS, l'essentiel est de s'asseoir et de choisir, cela prend 2 à 3 semaines :)

En particulier, la dernière chose populaire actuellement est le LSTM, ils sont très exigeants en termes de puissance de calcul, mais donnent des résultats impressionnants. Je pense maintenant à me procurer un PC de jeu puissant, au moins pour le calcul des cartes vidéo, au plus pour les NVidia tesla.

D'après l'expérience acquise avec les ns small - ils doivent être recyclés en automatique ou être recyclés, c'est un processus obligatoire. L'utilisation de l'AG pour sélectionner les paramètres des mêmes prédicteurs pour les NS est également indispensable. Tout cela demande de l'énergie, mais cela en vaut vraiment la peine. Nous avons déjà un semblant d'IA qui tient compte de ces 3 composantes. Surentraînement+génétique+pouvoirs

 

SanSanych Fomenko:

Au jour d'aujourd'hui, j'ai une erreur sur le nouveau fichier d'un peu moins de 30%. Les 20% ne sont pas réalisables par n'importe quel artifice, le remplacement des modèles ne mène à rien.

Résultat très élevé même pour HFT, pourriez-vous vérifier le jeu de données en csv, qui a donné de tels résultats, je veux m'assurer qu'il n'y a pas d'overfitting.

De haut et de loin parfois fait écho que même Renaissance minute prédit précision pas plus de 65-70%, étant donné qu'ils sont formés par des milliers de caractéristiques impensables, y compris les caractéristiques de traitement de l'imagerie satellitaire et les données de l'activité de l'infrastructure urbaine des mégapoles dans le monde entier, tout ce qui fait la nature et les foules de personnes sur la planète - les données.