L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 2742

 
Aleksey Nikolayev #:

Je crois avoir vu quelques indices d'une application d'analyse de survie.

Je ne l'ai pas fait moi-même, mais j'ai déjà posé une question similaire. Cette approche me semble prometteuse, mais elle relève d'un domaine complètement différent.

 
СанСаныч Фоменко #:

Il indique classDist {caret}, c'est-à-dire qu'il spécifie une fonction particulière qui fait partie du PACKAGE caret

Si j'ai bien compris, vous ne connaissez pas R. Dans ce cas, pourquoi perdez-vous votre temps sur ce fil de discussion et sur le MO en général ?

Sans la maîtrise de R, la discussion sur la MO n'a pas de sens.

J'ai gardé le silence sur l'entropie uniquement parce que l'entropie croisée est une fonction de perte standard pour les modèles de classification.... La MO n'est pas seulement mise en œuvre dans R ! (connaître une bibliothèque et ne pas connaître la nature des entités sur lesquelles elle opère - vous avancez sans comprendre la direction de votre mouvement).

Je vous pose une question encore plus difficile : pourquoi vous dissociez-vous catégoriquement des statistiques lorsque vous parlez de"théorie de l'information" ?.. alors qu'elle a été créée exactement comme une "théorie de l'information".

Le domaine se situe à l'intersection des mathématiques , des statistiques , de l' informatique , de la physique , de la neurobiologie , de l'ingénierie de l'information et de l' ingénierie électrique.

en effet, la discussion est sans sujet, si vous opérez par bribes et votre ego (et même à propos de quelqu'un, pas seulement à propos de vous), et non le sujet du dialogue... le fil de discussion ne change pas, malheureusement (la spécificité et le sujet des réponses ne sont pas ajoutés)
 
Maxim Dmitrievsky #:
Une fois de plus, ce porte-parole obtus appelle tout le monde à la vérité, mais n'a pas encore décidé laquelle
.

Vous avez déjà tellement ennuyé le modérateur qu'il démolit tout.

Ne lisez pas le post provocateur de l'utilisateur JeeyCi (son post est une provocation et une demande de "continuer le banquet").
Hier, j'ai supprimé plusieurs posts avec des jurons et des grossièretés avec des attaques personnelles, guidé par ceci - j'ai supprimé les posts de
JeeyCi .

J'ai fait deux avertissements dans le fil de discussion, ils ont été ignorés, et ensuite j'ai supprimé plusieurs messages avec des jurons.
Le seul message littéraire (qui était lisible) était votre message - celui-ci (qui a tout déclenché hier) :

Forum sur le trading, les systèmes de trading automatisés et les tests de stratégies de trading

...

Maxim Dmitrievsky, 2022.09.10 12:15

Il existe une sélection basée sur un modèle, une sélection agnostique et une sélection mixte. Si vous prenez agnostique, il s'agit de la corrélation et de l'information mutuelle (basée sur l'entropie). Cette dernière diffère de la première par sa capacité à capturer les dépendances non linéaires, sinon c'est la même chose. Dans ce cas, il est difficile, voire impossible, de parler d'une quelconque relation entre la caractéristique et la cible. Il s'agit simplement d'une corrélation. Mais il est utile de se débarrasser des caractéristiques non informatives.

Vous pouvez le faire dans une fenêtre coulissante, ou dans une fenêtre insaisissable, ou dans une fenêtre coulissante, ou dans une fenêtre de frottement.

Si vous voulez déterminer spécifiquement la causalité, c'est l'inférence causale, y compris l'utilisation de MO, que je ne sais pas comment appliquer à une série temporelle, je n'ai pas étudié le sujet.

Et toutes les méthodes précédentes ne fonctionnent pas pour trouver la causalité, mais seulement pour l'entraînement optimal des algorithmes.

Donc, une fois de plus, les citoyens ne peuvent pas se concentrer et enlever les mouches de leurs côtelettes.

Nous avons déjà entendu parler à maintes reprises du grand et omnipotent R. Il est évident que si l'on met un singe derrière le clavier, on ne peut pas faire autrement. Il est évident que si l'on met un singe derrière ce logiciel, il peut lui aussi se considérer comme un statisticien et un analyste, tant il est génial.

Oui, il m'arrive de supprimer des gros mots, surtout s'ils durent une demi-journée et deux pages de texte par exemple (comme hier).

----------------

Ce fil est très populaire (il est même lu sur le forum anglophone et est considéré comme le fil clé sur ce sujet).
Alors s'il vous plaît - moins de jurons.

 
mytarmailS #:

Si vous analysez les TS des traders plus ou moins performants, vous constaterez qu'ils négocient tous des niveaux.

Je n'ai pas vu un seul trader à succès qui négocie à l'aide d'indicateurs.

Un niveau est un point d'entrée clair et compréhensible avec un stop clair....

Si vous pouvez trader avec un risque faible, vous n'avez besoin de rien d'autre, un risque faible par transaction/une entrée précise est la chose la plus importante !

Avec l'aide de la MO, vous pouvez rechercher des niveaux de PD/SP, ces entrées précises, ce n'est pas trivial, ce n'est pas simple, vous ne pouvez pas lire cela dans des blogs sur la MO, ici vous devez utiliser votre propre tête....

Vous pouvez aussi tracer des niveaux sur le graphique sb et c'est aussi une série temporelle. Tout le monde en a assez de toi, on ne te répond plus. Vous racontez n'importe quoi jour après jour.
 
mytarmailS #:

Voici un exemple sur un échantillon généré aléatoirement de 5 traits et 1 cible binaire

sélecteur forrest et fiche

La file d'attente des tâches a été un peu déchargée - il est devenu possible d'exécuter le script. Je l'exécute et j'obtiens une erreur.

> install.packages("randomForest")
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/src/contrib:
  cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'
Installing package into ‘C:/Users/S_V_A/Documents/R/win-library/4.0’
(as ‘lib’ is unspecified)
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/src/contrib:
  cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'
Warning in install.packages :
  package ‘randomForest’ is not available (for R version 4.0.5)
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/bin/windows/contrib/4.0:
  cannot open URL 'https://cran.rstudio.com/bin/windows/contrib/4.0/PACKAGES'

> library(randomForest)
Error in library(randomForest) : нет пакета под названием ‘randomForest’

Si j'ai bien compris, le programme veut une ancienne version de R 4.0 ?

J'ai cherché une ancienne version et je ne l'ai pas trouvée. Une terrible incompatibilité est évidemment répugnante.

 
Aleksey Vyazmikin #:

La file d'attente des tâches a été un peu déchargée - il est devenu possible d'exécuter le script. Je l'exécute et j'obtiens une erreur.

Est-ce que je comprends bien que le programme veut l'ancienne version R 4.0 ?

J'ai R-3.6.3.

J'écris ceci sur l'ancienne R-3.6.3 pour mes propres raisons, donc c'est mon problème...

Je ne pouvais pas imaginer que le paquet serait retiré de la tap....

Aleksey Vyazmikin #:

Je comprends bien que le programme veut l'ancienne version de R 4.0 ?

correctement

Aleksey Vyazmikin #:

Eh bien, en général, j'ai cherché l'ancienne version et je ne l'ai pas trouvée. Une terrible incompatibilité est bien sûr répugnante.

Ecoutez, peut-être que vous ne pouvez pas vous lancer dans le commerce, avec une telle smikalka ? ?? ))

Avec la compatibilité, tout va bien, python, par exemple, ne fait qu'envier une telle compatibilité....


Voir aussi

https://stackoverflow.com/questions/62541885/package-randomforest-is-not-available-for-r-version-4-0-2

Essayez-le sur la version actuelle

urlPackage <- "https://cran.r-project.org/src/contrib/Archive/randomForest/randomForest_4.6-12.tar.gz"
install.packages(urlPackage, repos=NULL, type="source") 

 
Pour résumer la théorie de Sanych (puisqu'il n'a pas réussi à la formaliser correctement et à donner des exemples) :

*sa méthode de sélection des caractéristiques est basée sur la corrélation, puisque "relation" et "connexion" sont des définitions de la corrélation.

*De cette manière, nous procédons à un ajustement implicite à l'histoire, similaire à l'analyse discriminante linéaire (LDA) ou à l'ACP, ce qui simplifie le processus d'apprentissage et réduit le taux d'erreur.

*Il n'existe même pas de théorie selon laquelle le modèle formé devrait être plus performant sur les nouvelles données (qui ne sont pas impliquées dans l'estimation des liens entre les caractéristiques et les cibles), parce que les caractéristiques ont été ajustées au trait ou (pire) à l'historique disponible.

*La situation est quelque peu améliorée par le calcul de la moyenne du QC dans une fenêtre glissante, comme vous pouvez estimer l'écart et sélectionner les plus stables. Au moins, nous avons quelques statistiques sur lesquelles nous appuyer.

*Je pensais à la causalité ou à une relation statistiquement significative, mais ce n'est pas le cas dans son approche.
 
Maxim Dmitrievsky #:
Pour résumer la théorie de Sanych (puisqu'il n'a pas lui-même réussi à la formaliser correctement et à donner des exemples) :

*sa méthode de sélection des caractéristiques est basée sur la corrélation, puisque "relation" et "relation" sont des définitions de la corrélation.

*De cette manière, nous procédons à une adaptation implicite à l'histoire, similaire à l'analyse discriminante linéaire (LDA) ou à l'ACP, ce qui simplifie le processus d'apprentissage et réduit le taux d'erreur.

*Il n'existe même pas de théorie selon laquelle le modèle formé devrait être plus performant sur de nouvelles données (qui ne sont pas impliquées dans l'estimation des relations entre les caractéristiques et les cibles) parce que les caractéristiques ont été précédemment adaptées au caractère ou (pire) à l'ensemble de l'historique disponible.

*Par relation, j'entends causalité ou relation statistiquement significative, ce qui n'est pas le cas dans son approche.

Avec tout le respect que je vous dois, il ne s'agit pas d'un résumé (ni d'un condensé, ni d'une synthèse). Il est rempli d'attitudes personnelles et d'attaques non fondées.

On pourrait penser que quelqu'un aurait une théorie valable selon laquelle "un modèle entraîné devrait fonctionner sur de nouvelles données" :-) et validée... oui.

 
Maxim Kuznetsov #:

avec tout le respect que je vous dois, mais il ne s'agit pas d'un résumé (ni d'un condensé, ni d'une synthèse). Il s'agit d'une attitude personnelle et d'attaques non fondées.

On pourrait penser que quelqu'un aurait une théorie valide où "un modèle entraîné devrait fonctionner sur de nouvelles données" :-) et validée...ouais.

Et si vous lisez attentivement, vous pouvez voir l'embuscade au point 2, c'est-à-dire l'adaptation initiale à l'histoire. C'est pourquoi il y a une baisse de l'erreur d'apprentissage.

Le point 4 est un peu plus optimiste s'il n'est pas effectué sur tout l'historique disponible. Il ne devrait être effectué que pour l'échantillonnage de la formation, pour la qualité de l'ajustement. Pour obtenir une estimation adéquate du modèle sur de nouvelles données.

Je ne suis pas connu pour être un psychologue, donc ça ne gicle jamais nulle part. Et je ne connais personne personnellement.
 
СанСаныч Фоменко #:

Il n'y a pas assez de puissance pour atteindre le niveau EA. Mais le résultat de l'erreur d'ajustement du modèle : de 8% à 22% est une erreur d'ajustement qui diffère peu dans la section d'ajustement et hors de l'échantillon.

Cela laisse supposer que l'ajustement à l'ensemble de l'historique a été effectué avant l'entraînement. Si ce n'est pas le cas, veuillez me corriger. À quel intervalle les caractéristiques ont-elles été estimées/sélectionnées et à quel intervalle l'apprentissage a-t-il été effectué ?

Je viens de mettre au point une méthode similaire et je peux partager les résultats ce week-end. Seulement s'il y a une communication substantielle plutôt qu'un jeu de mots.