L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1921

 
mytarmailS:

Je ne comprends pas, voulez-vous obtenir les pro-formas résultants dans les règles pour les transférer à mcule ?

Bien sûr, sinon comment pourrais-je appliquer le modèle par la suite ? :)

 
Aleksey Vyazmikin:

Bien sûr, sinon comment pourrais-je appliquer le modèle plus tard ? :)

)))))) bien réécrire tous les algorithmes avec R dans µl et ensuite obtenir toutes les transformations en règles dans µl ))

 
mytarmailS:

)))))) bien réécrire tous les algorithmes avec R dans µl et ensuite obtenir toutes les transformations en règles dans µl ))

Réalisé que ce type de clustering ne crée pas de règles permettant de reproduire le résultat sans répéter le clustering. Et le regroupement est trop lent. Nous devons donc créer des règles via la construction d'un arbre, qui divisera les résultats du clustering en classes appropriées en fonction de certaines caractéristiques.

Donc la question reste - comment sauvegarder en csv la chaîne appartenant à chaque classe ?


Bien que ce soit étrange, pourquoi ne pas simplement continuer le clustering avec les données déjà existantes et définir une nouvelle chaîne dans l'une des classes, ou est-ce possible ?

 
Je me suis rendu compte que je pouvais sauvegarder la carte de regroupement et continuer le travail, mais je n'arrive pas à trouver comment. J'ai cependant trouvé un livre sur R.
Классификация, регрессия и другие алгоритмы Data Mining с использованием R
  • Шитиков В. К., Мастицкий С. Э.
  • ranalytics.github.io
Описана широкая совокупность методов построения статистических моделей классификации и регрессии для откликов, измеренных в альтернативной, категориальной и метрической шкалах. Подробно рассматриваются деревья решений, машины опорных векторов с различными разделяющими поверхностями, нелинейные формы дискриминантного анализа, искусственные...
 
Voici ce que j'ai trouvé ici

1. La façon de traiter les objets kmeans n'est pas immédiatement claire. La chose la plus simple à faire est de l'attacher à votre cadre de données :
 k = kmeans(data, centers = 7)
 data = k$cluster
Vous avez maintenant le numéro de cluster comme colonne dans le data.frame. Sauvegardez, comme vous le feriez pour le data.frame.

2. Aide à l'étude des valeurs (kmeans), les centres vous indiqueront où se trouve le centre du milieu. Pour les données entrantes, calculez de quel centre elles sont les plus proches. Exemple :

data(mtcars)
mt.k <- kmeans(mtcars, centers = 4)
mt.k$centers

Et je ne comprends pas comment faire rouler les résultats dans une colonne particulière ?

k означает сохранение результатов кластеризации для последующего использования
k означает сохранение результатов кластеризации для последующего использования
  • 2015.03.13
  • Soumajit 13 мар '15 в 14:55 2015-03-13 14:55
  • stackru.com
Я изучаю r среду программирования для выполнения кластерного анализа моих тестовых данных. Для тестирования я использую набор данных из одного столбца со следующей диаграммой рассеяния и гистограммой, построенной по отношению к индексу значений. Из данных я чувствую, что значения могут быть разделены на 7 кластеров. И когда я использую Функция...
 

Cette image montre les mêmes prédicteurs que précédemment, mais la taille de l'échantillon est différente et, plus important encore, de nouveaux prédicteurs ont été ajoutés.

Et c'est ainsi qu'il faut l'interpréter : la propension au surentraînement ?

 

Je vais ajuster élégamment toutes les courbes en utilisant le clustering. Contact

Je ne comprends pas pourquoi un algorithme aussi rudimentaire se lance presque immédiatement dans la recherche de nouvelles données.

Je blâme l'arbre de recyclage. Je veux utiliser boosta, mais je n'arrive pas à le transférer rapidement vers mql.

 

Ouf... voici la réponse.

si vous entraînez un modèle pour une période donnée et que vous regardez ensuite les acuras sur les données d'une autre période (nouvellement regroupées), alors pour l'arbre ce sera :

TRAIN DATA:  1.0   0.8541666666666666
NEW DATA:  0.1 8323586744639375 Fuuuuuuu

trane est l'ensemble de données de formation + l'ensemble de données de validation

Un nouvel ensemble de données est généralement constitué de nouvelles données sur de nouveaux clusters. L'arbre fonctionnait bien sur la validation, mais sur les nouveaux, il échoue.


Voir catbust sur les mêmes données :

TRAIN DATA:  0.9304589707927677   0.8916666666666667
NEW DATA:  0.8528265107212476

Quelle est la différence ?

vous ne savez pas ce qui se passe tant que vous ne l'avez pas vérifié étape par étape.

J'avais raison de blâmer l'arbre. Je pensais qu'il pouvait gérer une tâche aussi simple, mais non.

l'analyse de la poussière de chat...

 
Maxim Dmitrievsky:

Ouf... voici la réponse.

si vous entraînez un modèle pour une période donnée et que vous regardez ensuite les acuras sur les données d'une autre période (nouvellement regroupées), alors pour l'arbre ce sera :

trane est l'ensemble de données de formation + l'ensemble de données de validation

Un nouvel ensemble de données est généralement constitué de nouvelles données sur de nouveaux clusters. L'arbre fonctionnait bien sur la validation, mais sur les nouveaux, il échoue.


Voir catbust sur les mêmes données :

Quelle est la différence ? Parsing the catbust...

Il faut un certain temps pour comprendre ce qui se passe, jusqu'à ce que vous vérifiez tout étape par étape.

J'avais raison de blâmer l'arbre.
Maintenant, donnez-moi des photos des montagnes. Au fait, comment c'était là-haut dans les montagnes ? Où étais-tu ?
 
Ilnur Khasanov:
Maintenant, donnez-moi des photos des montagnes. Au fait, comment c'était là-haut dans les montagnes ? Où étais-tu ?

Altai... Je n'y suis pas allé au dernier moment, je ne voulais pas y aller).

Au fait, tu t'y connais en matière de "plus" ?