L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1921

 
mytarmailS:

Non capisco, volete ottenere le pro-forma risultanti nelle regole da trasferire a mcule?

Naturalmente, altrimenti come potrei applicare il modello dopo? :)

 
Aleksey Vyazmikin:

Naturalmente, altrimenti come potrei applicare il modello in seguito? :)

)))))) bene riscrivere tutti gli algoritmi con R in µl e poi ottenere tutte le trasformazioni in regole in µl ))

 
mytarmailS:

)))))) bene riscrivere tutti gli algoritmi con R in µl e poi ottenere tutte le trasformazioni in regole in µl ))

Mi sono reso conto che questo tipo di clustering non crea regole che possono riprodurre il risultato senza ripetere il clustering. E il clustering è troppo lento. Quindi, abbiamo bisogno di creare regole attraverso la costruzione di alberi, che divideranno i risultati del clustering in classi appropriate secondo alcune caratteristiche.

Quindi la domanda rimane - come salvare in csv la stringa appartenente ad ogni classe?


Anche se è strano, perché non continuare il clustering con i dati già esistenti e definire nuove stringhe in una delle classi, o è possibile?

 
Sto lottando - mi rendo conto che potrei salvare la mappa di clustering e andare avanti con il lavoro, ma non riesco a capire come. Ma ho trovato un libro su R.
Классификация, регрессия и другие алгоритмы Data Mining с использованием R
  • Шитиков В. К., Мастицкий С. Э.
  • ranalytics.github.io
Описана широкая совокупность методов построения статистических моделей классификации и регрессии для откликов, измеренных в альтернативной, категориальной и метрической шкалах. Подробно рассматриваются деревья решений, машины опорных векторов с различными разделяющими поверхностями, нелинейные формы дискриминантного анализа, искусственные...
 
Ecco cosa ho trovato qui

1. Non è immediatamente chiaro come trattare gli oggetti kmeans. La cosa più semplice da fare è attaccarlo al vostro frame di dati:
 k = kmeans(data, centers = 7)
 data = k$cluster
Ora avete il numero del cluster come colonna in data.frame. Salva, come salveresti il data.frame.

2. Studiate l'aiuto di Value (kmeans), i centri vi diranno dove si trova il centro del centro. Per i dati in arrivo, calcola a quale centro è più vicino. Esempio:

data(mtcars)
mt.k <- kmeans(mtcars, centers = 4)
mt.k$centers

E non capisco come arrotolare i risultati in una colonna particolare?

k означает сохранение результатов кластеризации для последующего использования
k означает сохранение результатов кластеризации для последующего использования
  • 2015.03.13
  • Soumajit 13 мар '15 в 14:55 2015-03-13 14:55
  • stackru.com
Я изучаю r среду программирования для выполнения кластерного анализа моих тестовых данных. Для тестирования я использую набор данных из одного столбца со следующей диаграммой рассеяния и гистограммой, построенной по отношению к индексу значений. Из данных я чувствую, что значения могут быть разделены на 7 кластеров. И когда я использую Функция...
 

Questa immagine mostra gli stessi predittori di prima, ma la dimensione del campione è diversa e, cosa più importante, sono stati aggiunti nuovi predittori.

E questo è il modo di interpretarlo - la propensione al sovrallenamento?

 

Aggiusterò elegantemente qualsiasi curva usando il clustering. Contatta

Perché un algoritmo così rozzo inizia a versare nuovi dati quasi immediatamente è al di là di me

Io do la colpa all'albero della riqualificazione. Voglio usare boosta, ma non riesco a trasferirlo rapidamente su mql.

 

Uff... ecco la risposta

se si allena un modello per un periodo di tempo e poi si guarda acuras sui dati per un altro (appena clusterizzato), allora per l'albero sarà:

TRAIN DATA:  1.0   0.8541666666666666
NEW DATA:  0.1 8323586744639375 Fuuuuuuu

trane è il set di dati di addestramento + il set di dati di convalida

Il nuovo set di dati è generalmente nuovi dati su nuovi cluster. Anche se l'albero ha funzionato bene sulla convalida, ma sui nuovi non riesce.


Vedi catbust sugli stessi dati:

TRAIN DATA:  0.9304589707927677   0.8916666666666667
NEW DATA:  0.8528265107212476

Qual è la differenza?

non sai cosa sta succedendo finché non lo controlli passo dopo passo.

Avevo ragione a dare la colpa all'albero. Pensavo che potesse gestire un compito così semplice, ma no.

analizzando il catbusto...

 
Maxim Dmitrievsky:

Uff... ecco la risposta

se si allena un modello per un periodo di tempo e poi si guarda acuras sui dati per un altro (appena clusterizzato), allora per l'albero sarà:

trane è il set di dati di addestramento + il set di dati di convalida

Il nuovo set di dati è generalmente nuovi dati su nuovi cluster. Anche se l'albero ha funzionato bene sulla convalida, ma sui nuovi non riesce.


Vedi catbust sugli stessi dati:

Che differenza c'è? Parsing the catbust...

Ci vuole un po' di tempo per capire cosa sta succedendo, finché non si controlla tutto passo dopo passo

Avevo ragione a dare la colpa all'albero.
Ora dammi qualche foto delle montagne. A proposito, com'era lassù in montagna? Dove sei stato?
 
Ilnur Khasanov:
Ora dammi le foto delle montagne. A proposito, com'era lassù in montagna? Dove sei stato?

Altai... Non sono andato all'ultimo momento, non volevo andare).

a proposito, sai qualcosa dei plus?