Riunire un team per sviluppare un IO (albero delle decisioni/foresta) in relazione alle strategie di tendenza - pagina 12

 
Se accade un miracolo e la squadra si riunisce, dovremo scegliere un algoritmo di apprendimento e un metodo per valutare il modello.
 
Roffild:
Se accade un miracolo e la squadra si riunisce, dovremo scegliere un algoritmo di apprendimento e un metodo per valutare il modello.

Posso rosicchiare un gruppo di riflessione.

 
Aleksey Vyazmikin:

...dovrò pensare a un sito alternativo. Forse qualcuno ne conosce uno simile? Sto pensando a qualcosa come una bacheca dove si possono condividere immagini e modificarle in qualche modo, una chat room separata, e qualcosa come un serbatoio di idee intelligenti...

Per esempio. Hanno anche un repository per condividere il codice. Hanno anche un'applicazione mobile. Imho, un servizio molto utile.

Trello
Trello
  • trello.com
Выбросьте длинные цепочки электронных писем, устаревшие таблицы, не такие уж и клейкие стикеры и неуклюжие программы для управления проектами. Trello помогает увидеть все детали проекта с первого взгляда. Зарегистрироваться – Это бесплатно.
 
Roffild:

Per valutare la qualità del modello (rete o foresta), si usano i valori di errore MSE, OOB, ecc.

Ma a differenza del riconoscimento delle immagini, dove un essere umano è il campione di verifica , è molto difficile fare un tale campione per un grafico dei prezzi. Quindi la stima di un modello di prezzo tramite MSE, OOB, ecc. è spesso mal interpretata.

Non esiste una definizione chiara di "overfitting" del modello.

Così ho smesso di controllare il modello tramite MSE, OOB, ecc.

Ora preferisco sovrapporre il risultato della formazione al grafico dei prezzi per vedere il quadro completo.

Ecco il mio metodo per valutare la qualità del modello (ho già postato questa foto):


IMHO, ciò di cui c'è bisogno non è un'immagine, ma metriche oggettive e quantitative, e se stiamo parlando di una valutazione comprensibile al consumatore della qualità dei modelli per il trading, allora si può misurarli dalla produttività del segnale, per esempio.


 
Dennis Kirichenko:

Per esempio. Un repository per la condivisione del codice è anche collegato. Hanno anche un'applicazione mobile. Imho, un servizio molto utile.

Hm... grazie per la dritta, servizio molto interessante. Usate la versione gratuita? Potete collegare tutte le estensioni che volete?

 
Roffild:

Ora preferisco sovrapporre il risultato della formazione al grafico dei prezzi per vedere il quadro completo.

Ecco il mio metodo per valutare la qualità del modello (ho già postato questa foto):

Dimmi come leggere questo grafico nel seminterrato. Hai quanti target ci sono (vedo solo una divergenza di 4 punti - 4 target?), ho capito bene che le previsioni avvengono all'inizio della barra (allora perché l'apertura non corrisponde o sto leggendo male il grafico?) di una barra?

La visualizzazione è utile per il processo di pensiero, ma senza esprimere queste divergenze in numeri è impossibile automatizzare il processo di stima del modello per la stessa funzione di fitness.

 
Roffild:
Se accade un miracolo e la squadra si riunisce, dovrete scegliere un algoritmo di apprendimento e un metodo per valutare il modello.

Sei nella squadra o no?

 
Алексей Тарабанов:

Posso fare un gruppo di riflessione.

Ok, mettiamola così...

 
Dennis Kirichenko:

Per esempio. Un repository per la condivisione del codice è anche collegato. Hanno anche un'applicazione mobile. Imho, un servizio molto utile.

Grazie, dovrò studiare il servizio. Oppure date un'occhiata ai progetti esistenti basati su di esso.

 

Condividerò i miei pensieri sulla valutazione dei modelli MoD.

Non so se esiste un erbario in MO, ma continuerò ad usarlo. Nel caso in cui qualcuno non capisca, un erbario è una collezione di buone foglie di alberi, e da un albero si possono raccogliere una foglia o molte. Questo modello ha uno svantaggio quando si vota - il numero di foglie che descrivono un fenomeno (target) in diversi momenti del tempo sarà diverso, cioè se rappresentiamo il campionamento come un campo, risulta che le foglie sono sparse in diversi set sul campo, il che influisce sulla qualità del voto. Quindi penso che per stimare questo modello (il metodo funziona per le foreste ma è più primitivo, l'enfasi dovrebbe essere messa solo sulla capacità predittiva sul campo) è necessario presentare ogni foglia (albero) come uno strato, sovrapporre questi strati uno sull'altro e dove le foglie si sovrappongono calcolare la capacità predittiva media aggiungendo il fattore che influenza il prodotto a seconda del numero di foglie (non necessario per le foreste), poi guardare sulla mappa risultante e stimare la sua uniformità. Una tale mappa può essere valutata in diversi modi, aggiungendo il terzo spazio - per vertici, o usando il metodo della mappa di Kohonen - per colore - per chiarezza, e per trovare la media complessiva e l'RMS di questa mappa. Allora possiamo vedere la qualità del modello, quanto è forte il suo potere predittivo su tutto il campione, non solo sull'aggregato. Tale stima potrebbe aiutare la funzione di fitness a cercare aree di miglioramento delle foglie/alberi del campione con un basso potere predittivo medio.

Cosa ne pensate?

O non mi sono ancora spiegato bene?