L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3178

 
Forester #:
Non sarebbe sufficiente mescolare la colonna con quella di destinazione?
La coda e gli altri parametri della serie rimarranno invariati. Penso che questo sia un vantaggio.

Non è nemmeno un male. Probabilmente è meglio provare entrambi i metodi. Se ci sono molti outlier nei tratti (code pesanti), i risultati potrebbero essere diversi, il che potrebbe fornire ulteriori informazioni.

 
Aleksey Vyazmikin #:

Il problema dei settari è la paura di mettere alla prova i loro principi religiosi.

Ci sono sempre molti modelli: si tratta di scegliere quello giusto.

Almeno io ci ho provato.

 
Aleksey Vyazmikin #:

Puoi spiegarmi meglio - non capisco.

Un compito noto privo di significato può essere ottenuto semplicemente mescolando casualmente le etichette (o generandole casualmente con probabilità pari alla frequenza delle classi).

L'idea è sempre la stessa: ottenere un ampio campione dai risultati di un gran numero di problemi intenzionalmente privi di significato da confrontare con il risultato del problema reale. Se il risultato reale non si trova nella coda di questo campione, il metodo è piuttosto scadente.

 
Maxim Dmitrievsky #:

Almeno ci ho provato.

Capite, per quale motivo in CatBoost c'è la possibilità di utilizzare diversi metodi di quantificazione degli indicatori dei predittori?

Pensate che semplicemente i programmatori abbiano lasciato questa possibilità a chi non ha abbastanza memoria operativa?

Oppure gli sviluppatori si rendono conto che il risultato della formazione dipende direttamente da queste tabelle?

E alla fine, prendete voi stessi, riorganizzate le impostazioni delle tabelle e osservate la variabilità del risultato.

Allora penserete perché questo accade e forse comincerete a capirmi meglio.


E tutte le affermazioni nello stile di un predicatore/profeta/giuradico non sono informative. Le interpreto come un desiderio di mettere in mostra la mia persona.

 
Aleksey Nikolayev #:

È possibile ottenere un compito privo di significato semplicemente mescolando le etichette in modo casuale (o generandole in modo casuale con probabilità pari alla frequenza delle classi).

L'idea è la stessa: ottenere un ampio campione dei risultati di un gran numero di compiti ovviamente privi di significato da confrontare con il risultato del compito reale. Se il risultato reale non si trova nella coda di questo campione, il metodo è piuttosto scadente.

Forse è meglio "mescolare" per preservare la proporzione di zeri e di uno.

 
Aleksey Vyazmikin #:

Capite perché CatBoost ha la possibilità di utilizzare diversi metodi per quantificare i punteggi dei predittori?

Pensate che i programmatori abbiano semplicemente lasciato questa possibilità a chi non ha abbastanza memoria operativa?

Oppure gli sviluppatori si rendono conto che il risultato dell'allenamento dipende direttamente da queste tabelle?

E alla fine, prendete voi stessi, riorganizzate le impostazioni delle tabelle e osservate la variabilità del risultato.

Allora penserete al perché di questa situazione e forse comincerete a capirmi meglio.


E tutte le affermazioni nello stile di un predicatore/profeta/giuradico non sono informative. Sono interpretate da me come un desiderio di mettere in mostra la propria persona.

Si suggerisce di chiedere agli sviluppatori del loro carrello, perché io non so cosa facciano.
 
Maxim Dmitrievsky #:
Si suggerisce di chiedere agli sviluppatori nel loro carrello

Non farlo. Nel caso in cui rispondano in modo errato)

 
Aleksey Nikolayev #:

Non farlo. In caso di risposta errata)

😁😁
 
Maxim Dmitrievsky #:
Si suggerisce di chiedere agli sviluppatori nel loro carrello, poiché non so cosa stiano facendo.

Chiedetelo a loro, visto che non capite.

Inoltre, alcuni booster fanno la quantizzazione del predittore dopo ogni split, quantizzando il resto.

Beh, non sono l'unico a usarla, anche i concorrenti a volte menzionano il lavoro in questa direzione.

In ogni caso, non voglio forzarvi oltre.

 
Aleksey Vyazmikin #:

Chiedete se non capite.

Inoltre, alcuni booster quantizzano il predittore dopo ogni split, quantizzando il resto.

Beh, non solo io lo uso, ma anche i partecipanti ai concorsi a volte menzionano il lavoro in questa direzione.

In ogni caso, non voglio forzarvi oltre.

e perché dovrei chiederlo, se la conversione da flotte a ints è necessaria principalmente per l'accelerazione su dati molto grandi

Il bonus può essere una piccola calibrazione del modello in meglio o in peggio, guarda caso.

ti daranno solo la stessa risposta, quindi probabilmente hai paura di chiedere perché svaluterebbe tutti i tuoi anni di duro lavoro :)

è frugare nella biancheria intima dell'algoritmo.