L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2832

 
Aleksey Nikolayev #:

La prima cosa che mi viene in mente è dividere lo spazio in una griglia con celle né troppo grandi né troppo piccole (la dimensione è determinata dal modello di rumore). Si inizia con una cella (scelta a caso, per esempio) - alcuni punti in essa determinano la direzione del gradiente della funzione smussata e si passa alla cella successiva, ecc. fino a quando non ci sono transizioni o loop. La posizione dell'estremo viene impostata con precisione in base alle dimensioni della cella, quindi non deve essere troppo grande, ma allo stesso tempo deve dare la possibilità di smussare, quindi non è troppo piccola. Dobbiamo accettare il fatto che in linea di principio non esiste una posizione esatta dell'estremo, poiché essa varia a seconda del metodo di lisciatura.

Sembra un sacco di lavoro).

 

L'imbottitura tra R e la sedia è troppo sottile.

un'altra fantasia non realizzata

 

Perché cancelli i post, paranoico? Per non essere punzecchiato di nuovo per esserti messo nei guai? :)

Quante volte puoi sbagliare così?

 
Maxim Dmitrievsky #:

Avete realizzato un grande progetto in R e lo avete messo sul server. E chi lo manterrà? Nessuno, perché non ci sono specialisti in questo campo e nessuno vuole imparare R per una statistica.

E per quanto riguarda python, assumete uno studente qualsiasi per una salsiccia e sarete a posto.


Chi ha bisogno di studenti con un bastone di salsiccia?

Servono studenti che conoscano la statistica, il MOE, che richiede 5 anni di studio. E poi è ancora auspicabile lavorare in un'organizzazione specializzata. E R o Python possono essere insegnati in una settimana, dato che tutti questi studenti-statistici conoscono il C++.

Ma per le persone che NON hanno studiato statistica per 5 anni, R è molto più utile di Python, poiché in R è necessario solo ciò che serve, tutto viene masticato, documentato....., poiché si tratta di un linguaggio specializzato.

 
СанСаныч Фоменко #:

Chi ha bisogno di studenti con un bastone di salsiccia?

Abbiamo bisogno di studenti che conoscano la statistica, il MOE, che richiede 5 anni di studio. E poi è auspicabile lavorare in un'organizzazione specializzata. E R o Python possono essere insegnati in una settimana, dato che tutti gli studenti-statistici conoscono il C++.

Ma per le persone che NON hanno studiato statistica per 5 anni, R è molto più utile di Python, poiché in R è necessario solo ciò che serve, tutto viene masticato, documentato....., poiché si tratta di un linguaggio specializzato.

Credetemi, uno studente imparerà la statistica in 5 giorni per una salsiccia, e anche molte altre cose.

La condizione principale per il successo è che lo studente sia affamato.

mentre stiamo parlando della stessa cosa da mesi e anni.

 

Perché discutere della correttezza dell'ottimizzazione? Locale, globale - non mi interessa.


La domanda di Dick è puramente teorica e non ha alcun valore pratico, perché anche gli estremi trovati molto correttamente si riferiscono al PASSATO e con l'arrivo di una nuova barra ci saranno quasi sempre nuovi estremi, a noi sconosciuti. Ricordiamoci del tester. Trova gli estremi. E che cosa? Un optimum del tester non ha valore se non si considera che vivrà in futuro. Ma la durata di vita di un ottimo non ha nulla a che vedere con la correttezza e l'esattezza di trovare questo ottimo, di cui scrive Dick.

 
Maxim Dmitrievsky #:

Credetemi, uno studente imparerà la statistica in 5 giorni per una salsiccia, e molte altre cose lungo il percorso.


La statistica viene insegnata per 5 anni, e non tutti possono esserlo, vengono selezionati appositamente agli esami di ammissione.

 
СанСаныч Фоменко #:

La statistica viene insegnata per 5 anni, e non tutti possono esserlo, vengono selezionati appositamente agli esami di ammissione.

Se si omettono i dettagli e si fornisce un problema applicato dal mondo reale, il processo sarà più veloce.

La maggior parte degli errori nella formazione si verifica quando una persona non capisce perché è necessaria e non l'ha mai incontrata nella sua vita. Non vedono l'obiettivo finale.

 

Qualcuno può dirmi come creare una metrica personalizzata per catboost, ho bisogno di Sharp.

Il risultato dell'addestramento del modello con la mia versione è quasi lo stesso di RMSE, quindi c'è un errore da qualche parte nel codice.

preds e target sono return (a[i]-a[i+1])

class Sharpe(object):
    def get_final_error(self, error, weight):
        return error

    def is_max_optimal(self):
        return True

    def evaluate(self, approxes, target, weight):
        assert len(approxes) == 1
        assert len(target) == len(approxes[0])
        preds = np.array(approxes[0])
        target = np.array(target)
        data = [i if i > 0 else -1*i for i in preds]
        sharpe = np.mean(data)/np.std(preds)
        return sharpe, 0

model = CatBoostRegressor(learning_rate=0.1, n_estimators=2000, eval_metric=Sharpe()) 
 
СанСаныч Фоменко vita di un ottimo non ha NULLA a che vedere con la correttezza e l'esattezza di trovare quell'ottimo di cui scrive Dick.

il mio cognome non è declinato.
la questione non è se l'ottimo globale cambierà o meno (cambierà per forza), ma se è in grado di trovare un estremo globale. se non vi interessa, potete semplicemente inizializzare i pesi della rete con numeri casuali e il gioco è fatto, perché che differenza fa se è globale o meno? locale))