Galateo del mercato o buone maniere in un campo minato - pagina 58

 
gpwr >> :

Credo che tu mi abbia di nuovo frainteso.

Non capisco davvero come farete a influenzare i coefficienti di questo polinomio per trovare l'errore minimo globale (cioè l'apprendimento). Vi mostro i pesi del neurone addestrato:


Tre esperimenti sullo stesso vettore. L'esperienza più a destra è stata quella di maggior successo. Cioè, capisco che avendo una topologia pronta, non è difficile (teoricamente) scegliere un tale polinomio che appianerebbe questa topologia abbastanza bene, ma spiegami, come farai a calcolare questa topologia (mesh già allenata) per una non allenata? In altre parole - qual è l'algoritmo per influenzare il kf, portando ad una riduzione della funzione di errore di apprendimento? Lo conosci?

 
Neutron >> :

Costruito appositamente per te:

Si vede chiaramente che la FZ è sempre presente ed è visivamente visibile sui movimenti bruschi del kotir.

Sergey, non discuterò più questo argomento con te, perché è banale e completamente inutile. Imparate la matematica, e la prossima volta che vi viene in mente la prossima idea super-duper brillante, per la cui realizzazione pensate di aver bisogno di uno o due istituti di ricerca e un cluster di PC, pensate un attimo - forse semplicemente non sapete o non capite. Dopotutto, è più probabile della "scoperta epocale", nella zona in cui avete a lungo calpestato tutto prima.


OK, considerate che il ritardo di fase (questo è il termine) esiste per due casi



Francamente, e tu mi annoi :o)

 
HideYourRichess >> :

Sono sorpreso di vedere un algoritmo che dimostra proprio questo 80%. Sto cercando un errore. Sembra molto semplice. Non funziona così.

nessuna sorpresa se io, che non sono un matematico, l'ho azzeccata, quindi che dire di un professionista! :о)))

 

al neutrone


C'è un ritardo di fase tra High/Low e Close? :о))) Quindi, secondo il vostro metodo visivo, ce n'è uno:




Da dove può venire?


Correzioni e aggiunte: finché nessuno sta guardando, farò piccole correzioni. Ho fatto un piccolo errore nella fretta, nella - foto sopra Open e Close. Un segnale è ritardato rispetto all'altro, ma in questo caso particolare non si tratta di uno spostamento di fase.


Non c'è ritardo di fase. Non è stato eseguito nessun operatore matematico che possa causare uno spostamento. Non c'è uno spostamento di fase che appare all'improvviso. Invece, c'è una scelta di processo, una regola che dice "questo è il processo".


Se lo "spostamento" è considerato in termini di Open che va per primo e Close che va per secondo, allora sì - c'è uno "spostamento" (non ho intenzione di discutere contro questo). Ma non so nemmeno quali metodi matematici possano "trovare" lo spostamento in questo caso particolare. Questi segnali sono alternativi l'uno all'altro.




E per scegliere Close per la previsione, è necessario avere un sistema incredibilmente accurato. E per la mia semplice idea, che tra l'altro è molto "robotica", nessun ritardo (H+L)/2 avrà alcun effetto.


PS: Gesù, Seryoga Seryoga, - questi processi sono monopenici, assolutamente. Ora è tutto, addio. Buona fortuna

 

al neutrone

Mentre aspetto il nuovo Matkad, sto ripetendo quello che ho imparato, cioè sto pasticciando con il singolo strato. Mi hai chiesto di mostrare la lunghezza del vettore di errore, e questo è quello che ho ottenuto:


Statistiche X, lunghezza L (se ho capito bene).

Calcolato nel modo seguente:


Qui i è il ciclo sulla statistica X è il vettore di input (sommato su tutta la lunghezza del vettore di allenamento corrente). Il quadrato dell'errore è accumulato durante l'intera epoca insieme al quadrato del vettore di addestramento:


E alla fine di un'epoca, si conta come segue:


Qui n è il ciclo su epoche.

È tutto fatto correttamente?

 

A giudicare dalla figura, c'è un errore da qualche parte - dovremmo vedere un apprendimento graduale della rete (diminuzione della lunghezza del vettore di errore) mentre ci spostiamo da un'epoca all'altra. Questo non è visibile. Le ragioni, come sempre, potrebbero essere un carro e un piccolo carrello. Per esempio, invece della grandezza del vettore di errore dall'epoca, il grafico mostra quella grandezza per la rete già addestrata (ultima epoca) in funzione del numero di esperimenti indipendenti... Segue dal suo - "Per X statistiche..." - quali statistiche? Non è che dobbiamo scriverlo qui. E questo - "...per lunghezza L", - L è normalizzato alla lunghezza del vettore dati e deve trovarsi vicino a 1, diminuendo gradualmente verso la fine della circonferenza... Noi vediamo qualcosa di diverso.

Qui, date un'occhiata a come dovrebbe essere:

Qui, il blu mostra la lunghezza del vettore di errore sul campione di allenamento (stiamo guardando come la griglia è addestrata, non come predice). Tutto sommato abbiamo usato 200 epoche di allenamento e k=1 per chiarezza, per mostrare che in questo caso particolare la rete è completamente addestrata (l'errore è zero) e semplicemente memorizza il campione di allenamento a memoria. È ancora più veloce. Il problema è che sul campione di prova con tali pesi il nostro sommatore mostrerà il tempo in Africa, cioè è completamente privato della capacità di generalizzazione. Le linee rosse nella figura mostrano la varianza (dispersione) di una serie di esperimenti (n=50), mentre la linea blu mostra la media (io compilo statistiche, ma in modo diverso da voi e ne parlerò più avanti).

Le tue ultime due espressioni sono quasi corrette, tranne che non dovrebbe esserci un indice sulla statistica (fai solo UN esperimento e hai bisogno di un nuovo codice, senza una serie di statistiche), e non capisco la prima equazione. Da dove viene? Ho un blocco simile che assomiglia a questo:

Dove j, è il ciclo sul vettore di addestramento. Notate che i miei indici sono notevolmente più piccoli quando l'indice è al quadrato!

P.S. A proposito, ho rinunciato a usare la funzione squeeze per i pesi, prima per il monostrato e poi per il doppio strato. Senza, i risultati sono altrettanto buoni e il fastidio è minore.

 
grasn >> :

non è una sorpresa se io, non un matematico l'ho capito, quindi parliamo di un professionista! :о)))


L'ho capito. Quello che facevo io potrebbe essere considerato una versione primitiva di AR, o viceversa, AR potrebbe essere considerato una versione migliorata di quello che facevo io.

 
Neutron >> :

Le tue ultime due espressioni sono quasi corrette, tranne che non ci dovrebbe essere un indice sulle statistiche (stai facendo solo UN esperimento e hai bisogno di nuovo codice, senza una serie di statistiche), ma non capisco la prima equazione. Da dove viene? Ho un blocco simile che assomiglia a questo:

Dove j, è il ciclo sul vettore di addestramento. Notate che i miei indici sono notevolmente più piccoli quando l'indice è al quadrato!

P.S. A proposito, ho rinunciato a usare la funzione squeeze per i pesi, prima per il monostrato e poi per il doppio strato. Senza, i risultati sono altrettanto buoni e il fastidio è minore.

La prima equazione sta calcolando la lunghezza del vettore degli errori e la normalizza alla lunghezza del vettore dei dati (cioè il modo in cui l'ho capito finora) La ragione è probabilmente che ho davvero bisogno di nuovo codice senza set di statistiche. Lo farò ora.

Per quanto riguarda la funzione di compressione, non mi ha funzionato subito (cioè il risultato non era ovvio), quindi non l'ho usata.

 
paralocus писал(а) >>

La prima equazione consiste nel calcolare la lunghezza del vettore degli errori e normalizzarla per la lunghezza del vettore dei dati (cioè il modo in cui l'ho capito finora)

Cosa rappresentano allora le ultime due espressioni?

Pensavo che il secondo fosse trovare i quadrati delle lunghezze dei vettori e il terzo trovare la lunghezza normalizzata. Se sì, perché la prima espressione?

 
HideYourRichess >> :

Ho capito tutto. Quello che ho fatto io può essere considerato una versione primitiva di AR, o viceversa, AR può essere considerato una versione migliorata di quello che ho fatto io.

Non ho incluso l'identificazione del modello, cioè la definizione ottimale della lunghezza del campione e dell'ordine del modello. Con quelli, penso che sia possibile arrivare al 90%. Non ho alcun dubbio che i vostri risultati saranno altrettanto buoni, e anche migliori. ;)