Apprendimento automatico e Reti Neurali - pagina 14

 

Lezione 22: Orientamento esterno, recupero di posizione e orientamento, regolazione del fascio, forma dell'oggetto



Lezione 22: Orientamento esterno, recupero di posizione e orientamento, regolazione del fascio, forma dell'oggetto

La conferenza esplora il concetto di orientamento esterno nella fotogrammetria, in cui la posizione e l'orientamento delle telecamere sono determinati in un ambiente 3D. Il docente discute vari metodi per risolvere problemi legati all'orientamento esterno, come il recupero della posizione e dell'orientamento di un oggetto utilizzando la regola del triangolo dei segni e la regola del coseno. Il video esplora anche l'uso di cilindri e mesh generalizzati per rappresentare oggetti 3D e allinearli nella visione artificiale. Il docente introduce anche l'immagine gaussiana estesa, un metodo di mappatura per oggetti convessi di forma arbitraria in una sfera unitaria, e ne spiega i limiti nella gestione di oggetti non convessi. Inoltre, il video tocca l'ottimizzazione non lineare e la sua applicazione nella creazione di modelli 3D accurati per la fotogrammetria.

La conferenza discute la parametrizzazione delle curve e il calcolo della curvatura in entrambi gli scenari 2D e 3D. In 2D, una curva convessa chiusa può essere rappresentata su una circonferenza unitaria dall'angolo eta e da una densità proporzionale alla curvatura, che è l'inverso del raggio della curva. La conferenza dimostra come integrare eta e utilizzare le equazioni xy per ottenere l'oggetto convesso per l'immagine circolare ed estende la rappresentazione ad altre forme come le ellissi. In 3D, viene introdotto il concetto di mappatura di Gauss per connettere i punti su una superficie ai punti su una sfera unitaria, e la curvatura delle superfici viene discussa con la curvatura gaussiana come conveniente singola quantità scalare che misura la curvatura. La conferenza si conclude con una discussione sul rapporto tra due aree, k e g, e su come si relaziona alla curvatura di una sfera.

  • 00:00:00 In questa sezione viene discusso il concetto di orientamento esterno in fotogrammetria. Viene dimostrato attraverso un drone dotato di telecamera che sorvola un terreno con un modello dettagliato. L'orientamento esterno comporta la determinazione di dove si trova la telecamera del drone e da quale angolo vede gli oggetti nell'ambiente 3D. Ciò richiede sei gradi di libertà, di cui tre per il movimento rotatorio e tre per la traslazione. Il modello richiede tre o più punti nei dati dell'immagine per fornire vincoli sufficienti per risolvere il problema.

  • 00:05:00 In questa sezione, il docente spiega come trovare la lunghezza delle gambe del treppiede per determinare R1, R2 e R3. Costruendo raggi e calcolando angoli, le uniche incognite sono le lunghezze dei tre bastoncini. Una volta trovate queste lunghezze, P0 può essere scoperto intersecando le tre sfere. Esiste il potenziale di ambiguità nella soluzione, ma questo può essere risolto utilizzando un'immagine speculare o l'ordine ciclico delle immagini. Il docente spiega che i libri erano pieni di formule per risolvere questo problema, ma ora questo processo può essere realizzato attraverso l'aggiustamento del pacchetto.

  • 00:10:00 In questa sezione, il docente discute l'uso di diverse regole ed equazioni per risolvere problemi relativi all'orientamento esterno, vale a dire recuperare la posizione e l'orientamento di un oggetto. L'uso di queste regole era importante nella navigazione e nel rilevamento, ma oggigiorno non viene utilizzato così tanto. La regola del triangolo dei segni e la regola del coseno sono le uniche due regole necessarie, ma altre regole possono essere utili per comodità. Il problema discusso implica avere un angolo e una distanza in un triangolo e risolvere r1 e r2 usando tre equazioni non lineari. Una volta trovata la posizione del piano, è possibile costruire vettori per determinare l'orientamento dell'oggetto rispetto al sistema di coordinate del suolo. I metodi dei minimi quadrati e RANSAC possono essere utilizzati anche per trovare soluzioni e trattare valori anomali.

  • 00:15:00 In questa sezione, il docente discute l'orientamento esterno delle telecamere e come mettere in relazione i tre vettori nel sistema di coordinate della telecamera con quelli nel sistema di coordinate del mondo attraverso una matrice di rotazione. Il docente spiega che possiamo rappresentare questo sistema di equazioni come un'equazione di matrice 3x3 da risolvere per la matrice di rotazione, che possiamo rappresentare come una matrice ortonormale. Se abbiamo più corrispondenze, possiamo usare i minimi quadrati per minimizzare l'errore nel piano dell'immagine per ottenere una soluzione più accurata. Il docente cita anche come questo metodo possa essere utilizzato per la regolazione del fascio, che coinvolge più telecamere che catturano lo stesso oggetto o scena da posizioni diverse, e come fornisce una soluzione al problema correlato che coinvolge centinaia di telecamere.

  • 00:20:00 In questa sezione, il relatore discute il problema dell'ottimizzazione non lineare in fotogrammetria e le sue soluzioni attraverso metodi come Levenberg Markart. In questa ottimizzazione, ci sono parametri sconosciuti dell'ambiente come i punti nell'ambiente, la posizione delle telecamere, le proprietà della telecamera e la distorsione radiale. Utilizzando molti vincoli e immagini, i ricercatori sono stati in grado di creare modelli 3D accurati di vari oggetti, a volte anche utilizzando una singola telecamera drone che sorvola un vulcano. L'oratore menziona anche punti interessanti nelle immagini, descrive una risorsa online di Lowe per identificarli e accenna brevemente alla regolazione del fascio, che è un intero settore all'interno della fotogrammetria.

  • 00:25:00 In questa sezione, il relatore discute varie rappresentazioni di oggetti 3D, inclusi poliedri e mesh. I poliedri sono relativamente facili da descrivere, ma per le superfici curve le mesh sono un'opzione migliore. Tuttavia, allineare le mesh non è molto significativo perché i vertici non hanno alcuna etichetta o significato particolare. Il relatore suggerisce di utilizzare immagini gaussiane estese, una risorsa online che può aiutare a recuperare la posizione e l'orientamento degli oggetti 3D.

  • 00:30:00 In questa sezione della videolezione, il relatore esplora il concetto di trovare una buona rappresentazione per gli oggetti nella visione artificiale che soddisfi determinate condizioni di invarianza, come la traslazione e la rotazione. Il relatore discute i limiti di alcuni tentativi di trovare una tale rappresentazione e passa ad esaminare una rappresentazione in particolare, il cilindro generalizzato. Questa rappresentazione implica prendere una forma del generatore e spostarla lungo una linea per generare forme più complicate con la proprietà che la sezione trasversale è la stessa ovunque lungo la lunghezza. L'oratore discute come questa rappresentazione soddisfi determinate condizioni di invarianza e possa aiutare con il riconoscimento e l'allineamento degli oggetti.

  • 00:35:00 In questa sezione, il docente discute l'uso di cilindri generalizzati per rappresentare oggetti e come possono essere combinati per creare un modello 3D. Tuttavia, questo metodo ha i suoi limiti, in quanto è difficile ottenere una rappresentazione univoca quando ci sono infiniti modi per descrivere lo stesso oggetto. Pertanto, la lezione ritorna ai poliedri come punto di partenza per la rappresentazione 3D, utilizzando un elenco di vertici con coordinate 3D e una struttura a grafo per descrivere le connessioni tra vertici e facce.

  • 00:40:00 In questa sezione, il relatore spiega come rappresentare un oggetto disegnando vettori unitari perpendicolari alle facce dell'oggetto e quindi moltiplicandoli per le aree. Questa rappresentazione può essere unica per oggetti convessi o poliedri complessi, purché la somma di questi vettori sia zero. Il relatore osserva che questa rappresentazione è utile per il riconoscimento e l'allineamento degli oggetti, piuttosto che per la ricostruzione. Pur essendo una prova non costruttiva, la rappresentazione non è un deterrente, come spiega il relatore.

  • 00:45:00 In questa sezione della conferenza, il relatore discute come approssimare un oggetto non poliedrico, come una forma cilindrica e conica con una parte piatta, tagliandolo a fette e costruendo un vettore unitario tenendo conto di la zona. L'oratore quindi costruisce una sfera unitaria e depone le masse nei punti corrispondenti sulla sfera, che rappresentano la superficie dell'oggetto. La superficie cilindrica corrisponde a un cerchio massimo sulla sfera, e la superficie conica corrisponde a un piccolo cerchio sulla sfera, e il piatto all'estremità corrisponde a una grande massa in un unico punto. Il relatore spiega che questa rappresentazione può essere utilizzata in vari modi per il compito da svolgere.

  • 00:50:00 In questa sezione, il docente discute l'uso della rappresentazione per allineare e riconoscere gli oggetti. La rappresentazione comporta il calcolo di una densità di orientamento per ogni oggetto, dove ogni punto sull'oggetto ha un punto corrispondente su una sfera unitaria. Il docente spiega che la rappresentazione è invariante alla traslazione e alla rotazione, rendendola di facile implementazione. La densità può essere utilizzata per determinare la curvatura, dove l'alta densità corrisponde alla bassa curvatura e la bassa densità corrisponde all'alta curvatura. Il docente introduce quindi l'immagine gaussiana estesa, che utilizza le normali di superficie per determinare il punto corrispondente sulla sfera per un dato punto sull'oggetto. Il docente suggerisce di iniziare con una versione 2D per comprendere il concetto prima di passare al 3D.

  • 00:55:00 In questa sezione viene spiegato un metodo di mappatura per oggetti convessi di forma arbitraria su una sfera unitaria. Gauss ha proposto questo metodo, che mappa un punto dall'oggetto al punto sulla sfera con la stessa direzione della normale. Questo metodo viene utilizzato perché è facile determinare il polo nord celeste o guardare dove si trova il sole e in che periodo dell'anno è misurare l'angolo. Questa mappatura è invertibile, quindi è possibile la corrispondenza tra il punto con lo stesso orientamento da una sfera a un oggetto. Tuttavia, il limite di questo metodo è che presenta alcuni problemi con oggetti non convessi.

  • 01:00:00 In questa sezione, il relatore discute la parametrizzazione di una circonferenza unitaria nel piano mediante l'angolo eta e la densità di una massa proporzionale alla curvatura. La curvatura è la velocità di rotazione di una curva chiusa convessa, che è la velocità di cambio di direzione o l'inverso del raggio della curva. La densità è l'inverso della curvatura e questa rappresentazione su un cerchio unitario è unica per una curva convessa chiusa in 2D. Il relatore spiega come dividere una curva in piccole sfaccettature che contribuiscono alla densità della curva, portando al caso continuo della rappresentazione della curva su una circonferenza unitaria. Sebbene non vi sia alcuna inversione in 3D, l'oratore illustra l'inversione e l'integrazione per spiegare ulteriormente le idee.

  • 01:05:00 In questa sezione, il docente discute l'integrazione di eta e l'uso delle equazioni x e y per ottenere l'oggetto convesso per l'immagine circolare nei casi 2D. Tuttavia, lo stesso processo non può essere utilizzato negli scenari 3D. Il docente introduce poi il concetto di baricentro della distribuzione di massa e osserva che dovrebbe essere all'origine di una curva chiusa, convessa. Spiega anche la limitazione che solo alcuni tipi di distribuzioni di massa sono legittimi. Per illustrare la teoria, il docente utilizza un esempio di cerchio di raggio r per determinare la curvatura.

  • 01:10:00 In questa sezione della lezione, il professore spiega come calcolare il raggio di curvatura di un cerchio e di qualsiasi altra forma curva, anche se non circolare. La curvatura è semplicemente l'inverso del raggio di curvatura, dove il raggio è il raggio del cerchio più adatto in una posizione specifica. Il professore dimostra come usare la matematica per rappresentare un'ellisse come un cerchio schiacciato per semplicità e spiega che ci sono molti modi diversi per rappresentare le curve matematicamente. Tuttavia, il professore osserva che questo metodo non funzionerà per determinare l'orientamento perché la simmetria è troppo ambigua.

  • 01:15:00 In questa sezione della lezione, il relatore spiega come rappresentare i cerchi in modo parametrico usando l'equazione (x/a)^2 + (y/b)^2 = 1. Dimostrano come generare un cerchio usando questo equazione, che è un modo più conveniente rispetto al tentativo di tutti i possibili valori x e y. Il relatore spiega poi come questa rappresentazione parametrica si rapporta alla Terra, che può essere vista come una sfera schiacciata in direzione verticale. Descrivono anche come mappare il cerchio sulla superficie della sfera calcolando la normale alla curva usando la differenziazione, invertendo x e y e cambiando il segno. Il passaggio finale prevede l'abbinamento della direzione normale alla direzione tangente.

  • 01:20:00 In questa sezione viene analizzata la curvatura, o uno su k, di un'ellisse rispetto a eta, l'angolo sulla circonferenza unitaria. Gli estremi, o valori massimi e minimi, si verificano a eta uguale a zero e pi maggiore di due, che corrispondono alle estremità dei semiassi. La curvatura varia continuamente e dipende dai semiassi a e b. Una volta calcolata la distribuzione continua degli estremi per un'ellisse che non è allineata con un sistema di coordinate, può essere ruotata in modo che corrisponda a un'altra ellisse per il riconoscimento dell'oggetto. Se c'è una buona corrispondenza, l'oggetto è un'ellisse; altrimenti non lo è.

  • 01:25:00 In questa sezione, il relatore discute l'applicazione dell'orientamento esterno 2D e interessanti operazioni di filtraggio che possono essere eseguite utilizzando la convoluzione sui cerchi. Tuttavia, l'obiettivo principale è l'orientamento esterno 3D e viene introdotto il concetto di mappatura di Gauss per collegare i punti sulla superficie ai punti sulla sfera unitaria in base all'orientamento normale alla superficie. Questo concetto viene esteso alle forme e viene discussa la curvatura delle superfici, con la curvatura gaussiana che è una comoda singola quantità scalare che misura la curvatura. Per le superfici convesse si considera una curvatura positiva, mentre per le superfici non convesse la curvatura è negativa.

  • 01:30:00 In questa sezione, l'oratore discute il rapporto tra due aree, k e g, che sono rispettivamente 1 su r al quadrato e r al quadrato. Il rapporto è coerente con la curvatura di una sfera, dove una sfera piccola ha una curvatura elevata, e viceversa per una sfera grande. La discussione poi tocca la curvatura gaussiana e come è intimamente legata ai calcoli che vengono fatti. Viene menzionata anche la curvatura integrale, che si applica a superfici non lisce e sarà ulteriormente discussa nella lezione seguente su come viene utilizzata nel riconoscimento e nell'allineamento.
Lecture 22: Exterior Orientation, Recovering Position & Orientation, Bundle Adjustment, Object Shape
Lecture 22: Exterior Orientation, Recovering Position & Orientation, Bundle Adjustment, Object Shape
  • 2022.06.08
  • www.youtube.com
MIT 6.801 Machine Vision, Fall 2020Instructor: Berthold HornView the complete course: https://ocw.mit.edu/6-801F20YouTube Playlist: https://www.youtube.com/p...
 

MIT 6.801 Machine Vision, autunno 2020. Lezione 23: immagine gaussiana, solidi di rivoluzione, istogrammi di direzione, poliedri regolari



Lezione 23: Immagine Gaussiana, Solidi di Rivoluzione, Istogrammi di Direzione, Poliedri Regolari

Il docente in questo video discute l'immagine gaussiana estesa (EGI) come rappresentazione di oggetti 3D che non possono essere presentati come poliedri. Il relatore spiega in che modo la curvatura integrale si riferisce a una macchia sulla superficie di una forma, discute il concetto di EGI in implementazioni astratte e discrete ed esplora l'immagine gaussiana di varie forme tra cui ellissoidi, solidi di rivoluzione come cilindri e coni e non convessi oggetti come tori. L'EGI può aiutare nella determinazione dell'atteggiamento di un oggetto nello spazio e può essere utilizzato per l'allineamento con i dati di visione artificiale. Vengono discussi anche i metodi per trovare la curvatura e la curvatura gaussiana dei solidi di rivoluzione, insieme alle sfide nel calcolo dell'EGI di oggetti non convessi.

Nella lezione 23 di un corso di informatica, il docente spiega come utilizzare l'immagine gaussiana per il riconoscimento e l'allineamento degli oggetti, nonché come creare un istogramma di direzione per rappresentare la vera forma di un oggetto in una libreria. Discutono anche delle sfide del binning degli istogrammi, della divisione di una sfera e dell'allineamento di un solido di rivoluzione, nonché di modelli e solidi regolari. La conferenza fornisce approfondimenti sulla rappresentazione di oggetti utilizzando la distribuzione di massa su una sfera, evitando elementi di superficie nascosti e comprendendo l'effetto della curvatura sulla distribuzione di massa. Discute anche i vantaggi e gli svantaggi dell'utilizzo di forme diverse per istogrammi binning e l'importanza di modelli e forme regolari per una buona qualità.

  • 00:00:00 In questa sezione, l'immagine gaussiana estesa viene discussa come rappresentazione di oggetti 3D che non possono essere presentati come poliedri. L'immagine gaussiana è una corrispondenza tra la superficie dell'oggetto ei punti sulla sfera unitaria basata sull'uguaglianza delle normali alla superficie. Tracciando l'inverso della curvatura gaussiana in funzione della posizione sulla sfera, può essere utilizzato per definire quanta parte della superficie ha una normale che punta in quella direzione. L'integrazione della curvatura gaussiana su una macchia sull'oggetto risulta nell'area della macchia corrispondente sulla sfera, che è chiamata curvatura integrale. Al contrario, integrando la curvatura gaussiana su k sulla sfera si ottiene l'area sull'oggetto che corrisponde a quella, che è una quantità più importante.

  • 00:05:00 In questa sezione, il relatore discute il concetto di curvatura integrale e come si collega a una macchia sulla superficie di una forma. Spiegano che prendendo l'integrale di curvatura su un'area, è possibile catturare il cambiamento totale di orientamento in quella zona, e questo è ciò che l'integrale sta calcolando. L'oratore applica quindi questo concetto a un cubo e spiega che la curvatura integrale dell'angolo di un cubo è pi greco su due. Discutono anche della distribuzione sulla sfera (indicata come "g") che dipende dall'orientamento e di come possa avere dei vincoli, simili a quelli visti nei poliedri.

  • 00:10:00 In questa sezione della conferenza, l'oratore discute l'area apparente di un oggetto convesso visto da una direzione specifica, basata sul coseno dell'angolo. L'oratore spiega che solo le sfaccettature con un prodotto scalare positivo sono visibili da quell'angolo e osserva che la somma di tutte le sfaccettature è zero. Ciò porta alla conclusione che il baricentro è all'origine e che le egis sono distribuzioni sulla sfera unitaria con centro di massa al centro.

  • 00:15:00 In questa sezione, il concetto di EGI (Extended Gaussian Image) viene ulteriormente discusso in implementazioni astratte e discrete. Il baricentro di EGI corrisponde alla superficie dell'oggetto chiusa e all'origine della sfera. L'EGI può anche essere calcolato esattamente per oggetti geometricamente definiti come l'esempio di una sfera in cui l'EGI è semplicemente R al quadrato a causa della natura simmetrica. Oggetti più complessi come un ellissoide possono essere rappresentati attraverso l'equazione implicita della superficie, che non è pratica per generare visualizzazioni o integrazioni sulla superficie, ma possono essere utilizzati modi alternativi per descrivere la stessa superficie.

  • 00:20:00 In questa sezione, il docente discute un metodo per ottenere una descrizione parametrica di una superficie utilizzando theta e phi come parametri. Differenziando l'equazione rispetto a questi parametri, ottiene le tangenti, che può quindi utilizzare per calcolare la normale alla superficie. Mostra anche come definire la curvatura. Il docente passa quindi a spiegare un modo per parametrizzare la sfera unitaria utilizzando le coordinate di latitudine e longitudine. Ciò comporta la ricerca della grandezza del vettore normale alla sfera unitaria, nonché la definizione di un altro vettore. La lezione fornisce una spiegazione dettagliata del processo di derivazione.

  • 00:25:00 In questa sezione viene esplorato il concetto di immagine gaussiana estesa di un ellissoide. La curvatura in termini di normale comporta la ricerca dei punti di intersezione dei semiassi sulla superficie dell'oggetto. Sebbene la risposta non sia ciò a cui si riferiscono le coordinate theta-phi, viene utilizzata per il riconoscimento e l'orientamento. Ci sono massimi e minimi all'interno del modello, e sono distribuiti sulla sfera. Ci sono tre direzioni ortogonali che sono simmetriche rispetto all'altro lato. Con i dati sperimentali, l'immagine gaussiana può aiutare nella determinazione dell'atteggiamento di un oggetto nello spazio.

  • 00:30:00 In questa sezione della conferenza, l'attenzione è rivolta ai solidi di rivoluzione, che sono oggetti più facili da calcolare rispetto a forme più complicate come gli ellissoidi. I solidi di rivoluzione, come cilindri, coni, sfere, iperboloidi di uno o due fogli, hanno un generatore che viene fatto ruotare attorno a un asse per produrre l'oggetto, che può quindi essere mappato su una sfera per calcolare l'egi. Vengono considerati la normale alla superficie dell'oggetto e l'angolo con l'equatore e la banda dell'oggetto viene utilizzata per ottenere la banda corrispondente sulla sfera, che riduce la forma 3D dell'oggetto a 2D. L'area della banda dell'oggetto è 2 pi moltiplicato per il raggio dell'oggetto moltiplicato per la larghezza della banda, mentre il raggio della sfera dipende dalla latitudine dove maggiore è la latitudine, minore è il raggio.

  • 00:35:00 In questa sezione, il docente discute la ricerca della curvatura di un solido di rivoluzione utilizzando la formula k=cos(eta)/r*kg, dove kg è la curvatura del generatore. Il docente spiega che la curvatura è il tasso di cambiamento della direzione della superficie normale mentre si muove lungo l'arco, che è la curvatura 2D del generatore. Il docente mostra anche che la formula ha versioni diverse a seconda che la curva sia data in forma implicita o in funzione di s o dell'altezza z. Infine, la lezione fornisce una comoda formula per trovare la curvatura di un solido di rivoluzione dato r come funzione di s.

  • 00:40:00 In questa sezione, l'oratore descrive due modi per ottenere la curvatura gaussiana di un solido di rivoluzione. Il primo metodo prevede la definizione del generatore di curve come r in funzione della lunghezza dell'arco, con uno dei 12 modi più comuni per specificare una curva. Il secondo metodo esamina l'altra variabile specificata, z, e utilizza termini trigonometrici per ottenere la curvatura. L'oratore mostra il processo passo-passo di differenziazione rispetto a z e come ciò si relaziona ai termini tangente e secante. Viene fornita la formula finale per la curvatura gaussiana, che finisce per essere leggermente più confusa del primo metodo ma è comunque utile per i casi in cui la curva del generatore è data come r in funzione di z.

  • 00:45:00 In questa sezione, il relatore discute come generare immagini gaussiane estese di solidi di rivoluzione e lavora attraverso un esempio usando un toro o una forma a ciambella. Spiegano che nel caso di oggetti non convessi come il toro, potrebbe esserci più di un punto sull'oggetto con lo stesso orientamento della superficie, rendendo la mappatura non invertibile. Il toro ha due di questi punti, uno convesso e l'altro a sella, che presenta una serie di sfide.

  • 00:50:00 In questa sezione, il relatore discute il calcolo dell'immagine gaussiana estesa di un oggetto non convesso utilizzando le formule per il raggio e la derivata seconda. Osservano che la curvatura della superficie cambia da positiva a negativa in certi punti, dividendo l'oggetto in due parti con curvature diverse. Il relatore propone due opzioni per affrontare questo problema, calcolando la curvatura gaussiana in tutti i punti con lo stesso orientamento della superficie e sommandoli, oppure utilizzando una formula per la somma delle curvature gaussiane che annulla alcuni termini.

  • 00:55:00 In questa sezione, il relatore discute l'immagine gaussiana estesa (EGI) e come può essere utilizzata per l'allineamento. L'oratore spiega che l'EGI per un toro varia uniformemente e ha una singolarità al polo, che può essere visualizzata incorporando la sfera unitaria in un cilindro unitario. Questa variazione può essere utilizzata per allineare il modello dell'oggetto con i dati della visione artificiale, riunendo le due sfere con una distribuzione che varia dolcemente, ma ha una rapida crescita verso i poli. Tuttavia, questo non dà l'atteggiamento completo, poiché l'oggetto può ancora essere fatto ruotare attorno all'asse senza cambiare nulla, il che è appropriato per un solido di rivoluzione. L'oratore menziona anche come le persone hanno cercato di ricostruire in modo iterativo l'EGI per il caso poliedrico discreto.

  • 01:00:00 In questa sezione, il relatore spiega che ricostruire un oggetto dalla sua immagine gaussiana è un problema complicato che richiederebbe un grande processo di ricerca o ottimizzazione, con le distanze di tutti i piani dall'origine come parametri. Tuttavia, questo approccio non è necessario per il riconoscimento e l'allineamento utilizzando immagini gaussiane, poiché il metodo prevede il confronto delle distribuzioni sulla sfera e la rotazione di una sfera rispetto all'altra fino a ottenere una buona corrispondenza. Il relatore introduce anche un nuovo modo di intendere le bande sulla sfera, che permette il calcolo della curvatura e la descrizione dell'effetto di schiacciamento in prossimità dei poli.

  • 01:05:00 In questa sezione, il docente discute l'area di un toro e come si relaziona con l'immagine gaussiana. Spiega che due ciambelle di forme diverse ma della stessa area hanno la stessa EGI, il che è uno svantaggio di consentire oggetti non convessi. Questa perdita di unicità può o non può avere importanza in un'applicazione, ma mostra che quando estendiamo questo a oggetti non convessi le cose non sono così belle. Inoltre, ci sono problemi con elementi di superficie nascosti in oggetti non convessi e possono essere introdotti piccoli errori durante la costruzione dell'EGI utilizzando dati numerici.

  • 01:10:00 In questa sezione, il docente discute come gestire numericamente oggetti reali imperfetti e inserirli in una libreria basata sulla loro vera forma. Spiegano come calcolare la superficie normale e l'area di una patch triangolare sulla superficie di un oggetto utilizzando dati stereo fotometrici o modelli mesh. Quindi descrivono come creare una distribuzione di massa su una sfera basata sulla normale alla superficie, che rappresenta un istogramma di direzione. Questo metodo fornisce un modo per comprendere l'effetto della curvatura sulla distribuzione di massa e perché è vantaggioso aggiungere contributi di massa invece di sottrarli. Nel complesso, questa tecnica consente la creazione di istogrammi di direzione e la rappresentazione di oggetti in una libreria basata sulla loro vera forma.

  • 01:15:00 In questa sezione, il relatore discute il concetto di istogrammi di direzione, che implicano la divisione della sfera in riquadri e il conteggio delle occorrenze all'interno di ciascuna cella. Il metodo viene utilizzato per indicare una forte concentrazione in una particolare direzione in cose come fibre muscolari parallele e direzioni di flusso dell'acqua nel cervello. Viene anche applicato in aree come l'imaging dei tumori, dove una distribuzione uniforme negli istogrammi di orientamento indica un tessuto irregolare. Gli svantaggi dell'utilizzo dei quadrati per dividere il piano sono spiegati con forme più arrotondate come un esagono che è più vantaggioso dei triangoli.

  • 01:20:00 In questa sezione, il docente discute le sfide nella selezione delle celle per il binning degli istogrammi e come tenere conto del rumore casuale quando si confrontano gli istogrammi. Viene introdotto il concetto di avere un secondo istogramma che viene spostato, ma questa soluzione diventa più costosa all'aumentare della dimensionalità. Un'altra soluzione è convolvere la distribuzione con una funzione di diffusione, e questo potrebbe essere più economico da fare rispetto alla soluzione precedente. La conferenza affronta quindi il problema della divisione di una sfera e le proprietà desiderate di una tassellatura, come avere un'area uguale, forme uguali, forme arrotondate, uno schema regolare e facilità di binning. Si noti che queste proprietà desiderate sono facili da ottenere nei casi planari, ma diventano più complicate su una superficie curva come una sfera.

  • 01:25:00 In questa sezione, il docente discute il problema dell'allineamento di un solido di rivoluzione con se stesso dopo la rotazione, e il vantaggio dell'allineamento sulla rotazione. Spiega come una sfera può essere divisa in dodici sezioni proiettando un dodecaedro sulla sua superficie, e ciascuna di queste sezioni può essere rappresentata da un numero. Se la sfera viene ruotata, i numeri che rappresentano le sezioni verranno semplicemente permutati e non ci sarà perdita di qualità. Tuttavia, se le sezioni si sovrapponessero dopo la rotazione, sarebbe necessario ridistribuire il peso in ciascuna sezione, con conseguente perdita di qualità. Il docente menziona quindi brevemente modelli regolari e solidi regolari come punti di partenza per gli istogrammi di orientamento, ma osserva che questo sarà discusso più dettagliatamente nella prossima lezione.
Lecture 23: Gaussian Image, Solids of Revolution, Direction Histograms, Regular Polyhedra
Lecture 23: Gaussian Image, Solids of Revolution, Direction Histograms, Regular Polyhedra
  • 2022.06.08
  • www.youtube.com
MIT 6.801 Machine Vision, Fall 2020Instructor: Berthold HornView the complete course: https://ocw.mit.edu/6-801F20YouTube Playlist: https://www.youtube.com/p...
 

MIT 6.0002 Intro to Computational Thinking and Data Science, autunno 2016. Lezione 1. Introduzione, problemi di ottimizzazione



1. Introduzione, problemi di ottimizzazione (MIT 6.0002 Intro to Computational Thinking and Data Science)

Questo video introduce il corso "1. Introduzione, problemi di ottimizzazione (MIT 6.0002 Intro to Computational Thinking and Data Science)" e illustra i prerequisiti e gli obiettivi del corso. L'obiettivo principale del corso è l'uso di modelli computazionali per comprendere il mondo e prevedere eventi futuri. Il video discute i modelli di ottimizzazione, che sono un modo semplice per risolvere problemi che coinvolgono obiettivi e vincoli. Il video discute anche uno specifico problema di ottimizzazione chiamato problema dello zaino, che è un problema in cui una persona deve scegliere quali oggetti prendere da una quantità finita di oggetti. Il video illustra come ottimizzare un menu, utilizzando un algoritmo goloso. Il video discute anche di un efficiente algoritmo per l'allocazione delle risorse, chiamato "greedy by value".

  • 00:00:00 Questo video introduce il corso "1. Introduzione, problemi di ottimizzazione (MIT 6.0002 Intro to Computational Thinking and Data Science)" e illustra i prerequisiti e gli obiettivi del corso. L'obiettivo principale del corso è l'uso di modelli computazionali per comprendere il mondo e prevedere eventi futuri.

  • 00:05:00 Il video discute i modelli di ottimizzazione, che sono un modo semplice per risolvere problemi che coinvolgono obiettivi e vincoli. Il video discute anche uno specifico problema di ottimizzazione chiamato problema dello zaino, che è un problema in cui una persona deve scegliere quali oggetti prendere da una quantità finita di oggetti.

  • 00:10:00 In questo video viene spiegato il problema dello zaino continuo o cosiddetto frazionario e viene descritto un algoritmo greedy. Il problema di prendere prima la cosa migliore è più complicato e viene mostrata una formalizzazione del problema.

  • 00:15:00 L'algoritmo greedy risolve un problema di ottimizzazione mettendo nello zaino il miglior oggetto disponibile man mano che si riempie. Questo algoritmo è efficiente, ma non è garantito che trovi una soluzione che sia la migliore possibile.

  • 00:20:00 Il video spiega come ottimizzare un menu, utilizzando un algoritmo goloso. L'algoritmo è implementato in una classe chiamata Food, che ha funzioni get value, get densità di costo e rappresentazione di stringhe. Il menu di build della funzione accetta un elenco di nomi e un elenco di valori di uguale lunghezza e utilizza la funzione chiave per determinare cosa si intende per "migliore".

  • 00:25:00 Questo video discute un algoritmo efficiente per l'allocazione delle risorse, chiamato "greedy by value". L'algoritmo tiene conto del peso e delle richieste di una risorsa ed è in grado di allocare le risorse in modo efficiente per grandi numeri.

  • 00:30:00 Il video illustra l'uso delle espressioni lambda per creare una funzione anonima. Spiega che le espressioni lambda possono essere utilizzate per creare una funzione che valuta un'espressione su una sequenza di parametri. Mostra anche come chiamare la funzione di un'espressione lambda.

  • 00:35:00 Il video illustra come gli algoritmi avidi possono portare a risultati diversi a seconda dell'ordinamento e come questo può essere un problema con l'arrampicata in collina. Mostra anche come modificare un algoritmo greedy per ottenere sempre il miglior risultato.

  • 00:40:00 Il video illustra come l'algoritmo greedy a volte può portare a soluzioni migliori rispetto all'algoritmo più ottimale, ma che richiede più tempo.
1. Introduction, Optimization Problems (MIT 6.0002 Intro to Computational Thinking and Data Science)
1. Introduction, Optimization Problems (MIT 6.0002 Intro to Computational Thinking and Data Science)
  • 2017.05.19
  • www.youtube.com
MIT 6.0002 Introduction to Computational Thinking and Data Science, Fall 2016View the complete course: http://ocw.mit.edu/6-0002F16Instructor: John GuttagPro...
 

Lezione 2. Problemi di Ottimizzazione



2. Problemi di ottimizzazione

Questo video illustra come risolvere i problemi di ottimizzazione utilizzando una tecnica chiamata programmazione dinamica. L'esempio utilizzato è il problema dello zaino, in cui scelte diverse in ogni nodo portano alla risoluzione dello stesso problema. Viene discussa l'implementazione memo della funzione maxVal e viene mostrato che il numero di chiamate cresce lentamente per la soluzione di programmazione dinamica.

  • 00:00:00 Il video discute i pro ei contro degli algoritmi greedy e fornisce un esempio di come utilizzare un albero di ricerca per risolvere un problema.

  • 00:05:00 Il video discute l'attraversamento di un albero, spiegando che il nodo più a sinistra ha il maggior numero di elementi possibili e il nodo più a destra ha il minor numero di elementi possibili. L'algoritmo è semplice e asintotico nella complessità.

  • 00:10:00 Questo video spiega come funziona l'algoritmo ricorsivo per la risoluzione dei problemi di ottimizzazione. L'algoritmo inizia esaminando il ramo sinistro dell'albero se l'elemento corrente non può essere preso, quindi passa al ramo destro se possibile. Se nessuno dei rami può essere preso, l'algoritmo restituisce il valore massimo dell'elenco toConsider.

  • 00:15:00 In questo video, l'autore mostra come migliorare le prestazioni di un algoritmo di ricerca utilizzando un algoritmo veramente ottimale.

  • 00:20:00 In questo video impariamo i problemi di ottimizzazione e come possono essere risolti utilizzando una tecnica chiamata programmazione dinamica. La programmazione dinamica è un modo per risolvere i problemi di ottimizzazione che si basa sulla comprensione da parte di un matematico di come i dati si accumulano nel tempo.

  • 00:25:00 La programmazione dinamica è un metodo per evitare di ripetere più volte gli stessi calcoli. Viene utilizzato nel problema di Fibonacci, in cui la risposta a un numero di Fibonacci viene calcolata prendendo i due numeri di Fibonacci precedenti e sommandoli.

  • 00:30:00 In questo video, l'autore discute i vantaggi dell'utilizzo della memoizzazione, una tecnica che memorizza i risultati in una tabella anziché calcolarli in modo ricorsivo. Mostrano come questo può essere utilizzato per migliorare le prestazioni in una funzione di Fibonacci risolvendo prima i sottoproblemi più piccoli e poi combinando i risultati.

  • 00:35:00 Il video discute i problemi di ottimizzazione e come, in alcuni casi, è possibile trovare soluzioni risolvendo lo stesso problema più volte. Discute anche il problema dello zaino, che ha dimostrato di avere una sottostruttura ottimale, ovvero due nodi che risolvono lo stesso problema. Tuttavia, il video sottolinea anche che in alcuni casi è possibile trovare soluzioni ai problemi risolvendo problemi diversi, in questo caso due nodi che risolvono lo stesso problema prelevando birre diverse da un menu.

  • 00:40:00 Il video illustra come affrontare i problemi di ottimizzazione utilizzando una soluzione di programmazione dinamica. L'albero nell'esempio mostra come diverse scelte in ciascun nodo (cosa prendere e cosa non prendere) portino alla risoluzione dello stesso problema, anche se le singole soluzioni possono sembrare diverse. Viene discussa l'implementazione memo della funzione maxVal e viene mostrato che il numero di chiamate cresce lentamente per la soluzione di programmazione dinamica.

  • 00:45:00 Questo video illustra come i problemi di ottimizzazione possono essere difficili da risolvere, ma la programmazione dinamica può spesso fornire una soluzione adeguata anche se non ottimale.
2. Optimization Problems
2. Optimization Problems
  • 2017.05.19
  • www.youtube.com
MIT 6.0002 Introduction to Computational Thinking and Data Science, Fall 2016View the complete course: http://ocw.mit.edu/6-0002F16Instructor: John GuttagPro...
 

Lezione 3. Modelli grafo-teorici



3. Modelli grafo-teorici

Questo video spiega come la teoria dei grafi può essere utilizzata per comprendere e risolvere i problemi relativi alle reti. Il video introduce il concetto di grafico e spiega come utilizzare la teoria dei grafi per trovare il percorso più breve tra due punti. Il video dimostra anche come utilizzare la teoria dei grafi per ottimizzare una rete e spiega come il modello può essere applicato a problemi del mondo reale.

  • 00:00:00 Questo video fa lezione sulla teoria dei grafi, una branca della matematica che studia le strutture e la dinamica delle reti. La teoria dei grafi consente di progettare e studiare più facilmente i modelli di ottimizzazione, nonché di comprendere come i dati scorrono attraverso le reti. La teoria dei grafi è suddivisa in due categorie: grafici e grafici con spigoli. I grafici in genere hanno due elementi, nodi e bordi. I nodi rappresentano i punti dati e gli spigoli rappresentano le connessioni tra di loro. I grafici con spigoli sono più comuni e vengono utilizzati per modellare una relazione tra due entità. Vedremo due modi per creare grafici con spigoli: non orientati e orientati. Esploreremo anche come aggiungere informazioni ai bordi, come i pesi. Infine, verrà introdotto un metodo di navigazione attraverso i grafici, noto come minimizzazione del costo o percorso più breve.

  • 00:05:00 I grafici sono composti da spigoli o archi e possono essere utilizzati per modellare le relazioni tra entità. Possono essere utilizzati nelle reti di trasporto, nelle reti finanziarie e nei social network, tra le altre cose.

  • 00:10:00 Questo video introduce la teoria dei grafi, che è un campo matematico utilizzato per comprendere le reti di relazioni. I grafici possono essere utilizzati per rappresentare situazioni del mondo reale e possono essere utilizzati per dedurre informazioni come il percorso più breve e la sequenza di interazioni tra gli elementi in una rete. Questo video mostra come utilizzare la teoria dei grafi per risolvere problemi come il pendolarismo e la navigazione.

  • 00:15:00 La teoria dei grafi è un campo della matematica che si occupa delle strutture e delle interazioni delle reti. Questo video segue una semplice spiegazione di come la teoria dei grafi viene utilizzata per risolvere problemi di cammini minimi.

  • 00:20:00 L'autore introduce un modello teorico dei grafi, che è un grafo orientato con nodi e spigoli, e un modo per memorizzare nodi e spigoli in un dizionario. Il modello consente una facile rappresentazione di un grafico, ma non è il modo più efficiente per farlo. L'autore introduce una lista di adiacenze, che è un modo più efficiente per rappresentare un grafo, e la utilizza per mostrare come aggiungere un arco e ottenere tutti i figli di un nodo.

  • 00:25:00 Questo video spiega come creare, cercare e stampare grafici utilizzando il linguaggio di programmazione Python. I grafici possono essere creati come sottoclasse della classe digraph, che consente grafici orientati e non orientati. Il video mostra un esempio di come aggiungere un bordo tra due nodi in un grafico.

  • 00:30:00 Il video presenta tre modelli basati sulla teoria dei grafi: problemi di percorso più breve, navigazione del percorso e reti di comunicazione. Il primo modello, i problemi del percorso più breve, è un problema di navigazione in cui l'obiettivo è trovare un percorso tra due città. Il secondo modello, la navigazione del percorso, è un problema in cui l'obiettivo è trovare un percorso tra due punti in un grafico. Il terzo modello, le reti di comunicazione, è un problema in cui l'obiettivo è trovare un percorso più breve tra due nodi in una rete. Il video introduce due algoritmi per risolvere i problemi del cammino minimo: la ricerca in profondità e il divide et impera.

  • 00:35:00 Prima ricerca approfondita, l'algoritmo inizia con il nodo sorgente e segue il primo bordo verso l'esterno, controllando se si trova nella posizione corretta. In caso contrario, l'algoritmo segue il primo bordo fuori dal nodo e continua a seguire i bordi in quell'ordine finché non trova il nodo obiettivo o esaurisce le opzioni. Nell'esempio fornito, l'algoritmo parte dal nodo di origine e segue il primo percorso lungo l'albero di ricerca, stampando le informazioni lungo il percorso. Se il nodo non è nel percorso, l'algoritmo segue il primo percorso fuori dal nodo ed esplora in modo ricorsivo i figli del nodo finché non trova un percorso per il nodo obiettivo.

  • 00:40:00 Questo video introduce il modello teorico dei grafi, che è un modo per capire come trovare soluzioni ai problemi. Il modello si basa sull'idea che un percorso è un elenco di nodi e che la ricerca approfondita può essere utilizzata per trovare una soluzione. Il modello è illustrato con due esempi. Il primo esempio mostra come trovare un percorso da Boston a Chicago e il secondo esempio mostra come trovare un percorso da Phoenix a New York. Dopo aver introdotto il modello, il video mostra come utilizzare la ricerca approfondita per trovare una soluzione a un problema.

  • 00:45:00 Questo video dimostra come i modelli basati sulla teoria dei grafi possono essere utilizzati per risolvere i problemi di ottimizzazione. Il video mostra innanzitutto come modificare un algoritmo di ricerca in profondità per ridurre al minimo la somma dei pesi sugli spigoli, quindi dimostra come utilizzare la ricerca in ampiezza per trovare un percorso ponderato più breve.

  • 00:50:00 Questo video introduce i modelli di teoria dei grafi, utilizzati per studiare le relazioni tra le variabili.
3. Graph-theoretic Models
3. Graph-theoretic Models
  • 2017.05.19
  • www.youtube.com
MIT 6.0002 Introduction to Computational Thinking and Data Science, Fall 2016View the complete course: http://ocw.mit.edu/6-0002F16Instructor: Eric GrimsonPr...
 

Lezione 4. Pensiero stocastico



4. Pensiero stocastico

Il prof. Guttag introduce i processi stocastici e la teoria della probabilità di base.

In questo video, l'oratore discute la differenza nei calcoli di probabilità tra il problema di due persone che condividono un compleanno e il problema di tre persone che condividono un compleanno. Spiega che il problema complementare per due persone è semplice, in quanto implica solo la questione se tutti i compleanni siano diversi. Tuttavia, per tre persone, il problema complementare implica una complicata disgiunzione con molte possibilità, rendendo la matematica molto più complessa. Il relatore mostra come le simulazioni possono essere utilizzate per rispondere facilmente a queste domande probabilistiche invece di fare affidamento su calcoli con carta e matita. Discute anche l'ipotesi che tutti i compleanni siano ugualmente probabili e come la distribuzione dei compleanni negli Stati Uniti non sia uniforme, con alcune date più comuni o non comuni di altre. Infine, il relatore mostra al pubblico una mappa termica dei compleanni degli studenti del MIT e conclude che l'adeguamento del modello di simulazione è più semplice rispetto all'adeguamento del modello analitico per tenere conto di una distribuzione non uniforme delle date di nascita.

4. Stochastic Thinking
4. Stochastic Thinking
  • 2017.05.19
  • www.youtube.com
MIT 6.0002 Introduction to Computational Thinking and Data Science, Fall 2016View the complete course: http://ocw.mit.edu/6-0002F16Instructor: John GuttagPro...
 

Lezione 5. Passeggiate casuali



5. Passeggiate casuali

Questo video sulle passeggiate casuali abbraccia l'importanza di studiarle e capire come la simulazione può aiutare con i concetti di programmazione nelle discipline scientifiche e sociali. Il relatore inizia illustrando come il numero di passi compiuti da un ubriaco influisca sulla sua distanza dall'origine. Il video introduce quindi la passeggiata casuale parziale e l'ubriaco masochista, mostrando come funziona il processo di simulazione e iterazione utilizzando semplici comandi di tracciamento. Il relatore sottolinea l'importanza di costruire simulazioni in modo incrementale e condurre controlli di integrità per garantirne l'accuratezza, e conclude discutendo l'arte di creare diversi tipi di grafici per rappresentare i dati. Il video introduce anche WormField come un modo per fornire più variazione e complessità nella simulazione.

  • 00:00:00 In questa sezione, Guttag spiega perché le passeggiate casuali sono importanti e introduce il concetto di passeggiata di un ubriacone come esempio. Pone la questione se esista una relazione interessante tra il numero di passi che fa un ubriacone e quanto sono lontani dall'origine. Per illustrare ciò, fornisce un piccolo esempio e chiede al pubblico di fare un sondaggio sul fatto che più passi fa l'ubriacone, più è probabile che si allontanino o se non importa quanti passi facciano. Guttag afferma inoltre che lo studio delle passeggiate aleatorie è utile per modellare i processi in varie discipline scientifiche e sociali e per dimostrare come la simulazione può aiutare a comprendere il mondo che ci circonda insegnando importanti argomenti relativi alla programmazione.

  • 00:05:00 In questa sezione del video sulle passeggiate casuali, l'oratore inizia analizzando la distanza media che una persona ubriaca percorrerebbe dal punto di partenza dopo aver fatto uno o due passi. Usando il teorema di Pitagora, determinano che in media la persona ubriaca sarebbe più lontana dal punto di partenza dopo aver fatto due passi. Poi passano ad analizzare cosa succede dopo 100.000 passi e ricorrono a una simulazione per calcolare la distanza media dall'origine di n passi. Per prepararsi alla simulazione, il relatore definisce alcune utili astrazioni come la posizione, il campo e la persona ubriaca. La classe Drunk funge da classe base utilizzata per definire due sottoclassi, inclusa la solita sottoclasse ubriaca.

  • 00:10:00 In questa sezione, apprendiamo la passeggiata aleatoria parziale, in cui un ubriaco può fare un passo aumentando y, diminuendo y, aumentando x o diminuendo x, e restituendo solo uno a caso. L'ubriaco masochista è una sottoclasse del solito ubriaco e preferisce spostarsi verso nord ma fa 1,1 passi rispetto a un passo avanti e solo 9/10 di un passo quando si sposta verso sud. Sebbene ciò suggerisca una passeggiata casuale distorta, l'immutabilità esiste poiché ubriachi e luoghi rimangono invariati. Tuttavia, i campi sono mutabili perché mappano gli ubriachi alla loro posizione nel campo attraverso un dizionario. Per verificare se l'ubriaco è presente o per ottenere la posizione del campo, utilizziamo i messaggi di errore del valore. Quando si chiama moveDrunk, le distanze in xey vengono ottenute dalla funzione takeStep e self.drunk viene assegnato a questa nuova distanza.

  • 00:15:00 In questa sezione, il presentatore spiega come simulare passeggiate casuali e come usarle per rispondere a domande su come si muovono diversi tipi di ubriachi. La simulazione prevede la creazione di un campo e l'aggiunta di ubriachi, in cui gli ubriachi eseguono un numero diverso di passi casuali nel campo. Il presentatore mostra come simulare una singola passeggiata e poi mostra come simulare più passeggiate per rispondere alle domande sul comportamento degli ubriachi. Calcolando la media delle distanze, osservando la media, il minimo o il massimo, possiamo vedere quanto lontano dall'origine arrivano i diversi tipi di ubriachi. Il presentatore discute quindi i risultati della simulazione e chiede se sembrano plausibili.

  • 00:20:00 In questa sezione, il professor John Guttag sottolinea l'importanza di un controllo di integrità ogni volta che si costruisce una simulazione. Esegue un semplice controllo di integrità del caso usando l'esempio di un uomo ubriaco che fa dei passi, che rivela un errore di programmazione nel codice di simulazione che non era immediatamente evidente. Dopo aver corretto l'errore, Guttag esegue nuovamente la simulazione per ricontrollare i risultati e rassicura gli spettatori che il superamento di un controllo di integrità non garantisce che una simulazione sia corretta, ma è una buona indicazione che è in buone condizioni.

  • 00:25:00 In questa sezione, l'oratore descrive un esperimento che confronta l'ubriaco normale con un ubriaco masochista, dove il primo fa passi a caso, e la versione masochista fa più spesso passi nella direzione opposta a quella precedente. L'esperimento dimostra che l'ubriaco masochista fa molti più progressi rispetto all'ubriaco normale, il che significa che il suo movimento è distorto in una direzione. Per capire perché, l'oratore utilizza Pylab per tracciare la linea di tendenza per ogni tipo di ubriaco per visualizzare la distanza nel tempo, con PyLab che combina le librerie NumPy, SciPy e MatPlotLib per fornire funzionalità di tracciamento simili a MATLAB. L'oratore spiega anche la sintassi di base della funzione plot e i suoi argomenti per Python.

  • 00:30:00 In questa sezione, il relatore mostra come produrre grafici usando PyLab, con l'aiuto di diversi argomenti che possono essere usati con le funzioni plot e legend. Esprime anche la sua opinione che padroneggiare l'arte di creare trame sia un'abilità preziosa. Inoltre, l'oratore indaga e mostra trame delle tendenze a distanza tra un normale ubriaco e un masochista ubriaco. L'oratore scopre che il solito ubriaco si muove all'incirca alla radice quadrata del numero di passi, mentre la tendenza masochistica dell'ubriaco nella distanza si muove a una velocità di numSteps per 0,05. Il relatore conclude dimostrando un nuovo tipo di trama, in cui i punti dati sono disconnessi da linee.

  • 00:35:00 In questa sezione, il relatore discute di come la visualizzazione può fornire informazioni dettagliate sui dati. Tracciando i luoghi alla fine delle passeggiate casuali, dimostra come si comportano i diversi tipi di ubriachi e le differenze tra loro. Sottolinea l'importanza di utilizzare i grafici per comprendere i dati piuttosto che presentare semplicemente fogli di calcolo degli endpoint. L'oratore introduce anche OddField, una sottoclasse di Field con wormhole che teletrasportano la posizione di un ubriaco in un punto diverso. Crea un dizionario di wormhole con posizioni casuali in cui l'ubriaco può essere teletrasportato, consentendo una maggiore variabilità nella simulazione.

  • 00:40:00 In questa sezione del video, l'istruttore spiega come le passeggiate casuali vengono utilizzate per simulare il movimento di un ubriacone e come i wormhole producono effetti profondi su dove finiscono gli ubriachi. Sottolinea inoltre l'importanza di costruire in modo incrementale la simulazione, iniziando con la definizione delle classi, costruendo le funzioni corrispondenti a una o più prove e riportando i risultati. Dimostra inoltre come utilizza semplici comandi di tracciamento per produrre vari tipi di grafici che aiutano a ottenere informazioni sulla simulazione.

  • 00:45:00 In questa sezione, l'oratore parla di un paradigma comune in cui imposta un iteratore di stile una volta per tutte, definendo n stili, quindi quando vuole tracciare un nuovo tipo di ubriaco, chiama semplicemente l'iteratore di stile per ottenere lo stile successivo. Gli stili includono il pennarello, la linea, il colore e la dimensione, tra le altre cose, che gli piace modificare rispetto alle impostazioni predefinite per rendere la trama più facile da leggere. Il relatore sottolinea la flessibilità di questo approccio, incoraggiando la sperimentazione per ottenere diversi stili di trama. Nella prossima lezione, approfondirà la simulazione di altri fenomeni e discuterà la credibilità di una simulazione.
5. Random Walks
5. Random Walks
  • 2017.05.19
  • www.youtube.com
MIT 6.0002 Introduction to Computational Thinking and Data Science, Fall 2016View the complete course: http://ocw.mit.edu/6-0002F16Instructor: John GuttagPro...
 

Lezione 6. Simulazione Monte Carlo



6. Simulazione Montecarlo

Il video spiega come funziona la simulazione Monte Carlo e come può essere utilizzata per stimare i valori di una quantità sconosciuta. Il video illustra come funziona il metodo e come è influenzato dalle diverse dimensioni del campione.

  • 00:00:00 In questa conferenza, John Guttag spiega come funziona la simulazione Monte Carlo e come è utile per stimare i valori di una quantità sconosciuta. Osserva inoltre che la chiave del successo del metodo è che il campione estratto dalla popolazione tenderà a riflettere le proprietà della popolazione da cui è tratto.

  • 00:05:00 Il video discute la simulazione Monte Carlo, in cui un campione viene prelevato da una popolazione e analizzato per determinare qual è il comportamento medio. Nell'esempio, una moneta viene lanciata 100 volte e viene determinata testa o croce. Se viene determinata testa, viene calcolata la probabilità del prossimo lancio. Se viene determinata croce, la probabilità del prossimo lancio viene calcolata in base alle prove disponibili. Se si determina nuovamente testa, la probabilità del prossimo lancio viene calcolata in base alle prove disponibili e all'ipotesi che la moneta sia equa. Se testa viene determinata una terza volta, la probabilità del lancio successivo si basa sul presupposto che la moneta sia equa e sulle prove disponibili. Poiché non c'è motivo di credere che la moneta sia equa, la probabilità del prossimo lancio è bassa.

  • 00:10:00 Nelle simulazioni Monte Carlo, i risultati imprevedibili di eventi casuali vengono catturati dalla varianza dei risultati. All'aumentare della varianza, la fiducia nell'accuratezza della simulazione diminuisce. La roulette è un gioco con un'alta varianza, il che significa che le previsioni del risultato sono difficili.

  • 00:15:00 In questo video, viene eseguita una simulazione Monte Carlo per mostrare che il rendimento atteso per un giro di una ruota della roulette è 0 se la probabilità del risultato è la stessa ogni volta. La legge dei grandi numeri afferma che quando il numero di prove va all'infinito, la possibilità che il rendimento sia diverso da 0 converge a 0.

  • 00:20:00 La "fallacia del giocatore d'azzardo" è la convinzione che se le proprie aspettative non sono soddisfatte in una data situazione, questo sarà risolto in futuro. La regressione alla media è un termine coniato da Francis Galton nel 1885 che descrive come, a seguito di un evento estremo (come genitori insolitamente alti), è probabile che il prossimo evento casuale sia meno estremo. Questo concetto è applicabile alla roulette, dove se qualcuno fa girare una ruota della roulette normale 10 volte e ottiene 10 rossi, questo è un evento estremo. L'errore del giocatore direbbe che i prossimi 10 giri dovrebbero comportare l'estrazione di più neri, al contrario della probabilità di 1,1024 che ci si aspetterebbe se i giri fossero indipendenti. Il professor Grimson non è l'unico che può fare brutti scherzi.

  • 00:25:00 In questo video, John Guttag spiega come funziona la regressione alla media e perché è importante nel gioco d'azzardo. Quindi mostra come la roulette europea sia una sottoclasse della fair roulette in cui aggiunge una casella extra, 0, al gioco. Questa tasca extra influisce sulle probabilità di ottenere un numero e lo rende più vicino allo 0 rispetto alla roulette americana, che è una sottoclasse della roulette europea in cui le probabilità sono sempre le stesse.

  • 00:30:00 Il metodo di simulazione Monte Carlo viene utilizzato per stimare probabilità e rapporti di probabilità. Il video dimostra come le diverse dimensioni del campione possono influenzare l'accuratezza delle probabilità stimate. Viene anche spiegata la matematica dietro la varianza e la deviazione standard.

  • 00:35:00 La simulazione Monte Carlo è un metodo per stimare valori che non sono noti. La simulazione Monte Carlo può essere utilizzata per stimare il rendimento atteso sulle scommesse alla roulette, il voto previsto in un esame e il conteggio dei voti previsto di un candidato politico. La regola empirica afferma che il 68% dei dati sarà all'interno di una deviazione standard davanti o dietro la media.

  • 00:40:00 La regola empirica dice che dovremmo avere un alto grado di fiducia nella media calcolata in una simulazione se la distribuzione degli errori è normale.

  • 00:45:00 Questo video spiega la funzione di densità di probabilità (PDF) e come viene utilizzata per calcolare la probabilità che una variabile casuale assuma valori specifici. La funzione di densità di probabilità è simmetrica attorno alla media e ha un picco in corrispondenza della media, motivo per cui viene spesso utilizzata per descrivere la probabilità che una variabile casuale assuma un valore specifico. La frazione dell'area sotto la curva tra meno 1 e 1 è di circa il 68%.
6. Monte Carlo Simulation
6. Monte Carlo Simulation
  • 2017.05.19
  • www.youtube.com
MIT 6.0002 Introduction to Computational Thinking and Data Science, Fall 2016View the complete course: http://ocw.mit.edu/6-0002F16Instructor: John GuttagPro...
 

Lezione 7. Intervalli di confidenza



7. Intervalli di confidenza

Questo video tratta vari argomenti relativi alla statistica, tra cui le distribuzioni normali, il teorema del limite centrale e la stima del valore di pi greco mediante simulazioni. Il docente utilizza Python per dimostrare come tracciare istogrammi e funzioni di densità di probabilità per distribuzioni normali, nonché come utilizzare la tecnica della quadratura per approssimare gli integrali. Inoltre, il relatore sottolinea l'importanza di comprendere le ipotesi alla base dei metodi statistici e la necessità di controlli di accuratezza per garantire la validità delle simulazioni. Sebbene gli intervalli di confidenza possano fornire affermazioni statisticamente valide, potrebbero non riflettere necessariamente la realtà ed è essenziale avere motivo di credere che i risultati di una simulazione siano vicini al valore effettivo.

  • 00:00:00 In questa sezione, il docente parla dei presupposti alla base della regola empirica e di come vengono generate le distribuzioni normali in Python utilizzando la libreria casuale. Dimostrano come produrre un'approssimazione discreta di una distribuzione normale e come tracciare un istogramma con contenitori ponderati. Lo scopo della ponderazione dei contenitori è quello di assegnare a ciascun articolo un peso diverso in modo che l'asse y possa essere regolato di conseguenza.

  • 00:05:00 In questa sezione, l'istruttore spiega come utilizzare Python per tracciare istogrammi e funzioni di densità di probabilità (PDF) per distribuzioni normali. Mostra il codice per la creazione di un istogramma utilizzando la libreria pylab, dove l'asse y mostra la frazione di valori che rientrano in un particolare intervallo. Quindi definisce i PDF e mostra come tracciarli usando Python. La curva PDF rappresenta la probabilità che una variabile casuale cada tra due valori, dove l'area sotto la curva dà la probabilità che ciò accada. L'istruttore utilizza un esempio di distribuzione normale standard con media zero e deviazione standard pari a uno.

  • 00:10:00 In questa sezione, il relatore spiega come tracciare una funzione di densità di probabilità (PDF) e interpretare i valori Y sul grafico. I valori Y sono in realtà densità o derivati della funzione di distribuzione cumulativa e non sono probabilità effettive in quanto possono superare 1 o essere negativi. Il relatore sottolinea che la forma della curva è più importante dei valori Y stessi, poiché l'integrazione dell'area sotto la curva ci consente di determinare le probabilità che i valori rientrino in un certo intervallo. L'oratore introduce quindi brevemente l'algoritmo "integrate quad" nella libreria "scipy" per l'integrazione.

  • 00:15:00 In questa sezione del video, il relatore spiega come utilizzare una tecnica numerica chiamata quadratura per approssimare gli integrali. Mostra un esempio di questa tecnica con la funzione gaussiana, che accetta tre argomenti e dimostra come passarli alla funzione di quadratura insieme a una tupla che fornisce tutti i valori per gli argomenti. L'oratore verifica quindi la regola empirica per la funzione gaussiana utilizzando valori casuali per mu e sigma e mostra che i risultati rientrano nell'intervallo previsto, dimostrando la validità della regola. Infine, spiega l'importanza delle distribuzioni normali e la loro prevalenza in molte aree.

  • 00:20:00 In questa sezione, l'oratore discute la distribuzione normale e come si applica a vari scenari, come le altezze di uomini e donne o le variazioni dei prezzi del petrolio. Tuttavia, non tutto segue una distribuzione normale, come i giri di una ruota della roulette. Quando si ha a che fare con un insieme di spin, il relatore mostra come si applica il teorema del limite centrale, il quale afferma che se un campione sufficientemente grande viene prelevato da una popolazione, le medie dei campioni saranno distribuite normalmente e avranno una media vicina a quella del popolazione.

  • 00:25:00 In questa sezione, il relatore spiega come la varianza delle medie campionarie è correlata alla varianza della popolazione divisa per la dimensione del campione. L'oratore utilizza una simulazione del lancio di un dado più volte con diversi numeri di dadi e mostra la deviazione standard che diminuisce all'aumentare del numero di dadi. Inoltre, il relatore mostra come la distribuzione delle medie formi una distribuzione normale. Ciò dimostra l'utilità del teorema del limite centrale. Il relatore applica questo concetto anche al gioco della roulette e mostra come la distribuzione dei guadagni medi dei giri di roulette assuma una forma simile a una distribuzione normale.

  • 00:30:00 In questa sezione, il relatore discute come, indipendentemente dalla forma della distribuzione dei valori originali, il teorema del limite centrale (CLT) può essere utilizzato per stimare la media utilizzando campioni sufficientemente grandi. Il relatore spiega che anche se la regola empirica non è perfettamente accurata, è abbastanza vicina da essere utile nella maggior parte dei casi. Inoltre, la casualità e le simulazioni Monte Carlo possono essere utili per calcolare qualcosa che è intrinsecamente non casuale, come il valore di pi greco. Ciò è dimostrato attraverso una spiegazione storica di come le persone hanno stimato il valore di pi nel corso della storia.

  • 00:35:00 In questa sezione, il relatore discute diversi metodi utilizzati per stimare il valore di pi greco nel corso della storia. I metodi includono la costruzione di un poligono di 96 lati e una simulazione Monte Carlo, che comporta la caduta casuale di aghi per stimare il valore di pi greco. La simulazione ha utilizzato una formula matematica per stimare pi greco trovando il rapporto tra aghi in un cerchio e aghi in un quadrato. L'oratore menziona anche il tentativo di simulare il metodo Monte Carlo usando un arciere e l'uso di Python per costruire una simulazione Monte Carlo.

  • 00:40:00 In questa sezione, il relatore spiega come stimare pi utilizzando una simulazione e come determinarne l'accuratezza utilizzando gli intervalli di confidenza. La simulazione prevede il lancio di aghi su un pavimento e il conteggio di quanti attraversano una linea, con più aghi che portano a stime migliori di pi greco. Per determinare l'accuratezza, la deviazione standard viene calcolata prendendo la media delle stime e dividendo per la lunghezza delle stime. Viene quindi utilizzato un ciclo per continuare ad aumentare il numero di aghi fino a quando la stima di pi greco rientra in un certo intervallo di precisione, consentendo una maggiore fiducia nella stima. Sebbene le stime di pi non siano monotonicamente migliori all'aumentare del numero di aghi, le deviazioni standard diminuiscono in modo monotono, fornendo una maggiore fiducia nella stima. Il relatore sottolinea che non è sufficiente produrre una buona risposta, ma piuttosto avere motivo di ritenere che la risposta sia vicina al valore effettivo.

  • 00:45:00 In questa sezione, l'oratore discute la differenza tra affermazioni statisticamente valide e affermazioni vere. Sebbene una simulazione possa fornirci intervalli di confidenza statisticamente validi, potrebbe non riflettere accuratamente la realtà. L'oratore introduce un bug nella sua simulazione sostituendo 4 con 2, e mentre gli intervalli di confidenza sono validi, la stima di pi greco è completamente sbagliata. Per garantire l'accuratezza della simulazione, è necessario eseguire un controllo di integrità. La tecnica generalmente utile del campionamento a punti casuali viene introdotta per stimare l'area di qualsiasi regione e utilizzata come esempio di come la casualità può essere utilizzata per calcolare qualcosa che non è intrinsecamente casuale, come l'integrazione.
7. Confidence Intervals
7. Confidence Intervals
  • 2017.05.19
  • www.youtube.com
MIT 6.0002 Introduction to Computational Thinking and Data Science, Fall 2016View the complete course: http://ocw.mit.edu/6-0002F16Instructor: John GuttagPro...
 

Lezione 8. Campionamento ed errore standard



8. Campionamento ed errore standard

Questo video su "Campionamento ed errore standard" copre vari concetti di statistica inferenziale, con particolare attenzione alle tecniche di campionamento per la stima dei parametri della popolazione. Il video esplora il campionamento probabilistico e il campionamento casuale semplice, nonché il campionamento stratificato, e discute il teorema del limite centrale, che si riferisce alla coerenza delle medie e delle deviazioni standard tra campioni casuali di una popolazione. Il video approfondisce anche argomenti come le barre di errore, gli intervalli di confidenza, la deviazione standard e l'errore standard, la scelta della dimensione del campione appropriata e i tipi di distribuzione. Il relatore sottolinea l'importanza di comprendere l'errore standard, in quanto aiuta a stimare la deviazione standard della popolazione senza esaminare l'intera popolazione, e come sia un concetto ampiamente discusso in diversi dipartimenti.

  • 00:00:00 In questa sezione, l'istruttore discute l'argomento del campionamento in relazione alla statistica inferenziale. L'idea chiave è esaminare uno o più campioni casuali estratti da una popolazione per fare riferimenti su quella popolazione. L'istruttore discute il campionamento probabilistico, in cui ogni membro della popolazione ha una probabilità diversa da zero di essere incluso in un campione. Il campionamento casuale semplice viene esplorato in profondità, il che richiede che ogni membro della popolazione abbia la stessa probabilità di essere scelto nel campione. Tuttavia, l'istruttore osserva che il campionamento stratificato può essere necessario in determinate situazioni, ad esempio quando una popolazione non è distribuita uniformemente e i sottogruppi devono essere suddivisi e rappresentati proporzionalmente nel campione.

  • 00:05:00 In questa sezione viene introdotto il concetto di campionamento stratificato come metodo per campionare piccoli sottogruppi che devono essere rappresentati proporzionalmente alla loro dimensione nella popolazione. Viene fornito l'esempio dell'utilizzo di un campionamento stratificato per garantire che gli studenti di architettura siano rappresentati. Tuttavia, il campionamento stratificato può essere difficile da eseguire correttamente, quindi questo corso si atterrà a semplici campioni casuali. Il corso fornisce un set di dati di esempio di temperature massime e minime giornaliere per 21 città degli Stati Uniti dal 1961 al 2015. I dati vengono visualizzati utilizzando istogrammi, che mostrano che i dati non sono distribuiti normalmente. La temperatura massima giornaliera media è di 16,3 gradi Celsius con una deviazione standard di circa 9,4 gradi.

  • 00:10:00 In questa sezione, il video discute l'idea del campionamento e il suo rapporto con la popolazione nel suo insieme. Prendendo campioni casuali di dimensione 100 da una popolazione e confrontando le medie e le deviazioni standard, il video mostra che mentre i singoli campioni possono differire dalla popolazione, nel complesso, le medie e le deviazioni standard saranno coerenti con la popolazione a causa del teorema del limite centrale . Eseguendo una simulazione di mille campioni, il video dimostra come la media delle medie del campione sia 16,3 e la deviazione standard sia 0,94, fornendo un intervallo di confidenza del 95% compreso tra 14,5 e 18,1. Sebbene l'intervallo di confidenza sia ampio, include la media della popolazione.

  • 00:15:00 In questa sezione, il video illustra i modi per ottenere un limite più stretto sulla stima della media effettiva della popolazione. Vengono presi in considerazione sia il prelievo di più campioni che il prelievo di campioni più grandi. L'esecuzione di un esperimento con la dimensione del campione aumentata da 100 a 200 ha comportato un calo abbastanza drammatico della deviazione standard da 0,94 a 0,66, indicando che dimensioni del campione più grandi possono aiutare a ottenere una stima più accurata. Viene inoltre introdotto l'uso di barre di errore per visualizzare la variabilità dei dati. Gli intervalli di confidenza possono essere utilizzati per determinare se le medie sono statisticamente significativamente diverse o meno. Se gli intervalli di confidenza non si sovrappongono, è possibile concludere che le medie sono significativamente diverse. Quando si sovrappongono, sono necessarie ulteriori indagini.

  • 00:20:00 In questa sezione, il relatore discute su come tracciare le barre di errore utilizzando il pacchetto PyLab in Python. Utilizzando la deviazione standard moltiplicata per 1,96, è possibile creare barre di errore che mostrano la media e il livello di confidenza della stima. All'aumentare della dimensione del campione, le barre di errore si riducono, fornendo una maggiore sicurezza ma non necessariamente una migliore precisione. Tuttavia, utilizzando il teorema del limite centrale, l'utilizzo di un singolo campione può ancora fornire preziose informazioni, anche se l'osservazione di più campioni con campioni di grandi dimensioni può essere ridondante.

  • 00:25:00 In questa sezione, il video discute il terzo pezzo del teorema del limite centrale, che afferma che la varianza delle medie campionarie sarà vicina alla varianza della popolazione divisa per la dimensione del campione. Questo porta al calcolo dell'errore standard della media, che è uguale alla deviazione standard della popolazione divisa per la radice quadrata della dimensione del campione. Il video utilizza un codice per verificare se l'errore standard della media funziona e mostra che la deviazione standard segue molto bene l'errore standard, rendendo così utile stimare la deviazione standard calcolando l'errore standard. La differenza tra la deviazione standard e l'errore standard è che per calcolare la prima è necessario esaminare molti campioni e per il secondo è necessario un solo campione.

  • 00:30:00 In questa sezione, il relatore discute il concetto di errore standard, che è un modo per approssimare la deviazione standard di una popolazione senza prelevare campioni multipli. La formula per l'errore standard include la deviazione standard della popolazione, ma questo in genere non è noto poiché richiederebbe l'esame dell'intera popolazione. Invece, la deviazione standard del campione viene spesso utilizzata come stima. Il relatore dimostra che per campioni di dimensioni maggiori, la deviazione standard del campione è un'approssimazione relativamente accurata della deviazione standard della popolazione. Tuttavia, si noti che ciò potrebbe non essere sempre vero per diversi tipi di distribuzioni e popolazioni più ampie.

  • 00:35:00 In questa sezione, il video discute diverse distribuzioni, tra cui uniforme, normale o gaussiana ed esponenziale, e mostra le approssimazioni discrete a queste distribuzioni. La differenza tra la deviazione standard e la deviazione standard campionaria non è la stessa per tutte queste distribuzioni, con l'esponenziale che rappresenta il caso peggiore. L'inclinazione, una misura dell'asimmetria di una distribuzione di probabilità, è un fattore importante quando si decide quanti campioni sono necessari per stimare la popolazione. Inoltre, il video rivela una scoperta controintuitiva secondo cui la dimensione della popolazione non ha importanza quando si determina il numero di campioni necessari.

  • 00:40:00 In questa sezione, il relatore discute l'importanza di scegliere una dimensione campionaria appropriata per stimare la media di una popolazione dato un singolo campione. Sottolinea che la scelta della giusta dimensione del campione è essenziale per ottenere una risposta accurata ed evitare l'uso di una dimensione del campione troppo piccola. Una volta scelta la dimensione del campione, viene prelevato un campione casuale dalla popolazione per calcolare la media e la deviazione standard del campione. Utilizzando l'errore standard stimato generato dal campione, vengono generati gli intervalli di confidenza attorno alla media campionaria. Il relatore avverte che questo metodo funziona solo se vengono scelti campioni casuali indipendenti e mostra come la scelta di campioni dipendenti può portare a risultati errati. Infine, dimostra un esperimento di esempio per calcolare la frazione al di fuori degli intervalli di confidenza del 95% e sottolinea che il cinque percento è il risultato ottimale.

  • 00:45:00 In questa sezione, il relatore discute l'importanza di comprendere il concetto di errore standard nell'analisi statistica. Sottolinea che se la risposta è troppo buona o troppo cattiva, il calcolo della probabilità non è corretto. Per dimostrare come funziona l'errore standard, esegue una simulazione e mostra che la frazione al di fuori dell'intervallo di confidenza del 95% è molto vicina al valore atteso del 5%. Il relatore conclude sottolineando il significato dell'errore standard e come sia un concetto ampiamente discusso tra i diversi dipartimenti.
8. Sampling and Standard Error
8. Sampling and Standard Error
  • 2017.05.19
  • www.youtube.com
MIT 6.0002 Introduction to Computational Thinking and Data Science, Fall 2016View the complete course: http://ocw.mit.edu/6-0002F16Instructor: John GuttagPro...