Ti stai perdendo delle opportunità di trading:
- App di trading gratuite
- Oltre 8.000 segnali per il copy trading
- Notizie economiche per esplorare i mercati finanziari
Registrazione
Accedi
Accetti la politica del sito e le condizioni d’uso
Se non hai un account, registrati
Lezione 12: Blob Analysis, Binary Image Processing, Teorema di Green, Derivata e Integrale
Lezione 12: Blob Analysis, Binary Image Processing, Teorema di Green, Derivata e Integrale
In questa conferenza, il professore copre una vasta gamma di argomenti tra cui proprietà intellettuale, brevetti, marchi e tecniche di elaborazione delle immagini per il rilevamento dei bordi. La conferenza sottolinea l'importanza della precisione nella visione artificiale 2D e le sfide nel rilevare bordi sfocati o sfocati. Il professore copre i metodi per trovare derivate parziali miste, laplaciani e rilevamento dei bordi utilizzando l'interpolazione sub-pixel, insieme a tecniche per la compensazione del bias e la calibrazione correttiva nella ricerca del picco. Nel complesso, la conferenza fornisce una panoramica completa di questi argomenti e delle loro applicazioni pratiche.
In questa conferenza sull'elaborazione delle immagini, il relatore discute vari metodi per evitare la quantizzazione delle direzioni del gradiente e migliorare la precisione nella determinazione della posizione del bordo. L'interpolazione è suggerita come metodo preferito rispetto alle tabelle di ricerca e alla quantizzazione per una determinazione più precisa della direzione del gradiente. Inoltre, la fissazione della dimensione del passo con un cerchio e l'utilizzo dell'analisi multiscala sono discussi come metodi alternativi di calcolo del gradiente. Il relatore spiega anche un approccio iterativo alla rotazione di un'immagine per ridurre a zero la componente y del gradiente e introduce il concetto di corda per ruotare attraverso angoli speciali. Si ricorda agli studenti di iniziare presto il quiz poiché è più faticoso del tipico problema dei compiti a casa.
Lezione 13: Rilevamento di oggetti, riconoscimento e determinazione della posizione, PatQuick (brevetto USA 7016539)
Lezione 13: Rilevamento di oggetti, riconoscimento e determinazione della posizione, PatQuick (brevetto USA 7016539)
La conferenza si concentra sul rilevamento, il riconoscimento e la determinazione della posa degli oggetti, con particolare attenzione al brevetto PatQuick (US 7,016,539). Il brevetto mira a rilevare e determinare la posa degli oggetti nello spazio e offre un miglioramento rispetto ai metodi precedenti, utilizzando una rappresentazione astratta chiamata modello che viene confrontata con un'immagine di runtime in diverse pose e rotazioni. Il brevetto incorpora anche un elenco di gradi di libertà generalizzati per aumentare la precisione e utilizza il filtraggio passa-basso e il rilevamento dei bordi per ottenere punti di confine, posticipando la soglia fino alle fasi finali. Inoltre, la conferenza discute il processo di creazione di modelli utilizzando il rilevamento dei bordi e le sonde con la spaziatura e il contrasto desiderati per rappresentare questi modelli, spiegando l'importanza di considerare i gradi di libertà come traslazione, rotazione, ridimensionamento e proporzioni, che consentono variazioni in dimensioni e prospettive degli oggetti.
Il video illustra i modelli di ricerca esagonali utilizzati per una ricerca traslazionale efficiente e scalabile nel rilevamento di oggetti, incluso il rilevamento dei picchi e una soluzione per il rilevamento di oggetti adiacenti. Il video discute anche di PatQuick, un brevetto per determinare la presenza di modelli predeterminati nelle immagini di runtime e la loro posizione multidimensionale. Il metodo utilizza sonde e un gradiente precalcolato per abbinare la posa di un oggetto e l'integrazione della funzione di punteggio rimuove gli errori dal risultato. Il video esplora un metodo alternativo per determinare le differenze angolari utilizzando prodotti scalari e sottolinea la complessità delle operazioni multiscala e la selezione della sonda per diverse granularità. L'accuratezza del metodo è limitata dalla quantizzazione dello spazio di ricerca.
Lezione 14: Ispezione in PatQuick, trasformata di Hough, omografia, determinazione della posizione, multiscala
Lezione 14: Ispezione in PatQuick, trasformata di Hough, omografia, determinazione della posizione, multiscala
In questa conferenza viene discusso l'algoritmo PatQuick, con particolare attenzione all'uso di sonde per produrre una funzione di punteggio in uno spazio multidimensionale, che determina la posa di un oggetto in immagini in tempo reale. Viene inoltre esaminata la funzione di corrispondenza utilizzata per valutare la qualità della corrispondenza in termini di direzione e ampiezza del gradiente, con diverse funzioni di punteggio discusse per i compromessi tra accuratezza e velocità. La conferenza approfondisce anche i diversi metodi utilizzati per rendere più efficiente il processo di corrispondenza dei modelli, inclusa la regolazione della granularità del calcolo e la sfida di ottenere le direzioni corrette, specialmente quando si eseguono trasformazioni che modificano le proporzioni di un'immagine. La conferenza tocca anche il tema dell'omografia e della trasformata di Hough per rilevare le linee nelle fotografie.
La conferenza copre una vasta gamma di argomenti relativi alla visione artificiale, tra cui Hough Transform, Extended Gauss Half Transform, determinazione della posizione, sottocampionamento multiscala e SIFT. La trasformata di Hough viene utilizzata per il rilevamento di linee e bordi, mentre la mezza trasformata di Gauss estesa è una versione più sofisticata della trasformata di Hough. La conferenza spiega anche come utilizzare la trasformata di Hough per rilevare i cerchi, come la posizione di una torre cellulare. Inoltre, il relatore discute il sottocampionamento delle immagini per ridurre il carico di lavoro senza sacrificare la qualità e introduce SIFT, un metodo per trovare punti corrispondenti in diverse immagini di una scena, ampiamente utilizzato nella produzione di informazioni 3D da più immagini. Infine, l'oratore discute brevemente la teoria musicale e termina con un promemoria per presentare proposte e una citazione sul non ritardare.
Lezione 15: Allineamento, PatMax, Distance Field, Filtering e Sub-Sampling (brevetto USA 7065262)
Lezione 15: Allineamento, PatMax, Distance Field, Filtering e Sub-Sampling (brevetto USA 7065262)
Il video discute diverse tecniche e brevetti relativi al riconoscimento di modelli e al rilevamento di oggetti. Una di queste tecniche è PatMax, che migliora in modo iterativo la posa di un'immagine di runtime utilizzando un attraente sistema basato sulla forza. Un'altra tecnica prevede la generazione di un campo vettoriale su una griglia di pixel per migliorare l'allineamento dell'immagine in fase di esecuzione. La lezione copre anche l'uso dei campi di distanza per il rilevamento dei bordi e l'espansione dei bordi seminati osservando i vettori di forza nel campo vettoriale. Il relatore discute anche l'uso del pattern matching multiscala e le fasi matematiche necessarie per adattare le linee agli insiemi di coordinate dell'immagine. Infine, viene introdotto un brevetto per il calcolo efficiente di scale multiple.
Nella lezione 15, il docente copre varie tecniche e scorciatoie per una convoluzione efficiente, il filtraggio e il sottocampionamento delle immagini. Questi includono l'approssimazione dei kernel del filtro utilizzando polinomi spline a tratti, utilizzando derivati come convoluzioni, comprimendo le immagini prendendo ripetutamente la terza differenza e combinando le convoluzioni in direzione x e y. L'oratore menziona anche l'importanza del filtraggio passa-basso prima del campionamento delle immagini per evitare interferenze e alias nelle immagini.
Lezione 16: Convoluzione veloce, approssimazioni del filtro passa-basso, immagini integrali (brevetto USA 6457032)
Lezione 16: Convoluzione veloce, approssimazioni del filtro passa-basso, immagini integrali (brevetto USA 6457032)
La conferenza copre vari argomenti relativi all'elaborazione del segnale, tra cui la limitazione della banda, l'aliasing, le approssimazioni del filtro passa-basso, la sfocatura, l'immagine integrale, l'analisi di Fourier e la convoluzione. L'oratore sottolinea l'importanza del filtraggio passa-basso dei segnali prima del campionamento per evitare artefatti di aliasing. La conferenza introduce anche l'idea dell'immagine integrale, che calcola in modo efficiente la somma dei pixel all'interno di un blocco, e varie tecniche per ridurre il calcolo durante l'approssimazione dei filtri passa-basso. Infine, la lezione discute l'interpolazione bicubica, che viene utilizzata per approssimare la funzione sinc, ei suoi costi computazionali.
In questa conferenza, il relatore discute vari argomenti relativi alla convoluzione, approssimazioni di filtri passa-basso e immagini integrali. Spiegano diverse implementazioni della convoluzione, incluso un metodo che consente di risparmiare tempo di calcolo aggiungendo valori da sinistra a destra e sottraendo per ottenere la media. Vengono inoltre discusse le limitazioni dell'interpolazione lineare per le approssimazioni del filtro passa-basso e la sua inferiorità rispetto a metodi più avanzati come l'interpolazione cubica. Viene introdotto il concetto di pillbox e il suo valore nel limitare le gamme di frequenza, e l'oratore parla del filtro passa-basso ideale e di come la sfocatura influisca sulla funzione di Bessel. La conferenza tocca anche l'uso di approssimazioni di filtri passa-basso per obiettivi di fotocamere DSLR e il concetto di fotogrammetria.
Lezione 17: Fotogrammetria, Orientamento, Assi di Inerzia, Simmetria, Orientamento
Lezione 17: Fotogrammetria, Orientamento, Assi di Inerzia, Simmetria, Orientamento
Questa lezione copre vari argomenti relativi alla fotogrammetria, inclusi segnali di profondità, calibrazione della fotocamera e definizione della trasformazione tra due sistemi di coordinate. Il relatore spiega come affrontare il problema di trovare la trasformazione di coordinate tra due sistemi utilizzando misure corrispondenti e sottolinea l'importanza di verificare l'esatto inverso della trasformazione. La conferenza discute anche la ricerca degli assi di inerzia nello spazio 2D e 3D e la determinazione della distanza tra due punti proiettati su un asse. Nel complesso, la sezione fornisce una panoramica completa della fotogrammetria e delle sue applicazioni.
La fotogrammetria richiede la costruzione di un sistema di coordinate su una nuvola di punti nei sistemi di coordinate sinistro e destro e la relativa relazione. Il docente spiega come determinare la matrice di inerzia o gli assi di inerzia e stabilire i vettori di base. Discutono anche delle sfide poste dagli oggetti simmetrici e delle proprietà di rotazione, come la conservazione di prodotti scalari, lunghezze e angoli. Inoltre, la lezione illustra come semplificare il problema di trovare la rotazione eliminando la traduzione e riducendo al minimo il termine di errore. Infine, il docente spiega come allineare due oggetti con forme simili utilizzando il calcolo vettoriale e suggerisce di esplorare altre rappresentazioni per la rotazione.
Lezione 18: La rotazione e come rappresentarla, i quaternioni unitari, lo spazio delle rotazioni
Lezione 18: La rotazione e come rappresentarla, i quaternioni unitari, lo spazio delle rotazioni
Questa conferenza discute le sfide della rappresentazione delle rotazioni e introduce l'utilità dei quaternioni di Hamilton. I quaternioni unitari sono particolarmente utili in quanto mappano direttamente sulle rotazioni in tre spazi, consentendo una discussione di uno spazio di rotazione e ottimizzazione in quello spazio. I quaternioni hanno proprietà simili ai numeri complessi e sono particolarmente utili per rappresentare le rotazioni poiché preservano i prodotti scalari, i prodotti tripli, la lunghezza, gli angoli e la manualità. La conferenza discute anche diversi metodi di rappresentazione della rotazione, l'importanza di poter ruotare i vettori e comporre le rotazioni, e le limitazioni dei metodi convenzionali come matrici, angoli di Eulero e blocco cardanico. Infine, la conferenza presenta la ricerca in corso nel campo, inclusa l'ottimizzazione e l'adattamento delle rotazioni ai modelli e lo sviluppo di nuovi metodi per l'analisi e la visualizzazione degli spazi di rotazione.
In questa lezione, il professore discute il problema di trovare la trasformazione di coordinate tra due sistemi di coordinate o la rotazione e traslazione più adatta tra due oggetti con punti corrispondenti misurati nei due sistemi di coordinate. La conferenza esplora l'uso dei quaternioni per allineare le telecamere dei veicoli spaziali con le direzioni del catalogo e risolvere il problema dell'orientamento relativo. Viene discussa l'efficienza dei quaternioni nel rappresentare le rotazioni, così come diversi metodi per avvicinarsi alla rappresentazione delle rotazioni nello spazio quadridimensionale. Inoltre, la conferenza esplora vari gruppi di rotazione per diversi poliedri, sottolineando l'importanza di selezionare il sistema di coordinate corretto per ottenere un campionamento spaziale regolare.
Lezione 19: Orientamento assoluto in forma chiusa, valori anomali e robustezza, RANSAC
Lezione 19: Orientamento assoluto in forma chiusa, valori anomali e robustezza, RANSAC
La conferenza copre vari aspetti dell'orientamento assoluto, incluso l'uso di quaternioni unitari per rappresentare le rotazioni in fotogrammetria, la conversione tra rappresentazioni di quaternioni e matrici ortonormali, la gestione della simmetria di rotazione e il coordinamento di traslazione, ridimensionamento e rotazione in modo privo di corrispondenze. La conferenza discute anche il problema dei valori anomali e della robustezza nei processi di adattamento e misurazione della linea e introduce il metodo RANSAC (Random Sample Consensus) come un modo per migliorare l'affidabilità delle misurazioni quando sono presenti valori anomali. La lezione si conclude con una discussione sulla risoluzione del problema dell'orientamento assoluto in forma chiusa utilizzando due piani in uno scenario complanare, comprese le sfide relative ai valori anomali e all'ottimizzazione.
In questo video sull'orientamento assoluto, il docente discute la questione dei valori anomali nei dati reali e propone l'uso di RANSAC, un metodo di consenso che coinvolge adattamenti di sottoinsiemi casuali per trattare i valori anomali. Il docente discute anche i metodi per ottenere una distribuzione uniforme dei punti su una sfera, inclusa l'iscrizione di una sfera in un cubo e la proiezione di punti casuali, la tassellatura della superficie della sfera e la generazione di punti su poliedri regolari. Inoltre, il docente illustra i modi per campionare lo spazio delle rotazioni per un riconoscimento efficiente di più oggetti in una libreria, trovando il numero di rotazioni necessarie per allineare un oggetto con se stesso e affrontando il problema di trovare rotazioni attraverso esempi o moltiplicazione di quaternioni.
MIT 6.801 Machine Vision, autunno 2020. Lezione 20: spazio di rotazioni, tassellazioni regolari, superfici critiche, stereo binoculare
Lezione 20: Spazio delle Rotazioni, Tessellazioni Regolari, Superfici Critiche, Stereo Binoculare
Questa sezione della conferenza copre argomenti tra cui tassellazioni regolari, superfici critiche, stereo binoculare e ricerca dei parametri di una trasformazione nello spazio tridimensionale. Il docente spiega che il modo migliore per tassellare una sfera è usare il duale di una tassellatura triangolare, creando forme approssimativamente esagonali con pochi pentagoni. Discutono anche di superfici critiche, che sono difficili per la visione artificiale, ma possono essere utilizzate per creare mobili con bastoncini dritti. Nella discussione sullo stereo binoculare, il docente spiega la relazione tra due fotocamere, il concetto di linee epipolari e come trovare l'intersezione di due fotocamere per determinare un punto nel mondo. Spiegano anche come calcolare l'errore tra due raggi per determinare la loro intersezione e minimizzare l'errore dell'immagine tenendo conto del fattore di conversione tra errore nel mondo ed errore nell'immagine. Infine, discutono su come trovare la linea di base e D per recuperare la posizione e l'orientamento di un oggetto rigido nello spazio usando un quaternione per rappresentare la linea di base.
La conferenza copre vari argomenti, tra cui lo spazio delle rotazioni, le tassellazioni regolari, le superfici critiche e lo stereo binoculare. Per le rotazioni, l'istruttore discute l'uso di approcci numerici, il problema delle singolarità e i vantaggi dell'utilizzo dei quaternioni unitari. Con tassellazioni regolari, mostrano come determinate superfici possono causare problemi con lo stereo binoculare e suggeriscono di utilizzare misure di errore e pesi per mitigare i problemi. L'oratore tocca anche le superfici quadriche e introduce un nuovo problema dei compiti che prevede la "riflessione senza paura".
Lezione 21: Orientamento relativo, stereo binoculare, struttura, quadriche, calibrazione, riproiezione
Lezione 21: Orientamento relativo, stereo binoculare, struttura, quadriche, calibrazione, riproiezione
Questa conferenza copre argomenti relativi alla fotogrammetria, tra cui l'orientamento relativo, le superfici quadriche, la calibrazione della fotocamera e le corrispondenze tra i punti dell'immagine e gli oggetti 3D noti. Il docente spiega vari metodi per risolvere problemi di distorsione e ottenere parametri come f e tz. Sottolineano inoltre l'importanza dei vettori unitari ortogonali quando si trova la matrice rotazionale completa e forniscono soluzioni per trovare k utilizzando una formula più stabile. Il docente sottolinea l'importanza di comprendere le equazioni omogenee, che sono fondamentali nella visione artificiale.
Questa lezione copre vari argomenti relativi alla visione artificiale e alla calibrazione, incluso l'uso di un bersaglio planare per la calibrazione, l'ambiguità della calibrazione dell'orientamento esterno, la ridondanza nella rappresentazione dei parametri di rotazione e la determinazione delle proprietà statistiche di determinati parametri attraverso il rapporto di guadagno del rumore. La lezione spiega la formula per risolvere un'equazione quadratica e introduce un metodo di approssimazione che coinvolge l'iterazione. Il caso del target planare è discusso come un metodo comunemente usato per la calibrazione e le applicazioni di visione artificiale. La conferenza tocca anche la rappresentazione della forma e il riconoscimento e la determinazione dell'atteggiamento nello spazio 3D.