Sie verpassen Handelsmöglichkeiten:
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Registrierung
Einloggen
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Wenn Sie kein Benutzerkonto haben, registrieren Sie sich
Vorlesung 14: Inspektion in PatQuick, Hough-Transformation, Homographie, Positionsbestimmung, Multi-Scale
Vorlesung 14: Inspektion in PatQuick, Hough-Transformation, Homographie, Positionsbestimmung, Multi-Scale
In dieser Vorlesung wird der PatQuick-Algorithmus diskutiert, wobei der Schwerpunkt auf der Verwendung von Sonden zur Erzeugung einer Bewertungsfunktion in einem mehrdimensionalen Raum liegt, die die Pose eines Objekts in Echtzeitbildern bestimmt. Die Übereinstimmungsfunktion, die verwendet wird, um die Qualität der Übereinstimmung in Richtung und Größe des Gradienten zu bewerten, wird ebenfalls untersucht, wobei verschiedene Bewertungsfunktionen für Kompromisse zwischen Genauigkeit und Geschwindigkeit diskutiert werden. Der Vortrag befasst sich auch mit verschiedenen Methoden, die verwendet werden, um den Prozess des Musterabgleichs effizienter zu gestalten, einschließlich der Anpassung der Granularität der Berechnung und der Herausforderung, die richtigen Richtungen zu finden, insbesondere bei der Durchführung von Transformationen, die das Seitenverhältnis eines Bildes ändern. Der Vortrag berührt auch das Thema Homographie und die Hough-Transformation zur Erkennung von Linien in Fotografien.
Die Vorlesung behandelt eine Reihe von Themen rund um Computer Vision, darunter Hough-Transformation, erweiterte Gauß-Halbtransformation, Positionsbestimmung, Multi-Scale-Subsampling und SIFT. Die Hough-Transformation wird zur Linien- und Kantenerkennung verwendet, während die erweiterte Gauß-Halbtransformation eine anspruchsvollere Version der Hough-Transformation ist. Der Vortrag erklärt auch, wie man die Hough-Transformation verwendet, um Kreise zu erkennen, beispielsweise den Standort eines Mobilfunkmastes. Darüber hinaus erörtert der Referent das Subsampling von Bildern, um die Arbeitsbelastung ohne Qualitätseinbußen zu verringern, und stellt SIFT vor, eine Methode zum Auffinden entsprechender Punkte in verschiedenen Bildern einer Szene, die häufig zur Erzeugung von 3D-Informationen aus mehreren Bildern verwendet wird. Abschließend geht der Referent kurz auf die Musiktheorie ein und endet mit einer Mahnung, Vorschläge einzureichen, und einem Zitat über das Nicht-Zögern.
Vorlesung 15: Alignment, PatMax, Distance Field, Filtering and Sub-Sampling (US-Patent 7065262)
Vorlesung 15: Alignment, PatMax, Distance Field, Filtering and Sub-Sampling (US-Patent 7065262)
Das Video diskutiert mehrere Techniken und Patente im Zusammenhang mit Mustererkennung und Objekterkennung. Eine solche Technik ist PatMax, die die Pose eines Laufzeitbildes unter Verwendung eines attraktiven kraftbasierten Systems iterativ verbessert. Eine andere Technik beinhaltet das Erzeugen eines Vektorfelds auf einem Pixelgitter, um die Laufzeitbildausrichtung zu verbessern. Die Vorlesung behandelt auch die Verwendung von Abstandsfeldern zur Kantenerkennung und das Erweitern von Saatkanten durch Betrachten von Kraftvektoren im Vektorfeld. Der Redner erörtert auch die Verwendung von Multiskalen-Musterabgleich und die mathematischen Schritte, die beim Anpassen von Linien an Sätze von Bildkoordinaten beteiligt sind. Schließlich wird ein Patent zur effizienten Berechnung mehrerer Skalen vorgestellt.
In Vorlesung 15 behandelt der Dozent verschiedene Techniken und Shortcuts zur effizienten Faltung, Filterung und Unterabtastung von Bildern. Diese umfassen das Annähern von Filterkernen unter Verwendung von stückweisen Spline-Polynomen, das Verwenden von Ableitungen als Faltungen, das Komprimieren von Bildern durch wiederholtes Bilden der dritten Differenz und das Kombinieren von Faltungen in x- und y-Richtung. Der Redner erwähnt auch die Bedeutung der Tiefpassfilterung vor der Bildabtastung, um Interferenzen und Aliasing in Bildern zu vermeiden.
Vorlesung 16: Fast Convolution, Low Pass Filter Approximations, Integral Images (US Patent 6457032)
Vorlesung 16: Fast Convolution, Low Pass Filter Approximations, Integral Images (US Patent 6457032)
Die Vorlesung behandelt verschiedene Themen der Signalverarbeitung, darunter Bandbegrenzung, Aliasing, Tiefpassfilternäherungen, Unschärfe, das Integralbild, Fourieranalyse und Faltung. Der Sprecher betont die Bedeutung der Tiefpassfilterung der Signale vor dem Abtasten, um Aliasing-Artefakte zu vermeiden. Die Vorlesung stellt auch die Idee des integralen Bildes vor, das die Summe der Pixel innerhalb eines Blocks effizient berechnet, und verschiedene Techniken, um den Rechenaufwand bei der Approximation von Tiefpassfiltern zu reduzieren. Abschließend behandelt die Vorlesung die bikubische Interpolation, die zur Approximation der sinc-Funktion verwendet wird, und deren Rechenaufwand.
In diesem Vortrag diskutiert der Referent verschiedene Themen rund um Faltung, Tiefpassfilternäherungen und Integralbilder. Sie erklären verschiedene Implementierungen der Faltung, einschließlich einer Methode, die Rechenzeit spart, indem Werte von links nach rechts addiert und subtrahiert werden, um den Durchschnitt zu erhalten. Die Grenzen der linearen Interpolation für Tiefpassfilter-Approximationen und ihre Unterlegenheit im Vergleich zu fortgeschritteneren Methoden wie der kubischen Interpolation werden ebenfalls diskutiert. Das Konzept einer Pillbox und ihr Wert bei der Begrenzung von Frequenzbereichen wird vorgestellt, und der Referent spricht über das ideale Tiefpassfilter und wie sich die Defokussierung auf die Bessel-Funktion auswirkt. Der Vortrag geht auch auf die Verwendung von Tiefpassfilter-Approximationen für DSLR-Kameraobjektive und das Konzept der Photogrammetrie ein.
Vorlesung 17: Photogrammetrie, Orientierung, Trägheitsachsen, Symmetrie, Orientierung
Vorlesung 17: Photogrammetrie, Orientierung, Trägheitsachsen, Symmetrie, Orientierung
Diese Vorlesung behandelt verschiedene Themen im Zusammenhang mit Photogrammetrie, darunter Tiefenhinweise, Kamerakalibrierung und die Erstellung der Transformation zwischen zwei Koordinatensystemen. Der Referent erläutert die Herangehensweise an das Problem, die Koordinatentransformation zwischen zwei Systemen durch entsprechende Messungen zu finden, und betont die Wichtigkeit, auf die exakte Inverse der Transformation zu prüfen. Die Vorlesung behandelt auch das Finden der Trägheitsachsen im 2D- und 3D-Raum und das Bestimmen des Abstands zwischen zwei auf eine Achse projizierten Punkten. Insgesamt bietet der Abschnitt einen umfassenden Überblick über die Photogrammetrie und ihre Anwendungen.
Die Photogrammetrie erfordert den Aufbau eines Koordinatensystems auf einer Punktwolke in linken und rechten Koordinatensystemen und die Verknüpfung der beiden. Der Dozent erklärt, wie man die Trägheitsmatrix bzw. die Trägheitsachsen bestimmt und die Basisvektoren ermittelt. Sie diskutieren auch die Herausforderungen symmetrischer Objekte und die Eigenschaften der Rotation, wie z. B. die Erhaltung von Skalarprodukten, Längen und Winkeln. Darüber hinaus behandelt die Vorlesung, wie das Problem der Rotationsfindung vereinfacht werden kann, indem die Translation eliminiert und der Fehlerterm minimiert wird. Abschließend erklärt der Dozent, wie man zwei Objekte mit ähnlichen Formen mithilfe der Vektorrechnung ausrichtet und schlägt vor, andere Darstellungen für die Rotation zu untersuchen.
Vorlesung 18: Rotation und ihre Darstellung, Einheits-Quaternionen, der Raum der Rotationen
Vorlesung 18: Rotation und ihre Darstellung, Einheits-Quaternionen, der Raum der Rotationen
Dieser Vortrag diskutiert die Herausforderungen bei der Darstellung von Rotationen und führt in die Nützlichkeit von Hamiltons Quaternionen ein. Einheitsquaternionen sind besonders nützlich, da sie direkt auf Rotationen in drei Räumen abgebildet werden, was eine Diskussion über einen Rotationsraum und eine Optimierung in diesem Raum ermöglicht. Quaternionen haben ähnliche Eigenschaften wie komplexe Zahlen und sind besonders nützlich für die Darstellung von Rotationen, da sie Punktprodukte, Tripelprodukte, Länge, Winkel und Händigkeit beibehalten. Der Vortrag behandelt auch verschiedene Methoden zur Darstellung von Drehungen, die Bedeutung der Fähigkeit, Vektoren drehen und Drehungen zusammensetzen zu können, und die Einschränkungen herkömmlicher Methoden wie Matrizen, Euler-Winkel und Gimbal-Lock. Abschließend stellt die Vorlesung laufende Forschungen auf diesem Gebiet vor, einschließlich der Optimierung und Anpassung von Rotationen an Modelle und der Entwicklung neuer Methoden zur Analyse und Visualisierung von Rotationsräumen.
In dieser Vorlesung behandelt der Professor das Problem, die Koordinatentransformation zwischen zwei Koordinatensystemen oder die am besten passende Rotation und Translation zwischen zwei Objekten mit entsprechenden Punkten zu finden, die in den beiden Koordinatensystemen gemessen werden. Die Vorlesung untersucht die Verwendung von Quaternionen, um Raumfahrzeugkameras mit Katalogrichtungen auszurichten und das Problem der relativen Orientierung zu lösen. Die Effizienz von Quaternionen bei der Darstellung von Rotationen wird ebenso diskutiert wie verschiedene Methoden zur Annäherung an die Darstellung von Rotationen im vierdimensionalen Raum. Darüber hinaus untersucht die Vorlesung verschiedene Rotationsgruppen für verschiedene Polyeder und betont die Bedeutung der Auswahl des richtigen Koordinatensystems, um eine regelmäßige Raumabtastung zu erreichen.
Vorlesung 19: Absolute Orientierung in geschlossener Form, Ausreißer und Robustheit, RANSAC
Vorlesung 19: Absolute Orientierung in geschlossener Form, Ausreißer und Robustheit, RANSAC
Die Vorlesung behandelt verschiedene Aspekte der absoluten Orientierung, darunter die Verwendung von Einheitsquaternionen zur Darstellung von Rotationen in der Photogrammetrie, die Konvertierung zwischen Quaternion- und orthonormalen Matrixdarstellungen, die Behandlung von Rotationssymmetrie und die korrespondenzfreie Koordination von Translation, Skalierung und Rotation. Die Vorlesung behandelt auch das Problem von Ausreißern und Robustheit in Linienanpassungs- und Messprozessen und stellt die RANSAC-Methode (Random Sample Consensus) vor, um die Zuverlässigkeit von Messungen zu verbessern, wenn Ausreißer vorhanden sind. Der Vortrag schließt mit einer Diskussion über die Lösung des Problems der absoluten Orientierung in geschlossener Form unter Verwendung von zwei Ebenen in einem koplanaren Szenario, einschließlich Herausforderungen in Bezug auf Ausreißer und Optimierung.
In diesem Video zur absoluten Orientierung diskutiert der Dozent das Problem von Ausreißern in realen Daten und schlägt die Verwendung von RANSAC vor, einer Konsensmethode mit zufälligen Teilmengenanpassungen, um mit Ausreißern umzugehen. Der Dozent diskutiert auch Methoden zum Erreichen einer gleichmäßigen Verteilung von Punkten auf einer Kugel, einschließlich des Einschreibens einer Kugel in einen Würfel und des Projizierens zufälliger Punkte, des Tesselierens der Oberfläche der Kugel und des Erzeugens von Punkten auf regelmäßigen Polyedern. Darüber hinaus behandelt der Dozent Möglichkeiten, den Rotationsraum für eine effiziente Erkennung mehrerer Objekte in einer Bibliothek abzutasten, die Anzahl der Rotationen zu ermitteln, die erforderlich sind, um ein Objekt mit sich selbst auszurichten, und das Problem des Findens von Rotationen durch Beispiele oder Quaternion-Multiplikation anzugehen.
MIT 6.801 Machine Vision, Herbst 2020. Vorlesung 20: Space of Rotations, Regular Tessellations, Critical Surfaces, Binocular Stereo
Vorlesung 20: Rotationsraum, regelmäßige Tessellationen, kritische Oberflächen, binokulares Stereo
Dieser Abschnitt der Vorlesung behandelt Themen wie regelmäßige Tessellationen, kritische Oberflächen, binokulares Stereo und das Finden der Parameter einer Transformation im dreidimensionalen Raum. Der Dozent erklärt, wie man eine Kugel am besten tesseliert, indem man das Dual einer dreieckigen Tessellierung verwendet, indem man mit einigen Fünfecken ungefähr sechseckige Formen erzeugt. Sie diskutieren auch kritische Oberflächen, die für maschinelles Sehen schwierig sind, aber verwendet werden können, um Möbel aus geraden Stöcken herzustellen. In der Diskussion über binokulares Stereo erklärt der Dozent die Beziehung zwischen zwei Kameras, das Konzept der Epipolarlinien und wie man den Schnittpunkt zweier Kameras findet, um einen Punkt in der Welt zu bestimmen. Sie erklären auch, wie man den Fehler zwischen zwei Strahlen berechnet, um ihren Schnittpunkt zu bestimmen und den Bildfehler unter Berücksichtigung des Umrechnungsfaktors zwischen Fehler in der Welt und Fehler im Bild zu minimieren. Schließlich diskutieren sie, wie man die Grundlinie und D findet, um die Position und Orientierung eines starren Objekts im Raum unter Verwendung einer Quaternion zur Darstellung der Grundlinie wiederherzustellen.
Die Vorlesung behandelt verschiedene Themen, darunter den Rotationsraum, regelmäßige Tessellationen, kritische Oberflächen und binokulares Stereo. Für Rotationen diskutiert der Dozent die Verwendung numerischer Ansätze, das Problem der Singularitäten und die Vorteile der Verwendung von Einheitsquaternionen. Mit regelmäßigen Tessellationen zeigen sie, wie bestimmte Oberflächen Probleme mit binokularem Stereo verursachen können, und schlagen vor, Fehlermaße und Gewichtungen zu verwenden, um Probleme zu mindern. Der Redner berührt auch quadratische Oberflächen und stellt ein neues Hausaufgabenproblem vor, das "furchtloses Nachdenken" beinhaltet.
Vorlesung 21: Relative Orientierung, binokulares Stereo, Struktur, Quadriken, Kalibrierung, Rückprojektion
Vorlesung 21: Relative Orientierung, binokulares Stereo, Struktur, Quadriken, Kalibrierung, Rückprojektion
Diese Vorlesung behandelt Themen rund um die Photogrammetrie, darunter relative Orientierung, quadratische Oberflächen, Kamerakalibrierung und Korrespondenzen zwischen Bildpunkten und bekannten 3D-Objekten. Der Dozent erklärt verschiedene Methoden zur Lösung von Verzerrungsproblemen und zur Ermittlung von Parametern wie f und tz. Sie betonen auch die Bedeutung orthogonaler Einheitsvektoren beim Finden der vollständigen Rotationsmatrix und bieten Lösungen zum Finden von k unter Verwendung einer stabileren Formel. Der Dozent betont die Bedeutung des Verständnisses homogener Gleichungen, die in der Bildverarbeitung von entscheidender Bedeutung sind.
Dieser Vortrag behandelt verschiedene Themen im Zusammenhang mit Computer Vision und Kalibrierung, einschließlich der Verwendung eines planaren Ziels zur Kalibrierung, der Mehrdeutigkeit der Kalibrierung der äußeren Ausrichtung, der Redundanz bei der Darstellung von Rotationsparametern und der Bestimmung der statistischen Eigenschaften bestimmter Parameter durch das Rauschverstärkungsverhältnis. Die Vorlesung erklärt die Formel zur Lösung einer quadratischen Gleichung und stellt ein Näherungsverfahren mit Iteration vor. Der Fall eines planaren Ziels wird als häufig verwendetes Verfahren für Kalibrierungs- und Bildverarbeitungsanwendungen diskutiert. Die Vorlesung berührt auch die Darstellung von Form und Erkennung sowie die Bestimmung der Haltung im 3D-Raum.
Vorlesung 22: Äußere Orientierung, Wiederherstellung der Position und Orientierung, Bündelanpassung, Objektform
Vorlesung 22: Äußere Orientierung, Wiederherstellung der Position und Orientierung, Bündelanpassung, Objektform
Die Vorlesung untersucht das Konzept der Außenorientierung in der Photogrammetrie, bei der die Position und Orientierung von Kameras in einer 3D-Umgebung bestimmt werden. Der Dozent diskutiert verschiedene Methoden zur Lösung von Problemen im Zusammenhang mit der äußeren Orientierung, wie z. B. die Wiederherstellung der Position und Orientierung eines Objekts mithilfe der Dreiecksregel der Zeichen und der Kosinusregel. Das Video untersucht auch die Verwendung von verallgemeinerten Zylindern und Netzen zur Darstellung von 3D-Objekten und deren Ausrichtung in Computer Vision. Der Dozent stellt auch das erweiterte Gaußsche Bild vor, ein Abbildungsverfahren für konvexe Objekte beliebiger Form auf eine Einheitskugel, und erklärt seine Grenzen bei der Behandlung nicht-konvexer Objekte. Darüber hinaus berührt das Video die nichtlineare Optimierung und ihre Anwendung bei der Erstellung genauer 3D-Modelle für die Photogrammetrie.
Die Vorlesung behandelt die Parametrisierung von Kurven und die Berechnung der Krümmung in 2D- und 3D-Szenarien. In 2D kann eine geschlossene konvexe Kurve auf einem Einheitskreis durch den Winkel eta und eine zur Krümmung proportionale Dichte dargestellt werden, die der Kehrwert des Radius der Kurve ist. Die Vorlesung zeigt, wie man eta integriert und xy-Gleichungen verwendet, um das konvexe Objekt für das kreisförmige Bild zu erhalten, und erweitert die Darstellung auf andere Formen wie Ellipsen. In 3D wird das Konzept der Gauss-Abbildung eingeführt, um Punkte auf einer Oberfläche mit Punkten auf einer Einheitskugel zu verbinden, und die Krümmung von Oberflächen wird diskutiert, wobei die Gaußsche Krümmung eine bequeme einzelne skalare Größe ist, die die Krümmung misst. Die Vorlesung endet mit einer Diskussion über das Verhältnis zweier Flächen k und g und wie es mit der Krümmung einer Kugel zusammenhängt.
MIT 6.801 Machine Vision, Herbst 2020. Vorlesung 23: Gaussian Image, Solids of Revolution, Direction Histograms, Regular Polyeder
Vorlesung 23: Gaußsches Bild, Rotationskörper, Richtungshistogramme, Regelmäßige Polyeder
Der Dozent in diesem Video diskutiert das erweiterte Gaußsche Bild (EGI) als Darstellung für 3D-Objekte, die nicht als Polyeder dargestellt werden können. Der Redner erklärt, wie sich die integrale Krümmung auf einen Fleck auf der Oberfläche einer Form bezieht, diskutiert das Konzept von EGI in abstrakten und diskreten Implementierungen und untersucht das Gaußsche Bild verschiedener Formen, einschließlich Ellipsoide, Rotationskörper wie Zylinder und Kegel und nicht konvex Objekte wie Tori. Das EGI kann bei der Bestimmung der Lage eines Objekts im Raum helfen und kann zur Ausrichtung mit Bildverarbeitungsdaten verwendet werden. Methoden zum Ermitteln der Krümmung und der Gaußschen Krümmung von Rotationskörpern werden ebenfalls diskutiert, zusammen mit Herausforderungen bei der Berechnung des EGI von nicht konvexen Objekten.
In Vorlesung 23 eines Informatikkurses erklärt der Dozent, wie man Gaussian Image zur Objekterkennung und -ausrichtung verwendet und wie man ein Richtungshistogramm erstellt, um die wahre Form eines Objekts in einer Bibliothek darzustellen. Sie diskutieren auch die Herausforderungen beim Binning von Histogrammen, beim Aufteilen einer Kugel und beim Ausrichten eines Rotationskörpers sowie regelmäßiger Muster und Körper. Die Vorlesung gibt Einblicke in die Darstellung von Objekten durch Massenverteilung auf einer Kugel, die Vermeidung verdeckter Oberflächenelemente und das Verständnis des Einflusses der Krümmung auf die Massenverteilung. Außerdem werden die Vor- und Nachteile der Verwendung verschiedener Formen für das Klassieren von Histogrammen und die Bedeutung regelmäßiger Muster und Formen für eine gute Qualität erörtert.