머신 러닝 및 신경망 - 페이지 12

 

MIT 6.801 머신 비전, 2020년 가을. 강의 1: 머신 비전 소개



강의 1: 머신 비전 소개

"머신 비전 입문" 강의는 이미지 분석에 대한 물리 기반 접근 방식을 강조하면서 과정 실행 계획 및 목표에 대한 철저한 개요를 제공합니다. 머신 비전 구성 요소, 잘못 제기된 문제, 표면 방향 및 이미지 처리 문제를 다룹니다. 강사는 또한 최소 제곱 최적화 방법과 카메라에 사용되는 핀홀 모델을 소개합니다. 카메라 중심 좌표계, 광축 및 벡터 사용에 대해서도 간략하게 설명합니다. 이 과정은 학생들이 고급 머신 비전 과정과 프로그래밍에서 수학 및 물리학의 실제 적용을 준비하는 것을 목표로 합니다.

연사는 또한 원근 투영을 위한 벡터 표기법, 표면 조명, 표면 요소의 축소, 2D 이미지를 사용하여 3D 비전 문제를 해결할 수 있는 방법을 포함하여 이미지 형성과 관련된 다양한 개념에 대해 논의합니다. 강사는 표면의 다른 부분의 밝기를 측정하는 데 사용할 수 있는 빨간색 길이와 표면 길이 사이의 코사인 관계 및 입사각에 따라 표면의 조명이 어떻게 변하는지 설명합니다. 그러나 물체의 모든 작은 면의 방향을 결정하는 것은 두 가지 미지수로 인해 어려울 수 있습니다. 발표자는 또한 2D 이미지를 사용하여 3D 비전 문제를 해결할 수 있는 이유를 설명하고 단층 촬영의 수학은 간단하지만 방정식이 복잡하여 반전을 수행하기 어렵다고 언급하며 결론을 내립니다.

  • 00:00:00 이 섹션에서는 Machine Vision 6801의 강사가 6801과 6866 모두에 대한 과제 및 채점 시스템을 포함한 과정의 물류를 소개합니다. 5개의 숙제 문제와 2개의 퀴즈가 있으며 공동 작업은 숙제 문제. 6866에 있는 사람들은 머신 비전 방법, 바람직하게는 동적 문제를 구현하는 기간 프로젝트를 갖게 됩니다. 수업에는 교과서가 없지만 과정 웹 사이트에서 논문을 사용할 수 있습니다.

  • 00:05:00 이 섹션에서 강사는 머신 비전 입문 과정의 목표와 결과를 설명합니다. 표면 및 이미지. 이 과정은 미적분, 벡터, 행렬 및 약간의 선형 대수 설명과 같은 일부 기본 수학 개념을 통해 원시 데이터에서 유용한 기능을 추출하고 프로그래밍에서 수학과 물리학의 실제 응용 프로그램을 제공하는 방법을 학생들에게 가르칩니다. 또한 미래의 고급 머신 비전 과정을 위해 학생들을 준비시킬 것입니다.

  • 00:10:00 대본의 이 섹션에서 연사는 머신 비전 과정에서 다룰 내용과 다루지 않을 내용에 대한 개요를 제공합니다. 이 과정은 기본 기하학 및 선형 시스템뿐만 아니라 회선 및 이미지 형성을 다룹니다. 그러나 이미지 처리나 패턴 인식에 관한 것은 아닙니다. 또한 이 과정은 기계 학습이나 컴퓨팅 이미징을 탐구하지 않고 물리 기반 모델을 사용한 직접 계산에 중점을 둡니다. 연사는 또한 인간의 시각이 광범위하게 논의되지 않을 것이라고 언급합니다.

  • 00:15:00 이 섹션에서 강사는 머신 비전과 이미지 모션 복구 및 표면 형상 추정과 같은 머신 비전이 할 수 있는 몇 가지 예를 소개합니다. 강사는 문제에 대한 물리학 기반 접근 방식을 취하고 시변 이미지에서 관찰자 움직임을 복구하고, 충돌 시간을 추정하고, 이미지를 기반으로 환경에 대한 설명을 개발하는 방법에 대해 논의합니다. 강의는 항공 사진의 등고선 지도, 산업용 머신 비전 작업, 제조 과정에서 물건 더미에서 물건을 고르는 문제를 해결하는 방법도 다룹니다.

  • 00:20:00 이 섹션에서 강사는 솔루션이 없거나, 무한한 수의 솔루션이 있거나, 초기 조건에 따라 솔루션이 있는 잘못된 문제에 대해 설명합니다. 작은 측정 오류로 인해 부정확할 수 있는 카메라의 위치와 방향을 결정하는 머신 비전 방법에 대해 논의합니다. 이 강의는 또한 2차원 이미지에서 3차원 정보를 인식하는 방법을 탐구하고 변수를 해결할 때 제약 조건과 미지수를 계산하는 문제를 강조합니다. 강사는 리처드 파인만의 코, 편원 타원체 등 이미지에서 물체의 3D 형상을 결정하는 알고리즘의 예와 이를 3D 프린터를 사용하여 물체의 모델을 만드는 것과 같은 실용적인 용도로 사용할 수 있는 방법을 보여줍니다.

  • 00:25:00 이 섹션에서 강사는 장면/세계, 이미징 장치 및 설명 작성을 담당하는 머신 비전 시스템을 포함하여 머신 비전 및 해당 구성 요소에 대한 개요를 제공합니다. 머신 비전의 가장 흥미로운 응용 분야는 로봇 공학과 관련되어 있으며, 여기서 성공의 증거는 구축된 설명을 사용하여 환경과 올바르게 상호 작용하는 로봇의 능력입니다. 머신 비전의 가장 어려운 측면 중 하나는 접촉 시간과 확장 초점, 특히 사용 가능한 정보가 그레이 스케일 이미지일 때 이미지 확장을 측정하는 방법을 결정하는 것입니다. 강사는 교정도 필수적이지만 프로세스에서 종종 간과되는 부분이라고 지적합니다.

  • 00:30:00 이 섹션에서 강사는 특히 로봇과 카메라의 경우 좌표계와 이들 사이의 변환에 대해 논의합니다. 그들은 또한 이미지 처리를 위한 아날로그 컴퓨팅의 사용과 그러한 알고리즘 개발과 관련된 문제에 대해 언급합니다. 그런 다음 강의는 이미지 형성 주제로 이동하여 조명의 중요성과 이미지의 회색 수준 또는 RGB 값을 결정하는 조명의 역할을 강조합니다. 강사는 광원, 이미지 장치 및 표면의 그림을 제시하고 반사와 이미지에 미치는 영향을 제어하는 각도를 지적합니다.

  • 00:35:00 이 섹션에서 강사는 표면 방향의 개념과 이것이 머신 비전에 미치는 영향을 소개합니다. 개체의 방향이 다를 수 있으므로 개체의 윤곽선 내에서 밝기가 달라집니다. 또한 표면 반사 속성은 다양한 모양을 유발할 수 있으므로 이러한 효과를 설명하고 설명하는 방법을 찾는 것이 중요합니다. 한 가지 접근 방식은 여러 개의 조명과 구형과 같은 알려진 모양의 보정 개체를 사용하여 모든 픽셀에서 세 가지 제약 조건을 얻어 표면 방향과 표면 반사율을 모두 복구할 수 있도록 하는 것입니다.

  • 00:40:00 이 섹션에서 교수는 고유한 노이즈로 인한 이미지 작업의 어려움과 측정 오류를 설명해야 하는 필요성에 대해 논의합니다. 그는 8비트 이미지의 조잡한 양자화와 작은 픽셀 크기로 인해 이미지에 종종 노이즈가 발생하여 측정 오류에 민감하다고 설명합니다. 교수는 또한 서로 다른 표면 방향이 서로 다른 색상을 생성하는 방법과 이것이 모양의 재구성을 허용하는 바늘 다이어그램을 구성하는 데 어떻게 사용될 수 있는지 설명합니다. 마지막으로 객체 방향을 결정하는 데 유용한 3D 모양의 편리한 표현으로 확장된 가우시안 이미지를 소개합니다.

  • 00:45:00 이 섹션에서 강사는 로봇과 비전 시스템 좌표계 사이의 관계를 설정하기 위한 보정 사용과 이미지를 처리하기 쉽고 정확하게 찾을 수 있는 측량사의 표시로 그 관계를 판단합니다. 그런 다음 강사는 이미지에서 세계에 대해 배우는 것을 목표로 하는 역 그래픽의 개념과 데이터에 민감하게 의존하는 솔루션을 처리할 수 있는 방법이 필요한 역 문제의 잘못된 특성에 대해 설명합니다.

  • 00:50:00 이 섹션에서 강사는 과정에 대해 선택한 최적화 방법인 "최소 제곱" 방법을 소개합니다. 이 방법은 폐쇄형 솔루션으로 이어져 구현하기 쉽고 로컬 최소값에 갇힐 가능성을 피하기 때문에 선호됩니다. 그러나 과정에서 많은 최소 제곱법을 사용하는 동안 특히 측정이 꺼져 있는 경우 방법의 견고성을 보장하기 위해 잡음 이득을 고려해야 합니다. 그런 다음 강사는 렌즈가 있는 카메라에 사용되는 핀홀 모델의 주제와 3D의 한 지점에서 2D의 이미지로의 투영을 설명하는 데 도움이 되는 방법으로 이동합니다. 카메라 중심 좌표계를 선택하면 방정식을 이해하기가 쉬워집니다.

  • 00:55:00 이 섹션에서 강사는 카메라 중심인 머신 비전에 사용되는 좌표계에 대해 설명합니다. 원점은 투영 중심에 배치되고 축은 광축과 정렬됩니다. 강의에서는 광축이 투영 중심에서 이미지 평면까지의 수직선이라고 설명합니다. 또한 강의에서는 머신 비전에서 벡터를 사용하는 방법과 엔지니어링 간행물의 표기법으로 벡터를 표시하는 방법을 다룹니다. 마지막으로 앞에서 언급한 방정식을 미분하여 3D와 2D 모션의 관계를 구할 수 있다고 강의에서 언급한다.

  • 01:00:00 이 섹션에서 강사는 원근 투영에 사용되는 벡터 표기법과 방정식 조작을 단순화하는 방법에 대해 설명합니다. 벡터 표기법이 반드시 사용되는 기호의 수를 줄이는 것은 아니지만 모든 개별 구성 요소를 더 쉽게 운반할 수 있습니다. 그런 다음 강사는 열 벡터의 사용에 대해 논의하고 표기법을 바꿉니다. 이 섹션은 밝기와 카메라가 캡처한 이미지와의 관계에 대한 소개로 끝납니다.

  • 01:05:00 이 섹션에서 강사는 물체의 밝기가 물체의 조명과 표면이 빛을 반사하는 방식에 따라 다르다고 설명합니다. 그는 또한 물체로부터의 거리가 멀어짐에 따라 수용체에 이미지화되는 영역이 증가하기 때문에 광원과 같은 방식으로 거리가 이미지 형성에 영향을 미치지 않는 방법에 대해 설명합니다. 또한 그는 거리 또는 방향의 변화율이 이미지 형성에 영향을 미칠 수 있으며 이는 광원 아래에서 표면 요소의 전력 단축에서 볼 수 있다고 언급합니다.

  • 01:10:00 이 섹션에서 발표자는 표면의 조명이 입사각과 빨간색 길이와 표면 길이 사이의 코사인 관계에 따라 어떻게 달라지는지 설명합니다. 조명의 이러한 가변성은 표면의 다른 부분의 밝기를 측정하는 데 사용할 수 있으며 표면의 방향에 대한 이해를 도울 수 있습니다. 그러나 표면 법선과 밝기라는 두 가지 미지수가 있기 때문에 물체의 모든 작은 면의 방향을 결정하기 어려울 수 있습니다. 연사는 여러 광원 또는 유색 광원을 사용하는 무차별 접근 방식을 포함하여 이 문제를 해결하는 다양한 방법에 대해 논의합니다.

  • 01:15:00 이 섹션에서 강사는 입사 조명에 영향을 미치는 축소 및 반전 현상과 그것이 표면에 이미지화되는 방식에 대해 설명합니다. 그는 또한 우리가 직선 광선과 단단한 표면이 있는 시각적 세계에 살고 있기 때문에 2D 이미지를 사용하여 3D 비전 문제를 해결할 수 있는 이유를 설명합니다. 광선이 공기를 통과할 때 중단되지 않아 3D 표면을 2D 이미지로 쉽게 매핑할 수 있습니다. 젤로로 채워진 방에서 유색 염료의 분포를 파악하기 위해 여러 뷰가 필요한 경우 단층 촬영을 사용할 수 있습니다. 그는 단층 촬영의 수학은 간단하지만 방정식이 복잡하여 반전을 수행하기 어렵다고 언급하면서 결론을 내립니다.
 

강의 2: 이미지 형성, 투시 투영, 시간 미분, 모션 필드



강의 2: 이미지 형성, 투시 투영, 시간 미분, 모션 필드

이 강의에서는 원근 투영의 개념과 동작과의 관계에 대해 광범위하게 논의합니다. 강사는 원근 투영 방정식의 미분을 사용하여 이미지에서 밝기 패턴의 움직임을 측정하는 데 어떻게 도움이 되고 실제 세계에서 움직임과 어떻게 관련되는지 보여줍니다. 강의는 또한 확장의 초점, 연속 및 불연속 이미지, 이미지에서 물체의 속도를 추정할 때 질감에 대한 기준점을 갖는 것의 중요성과 같은 주제를 다룹니다. 또한, 강의는 광학 흐름 벡터 필드를 복구하려고 할 때 곡선을 따라 총 미분과 방정식 계산 및 제약 조건에 대한 문제를 다룹니다.

발표자는 밝기 기울기, 물체의 움직임, 2D 사례 및 등광선과 같은 다양한 주제를 다룹니다. 물체의 속도를 계산할 때 직면하는 한 가지 문제는 밝기 기울기의 비례 관계로 인해 발생하는 조리개 문제입니다. 이 문제는 다른 이미지 영역에 가중치를 부여하거나 최소 솔루션을 검색하여 해결됩니다. 그런 다음 강의는 등광선의 다양한 사례를 탐구하고 결과의 변화에 대한 이미지 변화의 민감도를 측정하는 노이즈 게인의 개념을 사용하여 속도를 결정할 때 노이즈가 있는 것과 반대로 의미 있는 답변을 계산하는 것의 중요성을 강조합니다. .

  • 00:00:00 이 섹션에서 강사는 투시 투영 및 모션에 대해 설명합니다. 투시 투영은 3D 세계의 점과 2D 이미지 사이의 관계를 포함하며 이는 적절한 좌표계를 통해 나타낼 수 있습니다. 그들은 원근 방정식의 미분이 이미지에서 밝기 패턴의 움직임을 측정하는 데 도움이 될 수 있으며, 그런 다음 실제 세계에서 움직임을 결정하는 데 사용할 수 있다고 설명합니다. 강사는 x 및 y 방향의 속도와 같이 더 쉽게 소화되는 기호를 활용하여 방정식의 복잡성을 줄입니다.

  • 00:05:00 이 섹션에서 강사는 움직임이 없는 이미지의 지점인 확장 초점을 찾기 위해 움직임 벡터를 사용하는 방법을 설명합니다. 이 점은 원점에 연결하는 것만으로 동작의 방향을 결정할 수 있고 환경이나 동작에 대해 알려주기 때문에 중요합니다. 강사는 계속해서 확장의 초점이 특정 지점에 있을 경우 이미지의 패턴이 어떻게 나타나는지, 벡터 다이어그램을 그려 움직임 필드를 표시하는 방법을 보여줍니다.

  • 00:10:00 강의의 이 섹션에서는 이미지 형성 및 투시 투영의 맥락에서 확장 및 압축의 초점 개념을 소개합니다. 방정식은 거리와 속도를 측정하는 데 중요한 확장 초점에서 바깥쪽으로 방사되는 벡터를 설명합니다. z에 대한 w의 비율은 벡터의 크기를 결정하고 확장 초점의 역수는 압축 초점입니다. w에 대한 z의 비율을 취함으로써 충돌 시간을 추정할 수 있으며 이는 우주선 착륙이나 거리 측정에 유용합니다. 그런 다음 아이디어가 벡터 형식으로 도입되지만 즉시 유용하지는 않습니다.

  • 00:15:00 이 섹션에서 발표자는 원근 투영 방정식과 이를 사용하여 이미지 좌표를 소개하는 방법에 대해 설명합니다. 확장의 초점은 z에 해당하는 r dot이 0인 지점으로 도입됩니다. 시간에 따라 각 구성 요소를 미분하여 3D 모션과 깊이 모션에 대한 방정식을 도출할 수 있습니다. 발표자는 또한 책의 부록에서 나온 결과를 사용하여 방정식을 흐름에 대한 일반적인 설명으로 변환하여 세계 운동 측면에서 이미지 운동을 표현할 수 있도록 합니다.

  • 00:20:00 이 섹션에서 강사는 이미지 모션의 개념과 z축과의 관계에 대해 설명합니다. 그 결과 이미지 움직임은 z축에 수직인 것으로 나타났습니다. 이는 이미지가 x 및 y 방향의 속도를 가진 2차원이기 때문에 놀라운 일이 아닙니다. 그런 다음 강의는 방사형 운동의 개념과 이미지 운동에 미치는 영향을 탐구하며, 물체가 관찰자를 향해 직접 이동하거나 관찰자로부터 멀어지면 이미지 움직임이 없다는 결론을 내립니다. 강사는 벡터의 길이가 모두 같지 않은 유동장의 예를 검토하여 결론을 내리며 불쾌하지만 이점이 있음을 보여줍니다.

  • 00:25:00 이 섹션에서 강사는 이미지 형성의 순방향 프로세스를 이해하면 모션 필드에서 깊이를 복구하는 역문제를 해결하는 데 어떻게 도움이 되는지 설명합니다. 강사는 깊이와 속도가 모션 필드의 모양에 영향을 미치는 두 가지 핵심 요소이며 하나를 알면 다른 하나를 계산하는 데 도움이 될 수 있다고 설명합니다. 그러나 둘 다 복구하면 솔루션이 여러 개이거나 전혀 없는 잘못된 문제가 발생할 수 있습니다. 강사는 또한 밝기 값의 2D 패턴으로 표현될 수 있는 이미지 밝기 패턴과 RGB 값을 사용한 색상 표현에 대해서도 간략하게 다루며 이는 나중에 설명합니다. 마지막으로 강사는 디지털 이미지가 공간과 일반적으로 직사각형 그리드에서 양자화되어 이미지가 연속적이거나 불연속적으로 표현될 수 있다고 설명합니다.

  • 00:30:00 강의의 이 섹션에서 교수는 이미지 처리에서 연속 도메인과 불연속 도메인의 차이점에 대해 논의합니다. 실제로 이미지는 두 개의 인덱스가 있는 숫자 배열로 표시되는 경우가 많지만 연속 함수를 사용하면 적분과 같은 특정 작업을 더 쉽게 이해할 수 있습니다. 또한 교수는 차이 방법을 사용하여 밝기의 x 및 y 도함수를 근사화하는 것과 이미지 처리에서 밝기 기울기의 중요성에 대해 이야기합니다. 강의는 또한 1D 센서와 이미지를 스캔하는 수단으로 모션 기능을 사용하여 이미징에 사용할 수 있는 방법에 대해 다룹니다. 교수는 이미지의 두 프레임 사이의 움직임 속도를 결정하는 문제를 제기하고 테이블 표면을 매핑하는 광학 마우스의 예를 제공합니다.

  • 00:35:00 이 섹션에서 강사는 광 마우스 기술에 대한 가정, 특히 표면을 볼 때 일정한 밝기 가정에 대해 논의합니다. 그는 또한 프레임 간의 밝기 변화를 분석하여 곡선의 작은 선형 근사를 사용하여 동작을 결정하는 방법을 설명합니다. 강사는 에지 감지에 사용할 수 있는 밝기 기울기의 구성 요소뿐만 아니라 편도함수 표기법을 소개합니다. 마지막으로 델타 e = e sub x 곱하기 델타 x 공식이 도출되고 델타 t로 나누어 모션을 계산합니다.

  • 00:40:00 강의의 이 섹션에서 발표자는 1D 이미지의 단일 픽셀에서 동작을 복구하는 방법에 대해 설명합니다. 그 결과 화자가 동작을 복구할 수 있지만 이 접근 방식은 2D 이미지에는 작동하지 않습니다. 발표자는 ET 값이 클수록 움직임이 빠르며 EX가 0인 경우 0으로 나누거나 작은 값으로 나누면 측정 문제로 인해 오류가 발생하기 때문에 문제가 있다고 설명합니다. 또한 화자는 EX 값이 작거나 0이면 측정 오류로 인해 노이즈 추정이 발생한다고 설명합니다.

  • 00:45:00 강의의 이 섹션에서 화자는 이미지에서 물체의 속도를 추정할 때 질감이 있는 기준점을 갖는 것의 중요성에 대해 논의합니다. 이러한 유형의 측정은 특정 이미지 조건이 충족되지 않는 한 잡음이 많고 신뢰할 수 없습니다. 그러나 여러 픽셀을 사용하고 최소 제곱과 같은 기술을 적용하여 오류를 줄임으로써 결과를 극적으로 개선할 수 있습니다. 여러 픽셀을 결합하면 측정값의 표준 편차를 n의 제곱근으로 줄일 수 있으며, 이는 대형 이미지의 경우 중요합니다. 그러나 경사가 높은 영역의 정보가 경사가 낮은 영역을 오염시키지 않도록 텍스처의 경사를 기반으로 측정값에 가중치를 부여하는 것이 중요합니다. 마지막으로 분석을 2D 이미지로 확장하고 다음 결과를 얻기 위해 여러 접근 방식을 논의합니다.

  • 00:50:00 이 섹션에서 강사는 x, y 및 t를 축으로 하는 밝기 값의 3차원 볼륨으로 비디오 프레임을 개념화하는 방법을 설명합니다. 강의는 계속해서 편도함수와 x, y 또는 t 방향의 이웃 픽셀의 차이에서 파생되는 방법을 설명합니다. 그런 다음 강사는 특히 움직이는 물체의 밝기 구배와 관련된 곡선을 따라 총 미분의 개념을 탐구합니다. 연쇄 법칙을 사용하여 전체 도함수를 부분 도함수로 표현할 수 있으므로 물체의 밝기가 시간에 따라 어떻게 변할지 예측할 수 있습니다. 마지막으로 강의는 이미지 시퀀스에서 u와 b를 찾는 개념을 소개합니다.

  • 00:55:00 이 섹션에서 강사는 광학 흐름 벡터 필드를 복구하려고 할 때 방정식 계산 및 제약 조건 문제에 대해 논의합니다. 하나의 미지수 u와 하나의 구속 방정식의 경우 유한한 수의 솔루션을 얻을 수 있습니다. 그러나 두 개의 미지수 u와 v와 하나의 방정식 제약 조건이 있으면 희망이 없어 보입니다. 제약 방정식은 이미지가 움직일 때 밝기가 변하지 않는다는 가정에서 파생됩니다. 강사는 구속 방정식을 속도 공간에 플로팅하면 그것이 선임을 드러내며 문제를 해결하는 데 있어 중요한 발전임을 보여줍니다. 목표는 포인트를 포인트로 고정하고 정확한 광학 흐름 벡터 필드를 얻는 것입니다.

  • 01:00:00 비디오의 이 섹션에서 발표자는 물체의 움직임을 결정할 때 밝기 기울기의 중요성에 대해 논의합니다. 밝기 기울기는 밝기가 높은 영역과 낮은 영역 사이의 전환에 수직인 단위 벡터입니다. 연사는 국부 측정을 할 때 물체의 움직임을 결정하기 위한 방정식이 충분하지 않다고 설명합니다. 그러나 밝기 기울기 방향으로 움직임을 결정하는 것은 가능합니다. 그런 다음 발표자는 2D 사례에 대해 논의하고 개체의 움직임을 결정하기 위해 여러 제약 조건을 사용해야 한다고 말합니다. 이를 시연하기 위해 화자는 간단한 선형 방정식을 풀어 u 및 v 값을 복구합니다.

  • 01:05:00 이 섹션에서 강사는 2x2 행렬을 반전하고 이를 사용하여 이미지 움직임에 대한 일련의 선형 방정식을 푸는 방법을 설명합니다. 그러나 일부 에지 케이스에서는 행렬의 결정자가 0일 수 있습니다. 즉, 밝기 기울기가 서로 비례하여 조리개 문제가 발생합니다. 이 문제는 서로 다른 이미지 영역에 대한 기여도가 단순히 결과를 평균화하는 것이 아니라 다르게 가중치를 부여해야 함을 시사합니다. 이 문제를 해결하려면 방정식을 0 또는 가능한 한 작게 만드는 u 및 v 값을 검색해야 합니다.

  • 01:10:00 이 섹션에서 발표자는 u 및 v의 올바른 값이 전체 이미지에 통합될 때 적분 값이 0이 되는 이상적인 경우에 적용되는 제약 조건에 대해 설명합니다. 이것은 u와 v의 정확한 값을 찾기 위한 전략의 기초가 될 수 있습니다. 발표자는 장면에 빛이나 질감이 없을 때 이 접근 방식이 실패하여 ex와 ey에 대한 값이 0이 될 수 있다고 지적합니다. 그런 다음 연사는 피적분을 제곱하고 최소화하여 피적분을 항상 양수로 바꾸는 방법을 설명하여 미지수가 두 개인 두 방정식의 미적분 문제로 이어집니다. 그러나 이것은 2x2 행렬의 결정자가 0인 경우 실패할 수 있습니다. 이는 ex가 모든 곳에서 0이거나 ex가 ey와 같은 경우 발생할 수 있습니다.

  • 01:15:00 이 섹션에서 발표자는 동일한 밝기 기울기의 선인 등광선의 다양한 경우에 대해 논의합니다. 등광선은 45도 각도, 평행선 또는 곡선일 수 있습니다. 그러나 화자는 다른 모든 경우를 포함하기 때문에 가장 일반적인 경우는 어떤 각도에서 isophototes임을 강조합니다. 그들은 또한 등광선이 평행선일 때 유일한 문제가 발생하며, 이는 모서리 또는 높은 등광선 곡률이 있는 영역과 같이 밝기 구배가 많이 변하는 이미지의 영역을 찾아 극복할 수 있다고 언급합니다. 마지막으로 발표자는 노이즈 게인의 개념을 소개하고 학생들이 강의 또는 다가오는 숙제에 대해 궁금한 점을 보내도록 권장합니다.

  • 01:20:00 이 섹션에서 강사는 움직임의 속도를 결정할 때 시끄러운 답이 아닌 의미 있는 답을 계산하는 것의 중요성에 대해 논의합니다. 그는 결과 변화에 대한 이미지 변화의 민감도를 나타내는 노이즈 게인의 개념과 이것이 속도 계산에 미치는 영향을 설명합니다. 그런 다음 순방향 함수가 알려진 1차원 변환을 설명하고 목표는 노이즈에 지나치게 민감하지 않고 합리적으로 반전하는 것입니다.
 

강의 3: 접촉 시간, 확장 초점, 직접 모션 비전 방법, 노이즈 게인



강의 3: 접촉 시간, 확장 초점, 직접 모션 비전 방법, 노이즈 게인

이 강의에서는 머신 비전 프로세스와 관련된 노이즈 게인의 개념을 강조하고 정확도의 다양한 방향과 변화에 중점을 둡니다. 강사는 벡터를 정확하게 측정하고 게인을 이해하여 계산 오류를 최소화하는 것의 중요성에 대해 설명합니다. 이 강연에서는 접촉 시간의 개념, 확장의 초점 및 동작 필드를 다루며, 접촉 시간을 추정하기 위해 방사형 그래디언트를 계산하는 방법을 시연합니다. 또한 강사는 웹 카메라를 사용한 라이브 시연과 함께 멀티 스케일 슈퍼픽셀을 사용하여 프레임별 계산의 한계를 극복하는 방법을 시연합니다. 전반적으로 강의는 머신 비전 프로세스의 복잡성에 대한 유용한 통찰력과 다양한 수량을 정확하게 측정하는 방법을 제공합니다.

강의는 모션 비전의 다양한 측면과 접촉 시간 결정, 확장 초점 및 직접 모션 비전 방법에 대한 응용 프로그램에 대해 논의합니다. 발표자는 중간 결과를 시각화하는 도구를 시연하지만 그 한계와 오류도 인정합니다. 또한 이미지 처리에서 임의의 움직임을 처리하는 문제를 해결하고 유사한 속도로 움직이는 인접 지점의 중요성을 강조합니다. 또한 다이렉트 모션 비전 방식의 성공에 영향을 미치는 패턴에 대해 탐구하고, 접촉 시간과 적을 보다 편리하게 정의하기 위한 새로운 변수를 소개합니다. 마지막으로 다양한 변수가 모션 비전에 어떻게 영향을 미치는지 이해하기 위해 3개의 선형 방정식과 3개의 미지수를 푸는 과정과 계산 속도를 높이기 위한 과정의 병렬화에 대해 논의합니다.

  • 00:00:00 이 섹션에서 강사는 측정 오류와 환경과 관련된 수량 추정 오류 간의 관계를 나타내는 노이즈 게인에 대해 설명합니다. 그는 아이디어를 설명하기 위해 Wi-Fi 액세스 포인트를 사용하는 실내 GPS 시스템의 예를 사용합니다. 시스템의 정확도는 전화에서 액세스 포인트까지의 왕복 시간을 매우 정확하게 측정하여 제한됩니다. 강사는 일부 머신 비전 프로세스의 노이즈 게인 분석이 방향에 따라 다를 것이며 단일 숫자가 아닐 것이라고 강조합니다. 오히려 정확도는 한 방향에서는 꽤 잘 결정될 수 있지만 다른 방향에서는 그렇지 않습니다. 이동 방법에 따라 다릅니다.

  • 00:05:00 비디오의 이 섹션에서 강사는 트랜스폰더를 사용하여 위치를 결정하는 개념과 이로 인해 발생할 수 있는 해당 오류에 대해 설명합니다. 그는 두 개의 응답기를 사용하여 일렬로 배치하면 작은 거리 변화로 인해 특정 방향의 정확도를 결정하기 어렵다고 설명합니다. 그러나 응답기가 90도 떨어져 있으면 정확도가 향상됩니다. 또한 강사는 동일한 양의 오류로 가능한 위치의 궤적을 결정하는 것과 관련하여 원의 사용을 설명합니다.

  • 00:10:00 이 섹션에서 강사는 측정해야 하는 환경의 양에서 기기에서 관찰할 수 있는 것으로 전환하는 순방향 변환의 개념을 설명합니다. 그는 측정이 완벽하지 않을 수 있으므로 관심 있는 양의 잡음이 전달 함수의 도함수에 의한 측정의 잡음과 관련이 있다고 설명합니다. 강사는 또한 노이즈 게인의 중요성을 강조하면서 x의 작은 f프라임 값은 측정되는 양의 불확실성이 커지기 때문에 좋지 않다는 점을 강조합니다.

  • 00:15:00 이 섹션에서 발표자는 벡터를 측정하는 방법과 이러한 측정에서 이득을 이해하는 것의 중요성에 대해 논의합니다. 그들은 벡터를 측정하는 것이 스칼라 수량을 측정하는 것보다 조금 더 복잡해야 하지만 여전히 선형 변환을 적용하여 수행할 수 있다고 설명합니다. 연사는 벡터 측정의 중요한 측면이 이방성을 고려하고 결과 및 측정의 변화 크기를 결정하는 이득을 이해하는 것이라고 강조합니다. 행렬식의 역함수를 결정하는 것은 선형방정식을 푸는 데 필수적이며, 이 값이 0이 되거나 너무 작아지지 않도록 하여 계산 오류의 증폭을 최소화하는 것이 중요합니다. 화자는 역행렬을 구하는 방법을 설명하기 위해 2x2 행렬의 예를 제공합니다.

  • 00:20:00 본 강의에서는 노이즈 게인의 개념을 움직임과 관련된 예제에 적용하여 변수 u와 v에 대해 해결합니다. 양이 작으면 노이즈가 크게 증폭되며, 이는 두 픽셀의 밝기 기울기가 방향이 비슷하여 정보의 차이가 거의 없기 때문입니다. 속도 공간 다이어그램은 두 선이 교차하는 방식과 한 선의 작은 이동이 교차점에서 어떻게 큰 변화를 일으킬 수 있는지를 보여주기 위해 사용되며, 이는 바람직하지 않은 경우입니다. 그러나 잡음 이득이 모든 방향에서 동일하게 높지 않을 수 있으며 어떤 구성 요소를 신뢰할 수 있는지 아는 것이 유용하므로 모든 희망이 사라지는 것은 아닙니다. 그런 다음 강의는 접촉 시간의 개념으로 이동하기 전에 일정한 밝기 가정과 구속 방정식을 계속 검토합니다.

  • 00:25:00 더 복잡한 표기. 이 섹션에서 강사는 광학 마우스 문제와 최소 제곱 접근 방식을 사용하여 이를 처리하는 방법에 대해 설명합니다. 목표는 ex, ey 및 et의 측정을 사용하여 올바른 속도를 찾는 것이지만 이러한 측정은 일반적으로 노이즈로 인해 손상되므로 적분의 최소값(0이 아님)이 u 및 v의 추정치가 됩니다. 강사는 넘어갑니다. 최소값을 결정하고 이 적분을 최소화하는 것의 중요성을 설명하기 위한 일부 미적분. 그런 다음 확장 초점의 경우와 같이 u와 v가 예측 가능한 간단한 경우로 이동하고 원근 투영에서 세계 좌표와 이미지 좌표 간의 관계를 검토합니다.

  • 00:30:00 이 섹션에서 발표자는 x 및 y 방향에서 속도가 0인 동작에 대한 속도, 거리 및 확장 초점 사이의 관계에 대해 논의합니다. 이야기는 z 방향의 운동 구성 요소인 az의 w의 양과 접촉 시간이라고도 하는 초당 미터 또는 초 단위로 측정된 속도의 거리를 다룹니다. 아무 것도 변경되지 않으면 객체와 충돌하기까지 오랜 시간이 걸립니다. 그런 다음 발표자는 간단한 예를 들어 누군가가 벽을 향해 이동할 때 확장의 초점이 어떻게 작동하는지 그리고 해당 시나리오에서 모션 필드가 어떻게 보이는지 시연합니다.

  • 00:35:00 이 섹션에서 발표자는 벡터를 찾는 것이 확장 초점을 찾는 문제를 해결하는 가장 쉬운 방법이라고 생각할 수 있지만 현실은 밝기 패턴인 이미지뿐이며 그 안에는 벡터가 없습니다. 대신 이 문제를 해결하기 위해 확장 또는 축소 이미지의 이미지 데이터를 사용해야 합니다. 화자는 확장이 아닌 압축을 나타내는 벡터 다이어그램을 보여 주지만 확장의 초점이 이 실험에서 필수적인 요소임을 강조합니다. 발표자는 또한 두 벡터의 내적인 방사형 그래디언트의 아이디어를 소개합니다. 밝기 그래디언트의 벡터와 카메라의 광학 중심에 대한 벡터입니다. 이미지의 한 지점에서 밝기 도함수를 사용하여 접촉합니다. 그러나 이러한 수치는 노이즈의 영향을 받으며 미분 추정은 상황을 악화시키므로 이 방법은 그다지 정확하지 않습니다.

  • 00:40:00 이 섹션에서 강사는 방사형 그래디언트를 계산하고 이를 사용하여 이미지의 접촉 시간을 추정하는 방법을 설명합니다. 방사형 그래디언트는 이미지에 세워진 극좌표계에서 방사형 벡터와 이미지 그래디언트의 내적을 취하여 계산됩니다. 그런 다음 강사는 최소 제곱법을 사용하여 점광원에 대해 계산된 방사형 그래디언트와 이론적 값 0 사이의 차이를 최소화하는 방법을 보여줍니다. 이것은 매개변수 c의 추정이 접촉 시간을 제공하는 광학 축을 따라 움직이는 단순한 경우에 적용됩니다.

  • 00:45:00 강의의 이 섹션에서 교수는 직접 모션 비전 방법을 사용하여 접촉 시간을 추정하는 접근 방식을 설명합니다. 그는 미적분학을 사용하여 노이즈가 있을 때 평균 제곱 오차를 최소화하고 접촉 시간의 역수인 c에 대한 공식을 도출합니다. 핵심은 x 및 y 방향의 이웃 픽셀을 사용하여 밝기 기울기를 추정한 다음 방사형 기울기를 계산하고 마지막으로 모든 픽셀에 대해 이중 적분을 계산하여 g 및 g 제곱의 추정치를 얻는 것입니다. 이것으로 접촉 시간은 c 공식을 사용하여 쉽게 추정할 수 있습니다. 이 방법은 간단하고 효과적이며, 높은 수준의 처리나 정교한 물체 인식 기술이 필요하지 않아 접촉 시간을 직접 계산합니다.

  • 00:50:00 이 섹션에서는 화자가 이미지 분석 기술을 사용하여 버스의 위치를 측정하는 방법에 대해 설명합니다. 버스 이미지의 픽셀 수와 시간 경과에 따른 변화를 측정하여 버스의 위치를 정확하게 결정할 수 있습니다. 그러나 이 프로세스에는 높은 수준의 정밀도가 필요하며 더 복잡한 시나리오를 처리할 때 어려울 수 있습니다. 이러한 기술을 시연하기 위해 화자는 이미지를 처리하여 다양한 물체와 접촉하는 시간과 확장 초점을 추정하는 Montevision이라는 프로그램을 사용합니다. 이 프로그램은 이미지 기반 분석의 정확도를 최적화하기 위해 세 가지 값을 계산하지만 결과에 노이즈가 많기 때문에 효과적이려면 지속적인 개선이 필요합니다.

  • 00:55:00 이 섹션에서 강사는 프레임별 계산을 사용하여 접촉 시간을 계산하는 방법과 제한 사항에 대해 설명합니다. 이러한 제한에는 이미지 초점 변경 및 더 가까운 물체에서 더 큰 속도를 조정하는 방법의 실패가 포함됩니다. 강사는 이미지 처리 속도와 정확도를 개선하기 위해 다중 스케일 슈퍼픽셀을 사용하거나 픽셀을 함께 그룹화하여 이러한 한계를 극복하는 방법을 보여줍니다. 마지막으로 강사는 웹 카메라를 사용하여 카메라의 움직임에 따라 접촉 시간을 표시하는 라이브 시연을 보여줍니다.

  • 01:00:00 이 섹션에서 강사는 중간 결과를 표시할 수 있는 도구를 시연합니다. 여기서 x 미분은 빨간색을 제어하고 y 미분은 녹색을 제어하여 지형에서 기울기의 급격한 변화와 유사한 3차원 효과를 제공합니다. 지도. 또한, 방사형 도함수 g는 바깥쪽으로 향하는 것으로 나타나며 시간 도함수 et를 곱하면 움직임을 결정할 수 있습니다. 그러나 그러한 도구에는 계산 가능한 한계와 오류가 있고 매직 코드가 없으므로 흥미롭고 이해하기 쉬운 도구라는 점은 인정됩니다.

  • 01:05:00 이 섹션에서 강사는 이미지 처리에서 임의의 움직임을 처리하는 문제에 대해 논의합니다. 그는 각각 x 및 y 방향의 움직임을 나타내는 u 및 v가 이미지 전체에서 다를 수 있다는 사실에서 문제가 발생한다고 지적합니다. 이것은 200만 개의 미지수에서 100만 개의 방정식으로 이어져 문제를 해결할 수 없는 것처럼 보이게 할 수 있습니다. 강사는 문제를 해결하기 위해 추가 가정이 필요할 수 있다고 제안하지만 대부분의 경우 이미지의 인접 지점이 동일하거나 유사한 속도로 이동하여 추가 정보를 제공한다고 설명합니다. 그는 또한 이미지에 방사형 그래디언트가 0인 경우 솔루션이 실패할 수 있음을 경고하고 이것이 의미하는 바를 설명합니다.

  • 01:10:00 이 섹션에서 강사는 직접 비전 모션 방법을 사용하여 접촉 시간을 계산하는 데 성공하는 데 영향을 미칠 수 있는 패턴에 대해 논의합니다. 강사는 x 모양과 같은 일부 패턴은 기울기가 다른 방향으로 변경되므로 접촉 시간을 계산하는 데 유용한 정보를 제공한다고 설명합니다. 그러나 원형 차트와 같은 다른 패턴은 그래디언트의 방향이 일관되기 때문에 이 정보를 제공하지 못합니다. 강사는 또한 알고리즘이 종이와 같이 상대적으로 일관된 패턴으로 존재하는 작은 얼룩이나 섬유에서 0이 아닌 exey를 선택할 수 있다고 언급합니다. 마지막으로 방정식에서 접촉 시간과 적을 보다 편리하게 정의하는 데 도움이 되는 z의 fu와 z의 fv라는 두 가지 새로운 변수를 소개합니다.

  • 01:15:00 이 섹션에서 발표자는 두 개의 매개변수 a와 b를 기반으로 확장 초점을 계산하는 공식과 f가 공식에 나타나지 않는 방법에 대해 논의합니다. 많은 목적을 위해 f는 거리와 속도를 계산하는 데 필요하지만 접촉 시간 계산에는 f가 필요하지 않습니다. 그런 다음 화자는 유한한 수의 매개변수 a, b 및 c를 사용하여 문제를 최소 제곱 문제로 공식화하고 적분을 미분하여 피적분의 도함수를 찾습니다.

  • 01:20:00 강의의 이 섹션에서 연사는 다양한 변수가 모션 비전에 어떤 영향을 미치는지 알아보기 위해 3개의 선형 방정식과 3개의 미지수를 푸는 방법을 설명합니다. 이 솔루션은 닫힌 형식을 가지고 있어 다른 매개변수로 다시 계산하지 않고 결론을 신속하게 도출할 수 있으므로 이점이 있습니다. 계수에 영향을 미치는 수평, 수직 및 g 방향으로 구별되는 3개의 누산기가 있습니다. 계수 행렬은 대칭이므로 솔루션의 안정성을 이해할 수 있습니다.

  • 01:25:00 강의의 이 섹션에서 연사는 이미지에서 6개의 누산기를 실행하고 진행하면서 추가하는 프로세스를 병렬화하는 방법에 대해 설명합니다. 이 프로세스는 픽셀 간의 상호 작용이 필요하지 않으므로 GPU에서 실행하면 속도가 빨라질 수 있습니다. 이러한 누적기는 이미지 내에서 밝기 패턴과 텍스처를 누적하기 때문에 시간 변화에 의존하지 않습니다. 나머지 3개의 누산기는 시간 변화에 따라 달라집니다. 모든 누산기가 계산되면 3개의 미지수에서 3개의 방정식을 풀어야 합니다.
 

강의 4: 고정 광 흐름, 광 마우스, 일정한 밝기 가정, 폐쇄형 솔루션



강의 4: 고정 광 흐름, 광 마우스, 일정한 밝기 가정, 폐쇄형 솔루션

자율성을 위한 시지각 강의 4강에서는 고정광류, 광마우스, 일정한 밝기 가정, 폐쇄형 해법, 접촉시간 등의 주제를 다룬다. 일정한 밝기 가정은 이미지의 움직임을 밝기 기울기와 밝기 변화율과 관련시키는 밝기 변화 제약 방정식으로 이어집니다. 또한 강사는 카메라나 표면이 기울어진 상황을 모델링하는 방법을 시연하고 큰 움직임을 처리할 때 다중 척도 평균화의 이점에 대해 논의합니다. 또한 강의는 다양한 자율 상황에서 접촉하는 데 시간을 사용하는 방법을 탐구하고 행성 우주선에 착륙하기 위한 다양한 제어 시스템을 비교합니다. 마지막으로 강의에서는 선의 투영과 원근 투영을 사용하여 선을 정의하는 방법에 대해 다룹니다.

발표자는 소실점을 사용하여 카메라 보정을 위한 변환 매개변수를 복구하는 방법과 알려진 모양을 가진 보정 개체가 카메라 중심 시스템에서 점의 위치를 결정하는 방법을 포함하여 이미지 처리 응용 프로그램에 대해 논의합니다. 또한 구와 정육면체 등 광학적 흐름 알고리즘의 보정 대상으로 서로 다른 형상을 사용할 때의 장단점과 정육면체와 3개의 벡터를 사용하여 미지의 투영 중심을 찾는 방법에 대해서도 강의합니다. 강의는 실제 로봇 카메라 보정을 위해 방사형 왜곡 매개변수를 고려하는 것의 중요성을 강조하면서 끝납니다.

  • 00:00:00 이 섹션에서는 강사가 이미지 형성 및 모션 추적에 대해 이야기합니다. 그들은 원근 투영 방정식과 움직임이 일어나는 지점인 확장의 초점에 대해 논의합니다. 밝기가 일정하다는 가정이 도입되었습니다. 이는 많은 상황에서 환경에 있는 한 지점의 이미지 밝기가 시간이 지나도 변하지 않는다는 것을 의미합니다. 강사는 이 가정이 이미지의 움직임을 밝기 기울기와 밝기 변화율과 관련시키는 밝기 변화 제약 방정식으로 이어지는 방법을 설명합니다. 강의는 또한 속도를 해결하는 데 추가 제약이 필요한 방법과 동일한 속도로 움직이는 모든 것이 어떻게 극단적인 제약이 될 수 있는지에 대해 설명합니다.

  • 00:05:00 강의의 이 섹션에서 화자는 광학 마우스의 경우와 같이 전체 이미지에 대해 상수 u 및 v가 있는 광학 흐름 문제에서 u 및 v를 추정하기 위해 오류를 최소화하는 기술에 대해 논의합니다. . 이 프로세스는 매우 과도하게 제한되지만 대칭 2x2 계수 행렬을 사용하여 미지수에서 선형 방정식을 얻을 수 있습니다. 발표자는 미분을 계산하는 방법과 이 방법이 작동하지 않는 조건을 보여줍니다. 그들은 또한 e_x와 e_y가 모든 곳에서 동일한 비율에 있고 이 조건이 참인 특정 유형의 이미지를 설명합니다.

  • 00:10:00 이 섹션에서 강사는 c만 다른 평행선이 있는 직선인 exy가 상수인 isophoto에 대해 이야기합니다. 이러한 유형의 이미지는 한 방향으로의 슬라이딩을 측정할 수 없어 다른 부분을 결정할 수 없기 때문에 광학 마우스 시스템에 문제가 됩니다. 그런 다음 강의에서는 절대값이 아닌 분수 부분의 비율에 의존하는 접촉 시간의 개념을 소개하여 시스템이 보정 없이 작동할 수 있도록 합니다. 강사는 또한 방정식을 미분하는 방법을 시연하여 물체의 크기가 일정하여 제품의 도함수가 0이 된다는 것을 보여줍니다.

  • 00:15:00 이 섹션에서 강사는 프레임 간 크기의 특정 비율 변화를 거리의 특정 비율 변화로 변환하는 간단한 관계를 설명합니다. 이는 접촉 시간(TTC)으로 직접 변환됩니다. 강사는 이미지 크기 방법을 사용하여 TTC를 추정할 때 이미지 크기를 정확하게 측정하는 것이 중요하다고 강조합니다. 높은 TTC의 경우 프레임 간 이미지의 미세한 변화가 상대적으로 작기 때문입니다. 강사는 또한 z가 일정하다는 가정이 여전히 적용된다는 점에 주목하면서 평면 표면에 대한 접촉 시간에 대한 가정에 대해 논의합니다.

  • 00:20:00 이 섹션에서 강사는 카메라나 표면이 기울어진 상황을 모델링하는 방법에 대해 설명합니다. 기울어진 평면의 경우 이미지에서 깊이가 더 이상 일정하지 않습니다. 평면에 대한 방정식은 x와 y의 선형 방정식이며 보기에 더 복잡한 모델일 수 있습니다. 일반적으로 거기에서는 방정식이 너무 복잡해질 수 있으며 폐쇄형 솔루션이 없을 수 있습니다. 그러나 폐쇄형 솔루션이 있는 경우에 먼저 집중하는 것이 좋습니다. 표면이 평면이 아닌 경우 다항식으로 근사하여 최소 제곱 문제를 설정할 수 있습니다. 불행하게도 폐쇄형 솔루션을 찾을 수 없으므로 수치 솔루션이 필요합니다. 그럼에도 불구하고 솔루션이 다른 방향으로 구불구불하게 떨어져서 표면이 평면이라는 모델링에 비해 이점을 잃게 되므로 더 많은 변수를 도입하는 데 주의해야 합니다.

  • 00:25:00 이 섹션에서 발표자는 광학 흐름의 다중 스케일 구현 문제에 대해 논의합니다. 성공적인 구현에도 불구하고 그는 이미지의 움직임이 커질수록 결과의 정확도가 떨어진다고 언급합니다. 이 문제를 처리하는 한 가지 방법은 더 작은 이미지로 작업하여 프레임당 모션을 줄이는 것입니다. 발표자는 또한 큰 동작을 처리하기 위해 점점 더 작은 이미지 세트로 작업하는 것과 관련된 다중 척도 평균화의 이점에 대해 논의합니다. 필요한 작업량은 하위 집합의 수에 따라 증가하지만 총 계산 노력은 줄어듭니다. 발표자는 멀티 스케일 최적화 프로세스가 이전 강의에서 사용된 단순한 2x2 블록 평균화보다 더 복잡하다고 강조합니다.

  • 00:30:00 강의의 이 섹션에서 발표자는 다중 스케일 작업이 광학 흐름 계산 결과를 크게 향상시킬 수 있는 방법에 대해 논의합니다. 그는 앨리어싱을 방지하기 위해 저역 통과 필터링 후에 서브샘플링을 수행해야 하며, 2의 제곱근과 같은 덜 공격적인 요소로 서브샘플링을 수행할 수 있지만 더 단순한 2x2 블록을 위해 무시되는 경우가 많다고 설명합니다. 평균 방법. 발표자는 또한 비행기 사고를 방지하고 우주선이 목성의 위성인 유로파에 착륙하는 것을 개선하기 위해 접촉하는 데 시간을 사용하는 것과 같은 광학 흐름의 몇 가지 흥미로운 응용에 대해 언급합니다. 그는 제어 시스템이 로켓 엔진 가속을 변경하고 보다 안정적으로 우주선을 격추시키기 위해 측정에 접촉하는 데 시간을 사용할 수 있는 방법을 설명합니다.

  • 00:35:00 이 섹션에서는 자동차나 우주선과 같은 다양한 자율 상황에서 사용할 수 있는 하강 중에 접촉할 시간을 일정하게 유지하는 간단한 시스템에 대해 강의합니다. 기본 아이디어는 측정된 접촉 시간이 원하는 것보다 짧거나 긴지 여부에 따라 엔진에 적용되는 힘을 조정하여 일정하게 유지하는 것입니다. 이 방법은 특정 질감이나 보정에 의존하지 않고 단순히 높이와 속도 사이의 비율에 의존합니다. 이 시스템의 방정식은 z에 비례하는 해를 갖는 상미분 방정식으로 풀 수 있습니다.

  • 00:40:00 이 섹션에서 강사는 지속적인 접촉 시간 제어 시스템에 대해 논의하고 이를 행성 우주선에 착륙하기 위한 보다 전통적인 접근 방식과 비교합니다. 일정 시간 접촉 제어 시스템은 접촉 시간을 일정하게 유지하고 표면까지의 거리 및 속도에 대한 자세한 지식이 필요하지 않기 때문에 에너지 효율적이라는 이점이 있습니다. 강사는 일정한 가속 하에서 접촉하는 시간의 계산을 보여주고 접촉하는 시간은 항상 일정한 높이 전략을 사용하여 관찰되는 것의 절반임을 강조합니다.

  • 00:45:00 이 섹션에서 강사는 일정 가속 제어의 개념과 거리 및 속도를 추정하기 위한 기존 접근 방식과 비교하는 방법에 대해 설명합니다. 그런 다음 그는 고정 흐름이라고 하는 광학 흐름의 일반화를 소개하고 이미지의 모든 부분의 움직임이 동일하다고 가정한다고 설명합니다. 그러나 독립적인 동작이 있거나 미지의 수가 적은 경우 시스템이 과도하게 결정될 수 있습니다. 또한 제약 조건이 부족한 시스템의 잘못된 문제와 이를 해결하기 위해 무거운 제약 조건을 사용할 수 있는 방법에 대해서도 설명합니다.

  • 00:50:00 이 섹션에서 강사는 이미지의 인접 지점이 독립적으로 이동하지 않고 비슷한 속도로 이동하는 경향이 있어 광학 흐름에 대한 제약을 만드는 방법에 대해 설명합니다. 그러나 이 제약 조건은 간단한 방정식이 아니며 해결하려면 보다 정밀한 도구가 필요합니다. 이러한 도구를 사용할 수 없는 경우 이미지는 해당 영역에서 일정한 속도라는 가정이 덜 중요한 더 작은 조각으로 나눌 수 있습니다. 그러나 이 분할은 또한 해당 영역의 해상도와 밝기 균일성 사이에 트레이드 오프를 생성합니다. 강의는 또한 소실점의 개념과 카메라 보정 또는 두 좌표계의 상대적인 방향을 결정하는 데 사용할 수 있는 방법에 대해 다룹니다.

  • 00:55:00 강의의 이 섹션에서 교수는 선의 투영과 대수 및 기하학적을 포함하여 다양한 방법으로 정의할 수 있는 방법에 대해 논의합니다. 그는 3D에서 선은 단위 벡터를 사용하여 점과 방향으로 정의될 수 있으며 선의 서로 다른 점은 서로 다른 s 값을 갖는다고 설명합니다. 교수는 계속해서 이것을 원근법 투영을 사용하여 이미지에 투영할 수 있는 방법을 설명하여 변수 x, y 및 z가 있는 복잡한 방정식을 생성합니다. 그러나 s를 매우 크게 함으로써 방정식을 단순화할 수 있고 카메라 보정 및 이미징 시스템의 효과를 연구할 수 있습니다.

  • 01:00:00 이 섹션에서 발표자는 소실점에 대해 이야기합니다. 소실점은 선이 이미지 평면의 한 점으로 수렴하는 결과입니다. 이러한 소실점은 이미지의 기하학에 대해 학습하는 데 사용할 수 있으며, 이는 경찰, 건설 노동자 및 다가오는 차량으로 인해 위험에 처할 수 있는 다른 사람들에게 경고하는 것과 같은 실제 시나리오에 적용될 수 있습니다. 카메라는 소실점을 찾아 도로를 기준으로 카메라 중심 좌표계의 회전을 결정할 수 있습니다. 평행선은 동일한 소실점을 갖습니다. 즉, 직사각형 모양을 형성하는 일련의 평행선이 있는 경우 세 개의 소실점이 예상됩니다.

  • 01:05:00 이 섹션에서 강사는 이미지 처리의 두 가지 응용 프로그램에 대해 설명합니다. 카메라 보정을 위한 변환 매개변수를 복구하기 위해 소실점 찾기 및 알려진 모양을 가진 보정 개체를 사용하여 카메라 중심에서 점의 위치를 결정 체계. 강사는 소실점을 찾으면 도로와 수평선 방향에 상대적인 카메라의 팬 및 틸트를 복구할 수 있다고 설명합니다. 강의는 또한 정확한 카메라 보정을 위해 이미지 평면 위의 렌즈 위치와 중앙 프로젝션의 높이를 복구해야 하는 필요성을 다룹니다. 강사는 카메라 중심 시스템에서 점의 위치를 결정하기 위해 구형과 같은 알려진 모양을 가진 보정 개체를 사용할 것을 제안합니다.

  • 01:10:00 이 섹션에서 강사는 광학 흐름 알고리즘에 대한 보정 대상으로 다양한 모양을 사용하는 장단점에 대해 설명합니다. 구형은 상대적으로 쉽게 만들고 구할 수 있지만 이미지 평면에 투사할 때 시끄럽고 정확하지 않을 수 있습니다. 반면 큐브는 소실점에 해당하는 직각과 평행선으로 인해 상당한 이점이 있습니다. 강사는 소실점을 찾는 것이 선을 따라 3D를 가리키는 세 벡터의 이미지 투영을 결정하는 데 어떻게 도움이 될 수 있는지 설명합니다. 이 정보는 광학 흐름 알고리즘을 보다 정확하게 보정하는 데 사용할 수 있습니다.

  • 01:15:00 이 섹션에서 발표자는 정육면체와 같은 보정 개체와 A, B, C의 세 벡터를 사용하여 알 수 없는 투영 중심 P를 찾는 방법에 대해 이야기합니다. 세 벡터는 다음과 직각입니다. 이것은 P의 세 가지 미지수를 푸는 세 가지 방정식을 만드는 데 도움이 됩니다. 그러나 이차 방정식의 2차 항은 Zoot의 정리가 들어오는 여러 해를 가질 수 있게 합니다. 정리를 사용하여, 화자는 최대 솔루션 수가 방정식 순서의 곱임을 보여줍니다. 방정식을 단순화하기 위해 화자는 방정식을 쌍으로 빼서 미지수를 찾는 데 사용할 수 있는 세 개의 선형 방정식으로 이어집니다.

  • 01:20:00 이 섹션에서는 3개의 선형 방정식이 있지만 선형적으로 독립적이지 않으므로 두 개의 솔루션만 있음을 배웁니다. 선형 방정식은 3D 공간에서 평면을 정의하고 교차할 때 추가 정보를 제공하지 않는 세 번째 평면을 포함하는 선이 됩니다. 이 기술은 카메라를 보정하고 투사 중심의 위치를 찾는 데 유용합니다. 그러나 실제 카메라에는 실제 로봇 카메라 보정을 위해 고려해야 하는 방사형 왜곡 매개변수가 있습니다.
 

강의 5: TCC 및 FOR MontiVision 데모, 소실점, 카메라 보정에서 VP 사용



강의 5: TCC 및 FOR MontiVision 데모, 소실점, 카메라 보정에서 VP 사용

원근투영에서 소실점의 활용, 이미지 캘리브레이션에서 투영의 중심과 주점을 찾기 위한 삼각측량, 직교행렬에서 회전을 표현하기 위한 법선행렬의 개념 등 카메라 캘리브레이션과 관련된 다양한 주제를 다룬다. 강사는 또한 카메라의 초점 거리를 찾는 수학 및 소실점을 사용하여 세계 좌표계를 기준으로 카메라의 방향을 결정하는 방법을 설명합니다. 또한 TCC 및 FOR MontiVision 데모의 사용에 대해 논의하고 문제 해결에서 방정식 이면의 기하학을 이해하는 것의 중요성에 대해서도 설명합니다.

강의는 조명이 표면 밝기에 미치는 영향, 두 개의 서로 다른 광원 위치를 사용하여 무광택 표면을 측정하는 방법, 알베도를 사용하여 단위 벡터를 해결하는 방법 등 컴퓨터 비전과 관련된 다양한 주제를 다룹니다. 강의는 또한 카메라 보정의 소실점과 세 개의 독립적인 광원 방향을 사용하여 밝기를 측정하는 간단한 방법에 대해 설명합니다. 마지막으로 화자는 원근 투영의 대안으로 직교 투영과 이를 표면 재구성에 사용하는 데 필요한 조건을 만집니다.

  • 00:00:00 이 섹션에서 발표자는 키보드를 가리키는 웹캠에서 TCC 및 FOR MontiVision 데모를 사용하는 방법을 시연합니다. 그들은 접촉 시간 계산의 중요성과 이러한 계산에 영향을 미치는 요소에 대해 논의합니다. 발표자는 또한 원근법 투영에서 소실점의 개념과 카메라 보정에서 사용할 수 있는 방법에 대해 논의합니다. 그들은 접촉 시간 계산을 위한 방정식과 dzdt의 부호가 움직이는 물체의 이미지에 어떤 영향을 미치는지 설명합니다.

  • 00:05:00 이 섹션에서 강사는 특수 평행선이 투영 중심을 통과하는 이미지 평면의 지점인 카메라 보정의 소실점 개념에 대해 설명합니다. 다른 평행선에도 소실점이 있으며, 멀어질수록 이미지에 대한 투영이 특수 선의 투영에 가까워집니다. 이 개념은 컴퓨터 비전 애플리케이션에서 객체 인식에 유용한 좌표계와 카메라 보정 사이의 관계를 결정할 수 있게 해줍니다. 강사는 보정을 위해 이미지 평면에 투영할 수 있는 좌표계를 정의하는 평행선 세트가 있는 직사각형 개체의 세계에 대한 예를 제공합니다.

  • 00:10:00 이 섹션에서 발표자는 소실점과 카메라 보정에서의 소실점 사용에 대해 이야기합니다. 화자는 평행선을 연장하여 정확하게 결정할 수 있는 세 개의 소실점이 있으며 이 점을 사용하여 투영 중심을 찾을 수 있다고 설명합니다. 투영의 중심은 객체의 좌표계와 이미지 평면의 좌표계 간의 관계가 설정되는 곳입니다. 투영의 중심을 이미지 평면의 소실점에 연결하여 세 개의 벡터를 만들 수 있으며 이 벡터를 사용하여 소실점의 방향이 서로 직각인 점을 찾을 수 있습니다. 화자는 소실점이 서로 직각이 될 수 있는 모든 장소의 궤적이 원이라고 말합니다.

  • 00:15:00 이 섹션에서는 강사가 TCC의 3D 버전과 카메라 보정에 대해 설명합니다. 그는 투사 중심의 위치에 대한 제약이 구체에 있다는 점과 투사 중심의 가능성을 좁히기 위해 구체를 사용하는 방법을 설명합니다. 그런 다음 강사는 선형 방정식과 직선에 대해 논의하고 theta와 rho를 통해 직선을 매개변수화합니다. 매개변수화는 특이점을 피하고 선에 대해 2자유도 세계를 제공하므로 유용합니다.

  • 00:20:00 이 섹션에서 강사는 3개의 미지수가 있는 선형 방정식을 사용하여 3차원으로 평면을 표현하는 방법에 대해 설명합니다. 그는 스케일 팩터로 인해 실제로 자유도가 4가 아니라 3이라고 설명합니다. 이 이중성은 2D에서 선과 점 사이의 매핑과 유사하게 3D에서 평면과 점 사이에 매핑이 있음을 의미합니다. 그런 다음 강사는 카메라 보정 문제를 소개하고 세 개의 구를 교차하는 로봇 공학의 다변측 문제와 비교합니다.

  • 00:25:00 이 섹션에서 발표자는 3D 공간에서 두 구의 교차점을 해결하는 방법을 설명합니다. 첫 번째 구는 2차 항이 있는 방정식을 갖는 것으로 정의되며 최대 8개의 가능한 솔루션을 얻을 수 있습니다. 그러나 두 번째 구에서 이 방정식을 빼면 대신 선형 방정식을 얻을 수 있습니다. 모든 구형 쌍에 대해 이 과정을 반복함으로써 세 개의 선형 방정식을 생성할 수 있으며 세 개의 미지수는 풀 수 있습니다. 이것은 완벽한 솔루션처럼 보이지만 이 방법으로 생성된 행렬은 종종 특이 행렬이므로 해당 솔루션에서 고유하지 않다는 점에 유의해야 합니다.

  • 00:30:00 이 섹션에서 연사는 방정식을 조작하고 그 과정에서 중요한 정보를 잃는 문제에 대해 논의합니다. 그는 새로운 방정식을 도출하는 것은 완벽하게 괜찮지만 원래 방정식에는 문제를 해결하는 데 필요한 중요한 정보가 여전히 포함될 수 있으므로 원래 방정식을 버리지 않도록 주의해야 한다고 설명합니다. 그는 1차 및 2차 방정식의 예를 사용하여 이를 설명하고 원하는 수의 솔루션을 얻기 위해 일부 방정식을 버릴 수 있는 반면 다른 방정식은 유지해야 하는 방법을 보여줍니다. 연사는 또한 방정식 이면의 기하학을 이해하는 것의 중요성을 강조합니다. 대수학만으로는 즉시 알 수 없는 귀중한 통찰력을 제공할 수 있기 때문입니다.

  • 00:35:00 대본의 이 섹션에서 화자는 삼각 측량과 이미지 보정에서 투영 중심과 주요 지점을 찾는 방법에 대해 논의합니다. 투영의 중심은 3개의 평면을 생성하는 3개의 알려진 점을 사용하여 찾을 수 있으며 중심은 교차점에서 찾을 수 있다고 설명합니다. 주점을 찾기 위해 투영 중심에서 이미지 평면으로 수직선을 떨어뜨립니다. 또한 이미지가 수정되었거나 잘렸는지 감지하는 데 사용할 수 있는 소실점에 대해서도 논의합니다.

  • 00:40:00 이 섹션에서 강사는 사진 측량 및 카메라 보정에서 소실점 사용에 대해 설명합니다. 그는 소실점을 사용하여 이미지의 진위를 결정하는 방법을 설명하고 탐색과 관련된 다양한 사기를 탐구합니다. 그런 다음 그는 벡터의 세 번째 구성 요소를 찾고 초점 거리를 결정하기 위해 이차 방정식을 푸는 수학에 대해 탐구합니다. 그는 계속해서 2차 방정식을 풀 필요 없이 초점 거리를 결정할 수 있는 특별한 경우를 설명합니다. 이 비디오는 컴퓨터 비전의 기술적 측면에 대한 강의 시리즈의 일부입니다.

  • 00:45:00 이 섹션에서 발표자는 특히 세계 좌표계를 기준으로 카메라의 방향을 결정하기 위한 카메라 보정의 소실점 적용에 대해 논의합니다. 화자는 이미지에서 연석 및 도로 표시와 같이 평행할 것으로 추정되는 특징을 식별하여 이미지에서 인식할 수 있는 소실점을 생성할 수 있다고 설명합니다. 발표자는 또한 3개의 소실점을 모두 사용할 수 있는 이상적인 경우에 카메라가 캡처하는 직사각형 물체의 가장자리를 사용하여 x축과 y축을 정의한 다음 카메라 좌표계와 소실점 사이의 회전을 결정할 수 있다고 설명합니다. 세계 좌표계.

  • 00:50:00 이 섹션에서는 화자가 카메라 좌표계에서 측정된 물체 좌표계에서 단위 벡터를 찾는 과정을 설명합니다. 단위 벡터는 서로 직각이어야 하며 TCC 및 FOR MontiVision 데모를 계산하는 데 사용됩니다. 변환 행렬은 다른 좌표계에 대한 한 좌표계의 방향을 나타내며 화자는 앞으로 더 많은 작업을 수행할 것이라고 말합니다.

  • 00:55:00 이 섹션에서 강사는 행이 서로 수직이고 각 행의 크기가 1인 일반 행렬의 개념에 대해 설명합니다. 이것의 목적은 정규 직교 행렬에서 회전을 나타내는 것입니다. 개체에서 좌표축의 방향을 결정하면 두 좌표계 사이를 비교적 쉽게 오갈 수 있어 특히 카메라 보정에 유용합니다. 마지막으로 강의는 관찰된 밝기가 물질 표면, 광원, 입사각과 출사각, 방위각에 따라 달라지는 밝기의 개념에 대해 다룹니다.

  • 01:00:00 비디오의 이 섹션에서 발표자는 조명의 개념과 조명이 표면의 겉보기 밝기에 미치는 영향에 대해 설명합니다. 표면이 광원으로부터 얻는 전력은 광원 방향에 대해 표면이 기울어지는 각도에 영향을 받으며, 각도의 코사인을 사용하여 계산할 수 있다고 설명합니다. 그런 다음 연사는 다양한 방향으로 빛을 반사하지만 모든 방향에서 똑같이 밝게 보이는 특수한 속성을 가진 무광택 표면에 대한 아이디어를 소개합니다. 그들은 두 개의 서로 다른 광원 위치로 표면의 밝기를 측정하여 표면의 방향을 결정하는 방법에 대해 논의합니다.

  • 01:05:00 이 섹션에서 화자는 단위 벡터인 n을 구하는 것과 관련된 비선형성에 대해 논의합니다. 밝기 측정을 사용하여 코사인 세타 i를 추정할 수 있으며 표면 법선의 가능한 방향의 원뿔을 결정할 수 있습니다. 두 개의 별도 측정을 수행하면 두 개의 방향 원뿔이 생성되고 가능한 두 방향으로 구성된 해당 원뿔의 교차점만 법선 방향을 제공합니다. 그러나 단위 법선이어야 한다는 제약 조건은 이러한 두 가지 가능한 방향이 이제 최종 결정을 내리기 위해 단위 구와 교차해야 함을 의미합니다. 발표자는 표면의 반사율을 정의하는 알베도를 사용하여 이미지 평면에서 무언가가 얼마나 밝은지를 결정하는 선형 방정식 문제를 만들 수 있다고 설명합니다. 알베도 값의 범위는 0에서 1까지이며 물체에 들어가는 에너지의 양과 흡수되고 손실되는 양을 나타냅니다.

  • 01:10:00 이 섹션에서는 카메라 보정에서 소실점(VP)의 사용에 대해 설명합니다. 이 강의에서는 미지수를 캡슐화하고 벡터와 광원 위치의 행렬 곱을 통해 알베도 및 단위 벡터를 푸는 3-벡터를 소개합니다. 그러나 이 방법은 광원이 동일 평면에 있는 경우(즉, 동일한 평면에 있음) 또는 매트릭스의 두 행이 동일한 경우 매트릭스를 반전할 수 없는 경우에 제한됩니다. 강의는 또한 광원이 동일한 평면에 있지 않도록 해야 하기 때문에 천문학자에 대한 이러한 제약의 의미에 주목합니다.

  • 01:15:00 이 섹션에서 발표자는 미리 계산되고 효율적으로 구현될 수 있는 3개의 독립적인 광원 방향을 사용하여 밝기를 측정하는 간단한 방법에 대해 설명합니다. 카메라(RGB)의 세 가지 센서 세트를 활용하는 것이 이 목적에 유용할 수 있음을 제안합니다. 구의 알려진 모양을 기반으로 표면을 보정하기 위해 룩업 테이블을 구축할 수 있으며 표면 방향을 계산하여 3개의 이미지에서 밝기를 측정할 수 있습니다. 그러나 실제 표면은 이 간단한 규칙을 따르지 않으며 조회 테이블을 사용하여 표면 방향에 대한 수치 값을 반전시킬 수 있습니다. 마지막으로 화자는 투시 투영의 대안으로 직교 투영을 만집니다.

  • 01:20:00 이 섹션에서 화자는 이미지에서 표면을 재구성할 때 직교 투영을 사용하는 데 필요한 조건을 설명합니다. 그는 이 투영에 필요한 일정한 배율을 허용하면서 깊이 자체에 비해 깊이의 범위가 매우 작은 가정을 기반으로 한다고 공유합니다. 직교 투영법은 이미지에서 표면을 재구성하는 과정에서 단순화를 위해 사용됩니다.
 

강의 6: Photometric Stereo, Noise Gain, Error Amplification, Eigenvalues and Eigenvectors 복습



강의 6: Photometric Stereo, Noise Gain, Error Amplification, Eigenvalues and Eigenvectors 복습

강의 전반에 걸쳐 연사는 포토메트릭 스테레오에서 선형 방정식 시스템을 풀 때 노이즈 이득, 고유값 및 고유벡터의 개념을 설명합니다. 이 강의에서는 특이 행렬의 조건, 오류 분석에서 고유값의 관련성, 특이 행렬을 피하기 위한 선형 독립의 중요성에 대해 설명합니다. 강의는 램버트의 법칙과 표면 방향에 대한 논의로 마무리되며 단위 법선 벡터 또는 단위 구의 점을 사용하여 표면을 표현해야 할 필요성을 강조합니다. 전반적으로 이 강의는 측광 스테레오의 기본이 되는 수학적 원리에 대한 통찰력을 제공하고 지구 측정에서 달의 지형을 정확하게 복구하는 문제를 강조합니다.

계산 사진 과정의 강의 6에서 발표자는 표면 방향의 함수로서 표면 방향 및 플롯 밝기를 찾기 위해 단위 법선 벡터와 표면의 기울기를 사용하는 방법에 대해 논의합니다. 그들은 pq 매개변수화를 사용하여 가능한 표면 방향을 매핑하는 방법을 설명하고 기울기 평면을 사용하여 다양한 방향 각도에서 밝기를 플롯하는 방법을 보여줍니다. 발표자는 또한 그 양이 일정한 pq 공간에서 곡선을 찾기 위해 그라디언트 측면에서 광원의 단위 벡터와 단위 법선 벡터의 내적을 재작성하는 방법에 대해 논의합니다. 강의는 광원에 선을 회전시켜 만든 원뿔을 사용하여 다양한 모양의 원뿔 단면을 찾는 방법에 대한 설명으로 끝납니다.

  • 00:00:00 동영상의 이 섹션에서 강사는 미지 1개와 측정값 1개가 있는 1D 경우의 잡음 이득에 대해 설명하고 곡선의 기울기가 낮으면 작은 오류가 큰 오류로 증폭될 수 있음을 설명합니다. 영역. 2D 사례로 이동하면 행렬의 특성인 고유 벡터와 고유 값으로 이동하여 행렬을 곱하여 얻은 벡터가 행렬을 곱하는 데 사용된 벡터와 동일한 방향을 가리키는지 여부를 나타냅니다. 강사는 벡터의 크기와 배율은 중요하지 않으며 하나 이상의 고유 벡터가 있을 수 있다고 말하면서 이러한 벡터를 찾는 방법과 그 수에 대해 자세히 설명합니다.

  • 00:05:00 이 섹션에서 연사는 특이 행렬의 개념과 선형 방정식 시스템을 푸는 관련성에 대해 논의합니다. 특이 행렬은 결정자가 0인 행렬입니다. nxn 실수 대칭 행렬의 경우 행렬식은 n개의 근을 갖는 람다의 n차 다항식입니다. 이것은 방정식의 동차 집합의 경우 결정자가 0이면 고유한 솔루션이 아니라 여러 솔루션이 있음을 의미합니다. 이는 특정 방향의 오류가 다른 방향과 다를 수 있는 광학 마우스 복구와 같은 다차원 문제를 처리할 때 중요합니다. 따라서 작은 결정 요인을 문제가 있는 것으로 식별하는 것 이상으로 더 미묘한 그림이 필요합니다.

  • 00:10:00 강의의 이 섹션에서 연사는 균질 방정식 집합이 사소하지 않은 해를 갖기 위한 조건을 포함하여 균질 방정식과 그 흥미로운 속성에 대해 논의합니다. 행렬의 행렬식과 고유값 및 고유벡터에 대해서도 설명합니다. 고유 벡터는 고유 값의 속성이 유지되는 특별한 방향이 될 것이며 직교합니다. 고유값은 오류가 증폭되는 정도를 결정하며 이는 실제로 오류를 측정하는 데 중요합니다. 큰 행렬에 대한 고유값과 고유벡터를 찾는 작업은 종종 소프트웨어를 사용하여 수행되지만 기본 수준에서 프로세스를 이해하는 것이 유용합니다.

  • 00:15:00 이 섹션에서 발표자는 2x2 경우에 대한 동차 방정식을 풀 때 고유 벡터와 고유 값에 대해 설명합니다. 고유 벡터를 찾기 위해 화자는 솔루션이 행렬의 행에 수직이어야 함을 보여줍니다. 결과는 서로 다른 람다 값에 대해 동일한 방향을 가리키는 4개의 고유 벡터를 제공하며 단위 고유 벡터를 얻기 위해 정규화할 수 있습니다. 이 기술은 오류 증폭을 논의하기 위해 n개의 고유 벡터와 해당 고유 값을 제공하는 n x n 행렬로 확장될 수 있습니다.

  • 00:20:00 이 섹션에서 강사는 내적 표기법을 행렬로 확장하는 방법을 설명하고 고유값이 모두 다르면 모든 고유벡터가 직교임을 보여줍니다. 그는 또한 근의 일부가 동일하면 고유 벡터가 직교하도록 강요하지는 않지만 서로 직교하는 가능한 모든 고유 벡터 중에서 두 개를 선택할 수 있다고 언급했습니다. 이는 벡터 공간의 기반을 구축하는 데 도움이 됩니다. 강사는 또한 벡터를 열 벡터 또는 스키니 행렬로 생각하는 방법에 대해 이야기하고 두 가지 방법으로 내적을 작성할 수 있는 방법을 보여줍니다.

  • 00:25:00 이 섹션에서 강사는 고유 벡터와 고유 벡터를 사용하여 고유 벡터를 다시 표현하는 방법에 대해 설명합니다. 임의의 벡터 측정을 수행하고 행렬에 해당 측정을 곱하여 알 수 없는 변수를 얻음으로써 고유 벡터의 특수 방향을 따라 서로 다른 구성 요소를 서로 다른 양으로 확대할 수 있습니다. 이것은 오류 게인으로 알려져 있습니다. 그러나 그들은 역행렬이 사용되는 역 문제도 다루고 있으므로 강사는 아이디어를 적용하기 위해 n 벡터의 이항 곱을 소개합니다.

  • 00:30:00 이 섹션에서 발표자는 고유 벡터와 고유 값에 대해 이야기하고 다양한 방법으로 행렬을 다시 작성하는 데 사용할 수 있는 방법에 대해 설명합니다. 그들은 이러한 항이 모두 종속적이라고 설명하지만 고유 벡터 자체는 그렇지 않으므로 제외할 수 있습니다. 계속해서 이 접근 방식을 사용하여 고유값의 속성을 확인하는 방법과 이것이 시력 문제를 해결하는 데 중요한 이유에 대해 논의합니다. 구체적으로, 그들은 이 문제를 해결하기 위해 사용된 행렬이 종종 신호의 구성 요소를 람다 i에 대해 1로 곱하기 때문에 람다 i가 작으면 안정적이지 않은 잘못된 문제를 만들 수 있다고 설명합니다.

  • 00:35:00 이 섹션에서 강사는 오류 분석의 맥락에서 고유 벡터와 고유 값에 대해 설명합니다. 고유 벡터 중 하나의 고유 값이 작으면 측정에 약간의 오류가 있어도 결과에 큰 변화가 생길 수 있다고 그는 설명합니다. 등광체의 방향은 고유값이 작은 고유벡터에 해당하므로 정확한 움직임을 감지하기 어려운 반면 기울기 방향은 더 관대합니다. 그런 다음 강사는 서로 다른 조명 조건에서 물체의 여러 장의 사진을 찍어 표면 방향을 복구하는 기술인 측광 스테레오에 대해 논의합니다. 그는 알베도 매개변수가 표면이 반사하는 빛의 양을 설명하는 데 사용되며 표면 방향을 제한하는 데 도움이 될 수 있다고 설명합니다.

  • 00:40:00 이 섹션에서 강사는 3개의 미지수와 3개의 측정값에 대한 문제를 소개할 수 있도록 서로 다른 광원을 사용하여 3개의 측정값을 얻는 과정을 설명합니다. 이를 통해 선형 방정식 풀이 방법을 사용하여 이미지 방향을 명확하게 할 수 있으므로 솔루션을 계산하는 간단하고 저렴한 방법이 됩니다. 강사는 두 해를 찾는 것이 2차 방정식에서 발생하며 내적 표기법을 사용하여 단위 벡터를 임의의 3-벡터로 변환하여 피할 수 있다고 설명합니다. 또한 비디오는 단일 행렬을 피하기 위해 선형적으로 독립적인 행의 중요성을 언급합니다.

  • 00:45:00 강의의 이 섹션에서는 측광 스테레오, 오류 증폭, 고유값 및 고유벡터에 대해 설명합니다. 광원의 합이 0일 때 측정의 중복성을 탐색하고 3차원 공간의 세 벡터가 동일 평면에 있으면 방법이 실패함을 보여줍니다. 그러나 동일 평면에 있지 않고 서로 직각으로 배치되어 있으면 결과가 더 신뢰할 수 있습니다. 강의는 또한 태양의 다양한 조명을 기반으로 달의 지형도를 생성하기 위해 측광 스테레오를 사용하는 것을 참조합니다.

  • 00:50:00 강의의 이 섹션에서 교수는 지구 측정에서 달의 지형을 얻으려는 시도의 어려움에 대해 논의합니다. 달 궤도의 다른 위치에서 측정하는 것이 가능하지만 벡터가 거의 동일 평면에 있기 때문에 이 방법은 작동하지 않습니다. 교수는 또한 물체가 완벽하게 분산되고 균일한 반사율을 가지고 있다고 가정하는 램버시안 가정에 대해 이야기하지만 달 표면에서는 그렇지 않다고 지적합니다. 그러나 이 가정은 두 조명 강도를 비교하는 데 유용합니다. 한 쪽은 한 광원으로, 다른 쪽은 다른 광원으로 조명한 다음 균형을 조정하여 동일한 각도에서 보았을 때 두 측면이 똑같이 밝게 나타나도록 함으로써 달성할 수 있습니다.

  • 00:55:00 강의의 이 섹션에서 교수는 다른 각도에서 조명을 받았을 때 표면이 어떻게 빛을 반사하는지 설명하는 Lambert의 법칙을 발견한 Lambert가 수행한 실험에 대해 논의합니다. 법칙에 따르면 밝기는 입사각의 코사인에 비례합니다. 이 논의는 또한 표면 방향에 대해 이야기할 필요성과 단위 법선 벡터 또는 단위 구의 점으로 표면 방향을 나타내는 방법을 강조합니다. 교수는 이 현상학적 모델이 실제 표면의 정확한 표현이 아니라 가정된 동작이라고 언급합니다. 섹션은 Taylor 급수 확장을 소개하면서 끝납니다.
  • 01:00:00 비디오의 이 섹션에서 화자는 계산 문제에서 단위 정규 표기법과 그래디언트 표기법 간의 관계에 대해 논의합니다. 그들은 두 표기법 사이를 전환하는 방법을 설명하고 이것이 데카르트 좌표 및 극좌표와 같은 다른 도메인의 문제를 해결하는 데 어떻게 도움이 되는지 예를 제공합니다. 발표자는 또한 표면에서 접선을 찾는 방법을 보여주고 이러한 접선의 방향을 사용하여 단위 법선과 표면의 기울기를 나타내는 p 및 q 사이의 관계를 찾는 방법을 설명합니다.

  • 01:05:00 이 섹션에서 강사는 표면의 단위 법선 벡터를 사용하여 가능한 모든 표면 방향을 매핑하는 방법과 이 정보가 머신 비전에 어떻게 유용한지 논의합니다. 표면에 있는 두 접선 벡터의 외적은 단위 법선 벡터의 방향을 제공하며, 표면의 방향을 얻기 위해 정규화할 수 있습니다. pq 매개변수화를 사용하여 표면 방향을 2D 평면으로 투영하면 가능한 모든 표면 방향을 시각화할 수 있습니다. 이 평면의 점은 서로 다른 p 및 q 값에 해당하므로 바닥과 동일한 방향의 바닥 위 표면을 포함하여 표면 방향이 다릅니다. 강사는 머신 비전이 표면 방향을 복구할 수 있지만 완전한 표면을 만들기 위해 이러한 방향을 함께 패치하는 것은 별개이지만 과도하게 결정된 문제라고 지적합니다.

  • 01:10:00 비디오의 이 섹션에서 연사는 머신 비전에서 표면 방향의 함수로 밝기를 플롯하는 도구로 경사면을 사용하는 방법을 설명합니다. 평면의 각 점은 특정 표면 방향에 해당하며 밝기 값은 서로 다른 방향 각도의 재료 패치에서 실험적으로 결정될 수 있습니다. 그러나 한 번의 밝기 측정으로는 두 가지 미지수를 복구할 수 없으며 표면 요소의 방향을 정확히 파악하려면 여러 번의 측정이 필요합니다. 이 개념은 측광 스테레오 및 Lambertian 표면과 관련이 있으며 여기서 밝기는 입사각의 코사인에 비례하고 등광선은 경사면에서 찾습니다.

  • 01:15:00 여기에서 그는 n에서와 같이 단위 벡터에서 동일한 변환을 완전히 수행하기 위해 다른 방식으로 광원 방향을 다시 쓰는 것에 대해 논의합니다. 이것은 입사 광선이 평면에 있고 람보르기니에 가장 밝은 표면을 제공하는 psqs라고 하는 표면 법선과 평행한 지점을 도입합니다. n개의 점을 특정한 형태로 다시 작성함으로써 그들은 그 양이 일정한 pq 공간의 곡선을 결정할 수 있습니다. 모두 곱한 후, 원뿔 단면에 해당하는 p와 q의 2차 방정식이 남습니다. 주어진 예는 포물선과 타원입니다.

  • 01:20:00 이 섹션에서 발표자는 포물선, 타원, 원, 선을 포함하여 다양한 유형의 표면에 대한 일련의 등각도를 포함하는 다이어그램과 함께 표면이 플롯되는 그래픽에 사용할 수 있는 다이어그램에 대해 논의합니다. , 점 및 쌍곡선. 표면의 밝기는 다이어그램에서 읽어 플롯된 이미지에서 회색 수준 또는 색상으로 사용됩니다. 단위 법선은 표면에서 얻을 수 있으며 isofoad의 지점을 결정하는 데 사용할 수 있습니다. 광원이 이동하면 다이어그램이 변경되므로 고유한 솔루션을 얻으려면 두 세트의 isofoad의 교차점을 결정하는 것이 중요합니다. 2개의 광원을 사용하면 단일 솔루션이 아닌 유한 솔루션이 될 수 있으므로 2개 대신 3개의 광원이 사용됩니다.

  • 01:25:00 이 섹션에서 발표자는 원뿔과 다른 각도를 만들기 위해 광원에 대한 선을 회전시켜 중첩된 원뿔을 만드는 방법을 설명합니다. 이러한 원뿔은 평면에 의해 절단될 수 있으므로 항상 타원이 아닌 쌍곡선 및 포물선인 원뿔 단면이 생성됩니다. 연사는 또한 코사인 세타가 실제로는 음수가 될 수 없음을 명확히 하고 곡선이 닫힌 곡선에서 열린 방향으로 바뀌는 위치에 대한 질문을 향후 숙제 문제에 대한 수수께끼로 남깁니다. 강의는 숙제 및 발표 업데이트를 위해 Piazza에 가입하라는 알림으로 끝납니다.
 

강의 7: 기울기 공간, 반사율 맵, 이미지 조도 방정식, 노모닉 프로젝션



강의 7: 기울기 공간, 반사율 맵, 이미지 조도 방정식, 노모닉 프로젝션

이 강의에서는 그래디언트 공간, 반사율 맵 및 이미지 방사 조도 방정식에 대해 설명합니다. 강사는 반사도 맵을 사용하여 그래픽 응용 프로그램의 표면 방향과 밝기를 결정하는 방법과 서로 다른 조명 조건에서 촬영한 세 장의 사진을 사용하여 표면 방향에서 밝기로의 수치 매핑을 만드는 방법을 설명합니다. 또한 방사조도의 개념과 강도 및 방사도와의 관계, 밝기를 측정할 때 유한 조리개를 사용하는 것의 중요성을 소개합니다. 또한 강의는 렌즈를 통과한 후 빛이 어떻게 작용하는지, 단축법의 개념, 표면의 패치에서 나오는 빛이 이미지에 얼마나 집중되는지 결정하기 위해 렌즈가 광선을 집중시키는 방법에 대한 세 가지 규칙을 다룹니다.

이 강의에서 발표자는 입체각과 코사인 세타를 고려하여 이미지의 작은 영역에 전달되는 총 전력을 결정하는 방정식을 설명합니다. 그들은 이 방정식을 카메라의 f-스톱 및 조리개 크기가 받는 빛의 양을 제어하는 방법과 관련시킵니다. 연사는 또한 실제 세계에서 물체의 광도에 비례하는 이미지 방사조도와 축을 벗어날 때 밝기가 어떻게 떨어지는지에 대해 논의합니다. 계속해서 입사 및 방출 방향에 따라 표면이 얼마나 밝게 나타나는지 결정하는 양방향 반사율 분포 기능에 대해 논의합니다. 강사는 고니오미터를 사용하여 반사율을 측정할 수 있으며 물체가 빛을 반사하는 방식을 사실적으로 모델링하는 것이 중요하다고 설명합니다. 또한 양방향 반사율 분포 함수에 대한 헬름홀츠 상호성의 개념을 설명합니다. 그런 다음 강의는 그래디언트 공간을 표면 재료 모델에 적용하는 방법에 대해 논의하고 학생들에게 숙제 정보를 계속 업데이트하도록 상기시킵니다.

  • 00:00:00 이 섹션에서는 이미지의 밝기를 결정하는 항목을 탐색하기 위해 그래디언트 공간의 개념을 소개합니다. 밝기는 일반적으로 표면 방향과 같이 조명 및 기하학에 따라 달라지므로 밝기를 결정하기 위해 표면 패치의 방향을 언급할 필요가 있습니다. 단위 법선과 이미지의 기울기에 대한 편리한 약칭인 p 및 q도 언급됩니다. Lambertian 표면의 밝기는 해당 표면의 방향에 따라 논쟁의 여지가 있습니다. 많은 무광택 표면은 Lambertian 표면의 근사치이며 이러한 근사치는 편리해 보일 수 있습니다. 그러나 대부분의 우주 및 미시적 상황은 그러한 근사에 적합하지 않습니다.

  • 00:05:00 강의의 이 섹션에서 발표자는 방향에 따라 표면이 얼마나 밝아야 하는지를 보여주는 다이어그램인 반사율 맵의 개념에 대해 논의합니다. 이 다이어그램은 그래픽 응용 프로그램의 표면 방향과 밝기를 결정하는 데 사용할 수 있습니다. 그런 다음 발표자는 계속해서 이 개념을 비램버시안 표면으로 확장할 수 있는 방법과 표면 방향을 기반으로 밝기를 결정하기 위한 조회 테이블을 구축하는 방법을 설명합니다. 추가 정보 및 구속조건을 사용하여 표면 방향의 추정을 더 세분화할 수 있습니다.

  • 00:10:00 이 섹션에서는 강사가 이미지 보정을 위해 구체와 같은 보정 개체를 사용하는 방법에 대해 설명합니다. 모든 면에서 불이 켜진 구의 이미지를 취하고 여기에 원을 맞추면 이미지의 중심과 반지름을 추정할 수 있습니다. 구의 경우 표면에 대한 점과 단위 벡터가 평행한 편리한 관계가 있어 표면 방향을 쉽게 결정할 수 있습니다. 이 방법은 위도 정의를 약간 수정하여 지구에도 사용할 수 있습니다. 이전 강의의 공식을 사용하여 p와 q를 계산하면 이미지의 각 점에 대한 n과 표면 방향을 결정할 수 있습니다.

  • 00:15:00 이 섹션에서는 서로 다른 조명 조건에서 촬영한 세 장의 사진에서 표면 방향에서 밝기로 수치 매핑을 구축하는 과정에 대해 강의합니다. 목표는 나중에 동일한 조명 조건에서 물체의 3개 이미지를 촬영할 때 이 정보를 사용하여 표면 방향을 계산하는 것입니다. 강사는 각 상자가 p 및 q 값을 갖는 컴퓨터에서 3차원 배열을 생성하는 것과 관련된 이 프로세스의 구현을 설명합니다. 그런 다음 이미지는 불연속 간격으로 양자화되고 정보를 배열에 넣는 데 사용됩니다. 강의는 또한 양자화 효과 및 결코 채워지지 않을 수 있는 빈 셀과 같은 문제를 다룹니다.

  • 00:20:00 이 섹션에서 발표자는 Gradient Space에 대해 설명합니다. Gradient Space는 실제로 공간을 채우지 않고 3D 공간으로 매핑되는 2D 공간입니다. 대신 그 공간에 표면이 형성되고 p와 q를 사용하여 해당 표면의 점을 지정할 수 있습니다. 2개 이미지에서 3개 이미지로 이동할 때 e1 e2 e3에 따라 선형으로 확장되는 알베도 계수를 도입합니다. 캘리브레이션 개체는 흰색으로 칠해지고 측정이 이루어지며 1과 동일한 rho에 대한 표면 정의가 생성됩니다. 그러나 다른 행의 경우 큐브를 채우고 다른 표면을 생성할 수 있습니다. 항목이 배치되는 조회 테이블에는 3D 대 3D 조회 테이블인 p q 및 행이 포함됩니다. 무언가 잘못되면 알베도 rho에 대한 값이 아닌 다른 값으로 반영되어 오류 또는 세 개의 광원 중 하나가 예기치 않게 차단되었음을 나타냅니다. 이 방법은 그림자 드리우기를 인식하거나 너무 가깝거나 도넛 모양이 겹치는 것처럼 배치된 반사 표면의 경우 이미지를 분할하고 부분으로 분해하는 데 도움이 됩니다.

  • 00:25:00 강의의 이 섹션에서 연사는 그래디언트 공간 및 반사율 맵을 사용하여 캐스트 그림자 및 높은 반사 영역을 분할하는 방법에 대해 논의합니다. 테이블 값을 해당 복셀 값으로 채우는 체계적인 방법이 있습니다. 발표자는 또한 표면에 닿는 광원의 단위 면적당 전력인 조도(irradiance)의 개념을 소개합니다. 이 개념은 센서를 조명에 직접 노출하지 않기 때문에 이미지 처리와 관련하여 그다지 유용하지 않습니다. 발표자는 방사 전력량을 면적으로 나눈다는 용어가 있지만 영상 처리에는 쓸모가 없다고 설명합니다.

  • 00:30:00 이 섹션에서 발표자는 점원을 사용하여 특정 방향으로 얼마나 많은 방사선이 진행되는지 측정하는 측면에서 강도의 개념과 의미를 설명합니다. 입체각은 측정을 정규화하기 위해 정의되며 단위는 스테라디안으로 측정됩니다. 이는 2D의 라디안과 유사하지만 3개의 공간으로 투영됩니다. 입체각을 사용하면 스피커 주변의 가능한 방향이 4파이 스테라디안과 같은 모든 모양의 방향 집합을 측정할 수 있습니다. 또한 화자는 중심에서 벗어난 피사체에 대해 카메라 렌즈가 기울어지는 경우와 같이 객체의 단축 현상으로 인해 표면 영역이 구의 중심에 대해 기울어지는 경우를 설명하는 것의 중요성에 대해 언급합니다.

  • 00:35:00 비디오의 이 섹션에서는 강도와 광휘의 개념을 설명합니다. 강도는 입체각에 대한 전력으로 정의되는 반면 광휘는 단위 입체각당 단위 면적당 전력으로 정의됩니다. Radiance는 표면에서 관찰자나 카메라에 도달하는 것을 측정할 때 더 유용한 양입니다. 이미지 평면에서 밝기는 방사조도(irradiance)로 측정되며, 이는 표면의 광도 측면에서 측정하는 밝기입니다.

  • 00:40:00 이 섹션에서 강사는 에너지와 전력 측정 간의 관계와 이들이 서로 어떻게 비례하는지에 대해 논의합니다. 그는 또한 밝기를 측정할 때 유한 구경을 사용하는 것의 중요성과 핀홀 모델을 사용할 때 발생하는 문제에 대해서도 이야기합니다. 강사는 이상적인 얇은 렌즈와 중심 광선이 편향되지 않고 초점 중심에서 광축과 평행하게 나오는 광선을 포함하는 세 가지 규칙을 소개합니다. 그는 렌즈가 한정된 수의 광자를 제공하면서 핀홀과 동일한 프로젝션을 제공하는 방법과 특정 초점 거리 및 거리에서 렌즈를 사용하는 데 따른 페널티를 설명합니다.

  • 00:45:00 이 섹션에서 비디오는 렌즈를 통과한 후 빛이 어떻게 작용하는지에 대한 세 가지 규칙을 설명합니다. 규칙 1번은 렌즈를 통과한 후 초점 중심에서 나오는 모든 광선이 광축과 평행할 것이라고 주장합니다. 규칙 2번은 오른쪽에서 평행 배열이 초점 중심을 통과할 것이라고 명시합니다. 마지막으로 세 번째 규칙은 처음 두 규칙의 조합입니다. 비디오는 유사한 삼각형을 사용하여 렌즈의 초점과 길이를 결정할 수 있는 렌즈 공식을 도출합니다. 렌즈는 광선의 방향을 바꿀 수 있는 인상적인 아날로그 컴퓨터이지만 렌즈의 물리적 한계로 인해 완벽한 방향 전환을 달성할 수는 없습니다.

  • 00:50:00 이 섹션에서 비디오는 렌즈가 다양한 방향에서 오는 광선을 처리하는 방법과 방사형 왜곡과 같은 여러 종류의 결함 사이에 존재하는 트레이드오프에 대해 설명합니다. 이 비디오는 또한 방사조도와 객체 광도의 개념을 설명하고 간단한 이미징 시스템의 다이어그램을 사용하여 객체 패치에서 얼마나 많은 전력이 나오고 조명을 통해 이미지 패치에서 얼마나 많은 전력이 끝나는지 결정하는 방법을 설명합니다. 또한 비디오는 평면 이미지 평면과 렌즈가 카메라에 사용된다는 가정에 주목합니다.

  • 00:55:00 강의의 이 섹션에서 발표자는 개체 표면의 단위 벡터 단축 효과를 이미지 센서에 입사되는 빛과 관련시키는 방법에 대해 논의합니다. 그는 입체각에 대한 공식을 작성하고 코사인 알파를 곱하고 f 시컨트 알파 제곱으로 나누어 단축 효과를 고려합니다. 그런 다음 그는 이미지의 조도를 해당 패치에서 나오는 총 에너지와 델타 i 영역과 관련시킵니다. 마지막으로 그는 렌즈가 광선을 집중시키는 방법과 물체에서 볼 때 렌즈가 차지하는 입체각이 표면의 해당 패치에서 나오는 빛이 이미지에 집중되는 정도를 결정하는 방법에 대해 이야기합니다.
  • 01:00:00 강의의 이 섹션에서 화자는 입체각과 코사인 세타를 고려하여 이미지의 작은 영역에 전달되는 총 전력에 대한 방정식을 설명합니다. 단위 면적당 전력은 총 전력을 실제 측정되는 면적으로 나누어 구합니다. 발표자는 또한 이 방정식을 카메라의 f-스톱과 관련하여 조리개가 얼마나 열리는지를 결정하고 따라서 수신되는 빛의 양을 제어합니다. 조리개 크기는 일반적으로 2의 제곱근 단위로 측정되며 이미지 방사 조도는 f-스톱의 제곱에 반비례합니다.

  • 01:05:00 이 섹션에서 화자는 이미지의 밝기인 이미지 방사조도가 실제 세계의 물체의 밝기에 어떻게 비례하는지에 대해 논의합니다. 표면 광도의 밝기는 이미지 광도의 밝기에 비례하므로 이미지의 밝기를 쉽게 측정할 수 있습니다. 그러나 광각 렌즈를 사용할 때 고려해야 하는 네 번째 알파의 코사인으로 표시되는 축을 벗어나면 밝기가 떨어집니다. 이 효과는 눈에 잘 띄지 않지만 이미지 처리 체인에서 보상할 수 있습니다. 이 공식은 이미지의 그레이 레벨을 사용하여 밝기를 측정하는 아이디어를 정당화하고 실제 세계와 관련이 있음을 보여줍니다.

  • 01:10:00 이 섹션에서 강사는 입사 방향과 방출 방향에 따라 표면이 얼마나 밝게 나타나는지 결정하는 양방향 반사율 분포 함수의 개념을 설명합니다. 강사는 반사율이 흰색은 들어오는 모든 빛을 반사하고 검은색은 전혀 반사하지 않는다고 말하는 것처럼 간단하지 않다고 밝혔습니다. 강사는 또한 들어오는 빛의 방향 또는 나가는 빛의 방향을 지정하기 위해 극좌표 및 방위각의 관례적인 사용에 대해서도 논의했습니다. 양방향 반사율 분포 함수는 반사율을 결정하는 데 필수적이며, 나가는 전력을 들어오는 전력으로 나눈 값을 측정합니다.

  • 01:15:00 강의의 이 섹션에서 연사는 반사율에 대해 논의합니다. 반사율은 특정 위치에서 볼 때 물체가 얼마나 밝게 보이는지 소스 방향에서 투입되는 에너지의 양으로 나눈 값으로 정의됩니다. 발표자는 4차원 공간을 탐색하는 데 도움이 되는 각도 측정 장치인 고니오미터를 사용하여 반사율을 측정할 수 있다고 설명합니다. 연사는 많은 표면에서 반사율을 정확하게 측정하기 위해 두 각도 사이의 차이만 있으면 되므로 특정 물체에 대한 프로세스가 더 간단해 진다는 점에 주목합니다. 물체가 빛을 반사하는 방식을 사실적으로 모델링하는 것이 중요하며 반사율을 측정하면 잘 알려진 모델로 단순히 근사하는 것이 아니라 이러한 사실적인 모델링이 가능합니다.

  • 01:20:00 이 섹션에서 교수는 간섭을 통해 색상을 생성하는 미세 구조가 있는 무지개 빛깔의 항목과 타이거 아이와 같은 준보석과 같이 모양을 계산하기 위해 완전한 4차원 모델이 필요한 재료에 대해 논의합니다. 빛의 파장 규모로 압축된 미세구조. 또한 교수님은 양방향 반사율 분포 함수에 대해 Helmholtz reciprocity 개념을 소개하는데, 입사광과 방출광을 서로 바꾸면 같은 값이 나와야 데이터 수집이 쉬워진다고 합니다.

  • 01:25:00 이 섹션에서 화자는 토론 중에 교수가 사용하는 기술에 대해 논의합니다. 화자는 처음에 교수가 독일어로 된 책을 인용하여 자신의 지식 부족을 강조하는 것이라고 생각했지만 나중에 그것이 단지 토론 기술이라는 것을 깨달았습니다. 그런 다음 강의는 태양계의 달 및 암석 행성과 같은 물체의 표면 음영을 결정하기 위해 표면 재료 모델에 그래디언트 공간을 적용하는 방법에 대해 논의합니다. 연사는 또한 학생들에게 Piazza를 통해 숙제에 관한 연장이나 중요한 정보를 최신 상태로 유지하도록 상기시킵니다.
 

강의 8: 음영, 특수한 경우, 달 표면, 주사 전자 현미경, 그린의 정리




강의 8: 음영, 특수한 경우, 달 표면, 주사 전자 현미경, 그린의 정리

이 강의에서 교수는 측광 및 음영과 관련된 여러 주제를 다룹니다. 그는 복사조도, 강도 및 복사휘도 간의 관계와 이들이 어떻게 측정되고 관련되는지 설명합니다. 강의에서는 조명이 표면의 방향과 재질에 미치는 영향을 설명하기 위해 양방향 반사율 분포 함수(BRDF)도 소개합니다. 강사는 이상적인 람베르시안 표면의 속성과 들어오는 빛을 측정하고 Helmhotz 상호성을 다룰 때 혼란을 피하는 것과 관련된 의미에 대해 더 논의합니다. 강의는 또한 그래디언트에서 단위 벡터로 변환하는 과정과 그것이 광원의 위치와 어떻게 관련되는지를 다룹니다. 마지막으로 강의에서는 밝기 측정이 표면의 경사 또는 경사 방향을 결정하는 방법을 설명합니다.

강의는 광학 및 컴퓨터 비전과 관련된 다양한 주제를 다룹니다. 교수는 셰이딩 기술에서 셰이프를 사용하여 개체 표면의 프로필을 얻어 개체의 모양을 결정하는 방법에 대해 설명합니다. 그런 다음 그는 렌즈 논의로 전환하고 직교 투영의 사용을 정당화합니다. 강사는 또한 텔레센트릭 렌즈를 구축하여 머신 비전에서 투시 투영을 제거하는 방법에 대해 이야기하고 파장에 따른 유리의 굴절률 변화로 인한 수차를 보상하는 다양한 트릭을 시연합니다. 마지막으로 화자는 원근 투영과 관련된 몇 가지 문제를 단순화하는 직교 투영의 개념을 소개합니다.

  • 00:00:00 이 섹션에서는 강사가 광도 측정에 대한 이전 강의의 핵심 개념을 복습합니다. 그는 방사조도, 강도 및 광도를 정의하고 측정 및 관련 방법을 설명합니다. 그런 다음 그는 표면의 광도와 이미지의 해당 부분의 광도 사이의 관계를 소개합니다. 이 관계는 세상과 카메라 내부의 밝기에 대해 이야기하는 데 사용할 수 있습니다. 강사는 이 관계가 이미지의 입체각과 영역을 제한하는 렌즈의 조리개에 의해 어떻게 영향을 받는지 설명합니다.

  • 00:05:00 이 섹션에서는 조명, 형상 및 재료의 양과 관련하여 표면의 광도를 결정하는 데 초점을 맞춥니다. 조명이 표면의 방향과 재질에 미치는 영향을 설명하기 위해 양방향 반사율 분포 함수(BRDF)가 도입되었습니다. BRDF는 빛의 입사 방향과 방출 방향의 함수이며 총 출력 전력을 총 입력 전력으로 나눈 값을 계산하여 계산할 수 있습니다. 또한 BRDF는 제약 조건을 충족해야 합니다. 여기서 소스와 뷰어 방향이 바뀌면 동일하게 나와야 합니다. 일부 표면 반사율 모델은 이 제약 조건을 위반하지만 인간 또는 머신 비전에 중요하지 않으므로 수행해야 하는 측정 수를 줄이는 지름길입니다.

  • 00:10:00 강의의 이 섹션에서 교수는 이상적인 램버시안 표면의 속성에 대해 논의합니다. 모든 시야 방향에서 똑같이 밝게 나타나고 이상적인 램버시안 표면인 경우 모든 입사광도 반사합니다. 교수는 이것이 네 가지 매개변수 중 두 가지에 의존하지 않기 때문에 공식을 단순화한다고 설명합니다. 그런 다음 방의 조명과 같은 분산된 소스를 처리하는 방법과 입사 방향의 반구에 통합하는 방법에 대해 설명합니다. 교수는 모든 방출 방향에 대해 통합해야 하고 극각과 방위각을 사용하여 패치의 면적을 계산하는 방법을 설명합니다. 마지막으로 그는 f 항이 일정하다고 언급합니다.

  • 00:15:00 이 섹션에서는 음영의 개념과 표면의 빛 반사에 대해 설명합니다. 강의는 표면에 떨어지는 빛이 들어오는 방사선과 입사각에 따라 다르다는 점을 강조합니다. 모든 빛이 반사되고 표면에 증착되는 전력은 표면적의 e cosine theta i 곱하기라고 합니다. 따라서 반사광을 적분하면 들어오는 빛과 같습니다. 강의는 반전 표면에 대한 f의 상수 값을 계산하고 램버시안 표면에 대해 f가 1 나누기 파이라는 결론을 내립니다. 반사된 에너지가 모든 방향으로 동일하게 방사되지 않는다는 점에 주목하고 단축법이 표면에서 방출되는 전력에 어떤 영향을 미치는지 설명합니다.

  • 00:20:00 강의의 이 섹션에서 교수는 빛을 모든 방향으로 동일하게 방출하는 표면인 Lambertian 표면의 개념에 대해 논의합니다. 그러나 광원에서 비스듬히 크고 넓은 표면을 다룰 경우 표면 요소의 면적이 줄어들고 결과적으로 단위 면적당 전력은 무한대가 됩니다. 망막 손상을 방지하기 위해 표면은 특정 방향으로 덜 방사되지만 단위 면적당 전력은 일정하게 유지됩니다. 이 조건은 표면이 실제로 특정 영역에서는 더 많이 방사하고 다른 영역에서는 덜 방사하여 2파이에서 1이 아닌 1에서 파이의 비율을 초래한다는 것을 의미합니다. 그런 다음 강의는 이 지식을 사용하여 들어오는 빛을 측정하고 Helmhotz 상호성을 처리할 때 혼동을 피하는 방법을 설명합니다.

  • 00:25:00 이 섹션에서 강사는 Lambertian 곡면과 다른 곡면 유형을 소개하며 많은 응용 프로그램에서 매우 중요합니다. 이러한 유형의 곡면은 코사인 세타 i 곱하기 코사인 세타 e의 제곱근 나누기이며 Helmholtz 상호성을 충족합니다. 이러한 유형의 표면의 광휘는 단축법의 영향을 받으며 일부 소행성뿐만 아니라 달과 암석 행성의 표면을 모델링하는 데 사용됩니다. 이 강의는 3D 공간에서 내포된 원이지만 이미지 평면에서 타원으로 투영되는 이 표면의 등광선을 결정하는 방법을 설명하여 밝기 등고선 지도에 대한 통찰력을 제공합니다.

  • 00:30:00 이 섹션에서 화자는 3D 공간에서 특정 재료를 음영 처리하는 방법을 찾는 데 어려움을 논의합니다. 그들은 연구실에서 사용된 이전 방법이 이 재료에 적합하지 않으므로 새로운 접근 방식이 필요하다고 설명합니다. 그런 다음 화자는 단위 법선을 사용하여 고정된 벡터에 수직이어야 하는 표면의 모든 점에 대한 상수 값을 찾는 방법을 시연합니다. 그런 다음 그는 이것이 동일한 밝기를 가진 표면의 모든 단위 벡터가 평면에 있어야 한다는 것을 의미하며 재료에 대한 유용한 정보를 나타냅니다. 마지막으로 화자는 구형 좌표를 사용하여 더 나은 이해를 시도합니다.

  • 00:35:00 이 섹션에서 강사는 달 표면의 음영을 처리할 때 좌표계를 선택하는 방법에 대해 설명합니다. 좋은 시스템을 갖추면 대수적 혼란을 방지할 수 있기 때문입니다. 그들은 태양과 지구가 z=0인 좌표계를 사용하여 미지수 하나만으로 계산을 단순화할 것을 권장합니다. 강의는 또한 원반이 균일하게 밝아야 하지만 비램버시안 미세구조로 인해 완전한 구형으로 보이지 않는 보름달의 모습에 대해서도 간략하게 다룹니다. Hakka 모델은 이러한 유형의 행동을 예측하는 데 좋은 모델입니다. 마지막으로 강의는 n dot v에 대한 n dot s에 대한 공식으로 들어가 궁극적으로 구형 좌표 벡터를 사용하여 단순화된 버전에 도달합니다.

  • 00:40:00 이 섹션에서 강사는 달 표면의 밝기와 방위각 사이의 관계에 대해 설명합니다. 그들은 같은 밝기를 가진 표면의 모든 점은 같은 방위각을 가지며 일정한 경도의 선은 등각선이라고 설명합니다. 이것은 램버시안 표면과 매우 다릅니다. 달은 석탄과 같은 알베도를 가지고 있음에도 불구하고 반사율을 측정할 비교 대상이 없기 때문에 하늘에서 매우 밝게 보인다. 그러나 우리는 서로 다른 조명 조건에서 여러 장의 표면 사진을 촬영하여 달의 표면 방향과 잠재적으로 달의 모양을 결정하기 위해 포토메트릭 스테레오를 사용할 수 있습니다. 홉킨 모델은 기울기 측면에서 표면 방향을 설명하는 데 사용됩니다.

  • 00:45:00 이 섹션에서 강사는 그래디언트에서 단위 벡터로 변환하는 과정과 그것이 광원의 위치와 어떻게 관련되는지에 대해 설명합니다. 그들은 Helmholtz의 만족을 보장하기 위해 제곱근이 필요하며 특정 내적의 비율을 취하면 pq 공간에 플롯할 수 있는 등광선에 대한 선형 방정식을 얻는다고 설명합니다. 강사는 이 선들이 제곱근으로 인해 동일한 간격이 아니지만 평행하고 밝기가 0인 선이 하나 있어 들어오는 방사선에서 90도 방향을 돌렸음을 나타냅니다. 전반적으로 이 섹션에서는 등광선 계산의 기초가 되는 수학적 개념과 주어진 공간에서 광원의 위치와 밝기 사이의 관계를 다룹니다.

  • 00:50:00 이 섹션에서 강사는 다양한 문제를 쉽게 해결할 수 있는 포토메트릭 스테레오에서 선형 음영의 이점에 대해 설명합니다. 두 개의 서로 다른 조명 조건에서 두 개의 선형 방정식이 교차하고 교차점이 표면 방향입니다. 강사는 최대 4개의 솔루션이 있는 이전 방법의 문제인 Lambertian 음영에 모호성이 없다고 지적합니다. 강사는 또한 첫 번째 공간 도함수가 좌표계와 같은 방식으로 회전함을 시연하며, 이는 표면의 전체 방향을 알지 못하면서 특정 방향으로 표면 방향을 결정하는 데 유용합니다.

  • 00:55:00 이 섹션에서 강사는 밝기 측정이 표면의 기울기 또는 기울기 방향을 결정하는 방법을 설명하여 연구원이 수직 및 수평으로 점의 밝기 또는 반사율을 측정하여 표면의 프로파일을 수집할 수 있도록 합니다. 프로세스를 시작하려면 표면의 밝기를 측정하고 점진적으로 z를 찾는 초기 조건이 필요합니다. 그러나 측정 정확도는 반사율의 변화와 밝기 측정의 부정확성에 영향을 받을 수 있습니다.

  • 01:00:00 이 섹션에서 교수는 셰이딩 기술에서 모양을 사용하여 모양을 결정하기 위해 물체 표면의 프로파일을 얻는 방법에 대해 설명합니다. 그는 초기 값을 알고 있는 한 개체에 대해 프로필을 실행하여 프로필의 모양을 얻을 수 있는 방법을 설명합니다. 그러나 초기 값을 모르면 프로필의 절대 수직 위치를 얻을 수 없습니다. 그런 다음 그는 이 기술을 달에 적용하여 물체의 모양을 탐색하기 위해 표면의 다양한 프로필을 얻습니다. 교수는 또한 프로파일에서 3D 표면을 함께 연결하는 휴리스틱에 대해 이야기합니다. 나중에 그는 렌즈에 대해 이야기하기 위해 주제를 전환하고 직교 투영의 사용을 정당화합니다.

  • 01:05:00 이 섹션에서 강사는 여러 요소로 구성된 복합 렌즈가 신중하게 설계된 배열을 통해 수차를 보정하는 방법에 대해 설명합니다. 그는 유리의 굴절률이 파장에 따라 달라지므로 색수차가 발생하지만 서로 다른 재질의 복합 렌즈가 이를 보상할 수 있다고 지적합니다. 강사는 절점과 주평면을 사용하여 두꺼운 렌즈를 근사화하는 방법과 t(절점 사이의 두께)를 음수로 만드는 방법을 통해 짧은 망원 렌즈를 만들 수 있는 방법을 설명합니다. 이 기술은 긴 초점 거리와 작은 시야를 유지하면서 망원 렌즈의 길이를 크게 줄일 수 있습니다.

  • 01:10:00 이 섹션에서 강사는 머신 비전에서 투시 투영을 제거하는 두 가지 트릭을 보여줍니다. 첫 번째 트릭은 노드 중 하나를 무한대로 이동하여 거리에 따라 배율이 달라지는 효과를 줄이는 것입니다. 투사 중심이 멀리 떨어진 텔레센트릭 렌즈를 구축함으로써 원뿔 방향이 더 평행해지고 배율은 거리에 관계없이 일정하게 유지됩니다. 두 번째 트릭은 이미지 평면이 정확히 올바른 위치에 있지 않을 때 배율을 변경하는 다른 노드를 이동하는 것입니다. 선명한 이미지를 얻으려면 유리의 초점 거리를 변경하거나 이미지 평면을 기준으로 렌즈를 이동하여 렌즈의 초점을 맞춰야 합니다.

  • 01:15:00 강의의 이 섹션에서 발표자는 투영 중심이 플러스 무한대가 아닐 때 네 번째 법칙에 대한 코사인과 배율 변경 문제에 대해 논의합니다. 그는 절점을 이동하고 이중 텔레센트릭 렌즈를 사용하면 방사선이 센서에 수직인 특정 센서에 도달하게 되므로 이러한 문제를 제거할 수 있는 방법을 설명합니다. 또한 발표자는 들어오는 빛을 더 작은 영역으로 집중시키고 신호에 고주파 성분이 있을 때 발생할 수 있는 앨리어싱을 방지하기 위해 작은 렌즈 덮개가 필요하다고 설명합니다. 마지막으로 발표자는 저역 통과 필터링의 관련성과 신호를 완벽하게 재구성하기 위해 신호 대역폭의 두 배만 신호를 샘플링하는 것의 중요성을 언급합니다.

  • 01:20:00 이 섹션에서 강사는 렌즈릿 어레이를 사용하여 넓은 영역에서 빛을 측정할 때 블록 평균화를 사용한 저역 통과 필터링이 앨리어싱 문제를 줄이는 방법에 대해 설명합니다. 이 방법은 텔레센트릭 렌즈를 사용하여 빛이 센서에 수직으로 들어오는 경우에 효과적입니다. 그러나 장면의 심도 변화가 심도 자체보다 작은 경우와 같은 특정 경우에는 직교 투영법을 사용하는 것이 더 편리하다고 설명합니다. 이것은 세계의 x와 y와 이미지의 x와 y 사이의 선형 관계를 가능하게 하여 물체가 얼마나 멀리 떨어져 있는지에 관계없이 물체의 거리와 크기를 측정할 수 있게 합니다.

  • 01:25:00 이 섹션에서 연사는 텔레센트릭 렌즈를 사용한 실제 응용에 유용하고 논의될 몇 가지 문제를 단순화하는 직교 투영의 개념을 소개합니다. 일부 사람들은 이 방법이 람보르기니에서만 작동한다고 생각할 수 있지만 실제로는 모든 것에 작동하지만 다른 버전에서는 방정식이 지저분해집니다. 연사는 그들이 다음에 다룰 재구성의 종류는 원근법 투사로 수행할 수 있지만 복잡하고 통찰력이 부족하다고 설명합니다. 그러나 직교 투영으로 변경하면 이러한 문제 중 많은 부분이 명확해집니다.
 

강의 9: 셰이딩으로부터의 형태, 일반 사례 - 1차 비선형 PDE에서 5개의 ODE까지



강의 9: 셰이딩으로부터의 형태, 일반 사례 - 1차 비선형 PDE에서 5개의 ODE까지

이 강의는 이미지 밝기의 변화를 이용하여 사물의 형태를 해석하는 방법인 음영으로부터 형태를 주제로 합니다. 강사는 2차 전자 수집기를 사용하여 들어오는 전자빔의 일부를 측정하여 표면 기울기를 추정할 수 있는 주사 전자 현미경의 과정을 설명합니다. 강의는 또한 윤곽 적분, 모멘트 및 최소 제곱을 사용하여 표면 도함수를 추정하고 측정 노이즈가 주어진 가장 작은 표면을 찾는 방법에 대해 설명합니다. 화자는 셰이딩 문제로부터 모양에 대한 5개의 상미분 방정식을 도출하고 이미지 처리 연산에 사용되는 라플라시안 연산자의 개념도 설명합니다.

"Shape from Shading"에 대한 이 강의에서 발표자는 최소 제곱해에 대한 방정식을 해결하기 위한 다양한 접근 방식에 대해 논의합니다. 강사는 Laplacian 조건을 충족하고, 픽셀 값을 조정하고, 여러 지점에서 이미지 측정 및 기울기 계산을 사용하여 표면을 재구성하는 다양한 기술을 설명합니다. 강의는 초기값, 회전의 변환, 마이너스 세타를 통한 역변환의 주제를 다룹니다. 강사는 음영 해석의 구체적인 예를 제공하기 위해 임의의 반사율 맵에 대한 이러한 방정식의 일반화와 주사 전자 현미경 이미지 검사의 중요성에 대한 논의로 결론을 내립니다.

  • 00:00:00 강의의 이 섹션에서 교수는 이미지 밝기 측정을 사용하여 물체의 모양을 복원하는 방법인 음영에서 모양을 소개합니다. 그는 이 방법이 다중 노출이 필요한 포토메트릭 스테레오와 어떻게 다른지 설명합니다. 교수는 또한 다양한 유형의 표면 재료와 암석 행성의 반사 모델인 hapke와 현미경을 위한 세 번째 모델을 포함하여 반사 특성에 대해 논의합니다. 그는 전자 현미경 방법 간의 비교를 제시하고 주사 전자 현미경이 특정 밝기 변화로 인해 인간이 해석하기 쉬운 이미지를 생성하는 이유를 설명합니다. 이 이미지는 가장자리에 접근할수록 더 밝아집니다.

  • 00:05:00 이 섹션에서 강사는 물체의 모양을 해석하는 데 중요한 역할을 하는 이미지의 음영의 중요성에 대해 논의합니다. 강사는 표면 방향에 따라 밝기가 달라지는 나방의 머리와 축구공 모양의 달걀 모양 이미지를 제시하여 모양을 쉽게 해석할 수 있도록 합니다. 흥미롭게도, 축구공 같은 물체의 비램버시안 표면에도 불구하고 인간은 여전히 그 모양을 정확하게 해석할 수 있습니다. 그런 다음 강의는 물체 표면의 이미지를 생성하기 위해 가속된 전자 빔을 사용하는 주사 전자 현미경의 작동에 대해 탐구합니다.

  • 00:10:00 이 섹션에서는 주사 전자 현미경을 사용하여 음영 이미지를 만드는 과정을 설명합니다. 수 킬로 전자 볼트의 전자가 물체에 부딪히고 일부는 후방 산란으로 반사되지만 대부분은 에너지를 잃고 전자를 이온화하는 물체에 충돌시켜 2차 전자를 관통하고 생성합니다. 일부 2차 전자는 물체에서 나와 전극에 의해 수집되어 래스터와 같은 방식으로 물체를 스캔합니다. 여기에서 측정된 전류는 디스플레이의 광선을 변조하는 데 사용되며 편향을 통해 확대되어 수천에서 수만 배까지 확대될 수 있어 광학 현미경보다 더 강력합니다.

  • 00:15:00 강의의 이 섹션에서 발표자는 2차 전자 수집기를 사용하여 표면의 방향을 측정하는 과정을 설명합니다. 컬렉터는 들어오는 빔이 다시 나가는 부분을 측정합니다. 기울어진 표면은 더 많은 2차 전자가 빠져나가 더 많은 전류를 발생시킵니다. 반사율 맵, 밝기 대 방향을 플로팅하여 표면의 기울기를 결정할 수 있지만 기울기는 결정할 수 없으므로 두 개의 미지수와 하나의 제약 조건이 남습니다. 이 문제는 밝기 패턴에서 표면 모양을 추정하는 것이 목표인 음영 문제의 모양의 예입니다.

  • 00:20:00 강의의 이 섹션에서 발표자는 표면의 기울기 또는 기울기를 결정하기 위해 반사율 맵을 사용하는 방법에 대해 논의합니다. 그들은 이 방법이 특정 유형뿐만 아니라 다양한 표면에 사용될 수 있다고 설명합니다. 토론에서는 바늘 다이어그램과 표면 방향 및 모양을 결정하는 데 사용할 수 있는 방법도 다룹니다. 화자는 이것이 간단한 문제이지만 알려지지 않은 것보다 제약 조건이 더 많기 때문에 과도하게 결정된다고 설명합니다. 이를 통해 소음을 줄이고 더 나은 결과를 얻을 수 있습니다. 강의는 원점에서 높이의 변화를 결정하기 위해 p를 적분하는 데모로 끝납니다.

  • 00:25:00 이 섹션에서 발표자는 알려진 데이터를 통합하여 전체 영역을 채우기 위해 결합할 수 있는 x축 또는 y축을 따라 높이를 추정하는 방법에 대해 설명합니다. 그러나 사용된 p 및 q 값은 측정 노이즈의 영향을 받습니다. 즉, 다른 방식으로 p 및 q를 측정해도 동일한 답이 나온다는 보장이 없습니다. 이 문제를 해결하려면 p와 q에 대한 제약 조건을 적용해야 합니다. p와 q는 모든 루프에 대해 이 제약 조건을 충족해야 하며 큰 루프는 큰 루프에 대해서도 제약 조건이 참인지 확인하기 위해 서로를 상쇄하는 작은 루프로 분해될 수 있습니다.

  • 00:30:00 이 섹션에서 강사는 측광 외부 또는 기타 비전 방법으로 표면의 도함수를 측정하는 맥락에서 윤곽 적분과 영역 적분 간의 관계에 대해 설명합니다. 이 강의에서는 기울기가 거의 일정한 스트레칭의 중심을 기반으로 기울기를 추정하는 방법을 보여주고 Taylor 급수 확장을 사용하여 x y의 표면 z의 도함수와 관련된 방정식을 유도합니다. 측정된 p와 q를 제공하는 xy의 정확한 z를 찾는 것은 불가능하다고 하지만 최소 제곱근사를 찾는 더 우아한 방법이 제시됩니다.

  • 00:35:00 강의의 이 섹션에서 연사는 모든 픽셀에서 머신 비전 영역의 경계까지 계산을 줄이는 이점에 대해 논의합니다. 화자는 윤곽 적분과 모멘트를 통해 얼룩의 면적과 위치를 계산하는 예를 사용합니다. 이는 픽셀을 세는 대신 윤곽선을 추적하여 효율적으로 계산할 수 있습니다. 강의는 그린의 정리를 적용하여 모멘트 계산에 적분된 윤곽선을 일치시키는 것으로 계속됩니다.

  • 00:40:00 이 섹션에서 강사는 주어진 측정값에서 가능한 가장 작은 표면을 찾는 방법에 대해 설명합니다. 이상적으로는 x 및 y 도함수가 각각 이미지에서 얻은 p 및 q와 일치하는 표면을 찾을 것입니다. 그러나 측정 노이즈로 인해 불가능하므로 대신 최소 제곱 문제를 해결하여 최대한 작게 만들려고 합니다. Z는 무한 자유도를 가진 함수이므로 일반 미적분을 사용할 수 없습니다. 대신, 우리는 그리드에 있는 각각의 유한한 수의 미지수에 대해 미분하고 결과를 0으로 설정하여 많은 방정식을 얻을 수 있습니다.

  • 00:45:00 강의의 이 섹션에서 발표자는 x 및 y 방향 모두에서 관찰된 값과 추정된 도함수 사이의 오류를 최소화하기 위해 모든 그리드 점에 대해 z 값을 찾는 프로세스에 대해 논의합니다. 이를 위해 발표자는 i와 j의 가능한 모든 값에 대해 미분하고 결과를 0으로 설정해야 하며, 그 결과 최소 제곱을 사용하여 풀 수 있는 일련의 선형 방정식이 생성된다고 설명합니다. 그러나 화자는 식별자 이름 i와 j를 다른 이름으로 바꾸지 않으면 잘못된 답을 얻을 수 있는 잠재적인 문제에 대해 경고합니다. 많은 수의 방정식이 있음에도 불구하고 방정식이 희소하여 풀기가 더 쉽습니다.

  • 00:50:00 이 섹션에서 화자는 음영 문제에서 모양에 대한 5개의 상미분 방정식을 도출하기 위해 1차 비선형 편미분 방정식을 사용하는 과정을 살펴봅니다. 그들은 사각형 내부의 항, 일치하는 항, k 및 l의 다양한 값을 고려하는 미분 단계를 설명합니다. 강사는 최종 방정식을 단순화하고 용어를 분리하여 각각 p와 q의 x 및 y 도함수를 식별합니다. 목표는 궁극적으로 이미지의 모든 지점에 대한 솔루션을 찾는 것입니다.

  • 00:55:00 이 섹션에서 발표자는 머신 비전에서 도함수를 추정하는 그래픽 방식인 계산 분자 다이어그램을 설명합니다. 그는 이것을 사용하여 이미지 처리 작업에서 많이 사용되는 Laplacian 연산자를 도출하는 방법을 보여줍니다. 그는 Laplacian이 회전 대칭이며 회전 대칭이기도 한 에지 감지에 매우 유용한 미분 연산자가 있다고 설명합니다.

  • 01:00:00 이 섹션에서 발표자는 변동 미적분학을 사용하는 대신 셰이딩에서 모양에 대한 최소 제곱 솔루션에 대한 방정식을 푸는 이산적 접근 방식에 대해 논의합니다. 결과 방정식은 변수가 많지만 희소하므로 반복 솔루션이 가능합니다. 발표자는 이웃 픽셀의 로컬 평균을 계산하고 이미지 정보를 기반으로 보정을 추가하는 반복 접근 방식을 사용하여 이러한 방정식을 푸는 방법을 설명합니다. 발표자는 반복 솔루션은 제안하기 쉽지만 수렴한다는 것을 보여주는 것은 어렵지만 교과서에서는 그렇게 한다고 제안합니다.

  • 01:05:00 이 섹션에서 강사는 희소 항이 있는 간단한 방정식을 사용하여 픽셀 값을 조정하여 라플라시안 조건을 충족하는 접근 방식에 대해 설명합니다. 이 접근 방식은 열 방정식을 푸는 것과 관련이 있으며 병렬로 효율적으로 수행할 수 있으므로 측정 노이즈가 있는 경우에도 안정적입니다. 이 기술은 측광 스테레오 데이터에 적용하여 표면을 최소 제곱 방식으로 재구성하여 실험 데이터와 일치하는 합리적인 솔루션을 제공할 수 있습니다. 그러나 강사는 이 접근 방식이 측광 스테레오 외에는 직접적으로 유용하지 않으며 단일 이미지 재구성과 같이 해결해야 할 더 어려운 문제가 있음을 인정합니다.

  • 01:10:00 이 섹션에서 강사는 등광선으로 평행한 직선이 있는 반사율 맵의 간단한 경우에 대해 설명합니다. 평행선을 사용하면 보다 유용한 좌표계로 회전할 수 있고 한 방향에서는 정보를 최대화하면서 다른 방향에서는 최소화할 수 있습니다. 강의는 p, q, p 프라임과 q 프라임의 관계, 삼각형이 제공하는 각도 세타, 마이너스 세타를 통한 회전의 역변환을 제공합니다. 궁극적으로 강의는 구불구불한 선이 있는 일반적인 경우를 분석하고 음영에서 모양의 개념에 대해 논의합니다.

  • 01:15:00 이 섹션에서 강사는 여러 지점에서 이미지 측정 및 기울기 계산을 사용하여 표면을 재구성하는 방법에 대해 설명합니다. 강의는 또한 z의 높이에 상수를 추가하고 변경 사항을 찾는 접근 방식이 z의 라플라시안을 전혀 조정하지 않았으며 높이의 차이가 많은 정보를 제공하지 않고 상대적인 깊이만 제공한다는 점을 암시합니다. 그러나 강사는 재구성을 얻으려면 z의 초기 값이 필요하다고 말합니다.

  • 01:20:00 이 섹션에서 발표자는 Shape from Shading을 사용하여 표면 모양에 대한 솔루션 계산에서 각 행에 대해 잠재적으로 다른 초기 값을 갖는 문제에 대해 논의합니다. 전체 높이 변경을 처리하는 것은 쉽지만 각 행에 대해 다른 초기 값을 사용하려면 회전하지 않은 원래 세계로 다시 매핑할 수 있는 다른 초기 곡선이 필요합니다. 발표자는 에타의 일부 함수인 초기 곡선을 사용하여 이러한 곡선을 따라 이동하고 독립적으로 계산한 다음 솔루션을 탐색하는 속도를 변경하여 표면을 탐색할 것을 제안합니다.

  • 01:25:00 이 섹션에서 화자는 상수를 곱하면 방정식이 더 간단해지고 x 및 y 방향으로의 이동은 각각 q s 및 p s에 비례하는 반면 z 방향에서는 a가 있다고 설명합니다. 간단한 공식. 강의는 음영 해석의 구체적인 예를 제공하기 위해 임의의 반사율 맵에 대한 이러한 방정식의 일반화와 주사 전자 현미경 이미지 검사의 중요성에 대한 논의로 끝납니다.
 

강의 10: 특징적인 스트립 확장, 셰이딩의 모양, 반복 솔루션



강의 10: 특징적인 스트립 확장, 셰이딩의 모양, 반복 솔루션

이 강의에서 강사는 이미지 형성의 개념에서 밝기 측정을 사용하여 음영에서 모양의 주제를 다룹니다. 여기에는 밝기를 표면 방향, 조명, 표면 재료 및 형상과 관련시키는 이미지 방사 조도 방정식을 이해하는 것이 포함됩니다. 그들은 서로에게 공급되는 두 개의 별도 방정식 시스템을 사용하고 밝기 기울기를 사용하여 전체 스트립을 추적하여 p 및 q 변수를 업데이트하는 방법을 설명합니다. 이 강의에서는 또한 1차 비선형 PDE를 해결하는 문제와 표면을 탐색할 때 한 윤곽선에서 다른 윤곽선으로 단계별로 이동하는 다양한 방법에 대해 설명합니다. 마지막으로 강사는 특성 스트립 확장의 구현과 병렬화를 권장하고 단계 크기를 제어하면서 순차적 접근 방식이 최선의 방법이 아닐 수 있는 이유에 대해 논의합니다.

강의 10에서 교수는 표면의 고정점을 사용하고 그 주위에 작은 캡 모양을 구성하여 국부적 모양을 추정하는 것을 포함하여 쉐이딩에서 쉐이딩 문제를 해결하기 위한 다양한 방법에 대해 논의합니다. 강사는 또한 솔루션의 시작 조건을 제공할 수 있는 폐색 경계의 개념을 소개하고 정교한 수치 해석 방법을 사용하여 삼체 문제에 대한 컴퓨팅 솔루션의 최근 진행 상황에 대해 논의합니다. 또한 강의는 다음 강의에서 논의될 산업용 머신 비전 방법 및 관련 패턴에 대한 주제를 다룹니다.

  • 00:00:00 이 섹션에서는 강사가 학기 프로젝트에 대한 첫 번째 퀴즈 및 제안서 제출에 대한 공지를 제공합니다. 용어 프로젝트는 머신 비전 문제에 대한 솔루션 구현을 포함하며 학생들은 22일까지 짧은 제안서를 제출해야 합니다. 그런 다음 강사는 발표된 논문이나 교과서 대신 특허를 살펴보는 산업 머신 비전을 다루는 속도 변화에 대해 이야기합니다. 그 과정에서 학생들은 스타트업에 참여하는 기업가에게 필수적인 특허 언어에 대해 배우게 됩니다. 마지막으로 강사는 가장자리 감지를 위한 서브픽셀 방법 구현 또는 안드로이드 폰에서 접촉하는 시간과 같은 학생 프로젝트의 예를 제공합니다.

  • 00:05:00 이 섹션에서 강사는 특히 밝기 측정을 사용하여 음영에서 모양의 개념에 초점을 맞춰 이미지 형성의 다양한 측면에 대해 논의합니다. 이를 위해서는 밝기를 표면 방향, 조명, 표면 재료 및 형상과 관련시키는 이미지 방사 조도 방정식을 이해해야 합니다. 반사율 맵은 이 방정식을 단순화하는 데 사용되며 양방향 반사율 분포 함수(BRDF)에서 파생되지만 자세한 반사 속성을 요약하는 방법으로 사용됩니다. 강의는 계속해서 이 개념이 달과 다른 암석 행성의 반사 특성에 어떻게 적용되어 특정 방향에서 표면 방향을 결정할 수 있는 일련의 방정식을 도출했는지 설명합니다.

  • 00:10:00 이 섹션에서 화자는 직교 투영을 사용하여 높이의 작은 단계에 해당하는 이미지에서 작은 단계를 취하는 규칙에 대해 설명합니다. 그는 이것이 수학을 단순화하고 텔레센트릭 렌즈와 원거리 광원의 가정에 연결되어 Lambertian 가정을 가능하게 한다고 설명합니다. 전체 프로세스는 세 가지 상미분 방정식을 순방향 오일러 방법으로 수치적으로 풀고 Hapka 유형 표면을 통해 밝기를 공급하는 작업을 포함합니다. 화자는 이것을 p와 q로 표현한 다음 광휘의 이미지에 대한 방정식을 도출하는 방법을 보여줍니다.

  • 00:15:00 이 섹션에서 발표자는 측정된 표면 밝기의 양과 특정 표면에 필요한 솔루션 사이의 직접적인 관계에 대해 논의합니다. 그는 솔루션을 단순화하는 데 사용되는 소스 위치에 따라 달라지는 rs라는 상수가 있다고 설명합니다. 이 기술은 밝기를 취하고, 제곱하고, rs를 곱하고, z 방향의 도함수에서 1을 뺍니다. 미분 방정식의 초기 조건을 구하는 방법과 매개 변수를 사용하여 곡선을 정의하는 방법도 설명합니다. 그런 다음 이 방법은 기울기를 국지적으로 결정할 수 없는 일반적인 경우를 다루기 위해 일반화됩니다.

  • 00:20:00 이 섹션에서 강사는 특성 스트립 확장을 사용하여 솔루션 구성에 대해 논의합니다. 그렇게 하려면 z가 어떻게 변할지 알기 위해 높이의 변화를 계산해야 합니다. 그들은 우리가 표면 방향 p, q와 함께 x, y, z로 시작하고 x, y, z에 대한 규칙을 업데이트하고 z 높이의 변화가 방정식으로 주어진다고 가정합니다. 진행하면서 p와 q를 업데이트하는 것이 필요하므로 표면 방향을 전달하는 특징적인 스트립이 생성되며 이는 단순히 곡선을 갖는 것보다 더 많은 정보입니다. 강사는 2x2 행렬과 곡률에 해당하는 높이의 2차 편도함수를 사용하여 p와 q를 업데이트하는 방법을 설명합니다.

  • 00:25:00 이 섹션에서 강사는 평면의 곡선보다 더 복잡한 3D 표면에 대한 곡률 행렬을 계산하는 방법에 대해 설명합니다. 곡률 행렬에는 Hessian 행렬이라는 2차 도함수의 전체 행렬이 필요합니다. 그러나 솔루션을 계속하기 위해 고차 도함수를 사용하면 더 많은 미지수가 생성됩니다. 따라서 표면 방향의 변화가 이미지 밝기에 영향을 미치는 곡률에 해당하므로 이미지 방사 조도 방정식, 특히 밝기 구배가 필요합니다. 곡률 및 밝기 구배 방정식 모두에서 공통 행렬 H를 살펴봄으로써 H를 계산하면 x, y, z, p 및 q의 업데이트가 허용되어 방법이 완성됩니다.

  • 00:30:00 이 섹션에서 강사는 두 개의 선형 방정식을 사용하여 h를 푸는 개념에 대해 설명합니다. H는 이 두 방정식 모두에 나타나지만 두 개의 방정식과 세 개의 미지수가 있으므로 h에 대해 풀 수 없습니다. 그러나 특정 델타 x 및 델타 y를 사용하여 단계 크기를 제어하고 특정 방향을 선택하여 델타 p 및 델타 q를 계산할 수 있습니다. 강사는 또한 표면을 탐색함에 따라 방향이 바뀔 수 있다고 설명합니다. 이것을 방정식에 연결하면 문제를 해결하기 위해 p와 q를 변경하는 방법을 찾을 수 있습니다.

  • 00:35:00 이 섹션에서 강사는 이미지 조도 방정식에서 z 변수를 풀기 위해 필요한 5가지 상미분 방정식에 대해 논의하고, p 및 q 변수를 업데이트하기 위해 밝기 구배를 사용하여 스트립을 생성하는 방법을 소개합니다. 강사는 계속해서 서로 공급되는 두 방정식 시스템을 포함하는 솔루션의 흥미로운 부분과 그라데이션 방향을 결정하고 전체 스트립을 추적하는 데 사용할 수 있는 방법을 설명합니다. 궁극적으로 편미분 방정식은 p와 q를 사용하는 단순한 상미분 방정식으로 축소되어 방정식이 덜 위협적으로 보이도록 만듭니다.

  • 00:40:00 이 섹션에서 발표자는 셰이딩에서 모양의 맥락에서 밝기를 해결하는 데 있어 1차 비선형 PDE의 문제에 대해 설명합니다. 이것은 물리학에서 발견되는 일반적으로 2차 및 선형 PDE에서 출발한 것입니다. 즉, 이러한 유형의 PDE를 풀기 위해서는 특별한 방법이 필요합니다. P와 Q의 임의의 R에 대한 일반적인 경우를 논의한 다음 두 가지 특정 표면 특성인 hapke와 주사 전자 현미경에 적용합니다. X 및 Y에 대한 업데이트 규칙은 각각 PS 및 QS에 비례하는 것으로 표시됩니다.

  • 00:45:00 이 섹션에서 강사는 반복 솔루션으로 음영에서 특징적인 스트립 확장 및 모양을 사용하여 x, y 및 높이 축을 업데이트하는 방법을 설명합니다. 이 방법은 p와 q에 대해 미분하여 x와 y에 대한 업데이트를 계산하고 prp와 qrq를 사용하여 높이 축을 업데이트하는 것을 포함합니다. 강의는 이 방법이 주사 전자 현미경 이미지에 사용될 수 있으며 가능한 한 많은 이미지를 탐색하기 위해 특성 스트립을 이미지 평면에 투사하는 것과 관련된 기본 특성의 개념에 대해서도 언급합니다.

  • 00:50:00 이 섹션에서 발표자는 특성 스트립 확장의 구현과 순차적 접근 방식이 최선의 방법이 아닐 수 있는 이유에 대해 논의합니다. 각 곡선을 따라 발견되는 독립적인 솔루션으로 인해 각 곡선을 따라 프로세스를 실행할 수 있으므로 계산을 병렬화할 수 있습니다. 합리적인 단계 크기를 가져야 하는 계산 속도에 대해 논의하고 단계 크기가 상수 z에 의해 제어되는 간단한 경우를 검토합니다. z에 대한 방정식에서 PRP와 QRQ로 나누면 변화율이 1이 되어 z 값이 증가하는 등고선이 있는 각 곡선을 따라 일정한 솔루션이 생성됩니다.

  • 00:55:00 강의의 이 섹션에서 연사는 표면을 탐색할 때 한 윤곽선에서 다른 윤곽선으로 이동하는 다양한 방법에 대해 설명합니다. 그들은 z 방향으로 일정한 크기 증분으로 스테핑하거나 모든 방정식을 상수 인수로 나누어야 하는 이미지에서 일정한 단계 크기를 갖는 옵션을 언급합니다. 또 다른 옵션은 3D에서 일정한 크기 증분으로 스테핑하는 것입니다. 여기서 증분의 제곱의 합은 1이고 마지막으로 대비 또는 밝기 이미지의 윤곽선에서 아이소포드를 스테핑할 수 있습니다. 그러나 이러한 방법 중 일부는 다양한 속도로 실행되거나 0으로 나누어지는 서로 다른 곡선과 같은 문제가 있을 수 있으므로 이러한 제한 사항에 유의해야 합니다.

  • 01:00:00 강의의 이 섹션에서 교수는 이미지 및 반사율 맵에서 두 기울기의 내적에 대해 논의하지만 너무 자세히 설명하지는 않습니다. 이미지의 윤곽선에서 윤곽선으로 이동하면 인접한 솔루션을 쉽게 함께 묶을 수 있으며 조잡한 수치 분석 방법으로 충분한 결과를 얻을 수 있습니다. 그런 다음 교수는 3체 문제에 대한 컴퓨팅 솔루션의 최근 발전과 분석적으로 해결하는 것이 불가능하지는 않더라도 어려운 방정식을 해결하기 위해 정교한 수치 분석 방법이 어떻게 사용되는지에 대해 논의합니다.

  • 01:05:00 이 섹션에서 강사는 광학 머신 비전 방법을 사용하여 방향과 함께 표면을 탐색하기 위해 초기 곡선이 필요한 문제에 대해 논의합니다. 다행히도 곡선의 방향에 대한 제약 조건을 제공하는 이미지 방사 조도 방정식이 있으며 곡선이 표면에 있다는 것을 알고 있으므로 미분을 계산하고 선형 방정식을 풀 수 있습니다. 즉, 모양, 방향 등을 알고 있는 개체에서 특수 지점을 찾을 수 있으면 방향을 찾을 수 있고 개체에 대한 초기 스트립의 필요성을 제거할 수 있습니다.

  • 01:10:00 이 섹션에서 화자는 폐색 경계의 개념에 대해 논의합니다. 이는 물체가 휘어져 한쪽 부분이 보이고 다른 쪽 부분이 보이지 않는 곳입니다. 해당 지점에서 표면 법선을 구성하면 폐색 경계를 따라 구성된 벡터와 평행하게 되어 솔루션을 시작하기 위한 시작 조건을 제공합니다. 그러나 기울기가 무한하기 때문에 폐색 경계의 비율을 사용하여 방정식을 풀 수 없습니다. 스피커는 또한 조명을 받았을 때 개체 표면의 가장 밝은 점에서 발생하는 독특하고 전역적이며 고립된 극값인 고정점의 개념을 소개합니다. 이러한 점은 음영 문제에서 모양을 해결하는 데 유용한 정보인 해당 지점에서 표면의 방향을 제공합니다.

  • 01:15:00 이 섹션에서 강사는 사용된 이미징 기술에 따라 극한 또는 최소에 해당하는 반사 맵 및 이미지의 고정점에 대해 설명합니다. 그러나 고정점은 종속 변수에 변화가 없기 때문에 솔루션의 직접적인 시작을 허용하지 않습니다. 솔루션은 솔루션을 시작하기 위해 표면의 근사치를 구성하려고 시도할 때만 고정점에서 멀어질 수 있습니다. 아이디어는 고정점의 방향을 사용하여 작은 평면을 구성한 다음 반지름을 만들어 솔루션을 시작하는 것입니다. 그렇게 함으로써 솔루션은 정지된 지점에서 벗어나 더 나은 솔루션을 향해 반복을 시작할 수 있습니다.

  • 01:20:00 강의의 이 섹션에서 발표자는 음영의 모양과 관련하여 곡면의 고정점 개념에 대해 논의합니다. 아이디어는 고정점이 있는 표면의 곡률에 대한 고유한 솔루션을 찾는 것입니다. 발표자는 이러한 점들이 인간의 인식에서 중요하며 솔루션의 고유성에 영향을 미칠 수 있다고 설명합니다. 이어 표면의 곡률을 구하는 과정을 예를 들어 설명하는데, 표면은 셈(sem) 유형의 반사율 맵을 가지며 원점에 정지점이 있다고 가정합니다. 이미지의 기울기는 원점에서 0인 것으로 확인되어 해당 지점에서 극값이 있음을 확인합니다. 그러나 그래디언트는 원점에서 0이므로 로컬 모양을 추정하는 데 사용할 수 없으므로 2차 도함수가 필요합니다.

  • 01:25:00 이 섹션에서 발표자는 밝기의 2차 편도함수를 사용하여 모양에 대한 정보를 제공하고 고정점에서 로컬 모양을 추정하고 주변에 작은 캡 모양을 구성하여 모양을 복구하는 방법을 설명합니다. 또한 발표자는 산업용 머신 비전 방법과 후속 강의에서 논의될 관련 패턴에 대한 주제를 소개합니다.