また、スピーカーは、透視投影のベクトル表記、表面照明、表面要素の短縮、2D 画像を使用して 3D ビジョンの問題を解決する方法など、画像形成に関連するさまざまな概念についても説明します。講師は、表面の照度が入射角によってどのように変化するか、および赤の長さと表面の長さの余弦関係を説明します。これは、表面のさまざまな部分の明るさを測定するために使用できます。ただし、オブジェクトのすべての小さなファセットの方向を決定することは、2 つの未知数のために困難な場合があります。スピーカーは、2D 画像を使用して 3D ビジョンの問題を解決できる理由についても説明し、トモグラフィーの数学は単純ですが、方程式が複雑であり、逆変換を実行するのが難しいことに言及して締めくくります。
MIT 6.801 Machine Vision, Fall 2020Instructor: Berthold HornView the complete course: https://ocw.mit.edu/6-801F20YouTube Playlist: https://www.youtube.com/p...
00:10:00 講義のこのセクションでは、拡大と圧縮の焦点の概念が、画像形成と透視投影のコンテキストで紹介されます。この方程式は、距離と速度を測定する際に重要な、膨張の焦点から外側に放射するベクトルを表します。 z に対する w の比率によってベクトルのサイズが決まり、展開の焦点の逆数が圧縮の焦点になります。 w に対する z の比を取ることで、衝突までの時間を推定できます。これは、宇宙船の着陸や距離の測定に役立ちます。アイデアはベクトル形式で導入されますが、すぐには役に立ちません。
00:15:00 このセクションでは、スピーカーは透視投影方程式と、それを使用して画像座標を導入する方法について説明します。展開の焦点は、z に対応する r dot がゼロの点として導入されます。時間に関して各コンポーネントを微分することにより、3D での動きと深さでの動きの方程式を導き出すことができます。スピーカーはまた、本の付録の結果を使用して、方程式を流れに関する一般的なステートメントに変換し、世界の動きの観点からイメージの動きを表現できるようにします。
00:20:00 このセクションでは、講師が画像の動きの概念と z 軸との関係について説明します。結果として得られる画像の動きは、z 軸に垂直であることがわかります。これは、画像が x 方向と y 方向の速度を持つ 2 次元のみであるため、驚くべきことではありません。次に、放射状の動きの概念とその画像の動きへの影響について説明し、オブジェクトが観察者に直接近づいたり遠ざかったりする場合、画像の動きはないという結論に達します。講師は、ベクトルがすべて同じ長さではない流れ場の例を調べることで締めくくります。
00:30:00 講義のこのセクションでは、教授が画像処理における連続ドメインと離散ドメインの違いについて説明します。実際には、イメージは 2 つのインデックスを持つ数値の配列で表されることがよくありますが、連続関数を使用すると、積分などの特定の操作を理解しやすくなります。さらに、教授は、輝度の x 導関数と y 導関数を差分法で近似すること、および画像処理における輝度勾配の重要性について話します。講義では、1D センサーと、画像をスキャンする手段として動作を使用して、1D センサーをイメージングに使用する方法についても触れます。教授は、画像の 2 つのフレーム間の動きの速度を決定する問題を提起し、テーブルの表面をマッピングする光学式マウスの例を示します。
00:35:00 このセクションでは、講師が光学式マウス技術で行われた仮定、特に表面を見たときの一定の明るさの仮定について説明します。彼はまた、フレーム間の明るさの変化を分析することにより、曲線の小さな線形近似を使用して動きを判断する方法についても説明しています。講師は偏微分表記法と、エッジ検出に使用できる輝度勾配の成分を紹介します。最後に、式 delta e = e sub x x delta x が導出され、これを delta t で割ってモーションを計算します。
00:45:00 レクチャーのこのセクションでは、スピーカーは、画像内のオブジェクトの速度を推定する際に、テクスチャを含む基準点を持つことの重要性について説明します。このタイプの測定は、特定の画像条件が満たされない限り、ノイズが多く信頼性が低くなる可能性があります。ただし、複数のピクセルを使用し、最小二乗法などの手法を適用してエラーを減らすことで、結果を劇的に改善できます。複数のピクセルを組み合わせることで、測定値の標準偏差を n の平方根で減らすことができます。これは、大きな画像では重要です。ただし、テクスチャの勾配に基づいて測定値を重み付けして、勾配の低い領域が勾配の大きい領域からの情報で汚染されないようにすることが重要です。最後に、分析を 2D 画像に拡張し、次の結果を得るために複数のアプローチについて説明します。
00:50:00 このセクションでは、講師は、x、y、および t を軸とする輝度値の 3 次元ボリュームとして、ビデオ フレームをどのように概念化できるかを説明します。次に、偏導関数と、x、y、または t 方向の隣接ピクセルの差からどのように導出されるかについて説明します。次に講師は、特に運動中の物体の明るさの勾配に関連する、曲線に沿った全導関数の概念を探究します。連鎖律を使用すると、総導関数を偏導関数として表すことができ、オブジェクトの明るさが時間とともにどのように変化するかを予測できます。最後に、一連の画像から u と b を求める概念を紹介します。
01:00:00 ビデオのこのセクションでは、話者は物体の動きを決定する際の輝度勾配の重要性について説明します。輝度勾配は、高輝度領域と低輝度領域の間の遷移に垂直な方向を指す単位ベクトルです。話者は、局所的な測定を行う場合、物体の動きを決定するのに十分な方程式がないことを説明します。しかし、輝度勾配方向の動きは判別できる。その後、スピーカーは 2D のケースについて議論し、オブジェクトの動きを決定するには複数の制約を使用する必要があると述べています。これを実証するために、スピーカーは単純な線形方程式を解いて u と v の値を復元します。
01:05:00 このセクションでは、講師が 2x2 行列を反転し、それを使用して画像の動きに関する一連の線形方程式を解く方法を説明します。ただし、一部のエッジ ケースでは、マトリックスの行列式がゼロになることがあります。これは、明るさの勾配が互いに比例することを意味し、アパーチャの問題が発生します。この問題は、結果を単に平均化するのではなく、異なる画像領域への寄与を異なる方法で重み付けする必要があることを示唆しています。この問題を解決するには、方程式をゼロにするか、できるだけ小さくする u と v の値を探す必要があります。
01:10:00 このセクションでは、スピーカーは、u と v の正しい値が画像全体で積分されたときに被積分関数がゼロになるという理想的なケースに適用される制約について説明します。これは、u と v の正しい値を見つけるための戦略の基礎となる可能性があります。話者は、シーンに光やテクスチャがない場合、このアプローチが失敗し、ex と ey の値がゼロになる可能性があることに注意します。次にスピーカーは、被積分関数を 2 乗して最小化することで常に正になる方法を説明し、2 つの未知数を持つ 2 つの方程式の微積分の問題を導きます。ただし、2 行 2 列の行列式がゼロの場合、これは失敗する可能性があります。これは、ex がどこでもゼロであるか、ex が ey に等しい場合に発生する可能性があります。
MIT 6.801 Machine Vision, Fall 2020Instructor: Berthold HornView the complete course: https://ocw.mit.edu/6-801F20YouTube Playlist: https://www.youtube.com/p...
00:20:00 講義のこのセクションでは、ノイズ ゲインの概念を、運動と変数 u および v の解法を含む例に適用します。量が少ない場合、ノイズは大幅に増幅され、これは、2 つのピクセルでの明るさの勾配の方向が似ており、情報の違いがほとんどないためです。速度空間のダイアグラムを使用して、2 つの線がどのように交差するか、および 1 つの線の小さなシフトが交点に大きな変化を引き起こす可能性があることを示します。これは望ましくないケースです。ただし、すべての希望が失われるわけではありません。ノイズ ゲインがすべての方向で等しく高くない可能性があり、どのコンポーネントが信頼できるかを知ることは有用であることに注意してください。講義では、接触時間の概念に移る前に、一定の明るさの仮定と制約式を確認し続けます。
00:25:00 より複雑な表記。このセクションでは、講師が光学式マウスの問題と、最小二乗法を使用してそれを処理する方法について説明します。目標は、ex、ey、および et の測定値を使用して正しい速度を見つけることですが、これらの測定値は通常ノイズによって損なわれるため、積分の最小値 (ゼロではない) が u と v の推定値になります。最小値を決定するための微積分と、この積分を最小化することの重要性について説明します。次に、展開の焦点の場合など、u と v が予測可能な単純なケースに移り、透視投影における世界座標と画像座標の関係を確認します。
00:30:00 このセクションでは、スピーカーは、x 方向と y 方向の速度がゼロのモーションの速度、距離、および展開の焦点の間の関係について説明します。この講演では、z 方向の運動成分である az の量 w と、メートル/秒または秒単位で測定された速度の距離 (接触時間とも呼ばれます) について説明します。何も変わらない場合、オブジェクトに衝突するまでに長い時間がかかります。次にスピーカーは、簡単な例を使って、誰かが壁に向かって移動しているときに拡張の焦点がどのように機能するか、およびそのシナリオでモーション フィールドがどのように見えるかを示します。
00:40:00 このセクションでは、講師が放射状勾配を計算し、それらを使用して画像の接触時間を推定する方法を説明します。放射状グラデーションは、画像に正立した極座標系の放射状ベクトルと画像グラデーションの内積を取ることによって計算されます。次に講師は、最小二乗法を使用して、計算された放射状勾配と点光源の理論値ゼロとの差を最小限に抑える方法を示します。これは、光軸に沿った動きの単純なケースに適用されます。この場合、パラメーター c の推定によって接触時間が得られます。
00:45:00 講義のこのセクションでは、直接モーション ビジョン法を使用して接触までの時間を推定するアプローチについて教授が説明します。彼は微積分を使用して、ノイズが存在する場合の平均二乗誤差を最小限に抑え、接触時間の逆数である c の式を導き出します。重要なのは、x 方向と y 方向の隣接ピクセルを使用して輝度勾配を推定し、次に放射状勾配を計算し、最後にすべてのピクセルの二重積分を計算して g と g の 2 乗を推定することです。これらにより、接触までの時間は、c の式を使用して簡単に見積もることができます。この方法はシンプルで効果的で、高度な処理や高度なオブジェクト認識技術を必要とせず、接触までの時間を直接計算します。
01:00:00 このセクションでは、講師が中間結果を表示できるツールのデモンストレーションを行います。これにより、x 導関数は赤を制御し、y 導関数は緑を制御し、地形の勾配の急速な変化に似た 3 次元効果を与えます。地図。さらに、動径導関数 g は外側に向かうことが実証されており、時間導関数 et を掛けると、動きを決定できます。ただし、このようなツールには計算可能な制限とエラーがあり、魔法のコードがないため、魅力的でわかりやすいツールになっていることが認められています。
01:05:00 このセクションでは、講師が画像処理における任意のモーションの処理の問題について説明します。彼は、問題は、それぞれ x 方向と y 方向の動きを表す u と v が画像全体で異なる可能性があるという事実から生じると指摘しています。これにより、200 万の未知数で 100 万の方程式が生成される可能性があり、問題が解けないように見えます。講師は、問題を解決するために追加の仮定が必要になる可能性があることを示唆していますが、ほとんどの場合、画像内の隣接するポイントは同じまたは類似の速度で移動しているため、追加情報が得られることに注意してください。彼はまた、画像の放射状グラデーションがゼロの場合、ソリューションが失敗する可能性があることを警告し、それが何を意味するかを説明しています。
01:10:00 このセクションでは、講師は、直視運動法を使用して接触時間を計算する成功に影響を与える可能性のあるパターンについて説明します。講師は、X 形状のようないくつかのパターンは、さまざまな方向に変化するグラデーションを持っているため、接触時間を計算するための貴重な情報を提供すると説明しています。ただし、円グラフなどの別のパターンでは、グラデーションの方向が一貫しているため、この情報を提供できません。講演者はまた、このアルゴリズムは、一枚の紙のような比較的一貫したパターンでも存在する小さな斑点や繊維からゼロ以外のエクセイを拾い上げることができると述べています。最後に、講義では 2 つの新しい変数、z の fu と z の fv を紹介します。これらは、式でより便利に接触する時間と敵を定義するのに役立ちます。
01:15:00 このセクションでは、スピーカーは、2 つのパラメーター a と b に基づく展開の焦点を計算するための式と、どのように f が式に表示されないかについて説明します。多くの目的で、距離と速度の計算に f が必要ですが、接触時間の計算には f は必要ありません。次に、スピーカーは、有限数のパラメーター a、b、および c を使用した最小二乗問題として問題を定式化し、積分を微分して被積分関数の導関数を見つけます。
01:20:00 講義のこのセクションでは、スピーカーは、3 つの線形方程式と 3 つの未知数を解き、さまざまな変数がモーション ビジョンにどのように影響するかを調べる方法を説明します。解は閉じた形をしており、さまざまなパラメーターで再計算する必要がなく、結論をすばやく導き出すことができるため、有益です。水平方向、垂直方向、および g 方向で区別される 3 つのアキュムレータがあり、これらはすべて係数に影響します。係数行列は対称であり、解の安定性を理解できます。
MIT 6.801 Machine Vision, Fall 2020Instructor: Berthold HornView the complete course: https://ocw.mit.edu/6-801F20YouTube Playlist: https://www.youtube.com/p...
00:05:00 講義のこのセクションでは、スピーカーは、オプティカル マウスの場合のように、画像全体に対して一定の u と v があるオプティカル フローの問題で u と v を推定する誤差を最小化する手法について説明します。 .このプロセスは過度に制約されていますが、対称的な 2 行 2 列の係数行列を使用して、未知数の線形方程式を得ることができます。スピーカーは、微分を計算する方法と、この方法が機能しない条件を示します。また、e_x と e_y がどこでも同じ比率である特定のタイプの画像についても説明しており、この条件は当てはまります。
00:20:00 このセクションでは、講師がカメラまたは表面が傾いている状況をモデル化する方法について説明します。傾斜した平面の場合、深度は画像内で一定ではなくなります。平面の方程式は、x と y の線形方程式であり、見るのがより複雑なモデルになる可能性があります。一般に、そこでは方程式が複雑になりすぎて、閉形式の解が存在しない可能性があります。ただし、閉じた形式のソリューションがある場合に最初に焦点を当てることをお勧めします。表面が平面でない場合は、多項式で近似して最小二乗問題を設定できます。残念ながら、閉形式の解は見つからないため、数値解が必要です。それにもかかわらず、より多くの変数を導入する場合は注意が必要です。これにより、ソリューションが別の方向に曲がりくねってしまい、表面が平面であるというモデリングよりも利点が失われるからです。
00:25:00 このセクションでは、スピーカーはオプティカル フローでのマルチスケール実装の問題について説明します。実装が成功したにもかかわらず、彼は、画像内の動きが大きくなるにつれて結果の精度が低下すると述べています。この問題を処理する 1 つの方法は、フレームあたりの動きを減らす小さな画像で作業することです。講演者はまた、マルチスケール平均化の利点についても説明します。これには、大きな動きを処理するためにますます小さな画像セットを使用することが含まれます。必要な作業量はサブセットの数に応じて増加しますが、総計算量は削減されます。スピーカーは、マルチスケール最適化のプロセスが、前の講義で使用された単純な 2 x 2 ブロック平均化よりも複雑であることを強調しています。
00:55:00 講義のこのセクションでは、教授は線の射影と、代数的および幾何学的を含むさまざまな方法でそれを定義する方法について説明します。彼は、3D の線は単位ベクトルを使用して点と方向によって定義できること、線上の異なる点は異なる値の s を持つことを説明しています。教授は、透視投影を使用してこれを画像に投影する方法を説明し、変数 x、y、および z を使用した厄介な方程式を作成します。ただし、s を非常に大きくすることで、方程式を単純化し、カメラのキャリブレーションとイメージング システムの影響を調べることができます。
MIT 6.801 Machine Vision, Fall 2020Instructor: Berthold HornView the complete course: https://ocw.mit.edu/6-801F20YouTube Playlist: https://www.youtube.com/p...
00:00:00 このセクションでは、スピーカーはキーボードに向けられた Web カメラで TCC と FOR MontiVision デモの使用を実演します。彼らは、連絡までの時間の計算の重要性と、それらの計算に影響を与える要因について説明します。また、スピーカーは、透視投影における消失点の概念と、それらをカメラのキャリブレーションに使用する方法についても説明します。彼らは、接触までの時間の計算式と、dzdt の符号が移動物体の画像にどのように影響するかを説明しています。
00:45:00 このセクションでは、スピーカーは、特に世界座標系に対するカメラの向きを決定するためのカメラ キャリブレーションにおける消失点の適用について説明します。話者は、縁石や道路標示など、平行であると思われる画像内の特徴を識別することで、画像内で認識できる消失点を生成できると説明しています。講演者はまた、3 つの消失点すべてが利用可能な理想的なケースでは、カメラによってキャプチャされた長方形のオブジェクトのエッジを使用して x 軸と y 軸を定義し、その後カメラ座標系と世界座標系。
00:50:00 このセクションでは、スピーカーは、カメラ座標系で測定されたオブジェクト座標系で単位ベクトルを見つけるプロセスを説明します。単位ベクトルは互いに直角でなければならず、TCC および FOR MontiVision Demo の計算に使用されます。変換行列は、一方の座標系と他方の座標系との相対的な向きを表しており、講演者は、将来これをさらに行う予定であると述べています。
MIT 6.801 Machine Vision, Fall 2020Instructor: Berthold HornView the complete course: https://ocw.mit.edu/6-801F20YouTube Playlist: https://www.youtube.com/p...
00:05:00 このセクションでは、スピーカーは特異行列の概念と、線形方程式系を解く際のその関連性について説明します。特異行列とは、行列式がゼロの行列です。 n 行 n 列の実対称行列の場合、行列式は n 根を持つラムダの n 次多項式です。これは、同次方程式のセットの場合、行列式がゼロの場合、一意の解ではなく、複数の解が存在することを意味します。これは、特定の方向のエラーが他の方向とは異なる場合がある、光学式マウスの回復などの多次元の問題を扱う場合に重要です。したがって、小さな決定要因を問題として特定するだけでなく、より微妙な全体像が必要です。
00:15:00 このセクションでは、スピーカーは、2x2 の場合の同次方程式を解く際の固有ベクトルと固有値について説明します。固有ベクトルを見つけるために、スピーカーは、解が行列の行に対して垂直でなければならないことを示します。結果は、ラムダの異なる値に対して同じ方向を指す 4 つの固有ベクトルを与え、それらを正規化して単位固有ベクトルを得ることができます。この手法は n 行 n 列の行列に拡張できます。この行列は、n 個の固有ベクトルと対応する固有値を提供し、誤差増幅について説明します。
00:30:00 このセクションでは、スピーカーは固有ベクトルと固有値、およびそれらを使用してさまざまな方法で行列を書き換える方法について話します。彼らは、これらの項はすべて従属関係にあると説明していますが、固有ベクトル自体はそうではないため、因数分解することができます。彼らは、このアプローチを使用して固有値の特性を確認する方法と、視覚の問題を解決する上でこれが重要である理由について議論を続けています。具体的には、この問題を解決するために使用される行列は、多くの場合、ラムダ i に対して信号の成分を 1 倍するため、ラムダ i が小さい場合、不安定な不適切な設定の問題が生じる可能性があると説明しています。
MIT 6.801 Machine Vision, Fall 2020Instructor: Berthold HornView the complete course: https://ocw.mit.edu/6-801F20YouTube Playlist: https://www.youtube.com/p...
この講義では、講演者は、立体角とコサイン シータを考慮して、画像内の小さな領域に供給される総電力を決定する式を説明します。彼らは、この方程式をカメラの f ストップと関連付け、開口サイズが受け取る光の量をどのように制御するかを説明します。講演者はまた、実世界の物体の放射輝度に比例する画像放射照度と、軸から外れると明るさがどのように低下するかについても説明します。次に、入射方向と放射方向に応じて表面がどの程度明るく見えるかを決定する双方向反射率分布関数について説明します。講師は、ゴニオメーターを使用して反射率を測定することができ、オブジェクトがどのように光を反射するかをリアルにモデル化することが重要であることを説明します。また、双方向反射率分布関数のヘルムホルツ相反性の概念についても説明しています。その後、講義は表面材料モデルへの勾配空間の適用について議論し、学生に宿題の情報を常に更新するように促します。
00:00:00 このセクションでは、勾配空間の概念を紹介して、画像の明るさを決定するものを探ります。明るさは通常、表面の向きと同様に照明とジオメトリに依存するため、明るさを決定するために表面パッチの向きに言及する必要があります。単位法線、および p と q についても言及されています。これらは、画像の勾配の便利な省略形です。ランバート サーフェスの明るさは、問題のサーフェスの方向に応じて議論の余地があります。多くのつや消しサーフェスはランバート サーフェスの近似であり、そのような近似は便利に思えます。ただし、ほとんどの宇宙的および微視的な状況は、このような近似には適していません。
00:10:00 このセクションでは、講師が球体などのキャリブレーション オブジェクトを使用して画像のキャリブレーションを行う方法について説明します。ライトアップされた球体の画像をすべての側面から撮影し、それに円を当てはめることで、画像の中心と半径を推定できます。球の場合、面に対する点と単位ベクトルが平行になる便利な関係があり、面の向きを簡単に決定できます。この方法は、緯度の定義にいくつかの変更を加えることで、地球にも使用できます。前の講義の式を使用して p と q を計算することにより、画像内の各点の n と表面の向きを決定できます。
MIT 6.801 Machine Vision, Fall 2020Instructor: Berthold HornView the complete course: https://ocw.mit.edu/6-801F20YouTube Playlist: https://www.youtube.com/p...
00:10:00 講義のこのセクションでは、教授が理想的なランバート サーフェスの特性について説明します。それは、どの方向から見ても等しく明るく見えます。理想的なランバート サーフェスの場合、すべての入射光も反射します。教授は、4 つのパラメーターのうち 2 つに依存しないため、式が単純化されると説明しています。次に、部屋の照明などの分散光源を処理する方法や、入射方向の半球全体を統合する方法について説明します。教授は、すべての放射方向を統合する必要があること、および極角と方位角を使用してパッチの面積を計算する方法を説明しています。最後に、彼は f 項が一定であると述べています。
00:15:00 このセクションでは、シェーディングの概念と表面での光の反射について説明します。講義では、表面に当たる光が入射する放射と入射角に依存することを強調しています。すべての光が反射されると言われ、表面に蓄積されるパワーは、表面の面積の e cosine theta i 倍になります。したがって、反射光を積分すると入射光と等しくなります。講義では、反転曲面の f の定数値を計算し、f はランバート曲面の pi で 1 であると結論付けます。反射エネルギーがすべての方向に均等に放射されるわけではないことに注意してください。短縮が表面から放射されるパワーにどのように影響するかが説明されています。
00:20:00 講義のこのセクションでは、教授はランバート面の概念について説明します。これは、すべての方向に均等に光を放射する面です。しかし、大きな面を光源から斜めに扱う場合、面要素の面積は縮小し、結果として単位面積あたりのパワーは無限大になります。網膜の損傷を避けるために、表面は特定の方向への放射を減らしますが、単位面積あたりの電力は一定のままです。この条件は、表面が実際に特定の領域でより多く放射し、他の領域ではより放射が少ないことを意味し、その結果、2 pi に対して 1 ではなく、pi に対して 1 の比率になります。次に、この知識を使用して入射光を測定し、ヘルムホッツ相反性を扱う際の混乱を避ける方法を説明します。
00:25:00 このセクションでは、講師は、ランバート サーフェスとは異なり、多くのアプリケーションで非常に重要なタイプのサーフェスを紹介します。このタイプの曲面は、コサイン シータ i とコサイン シータ e の平方根を掛けたものであり、ヘルムホルツの相互関係を満たします。このタイプの表面の放射輝度は、縮み率の影響を受け、月や岩石惑星、小惑星の表面をモデル化するために使用されます。講義では、3D 空間では入れ子になった円ですが、画像平面では楕円として投影されるこの表面の等照線を決定する方法を説明し、輝度等高線マップに関する洞察を提供します。
00:35:00 このセクションでは、講師が月面のシェーディングを処理する際に座標系を選択する方法について説明します。適切なシステムを配置すると、代数的な混乱を防ぐことができるからです。彼らは、太陽と地球が z=0 にある座標系を使用することを推奨しており、計算を 1 つの未知数に単純化しています。講義では、円盤が均一に明るいはずの満月の外観についても簡単に触れていますが、非ランベルトの微細構造のため、完全な球形には見えません。 Hakka モデルは、この種の行動を予測するのに適しています。最後に、講義は n ドット v 上の n ドット s の式に飛び込み、最終的に球面座標ベクトルを使用した単純化されたバージョンに到達します。
00:55:00 このセクションでは、講師は、明るさを測定することで表面の急勾配または傾斜方向を決定する方法を説明します。研究者は、点の明るさまたは反射率を垂直方向および水平方向に測定することにより、表面のプロファイルを収集できます。このプロセスを開始するには、表面の明るさを測定し、段階的に z を見つけるという初期条件が必要です。ただし、測定の精度は、反射率の変動や明るさの測定の不正確さの影響を受ける可能性があります。
01:00:00 このセクションでは、教授は、オブジェクトの表面のプロファイルを取得して、シェーディング技術からの形状を使用してその形状を決定する方法について説明します。彼は、オブジェクト全体にプロファイルを実行することで、初期値を知っている限り、プロファイルの形状を取得する方法を説明しています。ただし、初期値がわからないと、プロファイルの絶対垂直位置を取得できません。次に、この手法を月に適用して、表面のさまざまなプロファイルを取得し、オブジェクトの形状を調べます。教授は、プロファイルから 3D サーフェスをつなぎ合わせるヒューリスティックについても話します。その後、彼はトピックをレンズについての話題に切り替え、正投影の使用を正当化します。
01:20:00 このセクションでは、レンズレット アレイを使用して広い領域からの光を測定する際に、ブロック平均化によるローパス フィルタリングがエイリアシングの問題をどのように軽減できるかについて講師が説明します。この方法は、光がセンサーに対して垂直に入射する場合にうまく機能します。これは、テレセントリック レンズを使用することによって実現されます。ただし、シーンの深度の変化が深度自体よりも小さい場合など、特定のケースでは正投影を使用する方が便利であることを説明します。これにより、世界の x と y と画像の x と y の間の線形関係が可能になり、距離に関係なくオブジェクトの距離とサイズを測定できます。
MIT 6.801 Machine Vision, Fall 2020Instructor: Berthold HornView the complete course: https://ocw.mit.edu/6-801F20YouTube Playlist: https://www.youtube.com/p...
「Shape from Shading」に関するこの講義では、スピーカーは、シェーディングから形状への最小二乗解の方程式を解くためのさまざまなアプローチについて説明します。講師は、ラプラシアン条件を満たし、ピクセル値を調整し、さまざまなポイントからの画像測定と勾配計算を使用してサーフェスを再構築するためのさまざまな手法について説明します。講義では、初期値、回転の変換、マイナス シータによる逆変換について説明します。講師は、任意の反射率マップに対するこれらの方程式の一般化と、シェーディング解釈の具体例を提供するために走査型電子顕微鏡画像を調べることの重要性についての議論で締めくくります。
00:20:00 講義のこのセクションでは、スピーカーは反射率マップを使用して表面の傾斜または勾配を決定する方法について説明します。彼らは、この方法は特定のタイプだけでなく、さまざまな表面に使用できると説明しています。ディスカッションでは、針の図と、それらを使用して表面の向きと形状を決定する方法についても説明します。話者は、これは単純な問題ですが、未知数よりも多くの制約があるため過剰決定されていると説明しています。これにより、ノイズが減少し、より良い結果が得られます。講義は、原点からの高さの変化を決定するために p を積分するデモンストレーションで終わります。
00:25:00 このセクションでは、スピーカーは既知のデータを統合して、x 軸または y 軸に沿った任意の高さを推定する方法について説明します。これらを組み合わせて、領域全体を埋めることができます。ただし、使用される p 値と q 値は測定ノイズの影響を受けやすいため、異なる方法で p と q を測定しても同じ答えが得られるという保証はありません。この問題を解決するには、p と q に対する制約を設定する必要があります。 p と q は、すべてのループでこの制約を満たさなければなりません。また、大きなループを小さなループに分解して互いに打ち消し合い、大きなループでも制約が確実に満たされるようにすることができます。
00:30:00 このセクションでは、講師は測光外部法または他の視覚法を使用して表面の導関数を測定するという文脈で、輪郭積分と面積積分の間の関係について説明します。講義では、勾配がほぼ一定であるストレッチの中心に基づいて勾配を推定する方法を示し、テイラー級数展開を使用して x y の表面 z の導関数を関連付ける方程式を導き出します。測定された p と q を与える xy の正確な z を見つけることは不可能であると言われていますが、最小二乗近似を見つけるためのより洗練された方法が提示されています。
00:40:00 このセクションでは、講師が私たちの測定値から可能な限り最小の表面を見つける方法について説明します。理想的には、その x 導関数と y 導関数が、それぞれ画像から取得した p と q に一致するサーフェスを見つけることです。ただし、測定ノイズのためにこれは不可能であるため、代わりに、最小二乗問題を解くことによって可能な限り小さくしようとします。 Z は無限の自由度を持つ関数なので、通常の計算は使えません。代わりに、グリッド上の有限数の未知数のそれぞれについて微分し、結果をゼロに設定して多くの方程式を得ることができます。
00:45:00 講義のこのセクションでは、スピーカーは、x 方向と y 方向の両方で観測値と推定された導関数の間の誤差を最小限に抑えるために、すべてのグリッド ポイントの z の値を見つけるプロセスについて説明します。これを行うには、スピーカーは、i と j のすべての可能な値を微分して結果をゼロに設定する必要があると説明します。これにより、最小二乗法を使用して解ける一連の線形方程式が得られます。ただし、スピーカーは、識別子名 i および j が他の名前に置き換えられない場合、間違った答えが得られる可能性があるという潜在的な問題について警告します。方程式の数が多いにもかかわらず、方程式がまばらであるため、解くのが容易になります。
00:50:00 このセクションでは、シェーディング問題から形状の 5 つの常微分方程式を導出するために、1 次非線形偏微分方程式を使用するプロセスについて説明します。彼らは、正方形内の項の微分、項の一致、および k と l のさまざまな値の考慮の手順を説明しています。講師は最終的な方程式を単純化し、項を分離して、それぞれ p と q の x 導関数と y 導関数を識別します。目標は、最終的に画像内のすべての点の解を見つけることです。
01:25:00 このセクションでは、スピーカーは、定数を掛けることで方程式がより単純になり、x 方向と y 方向の動きはそれぞれ q s と p s に比例し、z 方向にはストレートな公式。講義は、任意の反射率マップに対するこれらの方程式の一般化と、シェーディング解釈の具体例を提供するために走査型電子顕微鏡画像を調べることの重要性についての議論で締めくくられます。
MIT 6.801 Machine Vision, Fall 2020Instructor: Berthold HornView the complete course: https://ocw.mit.edu/6-801F20YouTube Playlist: https://www.youtube.com/p...
00:25:00 このセクションでは、講師が 3D サーフェスの曲率行列を計算する方法について説明します。これは、平面内の曲線よりも複雑です。曲率行列には、ヘッセ行列と呼ばれる二次導関数の行列全体が必要です。ただし、高次導関数を使用して解を続けると、未知数が増えることになります。したがって、表面の向きの変化は画像の明るさに影響する曲率に対応するため、画像放射照度の式、特に明るさの勾配が必要です。曲率方程式と輝度勾配方程式の両方で共通の行列 H を調べることにより、H を計算すると、x、y、z、p、q の更新が可能になり、メソッドが完成します。
00:30:00 このセクションでは、講師が 2 つの線形方程式を使用して h を解く概念について説明します。 H はこれらの方程式の両方に現れますが、2 つの方程式と 3 つの未知数があるため、h について解くことはできません。ただし、特定のデルタ x とデルタ y を使用することで、ステップ サイズを制御し、特定の方向を選択してデルタ p とデルタ q を計算できます。講師はまた、表面を探索すると方向が変わる可能性があると説明しています。これを方程式に当てはめることで、問題を解決するために p と q を変更する方法を見つけることができます。
00:35:00 このセクションでは、講師が画像放射照度方程式の z 変数を解くために必要な 5 つの常微分方程式について説明し、輝度勾配を使用してストリップを生成して p および q 変数を更新する方法を紹介します。講師は、互いに影響し合う 2 つの連立方程式を含むソリューションの興味深い部分と、それらがどのように勾配の方向を決定し、ストリップ全体をトレースするために使用できるかを説明します。最終的に、偏微分方程式は、p と q を使用して単純な常微分方程式に縮小され、方程式がより威圧的に見えるようになります。
00:40:00 このセクションでは、スピーカーはシェーディングから形状のコンテキストで明るさを解決する際の 1 次非線形 PDE の課題について説明します。これは、物理学で見られる一般的な 2 次および線形偏微分方程式からの逸脱であり、これらのタイプの偏微分方程式を解くには特別な方法が必要であることを意味します。 P と Q の任意の R の一般的なケースについて説明し、次に 2 つの特定の表面特性に適用します。ハプケと走査型電子顕微鏡です。 X と Y の更新規則は、それぞれ PS と QS に比例することが示されています。
00:45:00 このセクションでは、反復解によるシェーディングから特徴的なストリップの拡張と形状を使用して、x、y、および高さ軸を更新する方法について講師が説明します。この方法では、p と q について微分して x と y の更新を計算し、prp と qrq を使用して高さ軸を更新します。講義では、この方法が走査型電子顕微鏡画像に使用できることを指摘し、基本特性の概念にも触れます。これには、特徴ストリップを画像平面に投影して、可能な限り多くの画像を探索することが含まれます。
00:50:00 このセクションでは、スピーカーは特徴的なストリップ拡張の実装と、シーケンシャル アプローチが最適な方法ではない理由について説明します。各曲線に沿って独立した解が見つかるため、各曲線に沿ってプロセスを実行でき、計算を並列化できます。合理的なステップ サイズを持つ必要がある計算の速度について説明し、ステップ サイズが定数 z によって制御される単純なケースを調べます。 z の方程式で PRP と QRQ で除算することにより、変化率は 1 になり、z の値が増加するときの等高線を含む各曲線に沿って一定の解が得られます。
01:20:00 講義のこのセクションでは、シェーディングからの形状に関連して曲面上の静止点の概念について説明します。アイデアは、静止点を持つサーフェスの曲率の一意のソリューションを見つけることです。スピーカーは、これらの点が人間の知覚において重要であり、解決策の独自性に影響を与える可能性があることを説明します。次に、曲面が sem 型の反射率マップを持ち、原点に静止点があると仮定した例を使用して、曲面の曲率を求めるプロセスを説明します。画像の勾配は原点でゼロであることがわかり、その点に極値が存在することが確認されます。ただし、勾配は原点でゼロであるため、局所的な形状の推定には使用できず、二次導関数が必要になります。
MIT 6.801 Machine Vision, Fall 2020Instructor: Berthold HornView the complete course: https://ocw.mit.edu/6-801F20YouTube Playlist: https://www.youtube.com/p...
MIT 6.801 マシン ビジョン、2020 年秋。講義 1: マシン ビジョンの概要
講義 1: マシン ビジョンの概要
講義「マシン ビジョン入門」では、画像解析への物理学に基づくアプローチに重点を置いて、コースのロジスティクスと目的の概要を詳しく説明します。マシン ビジョン コンポーネント、不適切な設定の問題、面の向き、および画像処理の課題について説明します。講師はまた、最小二乗最適化法とカメラで使用されるピンホール モデルも紹介します。カメラ中心の座標系、光軸、およびベクトルの使用についても簡単に説明します。このコースは、学生がより高度なマシン ビジョン コースと、プログラミングにおける数学と物理学の実際の応用に備えることを目的としています。
また、スピーカーは、透視投影のベクトル表記、表面照明、表面要素の短縮、2D 画像を使用して 3D ビジョンの問題を解決する方法など、画像形成に関連するさまざまな概念についても説明します。講師は、表面の照度が入射角によってどのように変化するか、および赤の長さと表面の長さの余弦関係を説明します。これは、表面のさまざまな部分の明るさを測定するために使用できます。ただし、オブジェクトのすべての小さなファセットの方向を決定することは、2 つの未知数のために困難な場合があります。スピーカーは、2D 画像を使用して 3D ビジョンの問題を解決できる理由についても説明し、トモグラフィーの数学は単純ですが、方程式が複雑であり、逆変換を実行するのが難しいことに言及して締めくくります。
講義 2: 画像形成、透視投影、時間導関数、モーション フィールド
講義 2: 画像形成、透視投影、時間導関数、モーション フィールド
この講義では、透視投影の概念と運動との関係について詳しく説明します。講師は、透視投影方程式の微分を使用して、画像内の輝度パターンの動きを測定する方法と、それが現実世界の動きとどのように関連するかを示します。講義では、展開の焦点、連続画像と離散画像、画像内のオブジェクトの速度を推定する際のテクスチャの基準点を持つことの重要性などのトピックも取り上げます。さらに、この講義では、曲線に沿った総導関数と、オプティカル フロー ベクトル場を復元しようとするときの方程式のカウントと制約の問題についても触れています。
講演者は、明るさの勾配、物体の動き、2D ケース、等光線など、さまざまなトピックを取り上げます。オブジェクトの速度を計算する際に直面する課題の 1 つは、輝度勾配の比例関係によって引き起こされる開口の問題です。これは、異なる画像領域への寄与を重み付けするか、最小解を検索することによって解決されます。次に、等光線のさまざまなケースを詳しく説明し、結果の変化に対する画像の変化の感度を測定するノイズ ゲインの概念を使用して、速度を決定する際にノイズの多いものではなく、意味のある答えを計算することの重要性を強調します。 .
講義 3: 接触までの時間、拡張の焦点、ダイレクト モーション ビジョン法、ノイズ ゲイン
講義 3: 接触までの時間、拡張の焦点、ダイレクト モーション ビジョン法、ノイズ ゲイン
この講義では、マシン ビジョン プロセスに関連するノイズ ゲインの概念を強調し、さまざまな方向と精度の変化に焦点を当てます。講師は、計算のエラーを最小限に抑えるために、ベクトルを正確に測定し、ゲインを理解することの重要性について説明します。この講演では、接触時間の概念、展開の焦点、モーション フィールドについて説明し、放射状勾配を計算して接触時間を推定する方法のデモンストレーションを行います。講師は、Web カメラを使用したライブ デモンストレーションで、マルチスケール スーパーピクセルを使用したフレームごとの計算の限界を克服する方法も示します。全体として、この講義では、マシン ビジョン プロセスの複雑さと、さまざまな量を正確に測定する方法について有益な洞察が得られます。
レクチャーでは、モーション ビジョンのさまざまな側面と、接触するまでの時間、拡大の焦点、ダイレクト モーション ビジョン法を決定する際のアプリケーションについて説明します。スピーカーは、中間結果を視覚化するためのツールを実演しますが、それらの制限とエラーも認識しています。さらに、画像処理における任意の動きを扱う問題に取り組み、同様の速度で動く隣接点の重要性が強調されています。この講義では、ダイレクト モーション ビジョン手法の成功に影響を与えるパターンについても掘り下げ、より便利に敵と接触する時間を定義するための新しい変数を紹介します。最後に、3 つの線形方程式と 3 つの未知数を解いて、さまざまな変数がモーション ビジョンにどのように影響するかを理解するプロセスと、計算を高速化するプロセスの並列化について説明します。
講義 4: 固定オプティカル フロー、オプティカル マウス、一定の明るさの仮定、閉じた形式のソリューション
講義 4: 固定オプティカル フロー、オプティカル マウス、一定の明るさの仮定、閉じた形式のソリューション
自律視の講義4では、固定オプティカルフロー、オプティカルマウス、一定輝度仮定、閉形式解、接触時間などについて講義します。一定の明るさの仮定は、明るさの変化の制約方程式につながります。これは、画像内の動きを明るさの勾配と明るさの変化率に関連付けます。講師はまた、カメラまたは表面が傾いている状況をモデル化する方法を実演し、大きな動きを処理する際のマルチスケール平均化の利点について説明します。さらに、この講義では、さまざまな自律的な状況で接触する時間の使い方を探り、惑星探査機に着陸するためのさまざまな制御システムを比較します。最後に、講義では、線の投影と、透視投影を使用して線を定義する方法に触れます。
講演者は、消失点を使用してカメラ キャリブレーションの変換パラメーターを復元する方法や、既知の形状を持つキャリブレーション オブジェクトを使用してカメラ中心のシステム内の点の位置を決定する方法など、画像処理のアプリケーションについて説明します。この講義では、オプティカル フロー アルゴリズムのキャリブレーション オブジェクトとしてさまざまな形状 (球体や立方体など) を使用することの利点と欠点、および立方体と 3 つのベクトルを使用して未知の投影中心を見つける方法についても説明します。講義は、実際のロボティクス カメラのキャリブレーションで半径方向の歪みパラメーターを考慮することの重要性を強調して終了します。
講義 5: TCC および FOR MontiVision のデモ、Vanishing Point、カメラ キャリブレーションにおける VP の使用
講義 5: TCC および FOR MontiVision のデモ、Vanishing Point、カメラ キャリブレーションにおける VP の使用
講義では、透視投影における消失点の使用、画像キャリブレーションにおける投影の中心と主点を見つけるための三角測量、正規直交行列で回転を表すための正規行列の概念など、カメラのキャリブレーションに関連するさまざまなトピックについて説明します。講師は、カメラの焦点距離を求める数学と、ワールド座標系に対するカメラの向きを決定するために消失点を使用する方法についても説明します。さらに、TCC と FOR MontiVision Demos の使用について説明し、問題を解決する際の方程式の背後にある幾何学を理解することの重要性についても説明します。
講義では、表面の明るさに対する照明の影響、2 つの異なる光源位置を使用してつや消し表面を測定する方法、単位ベクトルを解くためのアルベドの使用など、コンピューター ビジョンに関連するさまざまなトピックを取り上げます。また、カメラのキャリブレーションにおける消失点と、独立した 3 つの光源方向を使用して明るさを測定する簡単な方法についても説明します。最後に、話者は、透視投影の代替としての正射投影と、それを表面再構成に使用するために必要な条件について触れます。
講義 6: フォトメトリック ステレオ、ノイズ ゲイン、エラー増幅、固有値と固有ベクトルの復習
講義 6: フォトメトリック ステレオ、ノイズ ゲイン、エラー増幅、固有値と固有ベクトルの復習
講演では、フォトメトリック ステレオで連立一次方程式を解く際のノイズ ゲイン、固有値、および固有ベクトルの概念について説明します。講義では、特異行列の条件、誤差分析における固有値の関連性、および特異行列を回避するための線形独立性の重要性について説明します。講義は、ランベルトの法則と面の向きについての議論で締めくくられ、単位法線ベクトルまたは単位球上の点を使用して面を表現する必要性を強調します。全体として、この講義では、測光ステレオの基礎となる数学的原理についての洞察を提供し、地球の測定値から月の地形を正確に復元するという課題に焦点を当てています。
計算写真コースの講義 6 では、スピーカーは単位法線ベクトルと表面の勾配を使用して表面の向きを見つけ、表面の向きの関数として明るさをプロットする方法について説明します。彼らは、pq パラメーター化を使用して可能な表面の向きをマッピングする方法を説明し、傾斜面を使用してさまざまな角度の向きで明るさをプロットする方法を示しています。講演者はまた、光源の単位ベクトルと単位法線ベクトルの内積を勾配に関して書き直して、その量が一定である pq 空間の曲線を見つける方法についても説明します。講義は、光源に線を回転させて作成された円錐を使用して、さまざまな形状の円錐曲線を見つける方法の説明で終わります。
講義 7: 勾配空間、反射率マップ、画像放射照度方程式、Gnomonic Projection
講義 7: 勾配空間、反射率マップ、画像放射照度方程式、Gnomonic Projection
この講義では、勾配空間、反射率マップ、および画像放射照度方程式について説明します。講師は、反射率マップを使用してグラフィックス アプリケーションの表面の向きと明るさを決定する方法、および異なる照明条件で撮影した 3 枚の写真を使用して表面の向きから明るさへの数値マッピングを作成する方法を説明します。また、放射照度の概念と強度および放射輝度との関係、および明るさを測定する際に有限アパーチャを使用することの重要性についても紹介します。さらに、講義では、レンズを通過した後の光の振る舞いの 3 つの規則、短縮の概念、レンズがどのように光線を集束させて、表面上のパッチからの光がどれだけ画像に集中するかを判断する方法についても触れます。
この講義では、講演者は、立体角とコサイン シータを考慮して、画像内の小さな領域に供給される総電力を決定する式を説明します。彼らは、この方程式をカメラの f ストップと関連付け、開口サイズが受け取る光の量をどのように制御するかを説明します。講演者はまた、実世界の物体の放射輝度に比例する画像放射照度と、軸から外れると明るさがどのように低下するかについても説明します。次に、入射方向と放射方向に応じて表面がどの程度明るく見えるかを決定する双方向反射率分布関数について説明します。講師は、ゴニオメーターを使用して反射率を測定することができ、オブジェクトがどのように光を反射するかをリアルにモデル化することが重要であることを説明します。また、双方向反射率分布関数のヘルムホルツ相反性の概念についても説明しています。その後、講義は表面材料モデルへの勾配空間の適用について議論し、学生に宿題の情報を常に更新するように促します。
講義 8: シェーディング、特殊なケース、月面、走査型電子顕微鏡、グリーンの定理
講義 8: シェーディング、特殊なケース、月面、走査型電子顕微鏡、グリーンの定理
この講義では、教授は測光とシェーディングに関連するいくつかのトピックを扱います。彼は、放射照度、強度、および放射輝度の関係と、それらがどのように測定され、関連付けられているかを説明しています。講義では、双方向反射率分布関数 (BRDF) も紹介して、照明が表面の向きと材質にどのように影響するかを説明します。講師はさらに、理想的なランベルト面の特性と、入射光を測定し、ヘルムホッツの相反性を扱う際の混乱を避けるための意味について説明します。講義では、勾配から単位ベクトルへの変換プロセスと、光源の位置との関係についても説明します。最後に、明るさを測定することで表面の勾配や斜面の方向を判断する方法について説明します。
講義では、光学とコンピューター ビジョンに関連するさまざまなトピックを扱います。教授は、シェーディング技術から形状を使用してオブジェクトの表面のプロファイルを取得し、その形状を決定する方法について説明します。その後、彼はレンズの議論に切り替え、正投影の使用を正当化します。講師はまた、テレセントリック レンズを構築することによってマシン ビジョンの透視投影を取り除くことについても話し、波長によるガラスの屈折率の変化による収差を補正するためのさまざまなトリックを実演します。最後に、スピーカーは正投影の概念を紹介します。これにより、透視投影に関連する問題の一部が単純化されます。
講義 9: シェーディングからの形状、一般的なケース - 1 次非線形 PDE から 5 つの ODE まで
講義 9: シェーディングからの形状、一般的なケース - 1 次非線形 PDE から 5 つの ODE まで
この講義では、画像の明るさの変化を使用してオブジェクトの形状を解釈する方法である、シェーディングからの形状のトピックについて説明します。講師は、二次電子コレクターを使用して入射電子ビームの一部を測定し、表面の傾斜を推定できるようにする走査型電子顕微鏡のプロセスについて説明します。講義では、等高線積分、モーメント、最小二乗法を使用して曲面導関数を推定し、測定ノイズを考慮して最小の曲面を見つける方法についても説明します。講演者は、シェーディング問題から形状の 5 つの常微分方程式を導出し、画像処理操作で使用されるラプラシアン演算子の概念についても説明します。
「Shape from Shading」に関するこの講義では、スピーカーは、シェーディングから形状への最小二乗解の方程式を解くためのさまざまなアプローチについて説明します。講師は、ラプラシアン条件を満たし、ピクセル値を調整し、さまざまなポイントからの画像測定と勾配計算を使用してサーフェスを再構築するためのさまざまな手法について説明します。講義では、初期値、回転の変換、マイナス シータによる逆変換について説明します。講師は、任意の反射率マップに対するこれらの方程式の一般化と、シェーディング解釈の具体例を提供するために走査型電子顕微鏡画像を調べることの重要性についての議論で締めくくります。
講義 10: 特性ストリップ拡張、シェーディングからのシェイプ、反復ソリューション
講義 10: 特性ストリップ拡張、シェーディングからのシェイプ、反復ソリューション
この講義では、インストラクターは画像形成の概念で明るさの測定を使用してシェーディングから形状のトピックを扱います。これには、明るさを表面の向き、照度、表面の材質、形状に関連付ける画像放射照度の式を理解することが含まれます。彼らは、互いにフィードする2つの別々の方程式系を使用してp変数とq変数を更新し、輝度勾配を使用してストリップ全体をトレースする方法を説明しています。この講義では、一次非線形偏微分方程式を解く際の課題や、サーフェスを探索する際に 1 つの等高線から別の等高線に移動するさまざまな方法についても説明します。最後に、インストラクターは、特徴的なストリップ展開の実装と、並列化の推奨とステップ サイズの制御について、逐次アプローチが最適な方法ではない理由について説明します。
講義 10 では、教授はシェーディングからの形状の問題を解決するためのさまざまな方法について説明します。これには、表面上の静止点を使用し、その周りに小さなキャップ形状を構築して局所的な形状を推定する方法が含まれます。講師はまた、解の開始条件を提供できる閉塞境界の概念を紹介し、高度な数値解析手法を使用して三体問題の解を計算する最近の進歩について説明します。さらに、この講義では、次の講義で説明する産業用マシン ビジョン手法と関連するパターンのトピックに触れます。