MIT 6.034 Artificial Intelligence, Fall 2010View the complete course: http://ocw.mit.edu/6-034F10Instructor: Patrick WinstonHow can we recognize the number o...
MIT 6.034 Artificial Intelligence, Fall 2010Instructor: Patrick WinstonView the complete course: https://ocw.mit.edu/6-034F10YouTube Playlist: https://www.yo...
このビデオでは、Patrick Winston がオブジェクト、サーフェス法線、および一般化された円柱のエッジ ベースの記述を形成するという David Marr のアイデアを含む、視覚オブジェクトを認識することの課題について説明します。講演者は、アライメント理論や相関アルゴリズムを使用して中間サイズの特徴の位置を計算するなど、視覚オブジェクト認識のさまざまな方法についても詳しく説明します。ウィンストンは、猫の飲酒の例を使用して、同一の寸法を持たない自然物を認識することの難しさと、視覚認識におけるコンテキストとストーリーテリングの重要性を強調しています。ビデオ全体を通して、彼はさまざまな概念を説明するためにデモンストレーションと例を提供します。全体として、講演者は視覚認識の難しさを強調し、学生がこの分野で研究を続けることを奨励しています。
00:00:00 このセクションでは、パトリック ウィンストンが、顔などの視覚オブジェクトを認識する際の課題について説明します。彼は、政治家の画像がどのように見えるかを変えることができるプログラムを紹介し、保存された画像をどのように補間するかを示します。ウィンストンはその後、視覚認識の最初のステップは、オブジェクトのエッジベースの記述を形成することであると提案したデビッド・マーのアイデアから始めて、オブジェクト認識の歴史を掘り下げます。次に、マーは、オブジェクトの向きを示すために表面法線でプライマル スケッチを装飾することを提案し、それを 2.5 D スケッチと呼んだ。これに続いて、2.5 D スケッチが一般化された円柱に変換され、視覚オブジェクトの認識に一歩近づきました。
00:20:00 このセクションでは、スピーカーは、z 軸を中心に回転する 3D オブジェクトの画像の x 座標の動きを計算する方法を実演します。まず、標準位置を定義し、その位置の x 座標と y 座標を特定します。次に、オブジェクトを回転させて 3 つの異なる位置 (a、b、c) を作成し、それぞれの回転角度を決定します。次に、スピーカーはベクトル回転を使用して、オブジェクトが z 軸を中心に回転するときに x 座標がどのように変化するかを計算します。このプロセスでは、余弦関数と正弦関数を使用し、ベクトルが回転するときにベクトルの x 座標と y 座標の射影を考慮する必要があります。
00:25:00 このセクションでは、話し手は正射投影による視覚オブジェクト認識を説明する方程式を単純化します。これは、透視図を使用せずに x 軸に沿った投影です。彼は、角度シータのコサインやサインなどの未知の要素は定数であり、x sub a と x sub b のアルファ乗数とベータ乗数として表すことができると主張しています。並進と回転を可能にするシナリオが与えられた場合、話者は、追加の定数タウを 2 つの方程式を引くことによって特定する必要があることに注意します。
00:35:00 このセクションでは、スピーカーは、視覚オブジェクト認識がどのように機能し、認識される特徴のサイズにどのように依存するかについて説明します。小さすぎたり大きすぎたりする画像は有益な情報を提供しませんが、2 つの目と鼻の組み合わせなど、中間サイズの特徴は役立つ場合があります。課題は、画像の海でこれらの中間の特徴を見つけることになります。スピーカーは、相関アルゴリズムを使用して、特徴が発生する画像内のオフセットを決定することを提案しています。パラメーター x を最大化することにより、顔と画像の積分を計算して特徴の位置を特定できます。
00:40:00 ビデオのこのセクションでは、プレゼンターは、ノイズのある画像を例として使用して、視覚オブジェクト認識で相関がどのように機能するかを説明します。相関には、オフセットのある面の範囲での乗算と積分が含まれます。オフセットが等しい場合、プログラムは画像をそれ自体で乗算し、面上で統合します。変換パラメーター x と y を最大化することで、ノイズが追加されているにもかかわらず、人物の顔など、画像の特定の特徴を抽出することができます。このデモンストレーションは、ノイズが追加されても、プログラムが適切な機能を選択できることを示しました。
MIT 6.034 Artificial Intelligence, Fall 2010View the complete course: http://ocw.mit.edu/6-034F10Instructor: Patrick WinstonWe consider how object recognitio...
MIT 6.034 Artificial Intelligence, Fall 2010View the complete course: http://ocw.mit.edu/6-034F10Instructor: Patrick WinstonThis lecture begins with a high-l...
MIT の Patrick Winston 教授が、データを使用して吸血鬼を識別する認識メカニズムを構築するという概念と、Occam's Razor を満たす小さくて費用対効果の高い識別ツリーを作成することの重要性について説明しています。考えられるすべてのツリーを計算することは NP 問題であるため、彼はツリーを構築するために発見的メカニズムを使用することを提案しています。ウィンストンは、シャドーテスト、ガーリックテスト、顔色テスト、アクセントテストを使用して、どの個人が吸血鬼であるかを特定することを提案し、セットで障害を測定して、障害の測定に基づいてテストの全体的な品質を見つける方法を説明しています.このビデオでは、識別ツリーを数値データで使用する方法、およびツリーを一連のルールに変換して、ルールベースの動作に基づく単純なメカニズムを作成する方法についても説明します。
MIT 6.034 Artificial Intelligence, Fall 2010View the complete course: http://ocw.mit.edu/6-034F10Instructor: Patrick WinstonIn this lecture, we build an iden...
*NOTE: These videos were recorded in Fall 2015 to update the Neural Nets portion of the class.MIT 6.034 Artificial Intelligence, Fall 2010View the complete c...
*NOTE: These videos were recorded in Fall 2015 to update the Neural Nets portion of the class.MIT 6.034 Artificial Intelligence, Fall 2010View the complete c...
00:10:00 このセクションでは、遺伝子型がどのように表現型を決定するか、および各個人に伴う適応度の変化について学びます。フィットネスがスコアリングされると、コンピューター サイエンティストは数値を使用して次世代への生存確率を計算できます。確率の合計が 1 になるようにするには、適応度から生成される確率測度が必要です。 x と y の関数を使用して空間内の最適値を検索する遺伝的アルゴリズムを構築する場合、適合度は、ある定数 x の正弦 (量の 2 乗) に定数 y の正弦 (量の 2 乗) を掛けたものによって決定されます。プラス x プラス y を定数で割ったもの。
MIT 6.034 Artificial Intelligence, Fall 2010View the complete course: http://ocw.mit.edu/6-034F10Instructor: Patrick WinstonThis lecture explores genetic alg...
MIT 6.034 Artificial Intelligence, Fall 2010View the complete course: http://ocw.mit.edu/6-034F10Instructor: Patrick WinstonWhy do "cats" and "dogs" end with...
00:45:00 このセクションでは、スピーカーはジュリア・チャイルドの隣に座って、彼女に有名になったことについて尋ねた話をします。子供は慣れると答えたので、話者は無視されるという反対の経験について考えさせられました。彼は、アイデアをパッケージ化することの重要性と、それが AI だけでなく、優れた科学を行うこと、自分自身をより賢くすること、より有名にすることの重要性を強調しています。
MIT 6.034 Artificial Intelligence, Fall 2010View the complete course: http://ocw.mit.edu/6-034F10Instructor: Patrick WinstonTo determine whether three blocks...
講義 7. 制約: 線画の解釈
7. 制約: 線画の解釈
このビデオでは、単純なオブジェクトを見ることができるコンピューターを作成する試みから始まった、線画を解釈するための制約充足問題の開発について説明しています。実験家のグズマンの研究が分析され、デビッド・ハフマンが、グズマンのプログラムよりも優れた理論を開発できる制約付きの単純な数学的世界で作業するというアプローチにつながった。このビデオでは、図面のラインとジャンクションをカタログ化および分類するために使用される語彙、5 つの八分円を要素で埋める可能性、およびオブジェクトの構築可能性をテストするための制約の使用について説明します。このビデオでは、ラベルを使用して線画を解釈する際の課題、Waltz のアルゴリズム、および描画分析でフォークの頂点を処理するプロセスについても説明しています。このプロジェクトで開発された制約には、マップの色分けやスケジューリングなど、制約の多い問題を解決するためのアプリケーションがあります。
青の視点の対称的な反対。話者はさらに、フォーク スタイルと L スタイルのジャンクションを作成できる頂点と、残りの線を境界として T 字型を作成できるオブジェクトを覆い隠します。最後に、話者は、オブジェクトが一点に集まると、6 つの面を持つ頂点も作成できると述べています。
講義 8. 制約: 検索、ドメイン削減
8. 制約: 検索、ドメイン削減
このビデオでは、問題解決における制約の概念、特に検索とドメイン削減のコンテキストについて説明します。スピーカーは、地図上の州に色を割り当てる例を使用して、検索を開始する前に制約を使用して可能性を絞り込む方法を説明します。また、スピーカーは、割り当てのみをチェックする、またはすべてを考慮するなど、制約を処理するためのさまざまなアプローチを探り、制約に基づく問題解決の別のアプリケーションとしてリソース計画の概念を紹介します。全体として、このビデオは、複雑な問題を効率的に解決するために制約を使用する方法の包括的な概要を提供します。
講義 9. 制約: 視覚オブジェクト認識
9. 制約: 視覚オブジェクト認識
このビデオでは、Patrick Winston がオブジェクト、サーフェス法線、および一般化された円柱のエッジ ベースの記述を形成するという David Marr のアイデアを含む、視覚オブジェクトを認識することの課題について説明します。講演者は、アライメント理論や相関アルゴリズムを使用して中間サイズの特徴の位置を計算するなど、視覚オブジェクト認識のさまざまな方法についても詳しく説明します。ウィンストンは、猫の飲酒の例を使用して、同一の寸法を持たない自然物を認識することの難しさと、視覚認識におけるコンテキストとストーリーテリングの重要性を強調しています。ビデオ全体を通して、彼はさまざまな概念を説明するためにデモンストレーションと例を提供します。全体として、講演者は視覚認識の難しさを強調し、学生がこの分野で研究を続けることを奨励しています。
講義 10. 学習の概要、最近隣
10. 学習入門、最近傍
この YouTube ビデオでは、ウィンストン教授が学習のトピックを紹介し、規則性に基づく学習とフィードバックに基づく学習の 2 種類の学習について説明しています。彼は、最近傍学習、ニューラル ネットワーク、ブースティングなどの規則性に基づく学習手法に焦点を当てています。最近傍学習では、値のベクトルを生成する特徴検出器が使用されます。次に、値のベクトルを可能性のあるライブラリからのベクトルと比較して、最も近い一致を見つけ、オブジェクトが何であるかを判断します。講演者は、この方法をどのように適用できるかについて、さまざまな例を挙げています。彼はさらに、決定境界を使用してオブジェクトのカテゴリを識別する方法についても説明しています。異なる症例間の相似性の原理を紹介し、学習に大きな影響を与える睡眠管理の重要性を強調しています。最後に、彼は不均一性の問題、「何が重要か」の問題、および統計手法を使用してデータを正規化することの重要性について触れています。
講義 11. 学習: 識別ツリー、障害
11. 学習: 識別ツリー、障害
MIT の Patrick Winston 教授が、データを使用して吸血鬼を識別する認識メカニズムを構築するという概念と、Occam's Razor を満たす小さくて費用対効果の高い識別ツリーを作成することの重要性について説明しています。考えられるすべてのツリーを計算することは NP 問題であるため、彼はツリーを構築するために発見的メカニズムを使用することを提案しています。ウィンストンは、シャドーテスト、ガーリックテスト、顔色テスト、アクセントテストを使用して、どの個人が吸血鬼であるかを特定することを提案し、セットで障害を測定して、障害の測定に基づいてテストの全体的な品質を見つける方法を説明しています.このビデオでは、識別ツリーを数値データで使用する方法、およびツリーを一連のルールに変換して、ルールベースの動作に基づく単純なメカニズムを作成する方法についても説明します。
講義 12a: ニューラルネット
12a: ニューラルネット
このビデオでは、ニューラル ネットワークに関連するさまざまなトピックについて説明します。スピーカーは、ニューラル ネットワークの歴史について議論することから始め、この分野を変革した Geoff Hinton によって行われた極めて重要な仕事に焦点を当てます。次に、ニューロンの構造と、入力が収集および処理される方法について説明します。ビデオでは、ニューラル ネットワークが関数近似器としてどのように機能するか、およびヒル クライミングと勾配降下法を使用してパフォーマンスを向上させる方法について詳しく説明します。部分導関数の計算を容易にするために連鎖則が導入され、講演者は、このアプローチを使用して世界で最も単純なニューラル ネットワークをトレーニングする方法を実演します。ニューラル ネットワークの最適な速度定数についても説明し、スピーカーは 2 つの入力と出力を持つより複雑なニューラル ネットワークを紹介します。最後に、再利用の原則を導入して、大規模なネットワークを介したパスの指数関数的なブローアップの可能性の問題に対処します。全体として、このビデオは、ニューラル ネットワークの優れたアイデアは、その分野に大きな影響を与える可能性があるにもかかわらず、多くの場合単純で見落とされやすいことを強調しています。
講義 12b: ディープ ニューラル ネット
12b: ディープ ニューラル ネット
このビデオでは、関連する計算プロセス、畳み込みニューラル ネット、自動コーディング アルゴリズム、出力層のパラメーターの調整、ソフトマックス、畳み込みネットを使用した逆伝播など、ディープ ニューラル ネットに関連するいくつかのトピックについて説明します。このビデオでは、画像処理でディープ ニューラル ネットワークがどのように機能するかを実演しながら、局所的最大値、拡張ネットワーク、ニューラル ネットワーク学習などの概念についても説明します。全体として、このビデオでは、ディープ ニューラル ネットワークに関連する主な概念の包括的な概要を、その長所と制限を含めて提供します。
講義 13. 学習: 遺伝的アルゴリズム
13. 学習: 遺伝的アルゴリズム
このビデオでは、進化を模倣して複雑な問題を解決できる遺伝的アルゴリズムの概念について説明します。染色体を介した遺伝的継承のプロセスは、突然変異と交叉の選択肢を持つバイナリ染色体を使用して分解およびシミュレートされます。候補の生存確率と順位付けを例を挙げて説明し、正しく実行した場合の有効性を示します。極大値を克服するという課題とシミュレーテッド アニーリング技術の導入について説明します。ルールベースのエキスパート システムの構築に関するプロジェクトや、ブロック状のオブジェクトで構成される生物の進化など、遺伝的アルゴリズムの実用的なアプリケーションが紹介されています。講師は、遺伝的アルゴリズムの起源と成功を振り返り、多様性が成功の重要な要素であることに注目します。
講義 14. 学習: まばらなスペース、音韻論
14.学習:スパーススペース、音韻論
ビデオのこのセクションでは、ウィンストン教授が、人間の学習方法に関する研究に関連するメカニズムとして、疎空間と音韻論の概念を紹介しています。彼は、言語学習に関して、私たちが見るものと聞くものとの相互作用について議論し、例を使用して、視覚的な手がかりが言語で知覚するものにどのように影響するかを説明します.講演者は、レジスタ、一連の単語、制約、音素のバッファなど、音声を認識して生成するように設計されたマシンの要素と接続について説明します。彼はまた、「猫」と「犬」という言葉に関連する独特の特徴を見る教室の例を使用して、肯定的な例と否定的な例を使用して音韻論のパターンを一般化する手法についても説明しています。最後に、メカニズムの機能に一致する制約を作成し、問題をよりよく理解して解決するために視覚的な表現を組み込むことの重要性について説明します。
講義 15. 学習: ニアミス、フェリシティ条件
15.学習:ニアミス、フェリシティ条件
このビデオでは、Patrick Winston 教授が、ニアミスとフェリシティ状態から学習するという概念について説明しています。彼は、アーチの構築や、アーチと見なされるために必要な特定の制約の特定など、さまざまな例を使用しています。彼はまた、コンピューター プログラムがヒューリスティック学習を使用して列車の主要な特徴を特定する方法についても説明しています。スピーカーは、自己説明とストーリーテリングの重要性を強調しています。特に、プレゼンテーションに両方を組み込むことで、アイデアが際立って有名になる方法を強調しています。究極的には、アイデアをパッケージ化することは AI だけでなく、優れた科学を行い、自分自身をより賢くし、より有名になることでもあると彼は信じています。