00:00:00 このセクションでは、Juan Casado が画像ベースの表現型解析の概念について説明します。これは、顕微鏡やその他の画像技術を使用して生物学的システムを理解する方法です。彼は、細胞のような生物学的構造の画像を、細胞サイズや DNA 含有量などのさまざまな表現型について定量化し、治療や創薬に関する決定を導くために使用する方法について説明しています。 Casado は、顕微鏡画像を使用した細胞サイズの正確な測定を通じて発見され、最終的に FDA による承認につながった白血病の治療薬候補の成功例を挙げています。彼は、生物学および医薬品開発の分野における画像ベースのプロファイリングの潜在的な影響を強調しています。
MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep Learning in the Life Sciences / Computational Systems BiologyGuest lecture: Juan C...
MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep Learning in the Life Sciences / Computational Systems BiologyGuest lecturers: Adri...
MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep Learning in the Life Sciences / Computational Systems BiologyGuest lecture: Rahul ...
00:30:00 このセクションでは、神経科学と深層学習のコラボレーションにより、人工ニューラル ネットワークの未知のパラメーターの最適化がどのように可能になり、霊長類の脳の神経応答パターンを厳密に模倣するモデルが得られたかについて、スピーカーが説明します。講演者は、エンジニアが深い畳み込みニューラル ネットワークでフィルターのマイクロ パラメーターを最適化できるようにするループを実装することでブレークスルーがもたらされたことに注目しています。これにより、生成されたモデルは、視覚系で何が起こっているのかについての新しい仮説と見なされ、脳内の生物学的ニューラル ネットワークとの比較が可能になりました。スピーカーは、これらの比較がどのように行われたかの例を示し、脳機能に関する初期の機械的仮説をもたらしました.全体として、この共同作業により、生物学的な腹側ストリームに見られるものを厳密に模倣する in silico 腹側ストリーム ニューロンの開発が可能になり、脳が視覚情報をどのように処理するかについての洞察が深まりました。
00:35:00 このセクションでは、スピーカーは、彼らが開発した深層学習モデルは、特に視覚オブジェクト認識の領域で、脳が感覚系プロセスをどのように実行するかについての仮説であると説明しています。彼らは、これらのモデルは完全ではなく、いくつかの不一致があることを指摘しており、将来的に最適化して改善することを目指しています.講演者はまた、エンジニアリングと AI におけるディープ ラーニングのより広範なアプリケーションについても説明し、これらのモデルをツールとして使用して、科学的な理解と最適化をさらに進めることができることを強調します。彼らは、脳のプロセスをより正確に表現するには、より多くのデータとモデルが必要であると述べて結論付けています。
MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep Learning in the Life Sciences / Computational Systems BiologyPlaylist: https://you...
この講義では、計算美学、デザイン、アートに関連するさまざまなトピックを扱います。アート制作へのアクセスの民主化、デザインの自動化、アートの限界の押し上げにおける AI の役割、および美学を定量化し、高レベルおよび低レベルの表現を使用してデザインの視覚的バランスを達成する際の課題について説明します。講師はまた、色のセマンティクスや雑誌の表紙デザインを例に挙げて、パターンを明らかにし、効果的にメッセージを伝えるコンピュテーショナル デザインの可能性を強調します。クラウドソーシング実験は、さまざまなトピックとの色の関連付けを決定するために使用され、さまざまな分野でのこの方法の潜在的なアプリケーションが調査されています.全体として、この講義では、創造的なアプリケーションにおける AI の役割と、アート、デザイン、およびその他の形式の創造的な表現を作成する方法に革命を起こす可能性について紹介します。
このビデオでは、StyleGAN や DALL-E などの生成モデルを使用して創造的な作品を生成するための計算美学、デザイン、アートの使用について説明しています。講師はまた、生成による学習の重要性を強調し、視聴者が問題を分析し、データを使用して革新的で創造的な解決策を考え出すように促します。ただし、スピーカーは、偏ったデータや一般化して枠にとらわれずに考える能力など、生成モデルの制限にも対処します。それにもかかわらず、講師は学生に提供されたコードを確認し、審美的に満足のいく画像を生成するためのさまざまな手法を試すように割り当て、計算美学とデザインに関するバークレーと MIT の間のソクラティックな議論への参加を奨励します。
00:30:00 このセクションでは、講師が計算美学とデザインのトピックについて説明します。彼らは、美学、セマンティクス、および写真スタイルの注釈を含む AVA データセットの可用性について言及しています。次に講師は、深層学習アルゴリズムが美的評価を学習および予測する方法を示し、これを使用して画像を強調および微調整できることを提案します。次に、コンピュテーショナル デザインの可能性と、デザインのパターンを明らかにし、自分自身をよりよく表現する上でのその重要性について説明します。
00:55:00 講義のこのセクションでは、スピーカーは、カラー パレットの推奨、画像検索、再配色、さらには Web デザインなどのタスクにおけるカラー セマンティクスのさまざまなアプリケーションについて説明します。彼女は、アルゴリズムを使用して、特定のコンセプトやテーマに基づいて色や雑誌の表紙を推奨したり、時間の経過に伴う Web デザインのパターンを分析して視覚化したりする方法を示しています。畳み込みニューラル ネットワークの使用は、特定の時代のカラー パレットや Web サイト デザインのトレンドを特定する際にも実証されています。
01:15:00このセクションでは、スピーカーは生成による学習の方向への興奮について話し合い、いくつかの結果を共有します。彼らは、生成による学習は、人間が問題を解決する方法を学習する方法に基づいて AI を訓練し、アルゴリズムを開発する方法であるため、興味深いと説明しています。スピーカーは、美学の定量化についての質問にも答え、人間の言語の高レベルの用語と計算用語の間のギャップを埋める 1 つの方法は、データとモデルを使用し、文化的概念を取り入れ、クラウドソーシングを通じて人々の意見を求めることであると述べています。
01:25:00ビデオのこのセクションでは、スピーカーは一般化の概念と、創造性と AI における既成概念にとらわれない考え方について説明します。講演者は、生成モデルが一般化と分布外思考が可能かどうかという問題を提示します。このトピックを探求するために、講演者は敵対的生成ネットワーク (GAN) の操縦可能性の概念を紹介し、ジェネレーターの潜在空間でウォークを見つけることによって画像を操作する能力を示します。それらは、現在の GAN モデルがズームインとズームアウト、シフトと回転などの変換を示すことができることを示しています。講演者は、イメージを操作するための潜在的なベクトルを見つけるプロセスを説明し、これを使用して、創造性と革新における生成モデルの可能性を示します。
01:35:00ビデオのこのセクションでは、講師が潜在空間を使用して、変換によって美的に魅力的な画像を生成する方法について説明します。画像の色、ズーム、回転、カメラのような変更などを変更するために、潜在空間を歩いたりハンドルを操作したりすることで、変換を行うことができます。講師は、画像の美学を検出するためのニューラル ネットワークの使用についても説明し、歩行方向または変換がより美的に魅力的な画像を生成するかどうかに関するフィードバックを提供します。この講義では、計算の美学とデザインに関するバークレーと MIT の間で開催されるソクラティックな討論に学生が参加することを奨励しています。さらに、講師は学生に、提供されたコードを確認し、審美的に満足できる画像を生成するためのさまざまな手法を試すように割り当てます。
First lecture of MIT 6.S192: Deep Learning for Art, Aesthetics, and Creativity, by Ali Jahanian.In this lecture, I start introducing the course and discuss C...
00:40:00 このビデオは、アリョーシャ エフロスとフィリップ イゾラによるアートの文脈に関する講義です。 Efros は、Malls Across America と呼ばれる Michael Galinsky のアートワークの写真がどのように彼に深い印象を与えたか、そして写真が表示されるコンテキストがその意味にどのように影響するかについて語っています。イゾラは、海を見つめる少女の写真が、それが撮影された時代に生きていた人々の記憶や感覚をどのように呼び戻すことができるかについて語っています。
First, Phillip Isola: "Generative Models as Data++" Then, Alyosha Efros: "Nostalgia to Art to Creativity to Evolution as Data + Direction" 39:14The debase go...
00:10:00 講義のこのセクションでは、Jun-Yan Zhu が GAN 圧縮の汎用フレームワークを使用して教師モデルを圧縮する方法を紹介します。目標は、教師モデルと同じ種類の出力を生成できるフィルターの少ない生徒モデルを見つけることです。この方法では、損失関数を作成して、学生のゼブラ出力の分布が教師の出力に非常に似ていること、学生の中間特徴表現が教師の出力に非常に似ていること、学生の出力が敵対的損失に応じてシマウマのように見えることを確認します。 .このプロセスには、最適なチャネル数の検索も含まれます。これにより、モデルのサイズとトレーニング時間を削減しながら、同じ結果を得ることができます。異なる構成間で重みを共有するプロセスにより、個別にトレーニングすることなく複数の構成をトレーニングできるため、トレーニング時間が短縮されます。
00:15:00 このセクションでは、Jun-Yan Zhu が、さまざまな構成で GAN モデルをトレーニングおよび評価するプロセスと、さまざまな損失関数を使用して教師モデルを模倣し、さまざまな構成で重みを共有する方法について説明します。モデルを圧縮してモバイル デバイスでリアルタイムのパフォーマンスを実現するというアイデアとともに、さまざまなサイズと計算コストのモデルの結果が提示されました。このアイデアの StyleGAN2 への適用も紹介され、元のモデルからの最終出力を適用する前に、低コストのモデルを画像編集に使用する方法が示されました。
00:20:00 このセクションでは、講演者が GAN を使用したインタラクティブな画像編集のデモを実演します。デモの目的は、ユーザーが笑顔の追加や髪の色の変更などのさまざまな属性で画像を編集し、変更に基づいてすぐにフィードバックを得られるようにすることです。システムは、大きなモデルと一貫した出力を生成する小さなモデルを採用して、プレビューが有益なままであることを保証します。編集が完了すると、元のモデルを実行して高品質の出力を生成できます。インタラクティブな編集は、既存の非深層学習コンテンツ作成ソフトウェアと比較して高速で高品質の結果を提供します。
00:30:00 このセクションでは、スピーカーは GAN モデルに十分な量のトレーニング データを用意することの重要性について説明します。彼らは、小さなデータセットでトレーニングする場合、ディスクリミネーターがすべての画像を簡単にオーバーフィットして正しく分類できることを示していますが、実際の画像への一般化には問題があります。これにより、ジェネレーターは多くのガベージ イメージを生成したり、崩壊したりします。講演者は、GAN を独自の目的で使用したり、小さなデータ セットで使用したりすると、オーバーフィッティングがはるかに深刻になり、効率的な GAN を作成するには十分なデータを取得することが重要であることを強調します。
00:35:00 このセクションでは、教授は、新しいサンプルを収集せずにデータセットを増やすために単一の画像の複数のバージョンを作成することを含む、機械学習のオーバーフィッティングに対抗するためのデータ拡張のアイデアについて説明します。ただし、この方法を GAN トレーニングに適用することは、生成された画像にも実際の画像に適用された同じ変換または拡張の効果があり、複製されたアーティファクトにつながる可能性があるため、より複雑です。この問題を回避するために、教授は、本物の画像と偽の画像の両方を拡張し、ジェネレーターとディスクリミネーターの間の拡張されたデータの違いをバランスさせるためにディスクリミネーターのトレーニングのためにのみ行うことを提案しています.
Jun-Yan Zhu Assistant Professor, School of Computer Science, Carnegie Mellon Universityhttps://www.cs.cmu.edu/~junyanz/More about the course: http://deepcrea...
David Bau が、機械学習の進化と、自己プログラミング システムを作成する可能性について説明します。彼は敵対的生成ネットワーク (GAN) を紹介し、現実的な画像を生成するためにそれらを訓練する方法を説明しています。プログレッシブ GAN 内の特定のニューロンと、生成された画像内の特定の意味的特徴との間の相関関係を特定するプロセスについて Bau が説明します。彼は、GAN の助けを借りて、ドア、草、木などのさまざまな要素を画像に追加する方法を示しています。さらに、GAN に新しい要素を追加する際の課題と、世界の現実的なレンダリングを取り巻く倫理的な懸念についても説明します。
00:00:00 このセクションでは、David Bau が機械学習の進化について、そのルーツである統計分析からセルフ プログラミング システムを作成する可能性までについて説明します。学術研究者として、彼は今がこの分野の方向性と機械学習モデルの意味について質問する興味深い時期であると信じています.彼が講演で扱う主な問題は画像生成であり、実際の画像のデータセットを収集し、生成ネットワークをトレーニングしてそれらを再作成するプロセスを紹介します。
00:05:00 このセクションでは、David Bau が敵対的生成ネットワーク (GAN) を紹介し、リアルな画像を生成するように訓練する方法を説明します。彼は、GAN の秘訣は、まず画像が本物か偽物かを分類するように弁別器をトレーニングし、次にこの弁別器をジェネレータに接続して、弁別器を欺く画像を作成することであると説明しています。ただし、ジェネレーターは現実的な画像に似ていない単純なパターンで弁別器をだますことを学習できるため、GAN のトリックはプロセスを繰り返し、ジェネレーターと弁別器の間を行ったり来たりすることであると彼は指摘します。リアルな画像。最後に、実際の画像と区別するのが難しいことが多い、GAN によって生成された画像の例を示しています。
00:15:00 このセクションでは、David Bau がプログレッシブ GAN の特定のニューロンと生成された画像の特定の意味的特徴との間の相関関係を特定するプロセスについて説明します。彼は、これは各ニューロンを個別にテストして、最も活性化されている場所を確認することで達成されたと説明しています。これは、特定の機能に関連していることを示しています.このプロセスを通じて、彼は樹木と相関するニューロンを特定し、窓やドア、椅子、さらにはドームなどの部品を構築することができました. Bau 氏は、これは監視されたトレーニングやラベルなしで達成されたことを指摘し、ネットワークがこれらの機能のさまざまな例を区別することをどのように学習したかを示し、それらを個別のコンポーネントで表しています。
00:20:00 このセクションでは、David Bau が、キッチンを生成するためのモデルですべての異なるニューロンをマッピングするという目標について説明します。これにより、さまざまなタイプの相関ニューロンのカタログが作成されました。 Bau は、モデルの中間層にはセマンティック オブジェクトと高度に相関するニューロンがあり、後の層にはより物理的な相関関係があることを発見しました。 Bau は、相関関係が非常に顕著であるため、画像生成でさまざまなオブジェクトのオンとオフを切り替えるなど、興味深いアプリケーションにつながることを発見しました。 Bau は、いくつかの木のニューロンをオフにすると、シーンから木が削除され、ジェネレーターが木の背後にあるものを埋める方法を示しました。逆に、ニューロンをオンにすると、ドアがシーンに表示され、ジェネレーターによってドアの適切なサイズ、向き、スタイルが入力されました。
00:25:00 ビデオのこのセクションでは、David Bau が GAN を使用して、ドア、草、木などのさまざまな要素を画像に追加する方法を示しています。特定のオブジェクトまたは要素と相関する特定のニューロンのみを活性化することにより、彼は画像のセマンティクスを操作できます。彼はまた、ランダムに生成された画像しか編集できないなど、GAN の制限についても説明しています。これは、モデルを逆方向に実行する方法を学習する必要がある反転問題で解決できます。
00:30:00 このセクションでは、David Bau が Generative Adversarial Network (GAN) を使用して画像を生成することの限界について説明します。ただし、ネットワークの重みを微調整して、ターゲット画像に正確にヒットする非常に近いネットワークを生成することができますが、ネットワークを比較的変更せずに編集を可能にします。 Bau は、ネットワークを介して写真を反転し、開始イメージを取得し、ネットワークを微調整してターゲット イメージを出力し、イメージを編集することにより、実際の写真を変更するためにこの手法を使用することを示しています。このプロセスでは、ドームやドアなど、イメージの建築様式に一致するオブジェクトを追加または削除できます。
00:35:00 ビデオのこのセクションでは、David Bau が GAN テクノロジを使用して、微調整されたネットワークを使用して特定の画像にオーバーフィットすることで画像を変更する方法を説明しています。コア スクリーン レイヤーをあまり変更しないようにネットワークの事前トレーニング済みの重みを変更することで、Bau は画像を編集し、ターゲット画像の大まかな近似値を作成することができました。ただし、ネットワークはこの知識を一般化しないため、ターゲット画像以外の画像に対して意味のある変更を生成することはできません。
00:40:00 このセクションでは、David Bau が敵対的生成ネットワーク (GAN) に新しい要素を追加するという課題について説明します。特定のオブジェクトの画像を生成するようにシステムをトレーニングすることはできますが、以前のデータセットやエンコードされたルールがない場合、新しい概念をシステムに教えることは困難です。したがって、バウは、モデルを再トレーニングせずに、塔の頂上に木を追加したり、建物の前にキャデラックを描いたりするなど、新しいルールに対応するために事前トレーニング済みのモデルの重みを変更する手法を開発しました。彼は StyleGAN2 でアプリケーションをデモンストレーションします。ユーザーはルールを指定し、好みに応じて出力を操作できます。
00:45:00 このセクションでは、David Bau が、生成した画像からいくつかの例を選択し、GAN を使用してその形状に関与する共有ニューロンを見つける方法について説明します。選択すると、彼はそれらの表現を再定義し、たとえば先のとがった塔の頂上を木に変えるなど、GAN のモデルへの適切な変更を計算することによって新しい画像を生成できます。 Bau は、このプロセスが彼の検索結果にある尖った塔のすべての画像の影響を受け、尖った塔の画像のまったく新しい表現につながることを示しています。さらに、バウ氏は、GAN の各レイヤーは、コンテキスト表現のメモリとして使用されるキーと値のペアを一致させるという単純な問題を解決するものと考えることができると説明しています。彼は、重み行列が最小二乗問題の解であり、1 つの層のキーと値のペアでルールを変更することも最小二乗問題であり、比較のために同じように書くことができると述べています。
00:50:00 このセクションでは、David Bau が、ルール全体を変更せずに、ネットワークが記憶した 1 つのことを変更する方法について説明します。これにより、まだ存在しないものを表すモデルを作成できます。これは、キーを見つけて新しい値を書き込み、ランク 1 の更新を特定の方向に使用してキーの値のみを変更することによって実現されます。これにより、ユーザーは GAN 内のルールを変更し、それらを使用して、トレーニング データだけではなく、想像力に基づいて何かを作成できます。この方法は、十分なデータがない場合にも使用でき、機械学習を使用して新しい世界を作成するための潜在的な道筋を提供します。
01:00:00 このセクションでは、David Bau が、ディープ ニューラル ネットワークを使用してリアルな画像を生成することの意味と潜在的な結果について説明します。フォレンジックによる偽造画像の検出作業は必要ですが、内部構造を理解し、これらのモデルが内部でどのように機能しているかを知ることは、より興味深いことだと彼は強調します。これらのニューラル ネットワークは、なぜ特定の決定を下すのかという質問にうまく答えられないため、ディープ ネットワークを理解する上で透明性が不可欠です。バウの目標は、ネットワーク内で適用されるルールを分解して意思決定を行い、その理由を尋ねる方法を開発することであり、ディープ ニューラル ネットワークの重要な倫理的側面として透明性を定義するのに役立ちます。さらに、バウのスキャン解剖に関する研究は、見栄えの悪いアーティファクトに寄与するニューロンを特定できることを示しています。これにより、これらのネットワークの出力の質が向上します。
01:05:00 このセクションでは、David Bau が、一部の GAN が生成した画像にアーティファクトや歪みを持ち、特定の学習方法で除去または削減できる場合があることについて説明します。現在の世代の GAN は、彼が実験したものよりも進んでいるかもしれませんが、この現象がまだ発生しているかどうかを調査する価値はあると彼は示唆しています。デビッドは、この分野では正しい質問をし、それを学ぶことが不可欠であると述べており、彼の仕事に興味のある人は誰でも彼に連絡することを勧めています.
https://people.csail.mit.edu/davidbau/home/More about the course: http://deepcreativity.csail.mit.edu/Information about accessibility can be found at https:/...
コンピューター サイエンスの教授であり、Art and Artificial Intelligence Lab の創設者である Ahmed Elgamal が、人間レベルのクリエイティブな製品を理解して生成するための AI の使用について説明します。 Elgamal は、美術史への科学的アプローチと、AI を進化させて人間と同じように芸術を理解することの重要性について説明します。彼はまた、機械学習を使用してアート スタイルを分類し、内部表現を分析し、アート スタイル間の違いを特定し、AI を介してアートの創造性を定量化することについても説明しています。 Elgamal はまた、美術史における主要なオブジェクトの概念を提案し、AI が芸術を生成する可能性を探り、創造的な追求における現在の AI アプローチの限界を認識しています。ただし、Elgamal は、AI ネットワークの境界を押し広げて抽象的で興味深いアートを作成するための進行中の実験についても説明しています。
Ahmed Elgammal は、アートワークをベースラインとして使用して、人間が GAN によって作成されたアートと人間のアートを区別できるかどうかを判断するチューニング テストの結果についても説明しています。人間は、GAN マシンによって作成されたアートは 75% の確率で人間によって作成されたと考えており、スタイルのあいまいさの概念と、コンピューター ビジョンと機械学習を美術史や芸術的関心と結び付ける上でのその重要性を強調しています。
00:00:00 このセクションでは、ラトガース大学のコンピューター サイエンス学部の教授であり、Art and Artificial Intelligence Lab の創設者である Ahmed Elgammal 教授が、芸術への情熱と、AI と芸術を組み合わせる重要性をどのように認識したかについて説明します。 .彼は、芸術は物体認識以上のものであり、文脈の層、感情の理解、人間と同様の認知能力と知的能力を必要とする歴史的および社会的文脈を含むと説明しています。彼は、人間レベルの創造的な製品を理解して生成することが、AI アルゴリズムがインテリジェントであることを示すための基本であると信じており、美学と主観性を客観性と科学と組み合わせる問題について議論しています。 Elgammal 教授は美術史への科学的アプローチを提唱し、AI を進化させて人間と同じように芸術を理解することの重要性を強調しています。
00:05:00 このセクションでは、Ahmed Elgemal が、創造的で主観的な要素であっても、芸術のあらゆる側面を機械の目を通して客観的に研究できるという考えについて説明します。彼の目標は、AI を通してアートを見ることの意味を理解し、それが AI と美術史の理解をどのように進歩させることができるかを理解することであると彼は説明します。 Elgemal は、時間の経過に伴うアート スタイルの変化の順序と進化をどのように特徴付け、どのような要因がこれらの変化に影響を与えるかなど、アートとスタイルのさまざまな要素と原則を定量化する作業について語っています。彼はまた、アートにおけるスタイルの概念を理解する上での現在の AI アプローチの限界についても説明しています。
00:10:00 このセクションでは、スピーカーは教師あり機械学習の問題について説明し、ビジュアル エンコーディングを使用してさまざまなレベルの機能をキャプチャして、さまざまなアート スタイルを分類します。この種の研究の進歩は、豚の年から深層学習まで比較されます。このマシンは、1年生の美術史の学生と同じレベルで美術スタイルを分類できます。講演者は、スタイルの特徴とスタイルの変化を促進するものを理解するために、機械によるアートの分類が重要であると主張します。これらのスタイルのマシンの内部表現を解釈するのは困難ですが、マシンがスタイルを識別する方法と、美術史家がスタイルについて考える方法との関係を研究すると、有用な情報が得られます。たとえば、スタイルに関する Heinrich Wolfflin の理論は、さまざまなスタイルの要素を区別する視覚的スキーマを示唆しています。
Abstract: In this talk, I will argue that teaching the machine how to look at art is not only essential for advancing artificial intelligence, but also has t...
00:55:00 このセクションでは、スピーカーは、機械学習の目的を定義することの難しさと、作成者がデータセットを作成し、何かを試してから、データを使用してモデルを操作するという実験プロセスがどの程度のものであるかについて説明しますある方向に向かって。プロセスの経験的な側面により、作成者は試行錯誤を通じて特定のコンテキストで機械学習について学ぶことができます。この側面は、人々が機械学習について学ぶための強力なツールになる可能性があります。 Carrie Cai 氏らによる最近の研究では、機械学習の専門知識がなくても、同様の実験的な探索的手順を使用することで、人々が信頼を築き、モデル化されているものを理解するのに役立つことが示されています。
Speaker title: Dr. Rebecca Fiebrink, Reader at the Creative Computing Institute, University of the Arts Londonhttps://www.doc.gold.ac.uk/~mas01rf/homepage/Mo...
細胞画像セグメンテーションのための深層学習 - 講義 20
細胞イメージングセグメンテーションのためのディープラーニング - 講義 20 - MIT ML in Life Sciences (Spring 2021)
このビデオでは、講演者は、タイムラプス イメージングで細胞の動きを決定することを含む、細胞追跡のための深層学習の使用について説明します。彼らは、従来の手動追跡方法は費用と時間がかかり、ディープラーニング方法はプロセスを大幅に高速化すると同時に、より高い精度を提供できると説明しています.講演者は、U-Net、StarDist、DeepCell など、細胞追跡のためのさまざまな深層学習アーキテクチャについて説明します。彼らはまた、細胞追跡における課題の 1 つは、近接または重複している細胞を区別することであり、複数オブジェクトの追跡やグラフベースのアプローチなどの方法がこの問題の解決に役立つ可能性があることにも注目しています。講演者は、細胞追跡のためのさまざまな深層学習手法のベンチマークを実施し、再現性と比較のためにオープン アクセス データセットを提供することの重要性を強調しています。彼らはまた、がん研究や創薬など、さまざまな分野での細胞追跡の潜在的なアプリケーションを強調しています。
深層学習による画像の登録と分析 - 講義 21
深層学習の画像登録と分析 - 講義 21 - 生命科学における MIT ML (2021 年春)
この講義では、エイドリアン・ダロックが医用画像の位置合わせとその背後にある最適化問題について詳しく説明します。彼はボクセル モーフと呼ばれる新しい方法を提案しています。これは、ラベル付けされていないデータ セットを使用して、画像登録用のニューラル ネットワークをトレーニングすることを含みます。講演者はまた、ニューラル ネットワークがこれまで見たことのない新しいデータとシーケンスに対するロバスト性の課題についても説明し、ロバストなモデルをトレーニングするために多様で極端な条件をシミュレートすることを提案します。スピーカーは、従来の登録モデルをボクセル モーフおよびシンセモーフ モデルと比較しますが、後者は非常に堅牢です。最後に、スピーカーは、テンプレートを直接学習するのではなく、目的のプロパティに基づいてテンプレートを生成する機能の開発と、結腸の異常を検出するためのカプセル ビデオ内視鏡の潜在的な使用について説明します。
この講義のスピーカーは、特にポリープ検出のための大腸内視鏡検査ビデオのコンテキストで、医療データの不足を克服するためのさまざまな機械学習アプローチについて説明します。彼らは、事前トレーニング済みの重みとランダムな初期化を利用してドメインシフトに対処し、パフォーマンスを向上させるディープラーニング画像登録および分析アーキテクチャを導入しています。この講義では、弱教師あり学習、自己教師あり学習、弱教師ありビデオ セグメンテーションについても説明します。スピーカーは、医療データ分析で機械学習アプローチを使用する際に直面する課題を認識し、これらのアプローチを実際の医療処置でテストして作業負荷を軽減することを奨励しています。
電子健康記録 - 講義 22
電子カルテ - 講義 22 - 生命科学における深層学習 (2021 年春)
ヘルスケアにおける機械学習の出現は、病院での電子医療記録の採用と、意味のあるヘルスケアの洞察に利用できる膨大な量の患者データによるものです。高次元の縦断的データ、欠落、および左右の検閲が原因で問題が生じる可能性がある、疾病登録に見られる縦断的データを利用して、病気の進行モデリングについて説明します。この講義では、ディープ マルコフ モデルなどの非線形モデルを使用して、これらの課題を処理し、長期的なバイオマーカーの非線形密度を効果的にモデル化する方法について説明します。さらに、スピーカーは、遷移関数用の新しいニューラル アーキテクチャを開発するためのドメイン知識の使用と、より一般化するためにドメイン知識をモデル設計に組み込むことの重要性について説明します。治療効果関数に関するモデルの複雑さに関する実験もあり、講演者は、さらなる調査結果を決定するために、より大きなコホートでこの質問を再検討する予定です.
ディープラーニングと神経科学 - 講義 23
深層学習と神経科学 - 講義 23 - 生命科学における深層学習 (2021 年春)
講義では、深層学習と神経科学、特に視覚科学の分野の相互作用について説明します。目標は、人間の視覚知性をリバース エンジニアリングすることです。これは、目に当たる光子に反応して人間が示す行動能力を指します。スピーカーは、シミュレートされたニューロンのネットワークなどのメカニズムの言語でこれらの機能を説明することを強調し、脳科学と人工知能の両方に利益をもたらす予測構築システムを可能にします。講義では、深層学習モデルが、脳が感覚系プロセスを実行する方法の仮説であり、脳の進化を模倣するだけでなく、潜在的なアプリケーションについて説明します。さらに、講義では、ニューラル ネットワークがどのように記憶を操作し、何かの意味を変えることができるかについての実用的な例を示します。
このビデオでは、脳の認知機能を理解し、この理解をエンジニアリング目的に活用する際のディープ ラーニングの可能性について説明します。講演者は、この分野におけるリカレント ニューラル ネットワークとその記憶および内部ダイナミクス機能との関連性を強調しています。この講義では、神経系が模倣を通じて学習する能力と、これを使用して作業記憶の表現、計算、および操作を学習する方法について説明します。このビデオでは、学習条件としてのフィードバック学習の証拠を見つけることの難しさと、システムを調整するためのエラー修正メカニズムの可能性についても取り上げています。講義は、コースでカバーされるトピックの多様性と、深層学習が将来の認知システムの解釈にどのように役立つかを考察することで締めくくられます。
MIT 6.S192 - 講義 1: 計算美学、デザイン、アート |生成による学習
MIT 6.S192 - 講義 1: 計算美学、デザイン、アート |生成による学習
この講義では、計算美学、デザイン、アートに関連するさまざまなトピックを扱います。アート制作へのアクセスの民主化、デザインの自動化、アートの限界の押し上げにおける AI の役割、および美学を定量化し、高レベルおよび低レベルの表現を使用してデザインの視覚的バランスを達成する際の課題について説明します。講師はまた、色のセマンティクスや雑誌の表紙デザインを例に挙げて、パターンを明らかにし、効果的にメッセージを伝えるコンピュテーショナル デザインの可能性を強調します。クラウドソーシング実験は、さまざまなトピックとの色の関連付けを決定するために使用され、さまざまな分野でのこの方法の潜在的なアプリケーションが調査されています.全体として、この講義では、創造的なアプリケーションにおける AI の役割と、アート、デザイン、およびその他の形式の創造的な表現を作成する方法に革命を起こす可能性について紹介します。
このビデオでは、StyleGAN や DALL-E などの生成モデルを使用して創造的な作品を生成するための計算美学、デザイン、アートの使用について説明しています。講師はまた、生成による学習の重要性を強調し、視聴者が問題を分析し、データを使用して革新的で創造的な解決策を考え出すように促します。ただし、スピーカーは、偏ったデータや一般化して枠にとらわれずに考える能力など、生成モデルの制限にも対処します。それにもかかわらず、講師は学生に提供されたコードを確認し、審美的に満足のいく画像を生成するためのさまざまな手法を試すように割り当て、計算美学とデザインに関するバークレーと MIT の間のソクラティックな議論への参加を奨励します。
MIT 6.S192 - 講義 2: ソクラテス論争、Alyosha Efros と Phillip Isola
MIT 6.S192 - 講義 2: ソクラテス論争、Alyosha Efros と Phillip Isola
このビデオでは、Alyosha Efros と Phillip Isola が、画像を使用して共有体験を作成するというアイデアについて話し合います。彼らは、これが記憶を呼び戻し、懐かしさを生み出すのに役立つと主張しています.
このビデオは、MIT の 2 人の教授による、人工知能におけるデータの役割に関する討論です。 Efros はデータが AI にとって不可欠であると主張し、Isola はデータが AI 開発の妨げになる可能性があると反論しています。
何かが記憶に残るとはどういう意味かという概念を視覚化すること。
MIT 6.S192 - 講義 3: Jun-Yan Zhu による「効率的な GAN」
MIT 6.S192 - 講義 3: Jun-Yan Zhu による「効率的な GAN」
講義では、大規模なトレーニング セッションを必要とする高度な計算、大量のデータ、複雑なアルゴリズムの必要性など、GAN モデルのトレーニングの課題について説明します。ただし、講師は、GAN 圧縮の汎用フレームワーク、微分可能な拡張、およびデータ拡張を使用して教師モデルを圧縮するなど、GAN の学習を高速化し、より少ないデータセットでトレーニングする新しい方法を紹介します。この講義では、GAN を使用したインタラクティブな画像編集についても説明し、GAN トレーニングを成功させるための大規模で多様なデータセットの重要性を強調します。モデルを実行するためのコードは GitHub で入手でき、さまざまな種類のデータでモデルを実行するための段階的な手順が示されています。講義は、実用的な目的のためのモデル圧縮の重要性を議論することで締めくくられます。
MIT 6.S192 - 講義 5:「GAN のニューロンを使ったペイント」David Bau 著
MIT 6.S192 - 講義 5:「GAN のニューロンを使ったペイント」David Bau 著
David Bau が、機械学習の進化と、自己プログラミング システムを作成する可能性について説明します。彼は敵対的生成ネットワーク (GAN) を紹介し、現実的な画像を生成するためにそれらを訓練する方法を説明しています。プログレッシブ GAN 内の特定のニューロンと、生成された画像内の特定の意味的特徴との間の相関関係を特定するプロセスについて Bau が説明します。彼は、GAN の助けを借りて、ドア、草、木などのさまざまな要素を画像に追加する方法を示しています。さらに、GAN に新しい要素を追加する際の課題と、世界の現実的なレンダリングを取り巻く倫理的な懸念についても説明します。
MIT 6.S192 - 講義 7:「機械の目で見た美術史の形」アーメド・エルジェマル
MIT 6.S192 - 講義 7:「機械の目で見た美術史の形」アーメド・エルジェマル
コンピューター サイエンスの教授であり、Art and Artificial Intelligence Lab の創設者である Ahmed Elgamal が、人間レベルのクリエイティブな製品を理解して生成するための AI の使用について説明します。 Elgamal は、美術史への科学的アプローチと、AI を進化させて人間と同じように芸術を理解することの重要性について説明します。彼はまた、機械学習を使用してアート スタイルを分類し、内部表現を分析し、アート スタイル間の違いを特定し、AI を介してアートの創造性を定量化することについても説明しています。 Elgamal はまた、美術史における主要なオブジェクトの概念を提案し、AI が芸術を生成する可能性を探り、創造的な追求における現在の AI アプローチの限界を認識しています。ただし、Elgamal は、AI ネットワークの境界を押し広げて抽象的で興味深いアートを作成するための進行中の実験についても説明しています。
Ahmed Elgammal は、アートワークをベースラインとして使用して、人間が GAN によって作成されたアートと人間のアートを区別できるかどうかを判断するチューニング テストの結果についても説明しています。人間は、GAN マシンによって作成されたアートは 75% の確率で人間によって作成されたと考えており、スタイルのあいまいさの概念と、コンピューター ビジョンと機械学習を美術史や芸術的関心と結び付ける上でのその重要性を強調しています。
MIT 6.S192 - 講義 8: 「機械学習が人間のクリエイターにどのように役立つか」レベッカ フィーブリンク著
MIT 6.S192 - 講義 8: 「機械学習が人間のクリエイターにどのように役立つか」レベッカ フィーブリンク著
音楽と AI の分野の研究者である Rebecca Fiebrink 氏は、創造的な目的で機械学習を使用および開発する際に、人間の相互作用と人間のループを維持することの重要性を強調しています。彼女は自分のツールである Wekinator について説明します。このツールは、人間の創造のためにリアルタイムの音楽で機械学習を使用できるようにします。彼女は、ドラム マシン、Blotar と呼ばれるサウンド合成アルゴリズム、blowtar と呼ばれる管楽器など、さまざまなジェスチャー制御の楽器を構築する方法を示しています。彼女は、クリエイターが複雑でニュアンスのあるサウンド パレットを探索し、センサーやリアルタイム データのデータ分析を容易にするために、機械学習がどのように役立つかを強調しています。彼女はまた、トレーニング データをインタラクティブに操作する利点についても説明し、創造的な作業プロセスに驚きと挑戦を加えるだけでなく、機械学習によってコンピューターとより自然な方法で通信できるようにする方法についても説明しています。