Imagine being able to have a language conversation about anything with a computer. This is now possible and available to many people for the first time with ...
ビデオのこのセクションでは、Greg Brockman が教育の改善における AI の役割について説明しています。彼は、伝統的な教育方法はしばしば非効率的で効果的ではなく、生徒は知識を保持するのに苦労し、教師はすべての生徒を引き付ける方法で教えるのに苦労していると主張しています. Brockman 氏は、AI が各生徒にパーソナライズされた学習体験を提供することで、これらの問題を解決できる可能性があると示唆しています。 AI ツールを使用すると、生徒の進捗状況をリアルタイムで監視し、カリキュラムを生徒のニーズや好みに合わせて調整できます。これにより、より魅力的で効率的な学習体験につながり、生徒はより多くの知識を保持し、教師はより重要な課題に集中できるようになります。ブロックマンはまた、プライバシーを念頭に置いて AI ツールを設計することの重要性を強調し、生徒のデータが保護され、教育目的でのみ使用されるようにします。
00:00:00 このセクションでは、OpenAI の CEO である Greg Brockman が、AI 用のツールを構築する、Dolly と呼ばれる AI ツールの機能を実演しました。このツールとChatGPTを併用することで、ユーザーは統一言語インターフェースで目的を達成するための画像やテキストを生成し、細かい部分を取り出して他のアプリケーションに組み込んで確認することができます。ユーザー インターフェイスに関するこの新しい考え方は、AI がユーザーに代わって実行できる機能を拡張し、テクノロジを新たな高みへと引き上げます。
00:10:00 ビデオのこのセクションでは、Greg Brockman が、複雑な問題を解決する際の人間と AI のコラボレーションの可能性について説明しています。彼は、別の AI に役立つデータを生成するために人間の入力を必要とするファクト チェック ツールの例を示し、マシンが信頼できる検査可能な方法で動作している間に、人間がどのように管理、監視、およびフィードバックを提供できるかを示しています。ブロックマン氏は、これがコンピューターとのやり取りの方法を再考するなど、これまで不可能だった問題の解決につながると考えています。彼は、強力な AI 言語モデルである ChatGPT を使用して 167,000 の AI 論文のスプレッドシートを分析し、探索的グラフを通じて洞察を提供する方法を示し、AI がデータ分析と意思決定を支援する可能性を示しています。
In a talk from the cutting edge of technology, OpenAI cofounder Greg Brockman explores the underlying design principles of ChatGPT and demos some mind-blowin...
6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep Learning in the Life Sciences / Computational Systems BiologyPlaylist: https://youtube...
00:40:00 このセクションでは、スピーカーは相関の概念と、それを使用して回帰予測変数を評価する方法について説明します。彼らは、相関は予測される値と実際の値の間の関係を測定し、ピアソン相関やスピアマン順位相関など、さまざまな種類の相関テストがあると説明しています。スピーカーはまた、相関テストの重要性と、それらを使用して予測変数の精度を評価する方法についても言及しています。彼らは、スチューデントの t 分布や二項検定などの統計検定を使用して、特定の相関値が得られる確率と、それが期待値から大きく逸脱しているかどうかを判断する方法を説明しています。
00:45:00 このセクションでは、スピーカーは、超幾何分布を使用して k 個の観測が偶然に正しく分類される確率を計算することにより、分類子がランダムに正しい選択を行う確率について説明します。彼はまた、複数の仮説をテストしている場合は、帰無の確率を調整する必要があり、厳密なボンフェローニ補正またはそれほど厳しくないベンジャミン ホフバーグ補正を使用してしきい値を調整できることも強調しています。講演者は、十分なデータがあればほぼどこでも相関関係を見つけることの危険性について警告し、相関関係の欠如は関係の欠如を意味するものではないことを強調します。このセクションは、スピーカーがニューラル ネットワークの議論に移る前にストレッチ ブレークで終了します。
6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep Learning in the Life Sciences / Computational Systems BiologyPlaylist: https://youtube...
6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep Learning in the Life Sciences / Computational Systems BiologyPlaylist: https://youtube...
Deep Learning in Life Sciences - Lecture 04 - RNNs, LSTMs, Transformers, GNNs (Spring 2021)6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis Kellis...
Deep Learning in Life Sciences - Lecture 05 - Interpretable Deep Learning (Spring 2021)6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep...
00:25:00 このセクションでは、スピーカーは、オートエンコーダーを使用して世界の表現を構築し、ジェネレーター関数を介して画像を生成する方法について説明します。オートエンコーダーの z ベクトルは、相対的な特徴と世界のさまざまな特徴の存在に関する意味のある情報を提供でき、追加の画像を生成するために使用できます。エンコーダーとデコーダーは、デコーダーを生成モデルとして使用し、エンコーダーを表現学習用の特徴空間ベクトルとして使用するなど、さまざまなタスクに個別に使用できます。次にスピーカーは、変分オートエンコーダー (VAE) の概念を紹介します。これは、モデルからサンプリングして追加のデータを生成できるようにする、オートエンコーダーの確率的スピンです。 VAE は、一連のスカラーの多次元表現と、各スカラーの関連する分散から学習します。潜在空間ベクトルの真の事前分布からサンプリングすることにより、画像のさまざまな属性に基づいて画像を生成できます。
00:30:00 このセクションでは、スピーカーは生成モデルと、オートエンコーダーでさまざまなベクトルを調整して世界をキャプチャするという目標について説明します。これらのベクトルは最終的に世界の意味のある表現になり、パラメーターを変更することでさまざまな画像のサンプリングを可能にします。生成モデルをトレーニングするための戦略は、モデル パラメーターを学習することによってトレーニング データの可能性を最大化することです。次に、スピーカーは、データの平均と分散を明示的にモデル化することにより、確率的にモデルを生成する変分オートエンコーダーを紹介します。エンコーダーに単一の z と z の分散の両方を提供させることにより、スピーカーは両方の正規分布からサンプリングし、ボートなどのオブジェクトのさまざまなバリエーションを認識することができます。
01:10:00 このセクションでは、講演者は GAN、Variational Autoencoders (VAE)、表現学習などの生成モデルについて説明します。これらのモデルの目的は、現実世界の基本的なパターンとスタイルを学習することによって、多様で現実的なサンプルを生成することです。講演者は、これらのモデルがアップスケーリング、ドメイン知識の転送、テクスチャ合成などのさまざまな画像操作タスクを実行する方法の例を紹介します。講演者は、高解像度画像の生成を可能にするプログレッシブ GAN や、多数のパラメーター空間を使用して直交パラメーターを学習する Nvidia の「This person does not exist」Web サイトなど、これらのモデルで行われた進歩についても強調します。さまざまな画像コンポーネントの分解。
Deep Learning in Life Sciences - Lecture 06 - Generative Models, GANs VAEs, Representation Learning6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manol...
00:05:00 このセクションでは、細胞の複雑さと、コンテキスト情報がなくても細胞が自分のアイデンティティを記憶する方法について説明します。細胞の制御回路も強調されています。これは、細胞がゲノムのすべての部分の状態を記憶できるようにする一連のプリミティブと構造に基づいています。構造的および機能的構築物の両方への DNA のパッケージングは、このプロセスに不可欠であり、細胞がその内部で非常に多くの DNA を圧縮できるようにします。このパッケージングは、ヌクレオソーム (DNA のストリング ビュー内の小さなビーズ) を介して行われ、4 つのヒストン タンパク質で構成され、それぞれが異なるヒストン修飾で翻訳後修飾できる長いアミノ酸 テールを備えています。これらの修飾は、CPG ジヌクレオチドなどの追加のエピゲノム マークを DNA に直接作用させ、細胞が自分のアイデンティティを記憶できるようにします。
00:10:00 このセクションでは、スピーカーはエピゲノムにおける 3 種類の修飾について説明します。DNA アクセシビリティ、ヒストン修飾、および DNA メチル化です。彼は、これらの修飾が遺伝子調節と転写因子の結合にどのように影響するかを説明しています。エピゲノミクスの言語を使用することで、DNA の圧縮をプロモーター領域の特定のシグネチャに合わせることで、体内のすべての細胞タイプをプログラムすることができます。プロモーター、転写領域、抑制領域、およびエンハンサー領域はすべて、識別および研究できるさまざまなマークのセットによってマークされています。特に、エンハンサーは非常に動的であり、H3K4 モノメチル化、H3K27 アセチル化、および DNA アクセシビリティによって特徴付けられます。
00:15:00 このセクションでは、エンハンサー、プロモーター、転写および抑制領域などに対応するクロマチンのさまざまな状態である「クロマチン状態」の概念について説明します。多変量隠れマルコフ モデルを使用して、これらのクロマチン状態を発見し、体のさまざまな細胞型のエンハンサー領域、プロモーター領域、転写領域を特定します。タンパク質が DNA を認識する方法も説明されており、転写因子は DNA 結合ドメインを使用してゲノム内の特定の DNA 配列を認識します。講演者は、DNA 配列の特異性の認識を可能にする DNA モチーフと位置重みマトリックス、および調節因子の結合部位を区別する情報理論的手段についても話します。
00:20:00 講演のこのセクションでは、講演者は遺伝子調節における調節モチーフの重要性と、これらのモチーフの破壊がどのように病気につながるかについて説明します。次に講演者は、遺伝子調節を調べるための 3 つの技術、クロマチン免疫沈降、DNA アクセシビリティ、および ATAC-seq について説明します。これらの技術は、エンハンサーの位置をマッピングし、モチーフを使用して深層学習モデルを構築することで DNA の言語を発見するために使用できます。
00:25:00 ビデオのこのセクションでは、スピーカーは機械学習モデルを使用して、配列が遺伝子制御特性をエンコードする方法を理解する方法について説明します。彼女は、規制 DNA をプロファイリングするさまざまな実験を紹介し、特定の反応を促進するために規制要素の複雑な構文を理解する必要性を強調しています。この問題は、各ゲノムが数千の塩基対の小さなチャンクに分割される機械学習タスクとしてモデル化され、これらの塩基対のそれぞれが実験からのシグナルに関連付けられます。
Deep Learning in Life Sciences - Lecture 07 - Regulatory Genomics (Spring 2021)6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep Learnin...
ビデオでは、制御ゲノミクスのためのディープラーニングの使用について説明し、DNA 配列がエンハンサー領域とプロモーター領域に存在するさまざまなモチーフとそれらの 3D ループを明らかにする方法に焦点を当てています。このビデオでは、染色体確認キャプチャ (3C) テクノロジーがどのように染色体組織をプローブできるか、また Hi-C テクノロジーが互いに相互作用するトポロジー関連ドメイン (TAD) とゲノムのコンパートメント パターンを特定できるかを説明しています。畳み込みフィルターが DNA シーケンスのすべての位置に適用され、さまざまな特徴やモチーフが検出されます。ディープ ラーニング フレームワークは、DNA シーケンスの共通のプロパティ、フィルター、モチーフを学習できるため、さまざまな予測タスクを実行できます。このビデオでは、マルチタスク学習がいかに有益であるかについても言及しており、深層学習ネットワークで追加のレイヤーを使用して、転写因子モチーフの複数のビルディング ブロック表現を認識して組み合わせると、複雑なモチーフをより効率的に認識できるようになる可能性があります。
このビデオの講演者は、転写因子結合と遺伝子発現予測に焦点を当てた調節ゲノミクスにディープラーニングを使用することについて説明しています。彼らは、畳み込み構造と拡張畳み込みを使用して DNA の大きな領域を取り込み、クロマチン データと遺伝子発現のマルチタスク フレームワークで予測を行う方法を探っています。また、講演者は、深層ニューラル ネットワークをトレーニングするための残差接続の使用についても説明し、モデルが IC データとモデルを使用して 3D 接触を予測する方法について説明します。全体として、深層学習は、ゲノミクス データを分析し、十分なデータと適切な変換を使用して DNA 配列に基づいて予測を行うための強力なツールとなります。
00:00:00 このセクションでは、エンハンサー領域とプロモーター領域を構成するさまざまなモチーフとそれらの 3D ループを区別することに焦点を当てて、遺伝子調節ゲノムの特徴を予測するための DNA 配列とディープラーニングの使用についてスピーカーが説明します。講演者は、各転写因子の結合の特異性を決定するための位置重み行列 (PWM) の使用について説明し、それを使用して遺伝子調節機能を予測します。クロマチン免疫沈降は、ゲノムの調節領域のプロファイリングに使用される技術としても言及されています。
00:05:00 このセクションでは、スピーカーは、三次元クロマチン構造を理解することで、さまざまな転写因子がどこに結合しているかを明らかにする方法を説明します。核は、細胞内のすべての DNA を含み、活性領域が核ラミナから押し出され、核の中心に近づくように空間的に編成されています。染色体確認キャプチャー (3C) は、DNA の鎖をランダムに切断し、それらを再び接着して、DNA の異なるセクションが互いに接触している可能性がある場所を確認することにより、染色体構成をプローブするために使用される手法です。この手法により、染色体が実際にどのように互いにループしているかを明らかにすることができます。
00:10:00 このセクションでは、異なる DNA フラグメントの切断とライゲーションを使用してキメラ分子を作成し、DNA の一部がゲノムのどこに結合してマッピングされるかを明らかにする方法についてスピーカーが説明します。これらのキメラ領域を配列決定して分析することにより、研究者はゲノムの 3 次元パッケージングと、異なる領域が互いにどのように相互作用するかについての洞察を得ることができます。講演者は、3C、4C、5C、および ChIA-PET などのさまざまな技術について説明します。これにより、ゲノム領域間の相互作用の分析や、抗体ベースの方法を使用して特定の制御因子によって結合された領域を選択的に研究できます。
00:20:00 このセクションでは、話者は核内の異なる染色体の縄張りと、ゲノムの a 対 b コンパートメント パターンについて説明します。中心に近いです。講演者は、トポロジー的に関連するドメインについても言及しています。これは、ドメイン内で強く相互作用するが、ドメイン全体では相互作用しない領域のグループです。これらのドメインのコーナー ピークの一般的なモデルは、ループの押し出しのプロセスによって作成されるというものです。これには、レギュレーター CTFC の結合部位とコヒーシンが DNA のループを押し出すことが含まれます。
00:30:00 このセクションでは、深層学習アーキテクチャの表現学習で畳み込みフィルターがどのように使用されるかについてスピーカーが説明します。 DNA シーケンスは、文字ごとに 4 つの異なる入力チャネルを持つワンホット エンコーディング表現に変換されます。さまざまな特徴やモチーフを検出するために、DNA 配列のすべての位置に畳み込みフィルターが適用されます。次に、これらのモチーフが学習され、転写因子がバイナリかどうかを判断するなど、特定のタスクを実行するために適用できます。講演者は、深層学習フレームワークがこれらすべての畳み込みフィルターを学習し、レイヤー数、予測タスク、入出力関係などを変化させることができることを強調しています。最終的に、アーキテクチャは DNA 配列の共通のプロパティ、フィルター、モチーフを抽出し、これらを使用して配列の表現を学習し、さまざまな予測タスクを実行できるようにします。
00:35:00 このセクションでは、講演者は生物学における核酸配列での機械学習の使用について紹介します。彼は、文字列カーネルなどの機械学習の以前の成功した使用の欠点と、k-mer の空間的配置またはそれらの間の関係を考慮できなかった方法について説明します。次に講演者は、深層学習手法がこれらの制限を克服し、機械学習のための DNA 配列のより良い表現を可能にする可能性があることを示唆しています。
Deep Learning in Life Sciences - Lecture 08 - TF binding (Spring 2021)MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021Prof. Manolis Kellis with Guest lectur...
AI (ChatGPT とその先) に注目する時が来ました
AI (ChatGPT とその先) に注目する時が来ました
このビデオでは、人工知能 (AI) の開発と、AI が私たちの働き方と生活をどのように変えているかについて説明しています。 AI の可能性に興奮している人もいれば、その潜在的な影響について心配している人もいます。スピーカーは、最近のポッドキャスト エピソードの簡単な要約も提供します。
ChatGPT の驚くべき可能性の裏話 |グレッグ・ブロックマン |テッド
ChatGPT の驚くべき可能性の裏話 |グレッグ・ブロックマン |テッド
ビデオのこのセクションでは、Greg Brockman が教育の改善における AI の役割について説明しています。彼は、伝統的な教育方法はしばしば非効率的で効果的ではなく、生徒は知識を保持するのに苦労し、教師はすべての生徒を引き付ける方法で教えるのに苦労していると主張しています. Brockman 氏は、AI が各生徒にパーソナライズされた学習体験を提供することで、これらの問題を解決できる可能性があると示唆しています。 AI ツールを使用すると、生徒の進捗状況をリアルタイムで監視し、カリキュラムを生徒のニーズや好みに合わせて調整できます。これにより、より魅力的で効率的な学習体験につながり、生徒はより多くの知識を保持し、教師はより重要な課題に集中できるようになります。ブロックマンはまた、プライバシーを念頭に置いて AI ツールを設計することの重要性を強調し、生徒のデータが保護され、教育目的でのみ使用されるようにします。
ライフサイエンスにおけるMITディープラーニング - 2021年春
ライフサイエンスにおけるMITディープラーニング - 2021年春
「生命科学の深層学習」コースは、機械学習をさまざまな生命科学のタスクに適用し、機械学習とゲノミクスの研究者と、MIT の博士課程の学生と学部生の教員によって教えられます。このコースでは、機械学習の基礎、遺伝子調節回路、疾患の変動、タンパク質の相互作用とフォールディング、Google Cloud プラットフォームで Python を介して TensorFlow を使用したイメージングについて説明します。このコースは、4 つの問題セット、クイズ、チーム プロジェクトで構成され、学生が独自のプロジェクトを設計するのを支援するメンタリング セッションが点在しています。インストラクターは、補完的なスキルと興味を持つチームを構築することの重要性を強調し、学期を通してさまざまなマイルストーンと成果物を提供します。このコースは、助成金やフェローシップの提案書の作成、査読、年次報告書、コミュニケーションとコラボレーションのスキルの開発など、実際の経験を提供することを目的としています。講演者は、従来の AI と、観察可能な刺激に基づいてシーンの内部表現を構築するディープ ラーニングとの違いについて説明し、トレーニング データ、計算能力、および新しいアルゴリズムの収束によるライフ サイエンスにおけるディープ ラーニングの重要性を強調します。 .
このビデオは、ライフ サイエンスにおけるディープ ラーニングの入門講義であり、複雑な世界の探求における機械学習とディープ ラーニングの重要性を説明しています。この講演では、ベイジアン推論の概念と、それが古典的および深層機械学習においてどのように重要な役割を果たすか、学習への生成的アプローチと識別的アプローチの違いに焦点を当てています。講義では、生物学的システム全体のネットワークを理解するためのサポート ベクター マシン、分類性能、および線形代数の能力についても取り上げます。講演者は、このコースでは、正則化、オーバーフィッティングの回避、トレーニング セットなど、深層学習のさまざまなトピックを取り上げると述べています。講義は、将来の講義のために人工ニューロンと深層ネットワークの解釈可能性に関連する質問に対処することで締めくくられます。
機械学習の基礎 - 講義 02 (2021 年春)
Machine Learning Foundations - Deep Learning in Life Sciences Lecture 02 (Spring 2021)
この講義では、機械学習の基礎について説明し、トレーニング セットやテスト セットなどの概念、識別型や生成型などのモデルの種類、損失関数の評価、正則化と過剰適合、ニューラル ネットワークを紹介します。講師は、ハイパーパラメータの重要性、生命科学における精度の評価、相関テスト、およびモデル テストの確率計算について説明します。最後に、ディープ ニューラル ネットワークの基礎とニューロンの構造について説明し、複雑な機能の学習における非線形性の役割を強調します。
講義の 2 番目のセクションでは、深層学習における活性化関数の概念について説明し、勾配の基礎である誤差を最小化するために重みの更新を調整する際に、偏導関数を使用して出力関数に一致するように重みを調整する学習プロセスについて説明します。に基づいた学習。バックプロパゲーションの概念は、重みを調整するためにニューラル ネットワークを介して導関数を伝播する方法として導入されています。深層学習モデルの複数のレイヤーで重みを最適化するためのさまざまな方法について説明します。これには、確率的勾配降下、モデル容量の概念、および VC 次元が含まれます。グラフに対するモデルの容量の有効性、バイアスと分散についても説明し、早期停止や重み減衰などのさまざまな正則化手法についても説明します。複雑さの適切なバランスを見つけることの重要性が強調され、生徒はクラスメートに積極的に自己紹介することが奨励されます。
CNN 畳み込みニューラル ネットワーク - 講義 03 (2021 年春)
CNN 畳み込みニューラル ネットワーク - 生命科学における深層学習 - 講義 03 (2021 年春)
このビデオ講義では、ライフ サイエンスの深層学習における畳み込みニューラル ネットワーク (CNN) のトピックを取り上げます。講演者は、視覚皮質の原理と、それらが CNN とどのように関係しているかについて説明します。これには、加算と重み付けの基本的な構成要素、ニューロンのバイアス活性化しきい値など、人間と動物の視覚系の構成要素が含まれます。彼らは、CNN が特殊なニューロンを低レベルの検出操作に使用し、隠れユニットのレイヤーを抽象的な概念の学習に使用すると説明しています。講義では、畳み込み層とプーリング層の役割、複数の特徴を抽出するための複数のフィルターの使用、転移学習の概念についても説明します。最後に、畳み込みのエッジ ケースに対処するための非線形性とパディングの使用についても説明します。全体として、講義では、さまざまなライフ サイエンス アプリケーションにおける CNN の能力と可能性が強調されています。
講義の後半では、畳み込みニューラル ネットワーク (CNN) に関連するさまざまな概念について説明します。講演では、スピーカーは、CNN で入力サイズを維持することの重要性、変換に対する不変性を達成する手段としてのデータ拡張、およびさまざまな CNN アーキテクチャとそのアプリケーションについて話します。この講義では、ディープ CNN での学習に関連する課題、ハイパーパラメーターとそれらが全体的なパフォーマンスに与える影響、およびハイパーパラメーター調整へのアプローチについても取り上げます。講演者は、CNN の背後にある基本原理を理解することの重要性を強調し、複数の設定に適用できる手法としての汎用性を強調します。
Recurrent Neural Networks RNNs、Graph Neural Networks GNNs、Long Short Term Memory LSTMs - 講義 04 (Spring 2021)
リカレント ニューラル ネットワーク RNN、グラフ ニューラル ネットワーク GNN、長期短期記憶 LSTM
このビデオでは、リカレント ニューラル ネットワーク (RNN) と、シーケンス学習に重要な時間的コンテキストをエンコードする能力から始まるさまざまなトピックを取り上げます。講演者は、隠れマルコフ モデルの概念とその限界を紹介し、長いシーケンスを処理するための強力なアプローチとして、長短期記憶 (LSTM) モジュールの議論につながります。このビデオでは、RNN を展開したり使用したりせずに一時的な関係を学習する Transformer モジュールについても説明しています。グラフ ニューラル ネットワークが紹介され、古典的なネットワーク問題の解決や計算生物学における潜在的なアプリケーションが紹介されています。講演は、縮退グラフ モデルや潜在グラフ推論への応用など、グラフ ニューラル ネットワークの最先端研究についての議論で締めくくられます。
ビデオのこの 2 番目の部分では、リカレント ニューラル ネットワーク (RNN)、グラフ ニューラル ネットワーク (GNN)、および長短期記憶 (LSTM) モジュールについて説明します。グラフベースのデータを処理する際に従来のフィードフォワード ニューラル ネットワークに制限があることを説明していますが、GNN は幅広い不変性を処理し、グラフ全体に情報を伝達できます。スピーカーは、グラフ畳み込みネットワーク (GCN) とその利点と課題についても説明します。さらに、このビデオでは、GNN をより強力かつ柔軟にする上での注意機能の重要性について説明しています。
解釈可能な深層学習 - 生命科学における深層学習 - 講義 05 (2021 年春)
解釈可能な深層学習 - 生命科学における深層学習 - 講義 05 (2021 年春)
このビデオでは、ディープ ラーニング モデルにおける解釈可能性の重要性について説明します。特に、意思決定が悲惨な結果をもたらす可能性があるライフ サイエンスの分野において重要です。講演者は、2 種類の解釈可能性について説明します。最初からモデルの設計に組み込むことと、既に構築されたモデルの事後解釈可能性手法を開発することです。彼らは、重みの視覚化、代理モデルの構築、活性化の最大化など、モデルを解釈するためのさまざまな手法を探求し、モデルの内部表現を理解することの重要性について議論します。講師は、例に基づく方法や帰属方法など、個々の決定を解釈するためのいくつかの方法についても説明します。さらに、講演者は、複雑な概念を解釈する際の課題とニューラル ネットワーク モデルの解釈の限界について説明し、ディープ ラーニング ニューラル ネットワークにおける勾配の不連続性に関連する仮説を探ります。
講演の第 2 部では、講演者は生命科学分野の深層学習モデルにおける不連続勾配と飽和関数の課題に取り組みました。彼らは、複数のサンプルにわたる入力の小さな摂動を平均してより滑らかな勾配を取得する方法、ランダム ノイズを使用して画像分類の顕著な特徴を強調する方法、デコンボリューション ニューラル ネットワークやガイド付き逆伝播法などの逆伝播法を使用して遺伝子調節モデルを解釈する方法を提案しました。講演者はまた、ピクセルフリッピング手順やスコアの削除と置換アプローチなど、帰属方法の定量的評価についても議論しました。最後に、深層学習モデルにおける解釈可能性の必要性と、それを達成するためのさまざまな手法を強調しました。
Generative Models、Adversarial Networks GANs、Variational Autoencoders VAEs、Representation Learning - 講義 06 (Spring 2021)
Generative Models、Adversarial Networks GANs、Variational Autoencoders VAEs、Representation Learning - 講義 06 (Spring 2021)
このビデオでは、機械学習における表現学習の概念について説明し、分類タスクにおける表現学習の重要性と、新しいアーキテクチャの開発における革新の可能性を強調しています。オートエンコーダーや変分オートエンコーダー (VAE) などの手法を使用して、ラベル付きデータを必要とせずに表現を学習する方法として、自己教師ありおよび口実タスクが導入されています。スピーカーは、潜在空間表現を操作することによって新しいデータを生成できる、VAE や生成的敵対ネットワーク (GAN) などの生成モデルについても説明します。各方法の長所と短所について説明し、その有効性だけでなく限界も強調しています。全体として、ビデオは機械学習における表現学習と生成モデルへのさまざまなアプローチの包括的な概要を提供します。
このビデオでは、Generative Adversarial Networks (GAN)、Variational Autoencoders (VAE)、および生成モデルにおける表現学習の概念について説明します。 GAN には、反対の目的を持つジェネレーターとディスクリミネーターが含まれており、偽のサンプルのトレーニング プロセスは遅くなりますが、解像度と目的関数の改善により、リアルな画像が得られる可能性があります。講演者は、GAN がどのように建築的にもっともらしい部屋を生成し、ある部屋を別の部屋に移すかを実演します。 VAE は密度関数を明示的にモデル化し、意味のある潜在空間パラメーターを通じて現実世界の画像の多様性を捉えます。講演者は、オープン アーキテクチャとモデルを使用した創造性と実験を奨励します。さまざまなドメインでの生成モデルと表現学習の適用は、無限の可能性を秘めた急速に成長している分野です。
Regulatory Genomics - Deep Learning in Life Sciences - 講義 07 (2021 年春)
Regulatory Genomics - Deep Learning in Life Sciences - 講義 07 (2021 年春)
講義では、遺伝子調節の生物学的基礎、調節ゲノミクスの古典的な方法、畳み込みニューラル ネットワークを使用したモチーフの発見、配列が遺伝子調節特性をエンコードする方法を理解するための機械学習モデルの使用など、調節ゲノミクスの分野について説明します。講演者は、遺伝子調節における調節モチーフの重要性と、これらのモチーフの破壊がどのように病気につながるかについて説明します。彼らは、畳み込みニューラル ネットワークを使用した新しいモデルを導入しました。このモデルは、シーケンスの読み取りをゲノムにマッピングし、2 本の鎖の各塩基対に含まれる 5 プライム エンドの数をカウントします。このモデルは、異なるタンパク質の複数の読み出しに使用でき、マルチタスク モデルを使用して個別または同時に適合させることができます。講演者はまた、構文が TF 協同性にどのように影響するかについての生物学的ストーリーを明らかにする解釈フレームワークを使用して、モデルがゲノムデータを含むあらゆる種類のアッセイを分析する方法を示します。モデルは、高解像度の CRISPR 実験によって検証される予測を行うことができます。
このビデオでは、ディープ ラーニングが信号ピークを強化およびノイズ除去することにより、カバレッジの低い ATAC-seq データの品質を向上させる方法について説明します。 AttackWorks は、カバレッジ データを取り込み、残差ニューラル ネットワーク アーキテクチャを使用して信号の精度を向上させ、アクセス可能なクロマチン サイトを特定するディープ ラーニング モデルです。講演者は、AttackWorks を使用して低品質のデータを処理し、単一細胞クロマチンのアクセシビリティ研究の解像度を向上させる方法を実演します。彼らはまた、血統プライミングに関与する特定の調節要素を特定するためにATAC-seqを使用した造血幹細胞に関する特定の実験についても説明しています。講演者は、学生にインターンシップやコラボレーションに手を差し伸べるように勧めます。
のように見える。この訓練されたモデルがあれば、それを非常に少数の細胞の小さな集団に適用して、配列決定する細胞がもっとある場合にデータがどのようになるかを予測できます。このアプローチにより、単一細胞クロマチンのアクセシビリティを研究できる解像度が大幅に向上し、モデルが実験、細胞タイプ、さらには種を超えて移植可能であることを示しています。
規制ゲノミクスのための深層学習 - レギュレーター結合、転写因子 TF - 講義 08 (2021 年春)
規制ゲノミクスのための深層学習 - レギュレーター結合、転写因子 TF - 講義 08 (2021 年春)
ビデオでは、制御ゲノミクスのためのディープラーニングの使用について説明し、DNA 配列がエンハンサー領域とプロモーター領域に存在するさまざまなモチーフとそれらの 3D ループを明らかにする方法に焦点を当てています。このビデオでは、染色体確認キャプチャ (3C) テクノロジーがどのように染色体組織をプローブできるか、また Hi-C テクノロジーが互いに相互作用するトポロジー関連ドメイン (TAD) とゲノムのコンパートメント パターンを特定できるかを説明しています。畳み込みフィルターが DNA シーケンスのすべての位置に適用され、さまざまな特徴やモチーフが検出されます。ディープ ラーニング フレームワークは、DNA シーケンスの共通のプロパティ、フィルター、モチーフを学習できるため、さまざまな予測タスクを実行できます。このビデオでは、マルチタスク学習がいかに有益であるかについても言及しており、深層学習ネットワークで追加のレイヤーを使用して、転写因子モチーフの複数のビルディング ブロック表現を認識して組み合わせると、複雑なモチーフをより効率的に認識できるようになる可能性があります。
このビデオの講演者は、転写因子結合と遺伝子発現予測に焦点を当てた調節ゲノミクスにディープラーニングを使用することについて説明しています。彼らは、畳み込み構造と拡張畳み込みを使用して DNA の大きな領域を取り込み、クロマチン データと遺伝子発現のマルチタスク フレームワークで予測を行う方法を探っています。また、講演者は、深層ニューラル ネットワークをトレーニングするための残差接続の使用についても説明し、モデルが IC データとモデルを使用して 3D 接触を予測する方法について説明します。全体として、深層学習は、ゲノミクス データを分析し、十分なデータと適切な変換を使用して DNA 配列に基づいて予測を行うための強力なツールとなります。