Makine Öğrenimi ve Sinir Ağları - sayfa 22

 

Gen İfade Tahmini - Ders 09 - Yaşam Bilimlerinde Derin Öğrenme (Bahar 2021)



Gen İfade Tahmini - Ders 09 - Yaşam Bilimlerinde Derin Öğrenme (Bahar 2021)

Video, gen ifadesi tahmininde derin öğrenmenin kullanımını ve yüksek boyutluluk ve gürültü dahil olmak üzere biyolojik veri setlerinin analizinde yer alan zorlukları tartışıyor. Ders, küme analizi, matrislerin düşük dereceli yaklaşımları ve sıkıştırıcı algılama gibi metodolojileri kapsar. Konuşmacı ayrıca, gen ifadesi tahmini ve kromatin için derin öğrenmenin kullanımından ve ayrıca güçlendirici aktivite alanlarını tahmin etmek için zayıf denetimli öğrenmeden bahsediyor. Ders, danq, djgx, fabrika matı ve sc fin dahil olmak üzere, öncelikle derin öğrenme metodolojisi kullanılarak geliştirilen çeşitli araçları tartışır. Sunucu ayrıca genomik veri setlerini incelemek için üretken modellerin kullanımından bahsediyor ve yaklaşık çıkarım metodolojisi fikrini, özellikle de varyasyonel çıkarım olarak adlandırılan popüler yöntemi tanıtıyor.

Dersin ikinci bölümünde, konuşmacı derin öğrenmenin yaşam bilimlerinde, özellikle gen ifadesi tahmini ve genomik yorumlamada uygulanmasını tartışıyor. İlk konu, varyasyon otokodlayıcı modellerinin astım veri kümeleri için RNA ekspresyon analizine uygulanmasına odaklanmaktadır. Konuşmacı, koşullu üretken bir model kullanarak deneysel yapıtları kaldırmak için bir çerçeve önerir. İkinci konu, Illumina'nın özellikle ekleme için genomik yorumlama için diziden işleve modelleri belirlemek için derin öğrenme ağlarına yaptığı yatırımı tartışıyor. Şirket, bir nükleotidin bir ekleme donörü mü, alıcı mı yoksa hiçbiri mi olduğunu tahmin eden derin bir evrişimli sinir ağı olan SpliceAI'yi geliştirdi. Üçüncü konu, konuşmacının belirli mutasyonların çerçeve kaymalarına ve hastalığa yol açabilen şifreli ekleme işlevine sahip olup olmayacağını tahmin etme araştırması hakkındadır. Konuşmacı ayrıca araştırma pozisyonları, stajlar ve doktora sonrası için sorular ve başvurular davet eder.

  • 00:00:00 Dersin bu bölümünde, konuşmacılar gen ekspresyonu analizini ve RNA ekspresyonunu ölçmek için kullanılan iki yöntemi tanıtırlar: hibridizasyon ve genom dizileme. İkincisi, son 20 yılda genom dizileme maliyetindeki şiddetli düşüş nedeniyle daha popüler hale geldi. Sonuç, yüzlerce koşulda hangi genin hangi düzeyde ifade edildiğini gösteren bir matristir. Bu matris dikey veya yatay olarak görülebilir ve genomdaki her gen için deneysel bir ilgi durumu boyunca veya sıralanmış belirli bir hücre tipi için 20.000 uzun vektör verir.

  • 00:05:00 Bu bölümde eğitmen, derin öğrenmenin gen ifadesi tahmininde nasıl kullanılabileceğini tartışır. Temel girdi matrisleri, farklı koşullar, dokular, hücre tipleri, deneyler, yaş ve cinsiyet genelinde belirli bir gen için ekspresyon vektörlerinin benzerliği gibi çoklu boyutlarda karşılaştırmalar yapmak için her hücrenin profilini çıkarmayı içerir. Küme analizi, sütunlar veya satırlar boyunca birbirine benzer koşulları veya birbirine benzer genleri bulmak için kullanılabilir. İlişkilendirme yaklaşımına göre suçluluk, ifade benzerliğine dayalı olarak açıklama yapılmamış genlerin açıklamasını tamamlamak için de kullanılabilir. Buna ek olarak, eğitmen, farklı ilgi sınıflarını ortaklaşa tahmin etmek için kendi kendini denetleyen öğrenme, doğrusal olmayanları ve üst düzey özellikleri kullanarak tahmin ve çok görevli öğrenme gibi derin öğrenme yaklaşımlarının kullanılmasını önerir ve son olarak, eğitmen derin öğrenmenin önemli olduğunu vurgular. tek yaklaşım değildir ve biyolojik sorular sormak ve bu sistemlerin temsillerini öğrenmek için kullanılabilecek bir dizi araç mevcuttur.

  • 00:10:00 Bu bölümde öğretim görevlisi, gen ekspresyon modellerini analiz etmek için kullanılabilecek boyut indirgeme tekniklerini tartışıyor. Böyle bir teknik, genetik baskı modellerindeki varyasyonun ana boyutlarını belirlemek için kullanılabilen temel bileşen analizidir (PCA). Matrislerin düşük sıralı yaklaşımları, verilerin optimal bir alt sıralı yaklaşımını etkili bir şekilde elde etmek için de kullanılabilir. t-SNE ve otomatik kodlayıcılar gibi diğer teknikler de uygulanabilir. Ek olarak öğretim görevlisi, gen ifadesinin doğrusal kombinasyonlarını yakalayan prob kombinasyonlarını kullanarak bileşik ölçümler oluşturmak için sıkıştırıcı algılamanın kullanılmasından bahseder. Son olarak, öğretim görevlisi, ilk konuk dersinde tartışılacak olan gen ekspresyon seviyelerini tahmin etmek için kromatin bilgisini kullanma potansiyelini tartışır.

  • 00:15:00 Bu bölümde, konuşmacı, daha önce transformatör modeli ve tekrarlayan sinir ağları için tartışılanlara benzer şekilde, dikkat mekanizmalarını kullanarak sistematik olarak birleştirerek çeşitli özelliklerden gen ekspresyonunu ve kromatini tahmin etmek için derin öğrenmenin kullanımını tartışıyor. Muhabir yapılarının kullanımı ve yüksek verimli testlerin yanı sıra belirli parçaların bir makine öğrenimi veya derin öğrenme yaklaşımı kullanarak ifadeyi yönlendirip yönlendirmeyeceğini tahmin etme yeteneği açıklanır. Konuşmacı ayrıca bir sinir ağı ve dizideki belirli özellikleri kullanarak doğrudan diziden eklemeyi tahmin etme kavramını tanıtıyor ve ekibinin haftalık denetimli bir çerçeve kullanarak insan genomundaki geliştiricileri tahmin etmek için derin öğrenmeyi kullanarak yaptığı çalışmayı vurguluyor.

  • 00:20:00 Videonun bu bölümünde, konuşmacı bir haberci deneyi ve bir dizi kromatin özelliği kullanarak bir gen ifadesi tahmini yöntemini tartışıyor. Genomdaki binlerce konumdaki farklı işaretlerden oluşan girdi matrisi, her gen için oluşturulur ve ifadeyi tahmin etmek için yakındaki kromatin özellikleri, yıldız arama sonucuna karşı test edilir. Çıktı seviyesi bir ikili sınıflandırıcıdır ve modelin ara temsilleri, genom dizisindeki belirli konumu tahmin etmek için kullanılır. Bu daha yüksek çözünürlük, daha gelişmiş bir temsile sahip olmak için bitişik sinyaldeki belirli eğrileri uydurarak elde edilen veri analizinin daha verimli bir şekilde kullanılmasına izin verir.

  • 00:25:00 Bu bölümde konuşmacı, nesne algılamaya benzer bir yöntem kullanarak artırıcı etkinlik alanlarını tahmin etmek için zayıf denetimli öğrenme fikrini açıklıyor. Orijinal görüntüyü evrişimli bir filtreye geçirerek, bir ısı haritası oluşturmak için kullanılan aktivasyon haritaları üretilir. Model, yalnızca geliştiricinin varlığının kaba bir açıklamasını gerektiriyordu ve aynı ısı haritası yöntemini kullanarak kesin konumu tahmin ediyordu. Çapraz hücre hattı ve çapraz kromozom doğrulama sonuçları, modelin yıldız arama arttırıcıları doğru bir şekilde tahmin edebildiğini göstermiştir. Tahminler yapılırken ilgisiz bölgelerin tıraşlanmasıyla elde edilen rafine set, daha yüksek oranda transkripsiyonel başlangıç bölgelerine sahiptir ve yüz farklı türde daha fazla korunur. Konuşmacı, modeli önceki son teknoloji modelle kıyasladı ve nöro progenitör hücrelerde bir vaka çalışması gerçekleştirerek nöroya özgü güçlendiricileri keşfetti.

  • 00:30:00 "Gene Expression Prediction" adlı YouTube videosunun bu bölümünde, konuşmacı biyolojik veri setlerini yorumlamadaki zorlukları ve yüksek boyutluluk ve gürültü gibi birden çok faktörü hesaba katan metodoloji geliştirmenin önemini tartışıyor. Konuşmacının laboratuvarındaki araştırması, genomik çalışma yöntemleri geliştirmek için tek hücreli genomik dahil olmak üzere farklı genomik teknik türlerini birleştirmeye odaklanıyor. Konuşmacı ayrıca derin öğrenmeyi gen ifadesi analizine uygulamaya ve bunu gürültülü veri kümelerinden sinyaller çıkarmak için kullanmaya olan ilgisini tartışıyor.

  • 00:35:00 Bu bölümde konuşmacı, altta yatan biyolojinin incelenmesine izin vermek için çok modlu veri kümelerini birleştiren bir metodolojinin geliştirilmesini tartışıyor. Sistemleri daha iyi anlamak için görsel sinyalleri doğal dil işleme ile birleştiren makine öğrenimi alanındaki son önerileri vurguluyorlar. Konuşmacı daha sonra, DNA dizilerinin işlevini ölçen danq ve gen ifadesini tahmin eden djgx dahil olmak üzere, laboratuvarlarının öncelikle derin öğrenme metodolojisini kullanarak geliştirdiği birkaç aracı listelemeye devam ediyor. Konuşmacı ayrıca transkripsiyon faktörü bağlanmasını tahmin eden diğer iki aracı, fabrika matı ve sc fin'i kısaca tartışır; sc fin, tek hücre tahmini için fabrika matının bir uzantısıdır.

  • 00:40:00 Videonun bu bölümünde sunucu, yaşam bilimlerinde derin öğrenme modellerinin kullanımına ilişkin çeşitli metodolojileri tartışıyor. Spesifik olarak, tartışma, RNA yapısı ikincil yapı tahminleri için UFO metodolojisini, ifadeleri tahmin etmek için derin sinir ağlarını kullanan DGX modelini ve değişmez temsil fikrine odaklanırken tek hücreli ataksik veri kümelerini incelemek için derin üretken modelleri kullanan SAILOR metodolojisini kapsar. öğrenme. Tartışma ayrıca, genomik ve RNA ifade verilerini incelemek için VAE modellerinin kullanımını, bir taksi analizi için derin üretken modellerin bir uzantısını ve paylaşılan temsilleri öğrenmek için çok modlu veri kümelerinin bir modelle kombinasyonunu kapsar. Sunum yapan kişi, geliştirilen tüm araçların açık kaynak olduğunu ve Github'da mevcut olduğunu not eder.

  • 00:45:00 Bu bölümde öğretim görevlisi, genlerin bir alt kümesini kullanarak gen ifadesi tahmini için bir yöntemi tartışıyor. Araştırmacılar, Luminex teknoloji platformunu kullanarak az sayıda genin (1.000) profilini çıkararak milyonlarca örnekle profiller oluşturabilir, bu da biyolojik süreçleri ve ilaç keşiflerini anlamak için uygun maliyetli bir yönteme yol açar. Kalan 20.000 gen, derin sinir ağları gibi hesaplama teknikleri kullanılarak çıkarılabilir. Araştırmacılar, çok katmanlı bir algı ileri beslemeli sinir ağına 978 boyutlu vektör girerek, 20.000 hedefi çok görevli bir şekilde ortaklaşa tahmin edebilir ve modeli geri yayılım yoluyla eğiterek doğrusal regresyondan daha iyi doğruluk elde edebilir. Modeli eğitmek için tüm gen koleksiyonuyla ifade profillerini içeren coğrafi veri seti kullanılır.

  • 00:50:00 Dersin bu bölümünde eğitmen, genomik veri kümelerini incelemek için üretken modellerin kullanımını tartışır. Çoğu genomik veri setinde etiket bulunmadığından, denetimsiz öğrenme genellikle daha alakalıdır. Amaç, yüksek boyutlu veri kümelerini, altta yatan kalıpları belirlemede daha yardımcı olabilecek düşük boyutlu bir gömmeyle eşlemektir. Bu amaca yönelik geleneksel yöntem, girdi ile çıktıyı eşleştirerek eğitilebilen, ancak fazla uydurmaya yatkınlık ve örnek üretememe gibi sorunları olan otomatik kodlayıcıdır. Bir çözüm olarak eğitmen, verileri gizli değişkenlerle olasılıksal bir çerçeve aracılığıyla modelleyen derin üretken modeller önerir. Gizli değişkenlerin dağılımına öncelikler atayarak, model, girdinin marjinal dağılımlarını elde etmek için bunları marjinalize edebilir.

  • 00:55:00 Bu bölümde, profesör, genel bir çerçeveye dayalı öğrenme verileriyle ilgili sorunları tartışır ve yaklaşık çıkarım metodolojisi fikrini, özellikle de verilen z'nin dağılımı üzerinde yardımcı bir dağılım öneren varyasyonel çıkarım adı verilen popüler metodolojiyi sunar. X. Yardımcı dağılıma bağlı log-olabilirliğin alt sınırı daha sonra veriler ve dağılımlar arasındaki ko mesafesi arasındaki bir denge yoluyla en aza indirilir, böylece gözlemlenebilir veri setlerini modellemek için yeterli güce sahipken sonsal dağılımın önceki dağılıma yeterince yakın olması sağlanır. . Bu, hem p(teta)x verilen z'yi hem de sinir ağları aracılığıyla yardımcı dağılımı negatif log olasılığının varyasyonunu en aza indirecek şekilde eğiterek modelleyebilen varyasyonel otomatik kodlayıcının geliştirilmesine yol açtı. Bununla birlikte, özellikle bir Gauss ürünü uygularken, yeniden parametreleştirme hilesi kullanılarak ele alınabilecek bu beklentilerin hesaplanmasında sorunlar vardır.

  • 01:00:00 Bu bölümde konuşmacı, varyasyon otokodlayıcı modellerinin özellikle astım veri kümeleri için RNA ekspresyon analizine uygulanmasını tartışıyor. RNA-seq veri kümelerinin ayrık ve nicel doğası nedeniyle, araştırmacılar okuma sayılarını modellemek için sıfırla şişirilmiş negatif binom dağılımları kullanırlar. Bu, derin bir üretim modeli oluşturmak için bu modelle birleştirilmiş bir otomatik kodlayıcı kullanma fikrine yol açar. Bununla birlikte, öğrenilen gizli temsiller, toplu efektler ve okuma kapsamı gibi deneysel yapıları yansıtabilir. Bu etkileri ortadan kaldırmak için konuşmacı, öğrenilen temsiller ve bunların altında yatan karıştırıcı faktörler arasındaki karşılıklı bilgiyi en aza indiren koşullu bir üretici model kullanan bir çerçeve önerir.

  • 01:05:00 Bu bölümde, Illumina'daki Yapay Zeka Laboratuvarı baş araştırmacısı, şirketin insan genomundaki olası her varyantı anlama ve genom dizilemesini herkes için faydalı hale getirme hedefinden bahsediyor. Odak noktası, çoğu klinik dizilemenin şu anda atladığı, kodlayıcı olmayan genetik varyasyonları yorumlamaktır. Bu nedenle Illumina, özellikle ekleme için genomik yorumlama için diziden işleve modelleri tanımlamak için derin öğrenme ağlarına büyük yatırım yapıyor. Bir nükleotidin bir ekleme vericisi mi, alıcısı mı yoksa hiçbiri mi olduğunu yalnızca diziden tahmin eden ve bir dizi dizisinden bir genin intron-ekson modelini yeniden yapılandırabilen derin bir evrişimli sinir ağı olan SpliceAI'yi geliştirdiler.

  • 01:10:00 Bu bölümde sunum yapan kişi, ekson ek bağlantı bağlantılarını tahmin etmenin zorluklarını ve derin öğrenilen ağlarının büyük CFTR geninin 30 eksonunun tamamını nükleotid düzeyinde hassasiyetle nasıl tahmin edebildiğini tartışıyor. Uzun menzilli dizi determinantlarının ekleme düzenlemesi için anahtar olduğunu ve ağın bu determinantları nükleozom konumlandırması ve ekzonların kümelenmesi dahil olmak üzere dizi verilerinden otomatik olarak türetebildiğini buldular. Ağ, dallanma noktası, poliper ay yolu, ag ve gt'nin yanı sıra intronik ve eksonik birleşme arttırıcılar dahil olmak üzere çeşitli özellikler kullandı ve yerel motiflerin fazlalığını uzun menzilli bir bağlamla telafi etti. Sunucu ayrıca, ağın doğruluğunun daha büyük bağlam boyutlarıyla nasıl arttığını ve protein olmayan kodlama dizileri üzerinde de çalıştığını gösterdi.

  • 01:15:00 Videonun bu bölümünde konuşmacı, ekzonu uzatan ve proteini çerçeve kaydıran tek bir nükleotit mutasyonunun neden olduğu erken başlangıçlı kalp yetmezliği olan nadir hastalık hastalarına yapay zeka ekleme uygulamasını tartışıyor. Model ayrıca GTEx'ten RNA-seq üzerinde doğrulandı ve doğrulama oranı, ekleme AI puanına bağlıydı. Konuşmacı, normal eklemeyi koruyabilecekleri için düşük puanlı ekleme varyantlarını yorumlamanın karmaşıklığını vurgular ve ele alınması gereken insan varyasyonunun dereceli bir yorumu vardır. Doğal seçilimin kriptik ekleme işlevine sahip varyantlar üzerindeki etkisi de incelendi ve doğal seçilimin, baharatlı i tarafından tahmin edilen kriptik ekleme mutasyonlarının esasen bir çerçeve kayması veya anlamsız protein kodlama mutasyonuna eşdeğer olduğunu gösterdiği bulundu. Son olarak model, otizm spektrum bozukluğu ve zihinsel engelli hastaların büyük klinik veri setlerine uygulandı.

  • 01:20:00 Dersin bu bölümünde konuşmacı, belirli mutasyonların şifreli ekleme işlevine sahip olup olmayacağını tahmin etme konusundaki araştırmalarından bahsediyor. Tahmin edilen anormal ek bağlantısını doğrulamak için RNA dizilimini kullandılar ve bu varyantların, çerçeve kaymalarına ve hastalığa yol açan yanlış yerde eklemeye nasıl neden olduğuna dair örnekler gösterdiler. Konuşmacı, araçlarını açık kaynak yapar ve soruların yanı sıra araştırma pozisyonları, stajlar ve doktora sonrası başvuruları davet eder. Ders, konuşmacıya teşekkür ve final projesi için bizi izlemeye devam etmeniz gerektiğinin hatırlatılmasıyla sona erer.
Gene Expression Prediction - Lecture 09 - Deep Learning in Life Sciences (Spring 2021)
Gene Expression Prediction - Lecture 09 - Deep Learning in Life Sciences (Spring 2021)
  • 2021.03.20
  • www.youtube.com
6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep Learning in the Life Sciences / Computational Systems BiologyPlaylist: https://youtube...
 

Tek Hücre Genomik - Ders 10



Tek Hücre Genomik - Ders 10 - Yaşam Bilimlerinde Derin Öğrenme (Bahar 2021)

Tek hücreli genomik üzerine olan bu derste, konuşmacı hücre sınıflandırma ve mikroakışkanlar dahil olmak üzere tek tek hücrelerin profilini çıkarmak için kullanılan çeşitli yöntem ve teknolojileri tartışıyor. Odak noktası, üç özel tek hücreli dizileme teknolojisidir - Smart-seq, drop-seq ve havuzlanmış yaklaşımlar. Konuşmacı ayrıca, ön işleme, görselleştirme, kümeleme ve ek açıklama dahil olmak üzere tek hücreli transkriptomları analiz etme sürecini ve topluluk kümelemede otomatik kodlayıcı mimarisinin kullanımını kapsar. Etki alanı uyarlaması ve hücre tiplerini uyarılmış bir şekilde yeniden yapılandırmak için derin öğrenme yöntemleri uygulanır. Ders ayrıca, tek hücreli genomik verilerinin analizinde yer alan zorlukları tartışır ve bu sorunları ölçeklenebilir ve tutarlı bir şekilde ele almak için üretken bir modelin kullanılmasını önerir.

Videonun ikinci kısmı, tek hücreli genomik ve derin öğrenme ile ilgili çeşitli konuları kapsar. Tartışılan konular arasında değişken çıkarım, tek hücreli RNA dizileme verileri için üretken bir süreç, hücre tipi veri setlerini karıştırmak için SCVI modeli, etiketleri çoğaltmak için CanVAE ve CVI araçları adı verilen tek bir kod tabanında çeşitli derin öğrenme algoritmalarının uygulanması yer alır. Konuşmacılar ayrıca, gen ifadesinin ölçülerini hesaplamak için sonsal olasılıkları kullanma konusundaki zorlukları ele alıyor ve sonsal beklentileri doğru bir şekilde hesaplamak ve tam keşif oranlarını kontrol etmek için yöntemler sunuyor.

  • 00:00:00 "Single Cell Genomics - Lecture 10 - Deep Learning in Life Sciences (Bahar 2021)" transkriptinin bu bölümünde, konuşmacı tek hücre profili oluşturmanın neden gerekli olduğunu açıklıyor. Vücuttaki bireysel hücreler birbirinden son derece farklıdır ve çevresel uyaranlar, etkileşimler, hücre döngüsü fazı ve transkripsiyon patlamaları nedeniyle değişebilir. Tek hücre profilleme, genellikle toplu verilerle yakalanmayan hücre türleri, sinyalleme ve genotipteki bireysel farklılıkları da yakalar. Konuşmacı, tek hücreli veri analizindeki mevcut patlamadan önce gelen birkaç teknolojiyi ana hatlarıyla belirtir, ancak transkripsiyonel çeşitliliği yakalamak için bireysel RNA'ları güçlendirmeye yönelik temel teknolojiyi vurgular.

  • 00:05:00 Bu bölümde, konuşmacı, hücre sıralama, mikroakışkanlar ve pipetleme dahil olmak üzere, tek tek hücrelerin profilini çıkarmak için kullanılan farklı teknolojileri ve yöntemleri tartışıyor. Araştırmacılar, farklı zaman noktalarındaki tek tek hücrelere ve hücreler arasındaki genlere bakarak, tek tek genlerin nasıl açılıp kapandığını ve belirli zaman noktalarında bile nasıl heterojenlik olduğunu görebilirler. Tek hücre analizi, teknik ve biyolojik sıfır değerlerinin ayırt edilmesinde zorluk teşkil eder, ancak bu tekniklerle elde edilen veriler, biyolojide görülenleri özetleyebilir. Konuşma ayrıca hücre tabanlı teknolojiyi kullanan smartseek, her ikisi de damlacık kullanan dropseek ve 10x ve hücreleri ayırmadan tek tek barkodlama yöntemi olan split-seek'i de kapsıyor.

  • 00:10:00 Bu bölümde konuşmacı, mikroakışkanlar ve kan toplama da dahil olmak üzere tek hücreli genomikte kullanılan farklı yöntemleri tartışıyor ve süreçte kullanılan temel boru hattını açıklıyor. Odak noktası üç özel teknolojidir - Smart-seq, drop-seq ve havuzlanmış yaklaşımlar. Smart-seq, hücre sıralama kullanır ve hücre başına 10.000 adede kadar gen yakalar, ancak her kuyu için ayrı bir sıralama reaksiyonu gerektirir ve bu da onu pahalı hale getirir. Drop-seq kuyuları damlacıklarla değiştirir, boncuklardaki barkodlarla tek tek hücreleri yakalar ve daha uygun maliyetlidir. Son olarak, havuzlanmış yaklaşım, karşılık gelen hücre kimliği ile etiketlenmiş tek bir tüpte tüm bireysel RNA moleküllerinin yakalanmasını içerir.

  • 00:15:00 Bu bölümde, konuşmacı üç farklı türde tek hücreli RNA dizileme teknolojisini açıklıyor. İlki, her bir hücrenin bir kuyu veya damlacık olarak sıralandığı ve her bir kuyucuğun, hücreleri birbirinden ayırmak için benzersiz bir barkodla etiketlendiği Kuyu Sıralamadır. İkincisi, farklı hücrelerden gelen tüm etiketli RNA'nın tek bir sıralama reaksiyonunda birleştirilmesini içeren 10X Genomics'tir. Üçüncü teknoloji, hücrelerin her yinelemede eklenen farklı barkodlarla farklı kuyular arasında karıştırıldığı ve her hücrenin RNA'sı için benzersiz bir barkod kombinasyonunun elde edildiği Split-Seq'tir. Bu, her RNA molekülü için hangi hücreden geldiğini gösteren bir milyon benzersiz adrese izin verir.

  • 00:20:00 Bu bölümde öğretim görevlisi, kuyulardaki hücreler, damlacıklar ve kombinatoryal indeksleme dahil olmak üzere tek hücreli sıralama teknolojilerini tartışır. Tek hücreli DNA metilasyon profili oluşturma, tek hücreli genom dizilimi ve tek hücreli DNA erişilebilirliği gibi çeşitli tahlil türleri kullanılabilir. Yaygın olarak kullanılan başka bir tahlil, tek tek hücrelerde kromatinin erişilebilirliğine bakan tek hücreli ATAC-seq testidir. Bununla birlikte, tek tek hücrelerden gelen veriler seyrek olabilir ve transkripsiyon faktörlerinden bahsetmek için birden çok konumdaki verilerin toplanması gerekir. Öğretim görevlisi ayrıca, tek hücreli çoklu omik yöntemlerin artan bir şekilde ortaya çıkmasından bahseder, ancak gürültü ve eserlerle uğraşırken hesaplama zorlukları konusunda uyarıda bulunur. Bölüm, sırasıyla Avrupa ve Batı Kıyısı'ndan tek hücreli genomikte derin temsil öğrenimini tartışacak olan iki konuk dersine girişle sona eriyor.

  • 00:25:00 Tek hücreli genomik dersinin bu bölümünde, konuşmacı çeşitli ön işleme, görselleştirme, kümeleme ve açıklama adımlarını içeren tek hücreli transkriptomları analiz etme sürecini tartıştı. Bilgi tek tek hücrelerde değil, yalnızca hücre topluluklarında mevcut olduğundan, süreç denetimsizdir. Konuşmacının laboratuvarı, bu adımları gerçekleştirmek için bir araç ve modül kitaplığı sağlayan python'daki başarılı tek hücre analizi de dahil olmak üzere, bu sürece yardımcı olacak araçlar ve çerçevelerle katkıda bulunmuştur. Görselleştirme ve aşağı akış analizi, gizli alan öğrenmeyi içerir ve en yaygın kullanılan yöntem akn grafiğidir. Konuşmacının laboratuvarı, hücresel farklılaşma süreçlerini anlamak için tek hücreli transkriptomlardaki zaman serisi bilgilerini incelemeye de yatırım yaptı.

  • 00:30:00 Bu bölümde konuşmacı, derin sinir ağları kullanan topluluk kümelemede otomatik kodlayıcı mimarisinin kullanımını tartışıyor. Bu yaklaşım, artan veri kümeleri boyutu ve gen çarpı hücre matrislerindeki gürültü ile başa çıkmak için kullanılır. Otomatik kodlayıcı mimarisinin darboğaz katmanının önemli olduğu ve biyolojik süreçler hakkında bilgi edinebileceği bulundu. Konuşmacı ekibi, ortalama kare hatasını negatif binom dağılımıyla değiştirerek gürültü işlevine uyum sağlayan derin sayımlı bir otomatik kodlayıcı geliştirmek için bu bilgileri kullandı. Bir PBMC veri setinde bu yaklaşımın iki boyutlu bir çizimi, darboğaz katmanının, biyolojik bilgiden yararlanmaya yardımcı olabilecek herhangi bir ön bilgi olmaksızın hücre tipi grupları tanıdığını gösterir. Bu sinir ağı yönteminin ölçekleme davranışı da Kn algoritmasına göre önemli bir avantaj olarak tanımlanmaktadır.

  • 00:35:00 Bu bölümde konuşmacı, yeni nesil evrişimli filtreleri geliştirmek için genomik ve tek hücreli verilerde derin öğrenmenin potansiyelini tartışıyor. Hücrelerdeki pertürbasyonlar ve ilaç uyaranları gibi belirli ayarları yenisine aktarmayı amaçlayan etki alanı uyarlamasına odaklanan bir projeden bahsediyor. Hücrelerin pertürbasyon etkilerini modelleyen ve yeni bir hücre tipinin nasıl davranacağını tahmin etmeye çalışan bu projeye "scgen" diyorlar. Tüm veri kümelerini kodlayarak, aritmetik ve örneklem dışı tahmin yapabilecekleri doğrusallaştırılmış gizli alan elde etmeyi umuyorlar. Ayrıca bu modeli daha karmaşık ayrıştırma için genişletiyorlar.

  • 00:40:00 Bu bölümde, konuşmacı, tek hücreli genomikte derin öğrenmeyi kullanarak bir hücre tipini yeniden oluşturma becerisini tartışıyor. Amaç, CD4 pozitif T hücreleri gibi bir hücre tipini uyarılmış bir şekilde, onları dışarıda bırakarak, esasen bir numune dışı tahmin yaparak yeniden oluşturmaktır. Tahmin sadece ortalamaya değil aynı zamanda varyansın dağılımına da dayanmaktadır. Bu rekonstrüksiyon sadece CD4 pozitif T hücreleri için değil, aynı zamanda tüm farklı hücre türleri için yapılır ve hücreye özgü yanıt öğrenilir, bu da onu genomik için güçlü bir araç haline getirir. Konuşmacı ayrıca gizli uzay öğrenimiyle genişletilen basit bir üretken model olan SCGen'den de bahsediyor. Büyük numune ile ilgili tüm bilgileri modele paketleyerek stil aktarımı yapmak için kullanılabilir. Son olarak, konuşmacı, dağıtılmış verilerle uğraşmak ve bu haritalara erişimi kolaylaştırmak için gerekli olan transfer öğrenimini tartışır.

  • 00:45:00 Bu bölümde konuşmacı, bir dokudaki hücrelerin farklı işlevlerini anlamayı amaçlayan Bayes modelinin ve varyasyonel otokodlayıcıların (VAE'ler) tek hücreli verilere uygulanmasını tartışıyor. İşlem, bir dokunun tek hücrelere ayrılmasını ve tek bir RNA dizileme hattının çalıştırılmasını içerir, bu da bir transkriptin her hücre için bir gen ile kaç kez hizalandığını gösteren bir matrisle sonuçlanır. Konuşmacı, lisansüstü ve yüksek lisans öğrencileri ve profesörleriyle yaptıkları çalışmalarda işbirliğinin önemini vurgular ve VAE'leri uygulamanın öneminden tek hücreli verilere, VAE'lerin uzantıları ve arıza modları tartışmasına kadar sunum boyunca ele alacakları çeşitli konuları sunar. .

  • 00:50:00 Bu bölümde konuşmacı, hücre ve gen düzeyinde sorguların analizi de dahil olmak üzere tek hücreli genomikte yer alan çeşitli görevleri ve zorlukları tartışıyor. Görevlerden bazıları hücre katmanlaştırma, yörünge analizi, veri seti uyumlaştırma, açıklama aktarımı, normalleştirme ve diferansiyel ifade testini içerir. Analiz, değişken sıralama derinliği ve yığın etkileri gibi teknik gürültünün yanı sıra verilerin yüksek boyutlu, Gauss olmayan doğası nedeniyle karmaşık olabilir. Konuşmacı, bu sorunları ele almak için gizli değişken modelleri ve dahil olan milyonlarca örneği analiz etmek için ölçeklenebilir yöntemler kullanmayı önerir.

  • 00:55:00 Bu bölümde, konuşmacı, algoritmaları tek hücreli genomik verilere uygulamanın sınırlamalarını ve tüm süreç için birleştirici bir modelleme varsayımına duyulan ihtiyacı tartışıyor. Tek hücreli verileri ölçeklenebilir ve tutarlı bir şekilde analiz etmek için kullanılabilen, Bayesçi modelleme tekniklerine dayanan üretken bir model fikrini sunarlar. Konuşmacı, bir grafik modelin nasıl okunacağını ve bağımsız çoğaltma ve koşulluluk gibi olasılıksal özellikleri kodlamak için farklı düğümlerin ve kenarların nasıl kullanılabileceğini açıklar. Amaç, Bayes kuralı kullanılarak elde edilebilen sonsal dağılımı hesaplamaktır, ancak marjinal olasılık, olasılıksal PCA'nın kullanıldığı durumlar dışında, genellikle anlaşılmazdır.

  • 01:00:00 Bu bölümde, konuşmacı scVI'da gözlemlerin sonsal olasılık dağılımına yaklaşmak için kullanılan değişken çıkarım kavramını tartışıyor. Yöntem, bir dağılım ailesini yerleştirmeyi ve esasen bir optimizasyon problemi olan, K-diverjansını posteriora en aza indiren q noktasını bulmayı içerir. Koşullu yoğunluk tanımını kullanarak, optimizasyon problemi izlenebilir hale gelir ve değişken çıkarım çekici bir yöntem haline gelir. Konuşmacı ayrıca, Gauss dağılımının ortalamasını ve varyansını belirlemek için bir sinir ağının kullanılabileceği olasılıksal PCA'nın bir uzantısını sunar. Bununla birlikte, VAE'lerde varyasyonel çıkarım kullanmak, iki sinir ağı kullanarak varyasyonel posteriorun tüm parametrelerini birbirine bağlayarak elde edilebilecek kanıtı en üst düzeye çıkararak model parametrelerini öğrenmeyi gerektirir. Son olarak, konuşmacı, belirli bir hücre ve gen için gen ifade sayımları oluşturmak üzere teknik efektleri bir grafik modele dahil eden scVI'yı tartışır.

  • 01:05:00 Bu bölümde, konuşmacı bir koşullu varyasyonel otomatik kodlayıcı (CVA) kullanarak tek hücreli RNA dizileme verilerinin üretim sürecinin ayrıntılı bir açıklamasını verir ve ayrıca bu modelin katmanlaştırma, harmonizasyon, uyumlaştırma gibi çeşitli görevler için nasıl kullanılabileceğini açıklar. normalleştirme, atama ve diferansiyel ifade. Konuşmacı, bu yaklaşımın toplu efektlerle nasıl başa çıkabileceğini ve ölçeklenebilirliği nasıl iyileştirebileceğini vurguluyor. Konuşmacı ayrıca modelin yararlılığını, gömmelerdeki hiyerarşik kümeleri ve gelişimsel gradyanları kurtarabildiğini ve ciddi yığın etkileri ve birçok kümenin olduğu durumlarda toplu etkileri idare edebildiğini göstererek gösterir.

  • 01:10:00 Bu bölümde sunum yapan kişi, hücre türlerini ayırt ederken hücre türü veri kümelerini karıştırmanın zorluğunu tartışıyor. Hücre türlerini görme yeteneğini kaybetmeden veri kümelerini karıştırabilen SCVI modelini sunarlar. Sunucu ayrıca Rao gizli değişkeninin diferansiyel ifade analizi için heyecan verici kullanımından da bahsediyor. Ekip, genlerin sıralamasını SCVI ve diğer mikrodizi teknolojisi yöntemleriyle karşılaştırdı ve SCVI'nin benzer, hatta biraz daha iyi performans gösterdiğini buldu. Son olarak sunum yapan kişi, açıklama amacıyla kullanılan SCVI'nın bir uzantısı olan ve etiketlerin bir veri kümesinden diğerine aktarılmasına izin veren SCVI++ modelini tanıtır. SCVI++ modeli, bir karışım modeline dayalıdır ve z'deki önceliği değiştirir ve hücre tipi ataması için bir sinir ağı kullanır.

  • 01:15:00 Bu bölümde, konuşmacı CanVAE adlı bir çerçevenin, T hücrelerinin bir alt kümesinin olduğu ancak bunların alt hücre tiplerinin düşük düzeyde ifade edilen bazı işaretleyici genlere dayalı olarak tanımlanamadığı bir kullanım durumunda kullanımını tartışıyor. . Etiketleri yaymak için CanVAE'yi kullanarak, tüm hücreler hakkındaki bilgileri kullandığı için yalnızca kümeleme veya sınıflandırmadan daha iyi çalışan yarı denetimli bir öğrenme yöntemi haline gelir. Ek olarak, konuşmacı, varyasyonel dağılımın parametreleştirilmesinde kullanılan sinir ağları ile ele alınması zor olan gizli uzaydan sürekli bilgiyi veya ortak değişkenleri çarpanlarına ayırma sorunu sunar. Daha uygun özelliklere sahip daha gevşek alt sınırlar ile sonuçlanan, toplu posteriorda bağımsızlık bildirimlerini zorlayan bir yöntem olan HC kısıtlaması VAES'i tanıtırlar. Son olarak, diferansiyel ifadeyi ve bunun, CanVAE çerçevesini kullanarak diferansiyel ifadeyi belirlemek için olasılık oranlarının bir eşik olarak kullanılabileceği bir Bayes modeli seçim problemi olarak nasıl düşünülebileceğini tartışıyorlar.

  • 01:20:00 Bu bölümde konuşmacı, gen ifadesinin ölçümlerini hesaplamak için sonsal olasılıkları kullanmayla ilgili zorlukları ve sınırlamaları tartışıyor. Son bilgi yanlışsa yaklaşım önyargılı olabilir ve birçok kişi yanlış keşif oranı ölçüsünü temel faktörlere göre kontrol etmeyi tercih eder. Bu sorunu çözmek için konuşmacı, değişken dağılımdan örnekler kullanarak sonsal beklentileri doğru bir şekilde hesaplamak için bir yöntem önerir. Varyansı fazla tahmin eden farklı üst sınırlar getirirler; bu, önemli örnekleme için onu hafife almaktan daha faydalıdır. Ek olarak, konuşmacı, CVI ile tam keşif oranını kontrol etmek için birden çok teklifi bir araya getirmeye yönelik bir prosedür sunar. Bu çalışmayla ilgili makale, konsantrasyon sınırlarını kullanarak önemli örnekleme için hatayı ölçen teorik analizleri de içerir.

  • 01:25:00 Bu bölümde, konuşmacı, tek hücreli omik verilerini analiz etmek için araçlar ve olasılık programlama dillerine bir arayüz içeren CVI araçları adı verilen tek bir kod temelinde çeşitli derin öğrenme algoritmalarının uygulanmasını tartışıyor. Kod tabanı, yaklaşık 10 ila 13 üretken modelin uygulanmasını içerir ve kullanıcılar, bir kod satırındaki koşullu varyasyonel otomatik kodlayıcıyı kolayca değiştirebilir veya yeni bir kod oluşturabilir. Konuşmacı ayrıca varyasyonel otomatik kodlayıcıların ve üretken rakip ağların moleküler biyolojideki etkisini tartışan bir gözden geçirme makalesinden de bahsediyor.
Single Cell Genomics - Lecture 10 - Deep Learning in Life Sciences (Spring 2021)
Single Cell Genomics - Lecture 10 - Deep Learning in Life Sciences (Spring 2021)
  • 2021.03.28
  • www.youtube.com
MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisGuest lecturers: Fabian Theis, Romain LopezDeep Learning in the Life Sciences / Computa...
 

Boyut Azaltma - Ders 11



Boyut Azaltma - Ders 11 - Yaşam Bilimlerinde Derin Öğrenme (Bahar 2021)

Yaşam bilimlerinde derin öğrenmeyle ilgili video dersler, tek hücreli veri analizinde kümeleme ve sınıflandırma için boyut azaltma tekniklerini keşfediyor. Dersler, denetimli ve denetimsiz öğrenme arasında ayrım yapar ve genlerin farklı ifadelerini değerlendirmek için istatistiksel hipotez test çerçevelerinin kullanımını keşfeder. Ders, doğrusal boyut indirgemesi için temel bileşen analizi, öz ayrıştırma ve tekil değer ayrıştırma kullanarak manifold öğrenme kavramını tanıtır ve kümeleme verilerinin korunması için t-dağılımlı stokastik komşu yerleştirme ve dağıtılmış stokastik komşu yerleştirme yöntemlerini tartışır. Konuşmacı ayrıca genomik verilere negatif olmayan matris çarpanlara ayırmanın uygulanmasını ve tek hücreli ve çok omik veri setlerinin entegrasyonunu tartışıyor. Bu tekniklerin nihai amacı, hücre tiplerini ve kimliğini tarafsız ve nicel bir şekilde yeniden tanımlamaktır.

İkinci bölüm, özellikle yaşam bilimlerindeki uygulaması olmak üzere, boyut indirgeme ile ilgili çeşitli konuları tartışmaktadır. Bütünleştirici negatif olmayan matris çarpanlara ayırma (iNMF), çeşitli bağlamlarda hücresel kimliği daha iyi anlamak için transkriptomik ve epigenomik profilleri bağlamak için kullanılır. Ders ayrıca, özellikle daha büyük veri kümeleri için derin öğrenmede mini toplu bir yaklaşım kullanmanın faydalarını ve büyük veri kümelerini analiz etmek için boyut indirgeme yöntemlerini geliştirmek için çevrimiçi algoritmalardan nasıl yararlanılabileceğini tartışır. Ek olarak, algoritma, RNA-seq ve ATAC-seq verileri gibi farklı veri türlerini entegre etmek için tanıtıldı. Son olarak konuşmacı, alanla ilgilenen öğrencilere akıl hocası olarak hizmet etme isteğini ifade eder. Genel olarak, ders bilgilendirici ve iyi karşılandı.

  • 00:00:00 Bu bölümde, video dersler tek hücreli veri analizi üzerine tartışmaya devam ediyor ve kümeleme ve sınıflandırma için boyut indirgeme tekniklerine odaklanıyor. Binlerce deneyde binlerce geni ölçen gen ifade matrisleri, genleri veya hücreleri kümelemek veya hücre tiplerini gen ifadelerine göre sınıflandırmak için kullanılabilir. Dersler, denetimli ve denetimsiz öğrenme arasında ayrım yapar ve genlerin farklı ifadelerinin olasılığını değerlendirmek için istatistiksel hipotez test çerçevelerinin kullanımını keşfeder. Video ayrıca, verilerin temel dağılımını dikkate alma ve veri setinde gözlenen dağılıma en uygun olanı bulma ihtiyacından da bahseder.

  • 00:05:00 Bu bölümde öğretim görevlisi, hem denetimli hem de denetimsiz öğrenme uygulamalarında boyut küçültmenin çeşitli nedenlerini tartışır. Bunlar, veri görselleştirme, veri indirgeme, veri sınıflandırma ve veri kümelerindeki gürültüyü azaltmayı içerir. Öğretim görevlisi, boyut indirgemenin varyasyonu yönlendiren faktörlerin anlaşılmasına, farklı sınıflar arasında ayrım yapılmasına ve ilginç veri alt kümelerinin belirlenmesine yardımcı olabileceğini açıklıyor. Buna ek olarak öğretim görevlisi, boyut indirgemenin yüksek boyutlu verileri daha düşük boyutlu bir manifolda eşlemeyi nasıl içerdiğini açıklar.

  • 00:10:00 Dersin bu bölümünde, daha düşük boyutlu bir temsile izin veren yüksek boyutlu verilerin gerçek boyutluluğunu anlamanın bir yolu olarak manifold öğrenme kavramı tanıtılır. Manifold öğrenme, yüksek boyutlu verilerin alınmasını ve veri kümesi tarafından keşfedilemeyen verilerin gerçek boyutluluğunun anlaşılmasını içerir. Temel bileşen analizi (PCA) kullanılarak doğrusal boyut indirgeme, bu manifoldları öğrenmenin en yaygın yollarından biri olarak tartışılmaktadır. PCA, verileri orijinal alanın bir dönüşümü olan bir dizi doğrusal koordinata yansıtmayı içerir. Orijinal verilerin özvektörleri, PCA'da dönüşümler için değişmez olan vektörleri bulmak için kullanılır.

  • 00:15:00 Yaşam bilimlerinde derin öğrenme konulu dersin bu bölümünde, büyük bir veri matrisini temel varyasyon vektörlerine ayrıştırmanın bir yolu olarak öz ayrıştırma kavramı tanıtılır. Simetrik matrisler için özvektörler ortogonaldir ve gerçek simetrik matrisler için özvektörler hem dik hem de gerçektir. Öz ayrıştırma, bir veri kümesinin en doğal doğrusal boyutluluk indirgemesini yakalar ve köşegen matris, bağımsız ana bileşenlerin etkilerini temsil eder. Simetrik olmayan matrisler için, genlerin ve koşulların özvektörlerini ve verileri en iyi açıklayan kombinasyonlarını bulmak için tekil değer ayrıştırması kullanılır.

  • 00:20:00 Bu bölümde öğretim görevlisi, tekil değer ayrıştırma (SVD) kavramını ve bunun doğrusal boyut indirgeme için nasıl kullanılabileceğini tartışır. SVD, verilerdeki en önemli varyasyon boyutlarını bulmak için bir matrisi iki döndürme ve bir ölçekleme dahil olmak üzere bir dizi işleme ayrıştırmanın bir yoludur. Ortaya çıkan matris, verilerin daha düşük boyutlu bir uzayda temsil edilmesine izin vererek, orijinal verilerin optimal bir düşük dereceli yaklaşımını hesaplamak için kullanılabilir. Bu, yetenekleri sınırlı olan doğrusal boyut indirgeme için kullanışlıdır, ancak doğrusal olmayan boyut indirgeme, bu kısıtlamaların bazılarını ortadan kaldırabilir. Temel bileşen analizi, verilerdeki varyasyonun ana doğrusal boyutlarını yakalayan bir doğrusal boyutluluk azaltma yöntemidir.

  • 00:25:00 Bu bölümde, t-dağılımlı stokastik komşu gömme (t-SNE) yöntemi, farklı ölçeklerde mesafeleri korurken boyutsal indirgeme için verileri kümeleme tekniği olarak ele alınmaktadır. Tüm mesafeleri eşit olarak ele alan PCA'ya güvenmek yerine, t-SNE, yeni alan içindeki benzer veri noktalarının yakınlığını korurken yüksek boyutlu bir alanı daha düşük bir boyuta eşler. Spesifik bir bant genişliği uygulayarak, yüksek boyutlu bir uzayda benzer ifade modellerine sahip tek tek hücreler, daha düşük boyutlu bir uzayda birbirine yakın hale getirilebilir ve her iki boşluk arasındaki KL sapmasını en aza indirir. İki alan arasındaki KL farklılığının maliyet fonksiyonunu en aza indiren bir gömme bulmak için kademeli yöntemler kullanılabilir.

  • 00:30:00 Bu bölümde, konuşmacı dağıtılmış stokastik komşu yerleştirmenin (d-SNE) gradyan yoluyla arama yaparak ve daha düşük boyutlu bir uzayın koordinatlarını optimize ederek verilerin yerel benzerlik yapısını nasıl koruduğunu tartışıyor. Yaklaşım, küresel mesafeler yerine yerel mesafeleri koruyan ve noktalar birbirinden ayrıldığında ancak yakındaki noktalar birbirine daha yakın olduğunda cezalandıran doğrusal olmayan bir yerleştirmedir. Bu yöntem, tek hücreli veri kümelerini çevreleyen görselleştirmeler için yaygın olarak kullanılır ve dikkate alınan komşuların sayısı ve orijinal kümelerin boyutu, yerleştirmenin kalitesini etkileyebilir.

  • 00:35:00 bu bölümde, konuşmacı, tek hücreli veri analizi için belirli hücre tipi kümelerini öğrenmeye odaklanarak, verilerin daha düşük boyutlu bir projeksiyonu kavramını tartışıyor. Birden fazla omik veri türünün, birbirleriyle eşleştirilebilecekleri daha düşük boyutlu bir veri kümesine ortak projeksiyonuna izin veren bir yöntemden bahsediyorlar. Konuşmacı, bütünleştirici negatif olmayan matris çarpanlara ayırmayı kullanan LIGER yaklaşımı ve çevrimiçi öğrenmeyi kullanarak INMF algoritmasını büyütmek için bir yöntem de dahil olmak üzere geliştirdiği çeşitli yaklaşımları sunar. Konuşma, kısmen örtüşen özelliklere sahip veri setlerini entegre etmeye ve tek hücreli RNA profilleri oluşturmak için değişken otomatik kodlayıcıları ve üretken rakip ağları birleştirmeye yönelik devam eden projeleri tartışarak sona eriyor.

  • 00:40:00 Bu bölümde konuşmacı, gen ifadesi, histon modifikasyonu, transkripsiyon faktörü bağlanması, kromatin erişilebilirliği, DNA metilasyonu ve kromatin konformasyon dahil olmak üzere tek hücrelerde gerçekleştirilebilen çeşitli ölçüm türlerini tartışıyor. Ayrıca mekansal koordinatları bilmenin ve moleküler bilgiyi doku bağlamına geri haritalamanın önemini vurguluyorlar. Konuşmacı, hücre türlerini tarafsız bir şekilde yeniden tanımlamak için tek hücre çözünürlüğüne sahip moleküler ve diğer bilgi türlerinin kullanıldığı nicel bir hücresel kimlik tanımına doğru ilerlemenin zorluğundan bahsediyor. Bu zorlukların üstesinden gelmek için konuşmacı, farklı ölçümlerin veri kümeleri arasında bütünleştirici tek hücreli analiz gerçekleştirmek için bütünleştirici negatif olmayan matris çarpanlarına ayırmaya dayalı liger adlı bir araç geliştirdi. Ayrıca, negatif olmayan matris çarpanlara ayırmanın "parçalara dayalı ayrışma" yaklaşımının faydalarını da tartışıyorlar.

  • 00:45:00 Bu bölümde, transkript, NMF faktörlerinin birlikte ifade edilen veya birlikte düzenlenen genleri gruplandıran metagenler olarak yorumlanmasına izin vererek genomik verilere negatif olmayan matris çarpanlarına ayırmanın (NMF) uygulamasını tartışır. Bu faktörler, teknik faktörleri yakalamanın yanı sıra biyolojik yolları veya hücre tipine özgü genleri temsil edebilir. NMF, genleri metajenler halinde gruplandırarak ve bu metajenleri kullanarak hücre ifadesini özetleyerek, hücre kimliğinin kantitatif bir tanımına ve çoklu veri setlerinde hücre tiplerinin ve durumlarının tanımlanmasına izin verir. Metagenlerin yorumlanabilirliği ayrıca teknik sinyallerin tanımlanmasına ve bunların veri kümelerindeki biyolojik sinyallerden ayrıştırılmasına da izin verir.

  • 00:50:00 Bu bölümde konuşmacı, optimizasyon probleminin maddesini matematiksel olarak nasıl çözdüklerini ve bazı önemli avantajları olan ve bir yakınsama garantisi sağlayan blok koordinat inişine dayalı yeni bir algoritma türettiklerini tartışır. Negatif olmayan en küçük kareler problemini çözmek için verimli bir algoritma kullanırlar ve analizin genel sağlamlığını artırmak için sonraki adımları gerçekleştirirler. Konuşmacı daha sonra, hücreleri donörden ziyade hücre tipine göre kümelemek için insan donörler arasında tek hücreli RNA-seq verilerini nasıl entegre ettiklerine dair bir örnek vererek, özün ana hücre tiplerini tanımlıyor ve hücrelerin nasıl benzer ve farklı olduğuna dair içgörüler sunuyor. insan bağışçıları

  • 00:55:00 Bu bölümde, konuşmacı tek hücreli veri entegrasyonunun farklı uygulamalarını tartışıyor. Bir örnek, bir doku içindeki hücre tiplerinin uzamsal konumlarını tanımlamaya yardımcı olabilen ve doku mimarisine ilişkin içgörüler sağlayabilen uzamsal ve tek hücreli veri setlerinin entegrasyonudur. Konuşmacı, farklı uzamsal konumlara sahip iki astrosit alt tipini tanımlamak için fare beyninden bir veri seti kullanarak bir örnek veriyor ve bu da nöral devrelerin birlikte nasıl çalıştığına dair fikir veriyor. Diğer bir önemli uygulama, tek hücrelerden çok omik veri kümelerini entegre etmektir; bu, veri kümelerinin ne örnekleri ne de özellikleri paylaşması nedeniyle zordur. Konuşmacı, epigenom verilerini gen düzeyindeki özelliklere dönüştürerek ve bunları gen ifadesiyle ilişkilendirerek bu veri kümelerini birbirine bağlama stratejisini açıklıyor.

  • 01:00:00 Bu bölümde konuşmacı, farklı bağlamlarda hücresel kimliği daha iyi anlamak için transkriptomik ve epigenomik profilleri bağlamak için bütünleştirici negatif olmayan matris çarpanlara ayırmanın (iNMF) nasıl kullanılabileceğini tartışıyor. Konuşmacı, fare korteksinden ve insan kemik iliğinden alınan verileri kullanarak, gen ekspresyonu ve metilasyon verilerinin bağlanmasının hücre tiplerinin daha net anlaşılmasını sağlayabileceğini ve hatta belirsiz etiketlere sahip hücre tiplerini nasıl tanımlayabildiğini gösteriyor. Ek olarak, konuşmacı yeni veriler bir akış biçiminde geldikçe hesaplamaları kademeli olarak güncelleyerek iNMF problemini daha büyük veri kümelerinde çözmek için bir çevrimiçi öğrenme algoritmasının nasıl kullanılabileceğini açıklar.

  • 01:05:00 Bu bölümde öğretim görevlisi, özellikle büyük veri kümeleri için derin öğrenmede mini toplu iş yaklaşımı kullanmanın faydalarını tartışıyor. Bu yaklaşım, ağırlıkların yinelemeli bir güncellemesine izin verir ve tüm veri setini bellekte depolamak zorunda kalmayarak daha hızlı yakınsama sağlar. Öğretim görevlisi, mini yığının özellikle yararlı olduğu üç senaryonun ana hatlarını çizer ve temel avantajı, önceki veri kümelerini yeniden analiz etmek zorunda kalmadan yeni veri kümelerini geldikçe dahil edebilmedir. Öğretim görevlisi ayrıca, parametreler açısından asimptotik olarak aynı çözüme yakınsayan bir vekil işlevi optimize etmek için çevrimiçi sözlük öğrenimi üzerine bir makaledeki mevcut teoriden yararlanarak bu yaklaşımın arkasındaki bilgisayar bilimini tartışır. Sonuç olarak, bu yaklaşım pratikte iyi çalışır ve daha büyük bir veri kümesindeki her ek hücrenin fazlalığı nedeniyle çok daha hızlı yakınsar.

  • 01:10:00 Bu bölümde, konuşmacı, büyük veri kümelerini analiz etmek için boyut indirgeme yöntemlerinde çevrimiçi algoritmaları kullanmanın avantajlarını tartışıyor. Konuşmacı, yaygın olarak kullanılan diğer yöntemlere karşı yaklaşımlarının bir karşılaştırmasını sunarak, önemli ölçüde daha düşük bellek kullanımına sahip olduğunu ve daha fazla zaman verimli olduğunu gösteriyor. Çevrimiçi algoritmayı kullanarak çarpanlara ayırmada yeni veri kümelerini dahil ettikleri Brain Initiative Cell Census Network tarafından üretilen verileri kullanarak yöntemin yinelemeli iyileştirme kabiliyetini gösterirler. Ayrıca, inmf algoritmasının, özelliklerin kısmen örtüştüğü bir duruma nasıl genişletilebileceğini, veri kümelerinde hem paylaşılan hem de paylaşılmayan özelliklerin kullanılmasına izin vererek nasıl genişletilebileceğini gösterirler; bu, özellikleri hizalamaya zorlayan daha önce kullanılan yöntemlerden daha tatmin edici bir yaklaşımdır.

  • 01:15:00 Bu bölümde, konuşmacı, bazı özellikler veri kaynaklarından yalnızca birinde mevcut olsa bile, bir veri kümesinde bulunan tüm özelliklerden yararlanmak için bir algoritmanın nasıl kullanılabileceğini açıklar. Algoritma, gen ifadesinin daha eksiksiz bir resmini vermek için RNA dizisi ve ATAC dizisi verileri gibi farklı veri türlerini entegre etmek için kullanılabilir, bu da kümeleri veya hücre profillerini çözme yeteneğini geliştirebilir. Konuşmacı ayrıca, tek hücreli ifade verilerinden gerçekçi hücre profilleri oluşturmak için varyasyonel otomatik kodlayıcıların (VAE'ler) ve üretken rakip ağların (GAN'lar) güçlü yanlarını birleştiren Michigan adlı yeni bir yaklaşımı da tanıtıyor. Algoritma, hücre kimliğindeki değişiklikleri manipüle etmek ve tahmin etmek için güçlü bir yaklaşım oluşturmak üzere VAE'nin çözme performansını ve GAN'ın oluşturma performansını kullanır.

  • 01:20:00 Bu bölümde konuşmacı, alana ilgi duyan öğrencilere mentorluk yapmak istediğini ifade eder ve dinleyicilere derse katıldıkları için teşekkür eder. Moderatör, dinleyicilerin bir şeyler öğrenip öğrenmediğini ve dinleyicilerin olumlu yanıt verip vermediğini kontrol etmek için hızlı bir anket yapar. Genel olarak, ders iyi karşılandı ve bilgilendirici oldu.
Dimensionality Reduction - Lecture 11 - Deep Learning in Life Sciences (Spring 2021)
Dimensionality Reduction - Lecture 11 - Deep Learning in Life Sciences (Spring 2021)
  • 2021.03.31
  • www.youtube.com
MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisGuest Lecture: Joshua WelchDeep Learning in the Life Sciences / Computational Systems B...
 

Hastalık Devre Diseksiyonu GWAS - Ders 12


Hastalık Devresi İncelemesi GWAS - Ders 12 - Yaşam Bilimlerinde Derin Öğrenme (Bahar 2021)

Hastalık devre diseksiyonu GWAS hakkındaki bu video, insan genetiğinin temellerini, yorumlama için hesaplama zorluklarını ve genom çapında ilişkilendirme çalışmalarında (GWAS) incelenen çeşitli genetik varyasyon türlerini kapsar. Video ayrıca Mendel haritalaması, bağlantı analizi ve hastalıklarla ilişkili tek nükleotid polimorfizmlerinin (SNP'ler) tanımlanması gibi metodolojileri de araştırıyor. Ek olarak, konuşmacı, hastalık fenotipleri ile önemli ölçüde ilişkili genomik bölgeleri görselleştirmek için ki-kare istatistiklerinin, Manhattan grafiklerinin ve QQ grafiklerinin kullanımını tartışır. Videoda ayrıca FTO geni ve bunun obezitedeki mekanik etkileri açısından nasıl kapsamlı bir şekilde incelendiği hakkında bir vaka çalışması da yer alıyor. Obezite ile genetik ilişkiyi anlamanın zorlukları ve bu konuya yaklaşım adımları da tartışılmaktadır.

Ders, genomik varyasyonların insan sağlığı üzerindeki etkisini incelemenin zorluğunu ve mutasyonların farklı hücre tiplerini nasıl etkilediğini anlamanın önemini tartışıyor. Konuşmacı, özellikle transkripsiyon faktörlerinin bağlanmasını ve kromatinin organizasyonunu tahmin etmeyle ilgili olarak, genomik sekans ve varyasyonların etkisini tahmin etmeye yönelik derin öğrenme yaklaşımlarını ana hatlarıyla açıklıyor. Ayrıca, DNA duyarlılığını ve histon işareti QTL'lerini tahmin etmek için derinlemesine sıralanmış genomik veri kümelerini kullanarak bu tahminlere ilişkin değerlendirmelerini ve ayrıca mutasyonların gen ekspresyonu ve otizm gibi insan hastalıkları üzerindeki etkisini tahmin etmek için derin öğrenmeyi kullanımlarını açıklıyorlar. Son olarak, önceden bilinen gen setlerinin tarafsız analizlerini ve derin öğrenme dizisi model kitaplığının kullanımını tartışıyorlar.

  • 00:00:00 Videonun bu bölümünde, konuşmacı insan genetiğinin temellerini ve yorumlamadaki sayısal zorlukları tartışıyor. Genetik varyasyonların genom çapında ilişkilendirme çalışmaları (GWAS) aracılığıyla nasıl tanımlandığını ve hastalıklara katkıda bulunan bireysel genetik varyantların nasıl bulunduğunu açıklarlar. Ders ayrıca genetik gen avcılığını ve bağlantı ve GWAS'ın hastalıklarla ilişkili yerleri tanımak için kullanımını da kapsar. Derin değişkenler ve derin deniz de dahil olmak üzere değişken yorumlama için hassas haritalama, vaka incelemeleri ve makine öğrenme araçlarının zorlukları da tartışılmaktadır. Antik Yunan'dan başlayıp Darwin'in dönüşüm ve doğal seçilim kavramını geliştirmesine kadar devam eden insan genetiği ve kalıtım örüntülerinin tarihi kısaca ele alınmaktadır.

  • 00:05:00 Bu bölümde konuşmacı, Mendel'in ayrık kalıtımı ile fenotipik özelliklerde gözlenen sürekli varyasyon arasındaki uzlaşmayı tartışıyor. Mendel tarafından tanıtılan parçacıklı kalıtım kavramı, baskın veya resesif olan genler olarak adlandırılan ayrı kalıtım birimleri olduğunu gösterdi. Bununla birlikte, insanlarda gözlemlenen sürekli varyasyonun biyometrisi, Mendel kalıtımı ile açıklanamadı. Bu, 1900'lerin başında istatistikçilerin sürekli değişimin birden çok Mendel lokusu tarafından açıklanabileceğini gösteren çalışmalarıyla değişti. Bu, sonunda kromozomların ve DNA'nın genetik materyali taşıdığının anlaşılmasına yol açan Mendel özellik haritalamasının temeli oldu. Ek olarak, konuşmacı, bağımsız çeşitlilik kuralından sapmanın nasıl insan genetiğinin beygiri haline geldiğini ve kromozomda fiziksel olarak yakın olan özelliklerin nasıl birlikte kalıtılma eğiliminde olduğunu tartışıyor.

  • 00:10:00 Bu bölümde, konuşmacı, farklı özelliklerin kodlandığı insan genomu bölgelerinin izini sürmek için farklı özelliklerin bağlantı ve ayrışma frekansını kullanan Mendel haritalaması olarak bilinen geleneksel genetik haritalama yaklaşımını tartışıyor. Ancak, bu yaklaşım yalnızca güçlü bir etkiye sahip özellikler için etkilidir. Konuşmacı daha sonra 2000'lerde, daha önce geleneksel bağlantı yöntemleri kullanılarak yapılan analizlerden etkilenmeyen zayıf etki varyasyonlarının haritasını çıkarma becerisine yol açan devrimden bahsediyor. Bu, genomdaki her bir SNP'ye ve bunların farklı hastalıklarla nasıl değiştiğine bakan genom çapında ilişkilendirme çalışmaları (GWAS) aracılığıyla gerçekleştirildi. Konuşmacı, SNP'ler, indeller, SDR'ler, yapısal varyantlar ve kopya numarası varyantları dahil olmak üzere GWAS'ta incelenen varyasyon türlerini ve bu varyasyonların genomun işlevselliğini nasıl etkileyebileceğini açıklamaya devam ediyor.

  • 00:15:00 Bu bölümde konuşmacı, Genom Çapında İlişkilendirme Çalışmalarının (GWAS), yani en yaygın genetik varyasyon türü olan Tek Nükleotid Polimorfizmlerini (SNP'ler) tanıtıyor. SNP'lerin iki aleli vardır ve her değişken kümelenmiş ve dbSNP adı verilen bir veritabanına yerleştirilmiştir. Konuşmacı ayrıca steno ve tekrarlar, eklemeler ve çıkarmalar ve daha fazlası gibi diğer varyasyon türlerini tartışır. Ek olarak, nadir varyantlar güçlü etki varyasyonunun incelenmesine izin verdiğinden, yaygın ve nadir varyantlar arasındaki fark açıklanır. İnsanların 23 kromozom, 20.000 gen, 3 milyar DNA harfi ve milyonlarca polimorfik bölgeden oluşan iki genom kopyasına sahip olduğu göz önüne alındığında, hastalık genlerini bulmanın zorluğu vurgulanmaktadır.

  • 00:20:00 Bu bölümde öğretim görevlisi, genetikteki yaygın ve nadir değişkenler arasındaki farkı ve bunların genom çapında ilişkilendirme çalışmaları ve Mendel analizi ile ilişkisini açıklar. Nadir varyantlar büyük bir etkiye sahiptir ve çoğunlukla Mendel analizinde bulunurken, yaygın varyantlar küçük bir etkiye sahiptir ve genom çapında ilişkilendirme çalışmaları ile yakalanabilir. Ek olarak, bağlantı analizi, kromozomlar arasındaki belirteçleri inceleyerek ve hangilerinin bir popülasyondaki fenotip ile ortak kalıtsal olduğunu görerek bir bozukluğa neden olan bir genin yerini belirlemeye yardımcı olabilir.

  • 00:25:00 Bu bölümde konuşmacı, şizofreni, obezite veya diyabet gibi durumları incelemek için kabaca %50 vaka ve %50 kontrol olmak üzere binlerce bireyi bir araya getiren genom çapında ilişkilendirme çalışmalarını tanıtıyor. Bu çalışmalar tipik olarak güç elde etmek için vakaları aşırı temsil eder ve dizilemeye kıyasla ucuz maliyeti nedeniyle genotipleme teknolojisi kullanılır. Konuşmacı, sonuçların doğruluğunu sağlamak için hem örneklerde hem de SNP'lerde kalite kontrolün önemini vurgular. Buna ek olarak, konuşmacı nüfus belgelendirme kavramını ve çalışmadaki bireyler arasındaki akrabalığın ortadan kaldırılması gereğini açıklar.

  • 00:30:00 Bu bölümde konuşmacı, genom çapında ilişkilendirme çalışmasında (GWAS) gerçek hastalık sinyallerini tespit etmek için ki-kare istatistiğinin ve p-değeri dağılımının nasıl kullanılacağını açıklar. Konuşmacı, kaç vaka ve kontrolün her bir SNP'nin alelini taşıdığını gösteren bir beklenmedik durum tablosu kullanarak vakalar ve kontroller arasındaki alellerin frekansındaki sapmaları arar. Ki-kare istatistiği, sapmanın büyüklüğünü ölçer ve p-değeri, alelin fenotip üzerinde hiçbir etkisinin olmadığı hipotezini reddetmek için kullanılır. Konuşmacı daha sonra, hastalık fenotipi ile önemli ölçüde ilişkili olan genomik bölgeleri görselleştirmek için bir Manhattan çiziminde p değerlerinin nasıl çizileceğini açıklar.

  • 00:35:00 Bu bölümde konuşmacı, bir SNP'nin bir hastalıkla rastgele ilişkilendirilmiş olasılığının eksi log 10 p değerini gösteren Manhattan grafiğinin yanı sıra p değerlerini karşılaştıran QQ grafiğinin kullanımını tartışır. test edilmiş milyonlarca SNP. Bunları, SNP'lerin rolünü diğer yollarla incelemek için fonksiyonel analiz izler. Genom çapında anlamlılık düzeyi, 20 yıl önce bir zarfın arkası hesaplamasına dayalı olarak kurulan eksi 8'in gücüne 5 çarpı 10 olarak ayarlanmıştır. Bununla birlikte, tüm SNP'lerin bağımsız olarak ayrılması için yeterli zamana sahip olmayan insan popülasyonundaki sınırlı genetik çeşitlilik nedeniyle hassas haritalama zor olabilir.

  • 00:40:00 Bu bölümde öğretim görevlisi, varyantların izole edilmek yerine nasıl bloklar halinde kalıtıldığını tartışır, yani bir bloktaki bir varyantın belirli bir aleli varsa, o bloktaki her varyantın aynı aleli vardır. Bir bölgede bir ilişki bulduktan sonraki adım, ilişkiden hangi tek nükleotid polimorfizminin (SNP) sorumlu olduğunu belirlemektir. Bir Crohn hastalığı çalışması, hem bağlantı analizi hem de genom çapında ilişkilendirme çalışmaları tarafından tespit edilen bir bölge bulurken, başka bir bölge yalnızca ikincisi tarafından bulundu. Öğretim görevlisi, her bölgenin risk alelinin sıklığını ve etki büyüklüğünü açıklar.

  • 00:45:00 Bu bölümde konuşmacı, koruyucu alellerin nadirliğini ve bunları vaka kontrolü ve kohort çalışmaları yoluyla keşfetmenin zorluklarını tartışıyor. Vakaları büyük ölçüde zenginleştiren çalışmalarda riski azaltan daha nadir alellerin bulunma olasılığının düşük olduğunu ve bu tür çalışmalar için gerekli aile soyağacının mümkün olmadığını açıklıyorlar. Konuşmacı ayrıca GWAS'ın yakaladığı yaygın değişkenler ile bağlantı analizinin yakaladığı nadir, güçlü etki alelleri arasındaki farkı da açıklar. Bu bölüm, haplotiplere ve rekombinasyon sıcak noktalarına kısa bir genel bakışla, bunların popülasyonlar arasındaki varyasyonları ve rekombinasyon olaylarına rehberlik etmede prdm9'un önemi ile sona ermektedir. Son olarak, konuşmacı, obezite veya vücut kitle indeksi için en güçlü GWAS isabeti olan ve mekanik etkileri için kapsamlı bir şekilde incelenen FTO geni üzerine bir çalışma sunuyor.

  • 00:50:00 Dersin bu bölümünde, konuşmacı obezite ile genetik ilişkiyi anlamanın zorluklarını tartışıyor ve bu konuya yaklaşım adımlarını özetliyor. İlk adım, çeşitli dokuların epigenomik ek açıklamalarının incelenmesiyle gerçekleştirilen ilgili doku ve hücre tipini belirlemektir. İkinci adım, uzun menzilli bağlama ve döngüleme ile karmaşık hale gelen akış aşağı hedef geni bulmaktır. Konuşmacı, homozigot riskli ve risksiz bireylerde farklı genlerin ekspresyonunun ölçülmesinin, FTO geninin kendisinin ekspresyonda herhangi bir değişiklik göstermediğini, bunun yerine FTO'dan uzakta bulunan IRX3 ve IRX5 genlerinin muhtemelen hedef genler olduğunu ortaya koyduğunu açıklıyor.

  • 00:55:00 Bu bölümde konuşmacı, düzenleyici motif analizi ve evrimsel koruma kullanarak obezite ile ilgili kodlayıcı olmayan lokuslar için hedef genleri nasıl tanımlayabildiklerini ve nedensel SNP'yi nasıl anladıklarını anlatıyor. Yukarı akış regülatörünü ve SNP'yi bozarak, ikisi arasındaki epistasisi ve bunun baskı ve baskıyı azaltmayı nasıl etkilediğini gösterebildiler. Konuşmacı, motifi bozmanın baskıyı azalttığını ve güçlendiricilerin aşırı aktif hale geldiğini, bunun da gen ekspresyon seviyesinde rx3 ve rx5'in aşırı aktivasyonuna yol açarak enerji dağılımından depolamaya geçişe neden olduğunu açıklıyor. Bir model oluşturarak ve genom düzenlemeyle, hiçbir şey bilmedikleri bir ilişki bölgesinden biyolojik süreci ve hedef genleri anlamaya ve devreyi değiştirmek için müdahale etmeye geçebildiler.

  • 01:00:00 Dersin bu bölümünde konuşmacı, bireylerde var olan çok sayıda genom varyasyonunun etkisini incelemenin zorluğunu ve genomik dizi ve mutasyonların farklı hücre tiplerini nasıl etkilediğini daha iyi anlamanın önemini tartışıyor. insan sağlığı. Konuşmacı, genomik dizi ve varyasyonların etkisini tahmin edebilen modeller oluşturmak için genomik diziyi ve büyük miktarda işlevsel genomik veriyi kullanmak için bir makine öğrenimi yaklaşımı benimsediklerini açıklıyor. Spesifik olarak, konuşmacı, bireysel transkripsiyon faktörlerinin bağlanmasını ve genomik dizilere dayalı kromatinin organizasyonunu tahmin etme çalışmalarını tartışır. Derin öğrenme tekniklerini kullanarak bir seferde 120.000 genom varyasyonunun etkisini tahmin etmek için sistematik bir yöntem geliştirmeyi hedefliyorlar.

  • 01:05:00 Bu bölümde, konuşmacı üç gereksinimi karşılayan bir düzenleyici dizi modeli oluşturmak için derin bir evrişimli ağ modeli kullanma kararlarını tartışıyor: büyük dizileri ve uzun dizi bağlamını kullanma yeteneği, doğrusal olmayanı modelleme yeteneği dizinin farklı bölgeleri arasındaki etkileşimler ve tüm farklı görevlerde öğrenilen dizi özelliklerini paylaşma yeteneği. Konuşmacı, modelin alt seviyelerde farklı dizi özellikleri seviyeleri öğrendiğini ve daha yüksek seviyelerde daha yüksek sıralı dizi örüntülerini öğrendiğini açıklar. Ayrıca, konuma özgü tahminler yaparken mekansal bilgileri korumanın önemini de vurguluyorlar. Model, herhangi bir genomik varyantın etkisini tahmin etmek için, modele yalnızca bir varyantla farklılık gösteren iki dizi vererek ve her alel için tahminleri karşılaştırarak kullanılabilir.

  • 01:10:00 Bu bölümde konuşmacı, kromatin düzeyinde DNA duyarlılığını etkileyen değişkenler için tahminlerinin doğruluğunu nasıl değerlendirdiklerini anlatıyor. Derin dizilimli genomik veri setlerini analiz ettiler ve bir alelin diğerinden önemli ölçüde daha fazla temsil edildiği, potansiyel DNA duyarlılığı farklılıklarını gösteren heterozigot varyantları aradılar. Hem referans hem de alternatif aleller için DNA duyarlılığını tahmin etmek için bir model geliştirdiler ve tahminleri deneysel sonuçlarla karşılaştırdılar. Modelin, referans ve alternatif aleller arasında daha güçlü farklara sahip varyantları tahmin etmede daha yüksek doğruluğa sahip olduğunu ve varyantları daha güvenle tahmin ettiğini bulmuşlardır. Değerlendirme, yanlış pozitiflere karşı sağlamdı ve gerçek pozitifleri filtrelemelerine izin verdi. Ayrıca bu yaklaşımı histon işareti QTL'lerine uyguladılar ve daha yüksek histon işaretleri ile bağlantılı aleli tahmin edebildiklerini keşfettiler.

  • 01:15:00 Bu bölümde konuşmacı, varyantların gen ifadesi üzerindeki moleküler düzeydeki etkilerini tahmin etmek için derin öğrenmeyi nasıl kullanabileceklerini tartışıyor. Daha büyük düzenleyici dizileri dikkate alma ihtiyacı ve daha az sayıda eğitim örneğine sahip olma gibi zorluklarla karşı karşıya kalıyorlar. 40 kilobaytlık geniş bir bölgeye bakarak ve farklı konumlarda tahmin yapmak için önceden eğitilmiş bir model uygulayarak bu zorlukları ele alıyorlar. Daha sonra düzenli bir lineer model kullanarak her bir gen ekspresyon profili tahmininden gen ekspresyonuna pürüzsüz bir katkı modeli eğitirler. Bu yaklaşım sayesinde, farklı mutasyonların etkisini ve benzer bir mekanizma ile aynı hastalığa nasıl neden olabileceklerini tahmin edebiliyorlar. Gen ifadesini tahmin etme sorunu çözülmekten uzak olsa da, bunu ele almak için ilk girişimi yaptılar.

  • 01:20:00 Bu bölümde konuşmacı, genomik değişkenlerin otizm gibi insan hastalıkları üzerindeki etkisini tahmin etmek için derin öğrenmenin kullanımını tartışıyor. Kodlamayan mutasyonların tespit edilmesinin ve hastalığa atfedilmesinin zor olduğunu açıklıyorlar. Bununla birlikte, mutasyonların kromatin profilleri ve protein bağlanma profilleri üzerindeki etkisini tahmin etmek için modeller kullanarak, otizmli bireylerin mutasyonlarını etkilenmemiş kardeşleriyle karşılaştırabildiler. Araştırmacılar, otizmli bireylerde otizmle ilişkili genler üzerinde, etkilenmeyen kardeşlerine kıyasla daha güçlü bir etki olduğunu buldular, bu da kodlamayan mutasyonların hastalığa katkısını doğruladı.

  • 01:25:00 Bu bölümde konuşmacı, kodlayıcı olmayan mutasyonların katkısını belirlemek için önceden bilinen gen setlerini kullanan tarafsız bir analizi tartışıyor. Bir gen ağındaki kardeş mutasyonlara kıyasla sorunlu mutasyonlarda daha güçlü etkiler aramak için ağ komşuluğu tabanlı bir analiz kullanırlar. Bu analiz, daha önce otizmli bireylerde keşfedilen kodlama mutasyonlarında belirtilmiş olan, sinapsla ilişkili ve kromatin düzenlemesiyle ilişkili gruplar halinde kümelenmiş genlerle, kodlama ve kodlama yapmayan mutasyonlar tarafından belirtilen mekanizmaların yakınsamasını göstermektedir. Konuşmacı ayrıca dizi modellerini eğitmek ve değerlendirmek için kullanılabilecek bir derin öğrenme dizisi modeli kitaplığından da kısaca bahseder.
Disease Circuitry Dissection GWAS - Lecture 12 - Deep Learning in Life Science (Spring 2021)
Disease Circuitry Dissection GWAS - Lecture 12 - Deep Learning in Life Science (Spring 2021)
  • 2021.04.08
  • www.youtube.com
MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep Learning in the Life Sciences / Computational Systems BiologyPlaylist: https://you...
 

GWAS mekanizması - Ders 13



GWAS mekanizması - Ders 13 - Yaşam Bilimlerinde Derin Öğrenme (Bahar 2021)

Yaşam Bilimlerinde Derin Öğrenme serisindeki GWAS mekanizması üzerine ders, karmaşık özelliklerde yer alan kodlamayan genetik varyantların işlevini anlamak için çeşitli yöntemlere bakar. Ders, belirli bir hastalık için genetik olarak ilişkili bölgelerdeki küresel özellikleri tanımlamak için epigenomik açıklamaların ve derin öğrenme modellerinin kullanımını tartışır. Ayrıca, farklı dokular ve arttırıcılar arasındaki zenginleştirmeleri kapsar ve bunların bir lokus içindeki nedensel SNP'yi tahmin etmek için ampirik öncüllere nasıl dönüştürülebileceğini açıklar. Ders ayrıca genom çapında ilişkilendirme çalışmalarında nedenselliği incelemek için gen ifadesi ve metilasyon gibi ara moleküler fenotiplerin kullanımını ve ifadenin fenotipik değişkenini açıklamak için genotip ve ifade kişisel bileşenlerinin nasıl birleştirileceğini tartışır. Son olarak, ders nedensel ve nedensel olmayan yolları belirlemek için bir değişkeni değiştirmenin sonuç değişkenleri üzerindeki etkisini belirlemek için nedensel çıkarım yöntemlerinin kullanımını inceler.

Bu videodaki öğretim görevlisi, genomik araştırmalarda nedensel etkilerin çıkarımını yapmak için çeşitli teknikleri tartışıyor. Nedensel ilişkiler kurmanın bir yolu olarak d-ayrımı ve genetikte doğal randomizasyonun kullanılması kavramını kapsarlar. Öğretim görevlisi ayrıca nedensel çıkarım için potansiyel sonuç yöntemiyle birlikte Mendel rastgeleleştirme ve Rubin'in Yarı Çıkarım Modelini tartışır. Gözlemsel araştırmalarda isnat ve önyargılara uyum sağlamanın zorluklarına değiniyorlar. Konuşmacı ayrıca sağlam bir nedensel algoritma geliştirmek için çoklu ortogonal kanıt kullanmanın önemini vurguluyor. Ek olarak, gen ifadelerini bozmak ve ağları öğrenmek için genetiğin kullanımını açıklarlar ve verilerdeki nedensel yapıları tanımlamanın bir yolu olarak değişmezlik koşulunu sunarlar. Ders, nedensel çıkarım için genom araştırmalarında kullanılan çeşitli teknikler ve araçlara kapsamlı bir genel bakış sunar.

  • 00:00:00 Bu bölümde, İngiliz Üniversitesi'nden Misafir Öğretim Üyesi Profesör Yong Jin Park ile ders, önceki oturumdaki tartışmayı epigenomik zenginleştirmeler, eQTL'ler gibi küresel değişkenleri ve arabuluculuk ve nedensellik çalışmasını anlamaya yönelik olarak genişletmeye odaklanır. Kolombiya. Ders, ince haritalamayı ve lokus mekanistik diseksiyonunu kısaca gözden geçirmeyi ve ardından eylem düzenleyicilerin dokularını, hücre tiplerini ve hedef genleri anlamak için epigenomik kullanarak global zenginleştirme analizi için farklı yöntemleri incelemeyi planlıyor. Ayrıca ders, fenotipleri tahmin etmek için genom çapında ilişkilendirme çalışmalarında kullanılan lineer karışık modellere ve poligenik risk puanlarına ve Perşembe günkü derste kalan konulara geçiş için kalıtım derecesine bakacaktır. Nihai hedef, binlerce genetik lokusta eş zamanlı olarak manhattan grafiklerindeki her zirvenin arkasındaki fonksiyonel itici güçleri ve mekanik temelleri anlamaktır.

  • 00:05:00 Dersin bu bölümünde eğitmen, öncelikle kodlamayan değişkenler tarafından yönetilen karmaşık özellikler için hastalık mekanizmalarını anlamak için genetiği kullanmanın zorluğunu tartışıyor. Bu zorluğun üstesinden gelmek için eğitmen, belirli bir özellik için genetik olarak ilişkili tüm bölgelerdeki genel özellikleri tanımlamak için hücre devresinin epigenomik ek açıklamalarını ve derin öğrenme modellerini kullanmayı önerir. Eğitmen, boy ve tip 1 diyabet gibi farklı özelliklerdeki zenginleşme farklılıklarını karşılaştırarak, tüm bölgeleri kapsayan özellikleri öğrenebileceklerini ve bunları tek tek lokusların özelliklerini anlamak için kullanabileceklerini öneriyor. Bu yaklaşım, hastalığa tarafsız bir bakış açısı sağlayabilir ve hedef genlerin, terapötiklerin ve kişiselleştirilmiş tıbbın tahmin edilmesine yardımcı olabilir.

  • 00:10:00 Bu bölümde, konuşmacı bir hipergeometrik veya iki terimli istatistiksel test kullanarak önemli zenginleşme aramak için genetik varyantlar ve dokuya özgü arttırıcılar arasındaki örtüşmeyi değerlendirme sürecini açıklıyor. Farklı özelliklerle ilişkili genetik varyantların, bu dokularda aktif olan güçlendiriciler arasında dokuya özgü zenginleşme gösterdiğini bulmuşlardır. Örneğin, boy ile ilişkili genetik varyantlar, embriyonik kök hücre arttırıcılarda zenginleştirilirken, kan basıncıyla ilişkili genetik varyantlar, sol ventrikülde etkili olan arttırıcılarda zenginleştirildi. Ayrıca, Alzheimer hastalığının beyinde aktif güçlendiriciler için küresel olarak zenginleştirilmediğini, bunun yerine beynin bağışıklık hücrelerinde, özellikle CD14+ hücrelerinde aktif güçlendiriciler için zenginleştirildiğini de keşfettiler. Bu, onların Alzheimer ile ilişkili genetik varyantların öncelikle beynin bağışıklık hücrelerinde hareket ettiğini varsaymalarına yol açtı. Artık hastalıkla ilişkili hangi genetik varyantların işlevsel olma olasılığının daha yüksek olduğunu belirlemek için bu bilgiyi Bayesçi bir çerçevede kullanabilirler.

  • 00:15:00 Dersin bu bölümünde konuşmacı, gözlemlenen zenginleşmelerin GWAS'ta kullanılabilecek ampirik önsellere nasıl dönüştürüleceğini tartışır. Konuşmacı, Crohn Hastalığı ve Alzheimer örneğini kullanarak, belirli bölgelerde zenginleşen bir hastalıkla ilişkili genetik varyantların, belirli bir lokus içindeki nedensel SNP'yi tahmin etmek için bir öncül olarak kullanılabileceğini açıklıyor. Daha sonra, her varyant için bir sonsal olasılık oluşturmak amacıyla bu önceliğin GWAS özet istatistiklerinden elde edilen kanıtlarla nasıl birleştirilebileceğini açıklarlar. RIVIERA olarak adlandırılan bu yöntemin etkinliği, önceliklendirdiği SNP'lerin evrimsel olarak korunma olasılığının daha yüksek olması ve eQTL'lerde ve dijital genom ayak izlerinde bulunmasıyla kanıtlanmıştır.

  • 00:20:00 Dersin bu bölümünde, konuşmacı, genetik varyantlar ve özellikler arasında son derece spesifik ilişkiler kurmak için zenginleştirilmiş güçlendiricilerin kullanılmasını tartışıyor. Konuşmacı, bu özellikleri üst üste geldikleri güçlendiricilerle eşleştirerek, bu lokuslarla ilişkili biyolojik fonksiyonları daha iyi anlamak için genetik lokusların belirli dokulara bölünmesini tartışır. Konuşmacı, bunun karmaşık özellikleri daha basit bileşenlere bölmek ve belirli dokulardaki güçlendiricilere olan yakınlıklarına göre lokusları önceliklendirmek için nasıl kullanılabileceğini vurgular. Konuşmacı ayrıca, farklı dokular ve hedef genlerle örtüşen koroner arter hastalığı ile ilişkili birkaç lokus örneği sağlar. Ek olarak, konuşmacı genom çapında bir öneme sahip olmayan yeni lokusların da nasıl çalışılabileceğini ve belirli dokulara nasıl haritalanabileceğini tartışıyor.

  • 00:25:00 Bu bölümde öğretim görevlisi, genom çapında anlamlılıktan daha az önemli olan eşik altı lokuslara öncelik vermek ve genom çapında önemli olanlardaki özellikleri öğrenerek yeni lokusları keşfetmek için bir makine öğrenimi yaklaşımını nasıl kullandıklarını açıklıyor. . Kalp repolarizasyonu ile ilişkili birçok lokus keşfettiler ve bunların özelliklerini, deneysel testlerden elde edilen ek kanıt satırlarıyla eşik altı değişkenlere öncelik vermek için öngörücüler olarak kullandılar. Bu yaklaşım kullanılarak önceliklendirilen genlerin, ilgili genom ilişkilendirme çalışmaları için güçlü bir şekilde zenginleştirildiğini ve kalp iletimi ve kasılma fenotipleri ile güçlü bir korelasyon ile anlamlı olan hedef genlerle bağlantılı olduğunu bulmuşlardır. Ayrıca, ara moleküler fenotiplere bakarak genetik varyasyon ve hastalık arasındaki boşluğu kapatmak için ifade kantitatif özellik lokuslarını nasıl kullandıklarını tartıştılar.

  • 00:30:00 Bu bölümde konuşmacı, genom çapında ilişkilendirme çalışmalarında nedenselliği incelemenin bir yolu olarak, ara moleküler özelliklerin, özellikle bir genin ifade düzeyinin veya belirli bir bölgenin metilasyon düzeyinin kullanımını tartışıyor. Amaç, hangi özelliklerin hastalığın bir sonucu olanlara karşı genetiğin bir sonucu olduğunu belirlemek için belirli dokulara, genomik mekanizmalara, gen ekspresyon değişikliklerine ve endofenotiplere odaklanmaktır. Metilasyon kantitatif özellik lokuslarının ve ifade kantitatif özellik lokuslarının temeli, yükseklik gibi kantitatif özelliklerin ölçülmesi ve alternatif alellerin sayısı ile metilasyon seviyesi veya yakınlardaki bir genin ekspresyon seviyesi arasında ilişki kurulmasıdır. Bu yaklaşım, on binlerce metilasyon qtl'sinin keşfedilmesine yol açmıştır ve bu ara moleküler fenotiplerin atfedilmesi, metilasyonu tahmin etmeye ve bunu hastalıkla ilişkilendirmeye yardımcı olabilir.

  • 00:35:00 Bu bölümde video, genotip güdümlü metilasyon ile Alzheimer hastalığı gibi fenotipler arasındaki korelasyonları keşfetmek için daha büyük kohortlarda atfedilen metilasyonun nasıl kullanılabileceğini tartışıyor. Atfedilen metilasyon, metilasyonun genetik bileşenidir ve bunu atfederek, araştırmacılar daha az birey kullanabilir ve genotip güdümlü metilasyonu arayabilirler, gücü artırabilir ve özellikle genetik bileşene bakabilirler. Video ayrıca, belirli durumlarda, birden fazla SNP'yi birlikte kullanırken, genomik olarak anlamlı olmayan birçok SNP'nin nasıl önemli hale geldiğine dair örnekler de gösteriyor, bu da araştırmacıların metilasyonu tahmin etmek için etkilerini birleştirmelerine olanak tanıyor.

  • 00:40:00 Yaşam bilimlerinde derin öğrenme konulu dersin bu bölümünde, konuşmacı genetik, metilasyon, transkripsiyon ve karıştırıcı çalışmalar yoluyla hastalık fenotipinin aracı faktörlerini belirlemeye yönelik bir metodolojiyi tartışıyor. Bu çeşitli faktörler ve gen ekspresyonu arasındaki ilişkiyi tahmin etmek için doğrusal regresyon modellerini kullanma sürecini açıklar, popülasyon etkileri ve parti etkileri gibi değişkenleri düzeltir ve nihai olarak metilasyon ve ekspresyon gibi ara moleküler fenotiplerin genetik sürücülerini tanımlar. Metodoloji, istatistiklerin kalibrasyonunu değerlendirmek için bir QQ grafiğini ve sonuçları yorumlamak için yaş, cinsiyet ve genotipler için temel bileşenler ve ifade gibi ortak değişkenlerin kullanımını içerir.

  • 00:45:00 Dersin bu bölümünde, ek kovaryans ve genotip içeren bir modelin ifadenin fenotipik değişkenini sadece temel modelden daha iyi açıklayıp açıklamayacağını belirlemek için genotip ve ifade kişisel bileşenlerini birleştirmeye odaklanılır. Bu, alelik analizle tamamlanabilecek bir ifade kantitatif özellik lokusu (eQTL) çalışmasının temelidir. Alelik analiz, heterozigot bireylerin okumalarını, aynı kişinin aynı hücresinden A ile bir aleli içerenler ve C ile başka bir aleli içerenler olarak ayırmayı içerir. A genotipini, C aleline göre daha yüksek bir ifadeye sahip gibi görünen bu alelin alele özgü ifadesi ile ilişkilendirerek, belirli bir SNP verildiğinde test edilen belirli bir bölgenin alele özgü etkisine bakılabilir. Ders ayrıca yanıt QTL'lerini ve bunların belirli bir çevresel koşula yanıt olarak QTL'leri belirlemedeki rolünü de kapsar.

  • 00:50:00 Bu bölümde öğretim görevlisi, gen ekspresyon seviyelerini düzenleyen genomik lokuslar olan ekspresyon kantitatif özellik lokusları (eQTL'ler) kavramını tartışır. Öğretim görevlisi, eQTL'lerin her zaman mevcut olabileceğini veya yalnızca belirli bir uyarana yanıt olarak mevcut olabileceğini açıklar. Transkript daha sonra nedensellik çıkarımı konusuna geçer; öğretim görevlisi, bir hastalıkta hangi lokusların nedensel bir rol oynadığına karşı hangi lokusların hastalık fenotipleri ile basitçe ilişkili olduğunu belirlemenin bir yolu olduğunu açıklar. Öğretim görevlisi, nedensel çıkarım alanının iki kategoriye ayrıldığını açıklıyor: nedensel etki ve nedensel keşif. Ders esas olarak nedensel etki etkisine odaklanacaktır.

  • 00:55:00 Bu bölümde, konuşmacı genetik analiz çalışırken nedensel çıkarım yöntemlerinin kullanımını tartışıyor. Nedensel çıkarım, bir x değişkenini değiştirmenin sonuç değişkeni y üzerindeki etkisini belirlemek için deneysel müdahaleleri içerir. Amaç, koşullu olasılığın girişimsel olasılığa neredeyse eşdeğer olmasını sağlamaktır. Konuşmacı ayrıca erişilebilirlik, şartlandırma, ayarlama ve ayırma kavramlarını da açıklar. Nedensel grafik dili kullanarak, araştırmacılar nedensel sorular sorabilir ve nedensel ve nedensellik karşıtı yolları belirleyebilirler. Bir arka kapı yolunun varlığı, koşullu olasılığın yorumlanmasını etkileyebilir ve korelasyonun nedenselliğe eşit olduğu yanılgısına yol açabilir.

  • 01:00:00 Bu bölümde öğretim görevlisi, genomik araştırmadaki nedensel etkiyi belirlemek için vektör değişkenleri arasındaki arka kapı yolunu engelleme kavramını tartışıyor. D-ayrımı fikrini ortaya koyuyorlar ve belirli değişkenleri şartlandırarak çarpıştırıcı örüntüleri yaratıyorlar. Öğretim görevlisi, bir değişken yeterince basitse, araştırmacıların müdahaleler yapabileceğini ve değişkenler ile ilgilenilen değişken arasındaki bağımlılığı kırmak için rastgele değişkenler atayabileceğini açıklıyor. Öğretim üyesi, çevresel faktörlerden etkilenmediği için genetiğin genomik araştırmalarda önemli bir değişken olduğunu ve onu belirli bir değere getirmenin doğal bir randomize kontrol denemesi gibi olduğunu vurgular.

  • 01:05:00 Bu bölümde öğretim görevlisi Mendel rastgeleleştirme kavramını ve bunun genotipler, ara fenotipler ve hastalık fenotipleri arasındaki ilişkiyi anlamak için nasıl kullanılabileceğini tartışıyor. Genotipler, gerçek nedensel etkiyi tahmin etmeyi kolaylaştıracak şekilde güzel bir şekilde rasgele dağıtılmıştır. Bu yöntem büyük ölçüde varsayımlara dayansa da, gen eQTL ve gen-çevre etkileşimi çalışmalarında başarıyla uygulanmıştır. Ek olarak öğretim görevlisi, beta regresyon parametresini ve aracılık etkilerini tahmin etmenin başka bir yolunun g üzerinde y regresyonu ile g üzerinde x regresyonunun kombinasyonu olduğunu açıklar. Nihayetinde, Mendel rastgeleleştirme, gerçek hayatta manipüle edilmesi zor olan değişkenler arasındaki karmaşık ilişkileri anlamak için eşsiz bir fırsat sunuyor.

  • 01:10:00 Bu bölümde öğretim görevlisi, genom araştırmalarında nedensel etkilerin çıkarımını yapmak için iki yaklaşımı tartışıyor: Mendel Rastgeleleştirme (MR) ve Rubin'in Yarı Çıkarım Modeli. MR, bir hastalık sonucuna ilişkin randomize kontrollü bir deneme için ara değişkenleri rastgele bozmak üzere genotiplerden yararlanan randomize bir kontrol denemesidir. Bununla birlikte, bilinmeyen karışıklıklar söz konusu olduğunda veya alternatif yollar varsa, MR zor olabilir. Rubin'in Yarı Çıkarım Modeli, atama ayrık bir değişken olduğunda nedensel etkileri ölçen karşı-olgusal bir akıl yürütme yaklaşımıdır. Bu yaklaşım, gözlemlenmemişse bir birim için potansiyel sonuç eksik olduğundan, bir atama sorunu yaratır.

  • 01:15:00 Yaşam bilimlerinde derin öğrenme konulu dersin bu bölümünde, konuşmacı genetik çalışmalarda nedensel çıkarım için potansiyel sonuç yöntemini tartışıyor. Bağımsızlık, güçlü göz ardı edilebilirlik ve örtüşme gibi varsayımlar, bireysel nedensel etkileri doğru bir şekilde tahmin etmek için gereklidir. Konuşmacı ayrıca bir Alzheimer hastalığı ilacını içeren oyuncak bir örnek sağlar ve bir eğilim işlevine uymanın ve eğilim puanlarını kullanmanın önyargıları düzeltmeye ve tedavi ile kontrol grupları arasında adil karşılaştırmalar üretmeye nasıl yardımcı olabileceğini tartışır. Potansiyel sonuç yöntemi, araştırmacıların farklı tedavi ve müdahalelerin etkileri hakkında ilginç sorular sormalarına olanak tanır.

  • 01:20:00 Bu bölümde, konuşmacı olası sonuç çerçevesi ve son teknoloji karşı olgusal çıkarım teknikleri yoluyla nedensel çıkarımı tartışıyor. Tedavi edilen grupların ağırlıklandırılmasının sonuçlardaki farkı nasıl açıklayabileceğini ve olası sonuçları tahmin etmek için isnat etmenin nasıl kullanılabileceğini açıklarlar. Ayrıca, birden fazla karıştırıcıyı yakalamak için bir kesme matrisi kullanmayı ve bu karıştırıcı etkileri ayarlamak için popülasyon PC'sini kullanmayı ve ayrıca Bayes regresyon ağaçlarını kullanarak eksik verileri belirleme stratejisini öneren yeni bir makaleyi tartışıyorlar. Bu sayede, tedavilerin etkinliğini belirlemek için bireysel nedensel etkiler ölçülebilir.

  • 01:25:00 Bu bölümde, konuşmacı yaşam bilimlerinde derin öğrenmenin nedensel keşif yönünü tartışıyor. Nedensel grafik yapısını yüksek boyutlu veri matrislerinden öğrenmenin karmaşık ve zorlu bir problem olduğunu açıklıyorlar. Bununla birlikte, bu alandaki atılımın, genetiğin rahatsız edici genlerde kullanılmasından ve ağları öğrenmek için gen ifadelerinin ölçülmesinden geldiğini belirtiyorlar. Araştırmacıların puana dayalı bir olasılık kullanmak yerine artık verileri üreten tek bir nedensel modeli varsayan değişmezlik koşuluna güvendiklerini ve bu varsayımı verilerin nedensel yapısını belirlemek için kullandıklarını açıklıyorlar. Konuşmacı ayrıca bu yaklaşımı gösteren bir oyuncak örneği de sağlar.

  • 01:30:00 Dersin bu bölümünde, konuşmacı değişmezlik koşulu fikrini ve bir modelin deneysel verileri tutarlı bir şekilde açıklayıp açıklayamayacağını belirlemedeki uygulamasını tartışır. Konuşmacı, gen nakavt deneyleri örneğini kullanır ve yanlış bir öngörücünün dahil edilmesinin, deneysel sonuçların reddedilmesine nasıl yol açabileceğini gösterir. Bilimsel deneylerin tekrarlanabilirliğini geliştirmenin bir yolu olarak nedensel üçgenleme fikrinden de bahsedilir. Konuşmacı, nedensel bir algoritma geliştirmek için çoklu ortogonal kanıtların önemini vurgulayarak bitirir.
GWAS mechanism - Lecture 13 - Deep Learning in Life Sciences (Spring 2021)
GWAS mechanism - Lecture 13 - Deep Learning in Life Sciences (Spring 2021)
  • 2021.04.08
  • www.youtube.com
MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep Learning in the Life Sciences / Computational Systems BiologyPlaylist: https://you...
 

Sistem Genetiği - Ders 14



Sistem Genetiği - Ders 14 - Yaşam Bilimlerinde Derin Öğrenme (Bahar 2021)

Sistem genetiği ve derin öğrenme üzerine olan bu derste, konuşmacı SNP kalıtımı, bölümleme kalıtımı, tabakalı LD skor regresyonu ve moleküler fenotiplemede derin öğrenme dahil olmak üzere çeşitli konuları kapsar. Ayrıca, binlerce fenotipe sahip yaklaşık 500.000 kişiden oluşan Birleşik Krallık biyobankası veri setini analiz etmek için elektronik sağlık kayıtlarının, genomik ilişkilendirme çalışmalarının ve genom biliminin kullanımını araştırıyorlar. Öğretim görevlisi, hastalık lokuslarının devrelerini ve GWAS ve EQTL araması için lineer karışık modellerin kullanımını anlamak amacıyla sekans fonksiyonu tahmini için derin öğrenme modellerinin nasıl kullanılabileceğini tartışır. Ayrıca, derin öğrenmedeki model varsayımlarının önyargılarına ve ihlallerine değiniyorlar ve hastalık açısından kritik hücre türlerini anlamada hücre türüne özgü düzenleyici ek açıklamaların önemini vurguluyorlar. Son olarak, öğretim görevlisi negatif seçilim ve nedensel etki boyutları ile ilgili bulguların karmaşıklığını tartışıyor ve genetik ilişkilerin ayrışmasını tartışmak için Stanford Üniversitesi'nden Profesör Manuel Rivas'ı tanıtıyor.

Ders, özelliklerin bileşimini ve katkı bileşenlerini ölçmek, adipogeneze veya lipolize katkıda bulunan genetik varyantları belirlemek, gen işlevi üzerinde güçlü etkileri olan ve hastalık riskini azaltan mutasyonları belirlemek ve gelişimi dahil olmak üzere çeşitli alanlarda genetik verilerin uygulanmasını derinlemesine inceler. çok değişkenli analiz kullanan risk tahmin modelleri. Buna ek olarak, ders, çeşitli biyobelirteçlerde poligenik risk skoru modellerinin uygulanmasını tartışır ve özellikle Avrupalı olmayan popülasyonlar söz konusu olduğunda, tahmin doğruluğunu iyileştirmek için farklı popülasyonlar arasında veri paylaşımına olan ihtiyacı vurgular. Ders, UK Biobank poligenik puanları ve biyotropik etkilerle ilgili araştırma projeleriyle ilgilenen öğrencileri denetleme isteğini ifade ederek sona erer.

  • 00:00:00 Bu bölümde, konuşmacı sistem genetiği ve elektronik sağlık kayıtları konusunu tanıtıyor. Yaygın ve nadir değişkenler, poligenik risk puanları, bağlantı dengesizliği ve ince haritalama değişkenleri dahil olmak üzere önceki derslerde ele alınan kavramları kısaca gözden geçirirler. Konuşmacı, çoklu SNP'lerle kodlama yapmayan ilişkilerin büyük çoğunluğu nedeniyle genom çapında ilişkilendirme çalışmalarını yorumlamadaki zorlukları tartışıyor. Daha sonra, hastalık lokuslarının altında yatan devreleri anlamak için sürücü genleri, bölgeleri ve hücre tiplerini tahmin etmeye yönelik dizi işlevi için genomik, RNA ve varyasyon bilgilerinin yanı sıra derin öğrenme modellerinin kullanımını tanıtıyorlar. Konuşmacı ayrıca, genotipler ve ortak değişkenler kullanarak ilgili fenotipler üzerindeki sabit ve rastgele etkileri tahmin eden hem GWAS hem de EQTL çağrısı için doğrusal karışık modellerin kullanımını tanıtıyor.

  • 00:05:00 Bu bölümde öğretim görevlisi, genetik varyantlarına dayalı olarak bir kişinin fenotipini tahmin etmenin temel temelini ve genomdaki tüm SNP'ler ve kohorttaki tüm bireyler genelinde her bir alternatif alelin etki boyutunu açıklamaktadır. Gürültü, sıfır merkezli bir değere ve karesel bir kovaryans matrisine sahip bireyler arasında dağıtılır. Ek olarak, rastgele etkiler, bireyler arasındaki genetik paylaşımı ölçen bir akrabalık matrisi kullanılarak açıklanır. Tüm bilinmeyenleri entegre etmek ve kovaryans matrisi tarafından yönlendirilen fenotipik etkilerin olasılığını belirlemek için bir Bayes yaklaşımı kullanılır. Lineer karma modeller, belirli bir özelliğin toplam kalıtım derecesini tahmin etmek için oluşturulur; bu, sonsuz küçüklük varsayımına dayanır ve sınırlı bir maksimum olabilirlik modeli kullanılarak tahmin edilir. Bu rastgele etkiler modeli, verilerin dönüşümlerini yakalar ve gerçek nedensel varyans hakkında bilgi eksikliğine rağmen çalışır.

  • 00:10:00 Bu bölümde konuşmacı, ara moleküler fenotiplerin etkisini ve SNP'ler ile ifade arasındaki doğrusal ilişkiyi tahmin ederek ek varyasyonu yakalamada derin öğrenmenin kullanımını tartışıyor. Konuşmacı, bunun, tahmini çevreleyen potansiyel gürültüyle eşleşen önceki dağılımlar kullanılarak yapılabileceğini ve bu da en çok tercih edilen sonucun çıkarılmasına izin verdiğini açıklıyor. Genetik matrisleri yönlendiren en güçlü etkilerin doğrudan popülasyon farklılıklarından kaynaklandığı popülasyon farklılıklarının etkisinden de bahsediyorlar. Son olarak, konuşmacı kalıtım kavramını ve genetik akrabalığı genomun alt kümelerine ayırmanın kalıtımı hesaplamak için nasıl güçlü bir yaklaşım olabileceğini açıklıyor ve kromozomlar ne kadar uzunsa, birçok karmaşık özellik için o kadar fazla varyantı açıkladıklarını öne sürüyor.

  • 00:15:00 Bu bölümde, Harvard Halk Sağlığı Okulu'ndan Alkes Price, fenotip ve genotip arasındaki ilişkiye ilişkin olarak tüm popülasyonda elde edilebilecek maksimum değer olarak tanımlanan bir parametre olan SNP kalıtsallığı kavramını açıklıyor. Kodlama ve kodlamama gibi farklı fonksiyonel SNP kategorileri arasında kalıtımı bölme fikrini ve bunun, belirli hastalıklarda ve dokularda kalıtım için hangi SNP'lerin zenginleştirildiğine dair sonuçlara nasıl yol açabileceğini tartışıyor. Price ayrıca insan vücudundaki hastalık açısından kritik hücre tiplerini ve hücresel süreçleri incelemek için bir araç olarak tabakalı LD skoru regresyonu kavramını da sunar.

  • 00:20:00 Bu bölümde, konuşmacı istatistiksel genetikteki büyük veri kümelerinden özet ilişkilendirme istatistiklerini analiz etme fikrini tanıtıyor. Bu yöntem, şizofreni, romatoid artrit ve Crohn hastalığı gibi, bireysel düzeydeki genotipler ve fenotipler yerine özet istatistik verileri kullanılarak büyük numune boyutlarının mevcut olduğu hastalıkları analiz ederken kullanışlıdır. Konuşmacı, farklı fonksiyonel kategorilerden LD ile SNP'ler genelinde hastalık GWAS'tan ki-kare ilişkilendirme istatistiklerini gerilemek için kullanılan tabakalı ld skor regresyon yöntemini açıklar. Yöntem, birden büyük bir ortalama ki karenin kafa karıştırıcı anlamına gelmediği ve SNP'ler genelinde ortalama LD puanına dayandığı fikrine dayanmaktadır.

  • 00:25:00 Bu bölümde, konuşmacı etiketleme kavramını ve biyolojik olarak nedensel sinyali SNP'ler (tek nükleotid polimorfizmleri) ve LD (bağlantı dengesizliği) puanları ile ilişkili olarak açıklar. Tabakalı LD (bağlantı dengesizliği) skor regresyon yönteminin, bu skorlardaki kafa karışıklığının tespit edilmesine nasıl yardımcı olabileceğini tartışıyorlar ve daha yüksek bir ortalama ki-kare skoru kafa karışıklığının varlığını gösteriyor. Ayrıca genomik LD (bağlantı dengesizliği) konusuna ve bunun SNP'lerin popülasyonuna ve sıklığına göre nasıl değiştiğine de değiniyorlar. Konuşmacı daha sonra bu yöntemi daha fazla açıklamak için gerçek verileri bir şizofreni veri seti biçiminde sunar.

  • 00:30:00 Dersin bu bölümünde, LD puanlarını kullanarak SNP kalıtım derecesini tahmin etmek için bir regresyon denklemi tanıtılmaktadır. Regresyon denkleminin kesişme noktası karışıklığı yansıtırken, eğim ki-kare istatistiği ile LD puanı arasındaki korelasyonu yansıtır. Bu eğim, SNP kalıtım derecesini tahmin etmek için kullanılabilir ve çok doğrusal regresyonun ilgili eğimleri, bize farklı fonksiyonel kategorilerin nedensel SNP kalıtım derecesi hakkında bilgi verebilir. Miktar zenginleştirme, belirli bir işlevsel kategori tarafından açıklanan SNP kalıtsallığının yüzdesine karşı o kategorinin parçası olan SNP'lerin yüzdesini ölçebilir. Eğimin işlevsel yorumu, işlevsel kategorilerin örtüşüp örtüşmediğine bağlıdır.

  • 00:35:00 Bu bölümde konuşmacı, çeşitli işlevsel açıklamalarda zenginleştirmeyi değerlendirmek için kullanılan katmanlı LD puanı regresyonunu tartışıyor. Yöntem, SNP'leri, arttırıcıları, histon işaretleyicileri ve daha fazlasını kodlamak için uygulanır. Konuşmacı, nedensel kategoriler modele dahil edilirse yöntemin yansız tahminler ürettiğini, ancak nedensel kategoriler modelde yer almıyorsa yanlı hale geldiğini belirtiyor. Bununla birlikte, birkaç kategori eksik olsa bile, model kalan kategoriler için tarafsıza yakın tahminler üretmek için yeterli zenginliği sağlayabilir. Konuşmacı, bireysel düzey veri yöntemlerinin şu anda çok sayıda örtüşen veya sürekli değerli işlevsel kategori üzerinde çalışacak şekilde tasarlanmadığını vurgular.

  • 00:40:00 Bu bölümde, konuşmacı, dikkatli olunmazsa derin öğrenmede model varsayımlarının olası ihlallerinin olduğunu açıklıyor ve gen ifade verilerinde temel model varsayımını karşılamayan en iyi qtl'ye sahip bir örnekten alıntı yapıyor. Konuşmacı daha sonra derin öğrenme yönteminin uygulamalarını gerçek kromatin ve gen ifade verilerine tartışmaya geçer. Konuşmacı, 17 özelliğin kamuya açık özet istatistiklerini kullanarak, kodlama SNP'lerinin hastalıklar ve karmaşık özellikler, özellikle otoimmün hastalıklar ve boy için zenginleştirildiğini, 29 memelide korunan SNP'lerin de hastalık üzerinde önemli etkiye sahip olduğunu buldu. Ek olarak, fantom beş güçlendiricilerin, otoimmün hastalıklar için önemli bir zenginleştirmeye sahip olduğu bulundu. Daha sonra tartışma, belirli özelliklerin üreme uygunluğuyla nasıl daha yüksek veya daha düşük bir bağlantıya sahip olabileceği ile ilgili olarak bu sonuçları yorumlamaya döner.

  • 00:45:00 Bu bölümde öğretim görevlisi, daha büyük nedensel etki boyutlarından kaynaklanmayan belirli işlevsel kategorilerin kalıtım için neden zenginleştirildiğini açıklıyor. Yaygın alıntıların, negatif seçim nedeniyle etki boyutları üzerinde yumuşak bir üst sınırı vardır, bu nedenle daha çok, her biri orta veya küçük ila orta nedensel etki boyutlarına sahip olan, işlevsel kategorideki bir şeyler yapan parçacıkların sayısıyla ilgilidir. Öğretim görevlisi ayrıca, hastalık açısından kritik hücre türlerini anlamada hücre türüne özgü düzenleyici ek açıklamaların önemini tartışır. Beyin düzenleyici ek açıklamalar en çok şizofreni için zenginleştirilmiştir, bağlantılı kemik düzenleyici uyarlamalar en çok boy için zenginleştirilmiştir ve bağışıklık hücre tipleri en çok romatoid artrit için zenginleştirilmiştir. Genom çapında poligenik bir yaklaşım, yüksek oranda poligenik özellikler için, bu özellikler için sayıca çok düşük olabilen genom çapında önemli parçalara odaklanan geleneksel yaklaşımlardan daha fazla biyolojik içgörü sağlayabilir.

  • 00:50:00 Dersin bu bölümünde, konuşmacı şizofreni ve romatoid artrit dahil olmak üzere belirli hastalıklarla ilgili spesifik genleri incelemek için gen ekspresyonu verilerini kullanmayı tartışıyor. Ayrıca, nedensel etkilerin boyutunun ld düzeyine bağlı olduğu ld bağımlı mimariler kavramından ve daha düşük ld düzeylerine sahip snipslerin 56 farklı özellikte daha büyük nedensel etki boyutlarına sahip olduğundan bahsederler. Konuşmacı, negatif seçilimle ilgili olan bu bulguların karmaşıklığından bahsediyor, ancak tek hücreli RNA dizileme verilerini ve hastalık açısından kritik hücre tiplerini tartışmak için zamanımız tükeniyor. Daha sonra, binlerce fenotipe sahip yaklaşık 500.000 kişiden oluşan popülasyon tabanlı Birleşik Krallık biyobankası veri setini analiz etmek için elektronik sağlık kayıtlarını, genomik ilişkilendirme çalışmalarını ve genomiği birleştirme sürecini tartışan Stanford Üniversitesi'nden Profesör Manuel Rivas'ı tanıtıyorlar.

  • 00:55:00 Bu bölümde, konuşmacı, genetik ilişkilendirme çalışmalarını temsil etmek için çoktan çoğa eşlemelerin daha az bileşene çözülmesini içeren, genetik ilişkilerin ayrıştırılması adı verilen bir yaklaşımı tartışıyor. Konuşmacı, binlerce özellik ve genetik varyans için özet seviye verilerinden oluşan bir matrisi temsil etmek için kesik bir tekil değer ayrıştırma yaklaşımı kullandı ve her biri üç matristeki ortogonal öğelerin bir ürünü olan yaklaşık 100 bileşenden oluşan daha düşük bir bileşenle sonuçlandı. . İlk iki bileşen, antropometrik fenotiplerle karakterize edildi ve konuşmacı, farklı fenotipleri nasıl etkilediklerini görmek için her varyantın iki bileşene nasıl yüklendiğini yansıttı.

  • 01:00:00 Bu bölümde konuşmacı, bir yağ bileşeni ve yağsız bir kütle bileşeninden oluşan Vücut Kitle İndeksi (VKİ) gibi belirli bir özellik için kompozisyon ve katkı bileşenlerinin nasıl ölçülebileceğini açıklar. . BMI'nin genetik riskine, diğer bileşenlerin yanı sıra bir yağ bileşeni de katkıda bulunacaktır. Konuşmacı, belirli Protein Kesen Varyantları (PTV'ler) üzerinde çalışarak ve güçlü etki boyutlarını belirleyerek vücut kitle indeksi üzerinde sadece yağsız bir etkiye sahip olmaktan ziyade adipogenez veya lipoliz etkilerine katkıda bulunabilecek genetik varyantları belirlemekle ilgilendiklerini açıklıyor. Bu süreçte konuşmacı, BMI'ye yüksek kolesterol yağsız kütle katkısı olan pde3b genini ve idiprogenez üzerinde fonksiyonel sonuçları olan GPR 151'i tanımlar. 2000 fenotip için genetik ilişkilendirmeler, herkesin favori genini, varyantını veya fenotipini araması ve farklı popüler türlerde bulunan ilişkilendirme setine göz atması için bir arama portalı haline gelmesi fikriyle biobank engine.com.edu adresinde çevrimiçi olarak mevcuttur. biyobankalar.

  • 01:05:00 Bu bölümde konuşmacı, gen işlevi üzerinde güçlü etkileri olan ve hastalık riskini azaltan, yeni terapötik hipotezlere yol açabilecek ve ilaç keşfi için hedef seçimine rehberlik edebilecek mutasyonların tanımlanmasını tartışıyor. Birden fazla biyobankadan alınan özet düzey verileri birleştirerek gen fonksiyonu ve fenotip üzerinde güçlü etkileri olan spesifik genetik varyantları tanımlama sürecini açıklarlar. Poligenisitenin kalıtımı ve genetik etkilerin korelasyonu gibi genetik parametreleri tahmin ederek, çıkarımı iyileştirmek ve terapötik gelişime rehberlik etmek için genetik ile özellikler/hastalıklar arasındaki ilişkiyi görselleştirmeyi amaçlarlar. Güçlü etkili mutasyon örnekleri ve bunların astım ve tip 1 diyabet gibi hastalıklara karşı korunma üzerindeki etkileri de verilmektedir.

  • 01:10:00 Bu bölümde sunum yapan kişi, risk tahmin modellerinde genetik verilerin uygulanmasını tartışıyor. İnsanlar, yüzlerce fenotiple bağlantılı çok sayıda genetik varyanta sahiptir, bu nedenle bu bağlantıları keşfetmeye yönelik bir yaklaşım, milyonlarca tek değişkenli modele uymaktır. Bununla birlikte, genetik varyantlar arasındaki korelasyon nedeniyle bu yaklaşımın tahmin için zayıf özellikleri vardır, bu da ilgili varyantı diğerlerinden ayırt etmeyi zorlaştırır. Bu nedenle, milyonlarca değişkenli büyük regresyon modelleri uydurularak çok değişkenli bir model geliştirilmiştir. Bu modellerin montajı için geliştirilen pakete S-LDSC adı verilmektedir. Model, tahmin performansını iyileştirmek için değişken seçimine izin veren cezalandırılmış bir regresyon çerçevesi olan Kement algoritmasını kullanır.

  • 01:15:00 Bu bölümde konuşmacı, kardiyovasküler, böbrek ve karaciğer biyobelirteçleri dahil olmak üzere 35 biyobelirteç için poligenik risk skoru modellerinin uygulanmasını tartışıyor. Çalışma, model performansını değerlendirmek için 70'lik bir eğitim veri seti, 10'luk doğrulama seti ve 20'lik bir test bölümü oluşturdu. Modellerin performansı farklı popülasyonlarda ölçüldü ve sonuçlar, bu tahmine dayalı modellerin tahminler için nedensel değişkenleri kullanan bir popülasyondan diğer popülasyonlara aktarılmasıyla ilgili sınırlamaları gösterdi. Çalışma, korelasyon yapısının farklı popülasyonlar arasında değiştiğini ve modellerin tahmin performansını etkilediğini gösterdi. Ayrıca, farklı genetik varyant setleri, fenotipin kalıtsallığını açıklayabilir ve bir popülasyondan tahmine dayalı modellerin aktarılması, diğer popülasyonlarda iyi çalışmayabilir ve genetik varyantlar arasındaki korelasyon yapısının ilişkisini bozabilir. Bu, tahmin doğruluğunu iyileştirmek için farklı popülasyonlar arasında veri paylaşımı ihtiyacını gerektirir.

  • 01:20:00 Bu bölümde konuşmacı, farklı popülasyonlardaki genetik varyantları incelerken, Avrupalı olmayan popülasyonlarda belirli varyantların bulunmamasının etki büyüklüklerinde heterojenliğe katkıda bulunabileceğini açıklıyor. Bununla birlikte, birden fazla popülasyonda bir varyant mevcut olduğunda, etki büyüklükleri daha homojen olma eğilimindedir. Lipoprotein a örneği, Avrupa popülasyonundaki varyansa katkıda bulunan genetik varyantların Afrika popülasyonunda bulunmadığı ve Afrika popülasyonlarında düşük performansa yol açtığı açıklamasıyla birlikte verilmektedir. Konuşmacı ayrıca UK Biobank poligenik puanları ve biotropik etkilerle ilgili araştırma projeleriyle ilgilenen öğrencileri denetlemeye istekli olduğunu ifade eder.
Systems Genetics - Lecture 14 - Deep Learning in Life Sciences (Spring 2021)
Systems Genetics - Lecture 14 - Deep Learning in Life Sciences (Spring 2021)
  • 2021.04.08
  • www.youtube.com
MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep Learning in the Life Sciences / Computational Systems BiologyPlaylist: https://you...
 

Grafik Sinir Ağları - Ders 15



Grafik Sinir Ağları - Ders 15 - Yaşam Bilimlerinde Öğrenme (Bahar 2021)

Grafik Sinir Ağları hakkındaki bu YouTube dersinde konuşmacı, grafik ağların temelleri, spektral gösterimler, yarı denetimli sınıflandırma ve çok ilişkisel veri modelleme dahil olmak üzere çok çeşitli konuları kapsar. Ayrıca, grafik ağları ile doğal dil işlemenin kesişimine ve ilaç keşfi için grafiklerin nasıl oluşturulacağına da odaklanılmaktadır. Öğretim görevlisi, tahmin görevleri için kullanılabilecek yararlı düğüm yerleştirmeleri elde etmek için bilgileri grafikler arasında yaymak için çeşitli yöntemleri açıklar. Ders ayrıca GNN'ler için karşılaştırmalı öğrenmenin önemini, yama tabanlı temsiller ile dikkat tabanlı yöntemleri birleştirmenin potansiyel faydalarını ve NLP'de dönüştürücü yaklaşımın kullanımını vurgulamaktadır. Dersin ikinci yarısı, ilaç keşfinde GNN'lerin pratik kullanımlarını ve bir bağlantı ağacı kullanarak moleküllerin yapısının nasıl kodlanıp kodunun çözüleceğini gösteren makaleleri tartışmaya odaklanır.

Bu video, ilaç keşfi ve gizli grafik çıkarımı da dahil olmak üzere yaşam bilimlerinde grafik sinir ağlarının (GNN'ler) çoklu uygulamalarını tartışıyor. Konuşmacı, uzamsal konum eksikliği ve sabit sıralama gibi GNN'lerdeki sorunları ve potansiyel yolları vurgular ve dikkate alınan kurulum, belirli bir düğümün türünü tahmin etmeyi, iki düğüm arasındaki bir bağlantıyı tahmin etmeyi, iki düğüm veya iki ağ arasındaki benzerliği ölçmeyi içerir. ve ağda topluluk algılama gerçekleştirerek düğümleri kümeleme. Öğretim görevlisi ayrıca GNN'lerin grafikleri nasıl verimli bir şekilde eğitebileceğini ve yerleştirebileceğini, bilgileri dönüştürüp toplayabileceğini ve polifarmasi yan etkileriyle nasıl başa çıkabileceğini açıklıyor. Ek olarak, ders, yeni hücre türlerine genelleme yapmak için MARS gibi meta-öğrenme modelleriyle birlikte, yaşam bilimlerindeki temsilleri otomatik olarak öğrenmek için iki yöntemi kapsar. Son olarak ders, GNN'lerin hücre tipi heterojenliğini yakalamak için birden çok veri kümesinde gizli hücre temsillerini nasıl öğrenebileceğini tartışır.

  • 00:00:00 Bu bölümde, konuşmacı grafikler ve proteinler üzerine dördüncü modülü ve grafik sinir ağları, protein yapısı ve ilaç tasarımı üzerine gelecek dersleri tanıtıyor. Konuşmacı, yaklaşan bir sınıf içi sınava hazırlanmak için ödevler, düzeltmeler ve kağıtlar yoluyla materyali gözden geçirmenin önemini vurgular. Amaç, öğrencileri kandırmak veya şaşırtmak değil, alanı benimsemelerine ve derinlemesine bir anlayış kazanmalarına yardımcı olmaktır. Konuşmacı ayrıca öğrencileri, alanda devrim niteliğinde bir gelişme olan protein katlanması hakkında AlphaFold ekibi tarafından yapılacak bir ders hakkında bilgilendirir.

  • 00:05:00 Bu bölümde öğretim görevlisi, ağ kavramını ve bunların biyolojik ağlar da dahil olmak üzere toplumun çeşitli yönlerinde nasıl yaygın olduğunu tanıtıyor. Biyolojik ağlar, düzenleyici ağları, sinyal ağlarını ve hücrenin farklı seviyelerinde çalışan metabolik ağları içerir. Birbiriyle etkileşime giren bu ağların özelliklerini anlamak için ağ analiz yöntemlerine ihtiyaç vardır. Ayrıca, olasılıksal nesneleri temsil etmek için düğümleri ve kenarları kullanan olasılıksal ağlardan bahsedilmektedir. Bu ağların matris temsilleri, doğrusal cebir yaklaşımları aracılığıyla bunların ayrıştırılmasına, toplulukların öğrenilmesine ve modüllerin tanımlanmasına izin verir.

  • 00:10:00 Dersin bu bölümünde, konuşmacı ağ analizi ve bunun spektral temsilleri üzerine yapılan kapsamlı çalışmalara genel bir bakış sunar. Tartışılan yöntemler, Laplacian matrisinin birinci ve ikinci özdeğerlerine dayanan ağlar aracılığıyla maksimal kesimler kullanarak bileşenlerin ayrılabilirliğinin belirlenmesini ve farklı kenarlar arasındaki bilgi akışını anlamak için difüzyon çekirdeklerinin kullanımını içerir. Konuşmacı, derste tartışılacak olan grafik sinir ağları gibi derin öğrenme yöntemleriyle birlikte kullanılabileceği için bu yerleşik literatürü unutmamanın önemini vurgular. Konuşmacı daha sonra grafik sinir ağları hakkında bilgi tazeleyecek ve yarı denetimli öğrenme, çoklu ilişkisel veri ve doğal dil işleme gibi sorun alanlarını tartışacak olan konuk öğretim görevlisi Neil Band'ı tanıtıyor.

  • 00:15:00 Bu bölümde, düğüm özelliklerini veya birçok grafiği hesaplamak için bilgileri grafikler üzerinde etkili bir şekilde yaymayı ve grafik evrişimli ağları kullanarak akış aşağı işlemleri gerçekleştirmeyi öğreniyoruz. Bu ağ, özellik bilgisini toplayabilir ve komşulardan gelecekteki bilgileri alıp çekerek belirli düğümü güncelleyebilir. GNNS'nin nihai hedefi, tüm bir grafiğin özelliğini tahmin etmek veya her bir düğümün türünü tahmin etmek için kullanılabilen bir gömme vektörü üretmektir. Güncelleme kuralı, düğümün gizli temsilinden ve yakın çevreden alınan güncellemelerden yayılan bilgileri temel alır. Ayrıca, modelin parametre sayısını azaltmak için, farklı ağırlık matrisleri uygulamak yerine, tüm komşulara ortak parametrelerle aynı ağırlık matrisleri uygulanmıştır.

  • 00:20:00 Bu bölümde öğretim görevlisi, makaleleri düğümler ve alıntı bağlantılarını kenarlar olarak kullanarak alıntı ağları üzerinde bir sınıflandırma görevi gerçekleştirmek için grafik sinir ağlarını kullanma sürecini açıklar. Grafikteki her bir düğümün yakın çevresinden bilgi emmek için güncellenmesini ve ardından çıktıların elde edilmesini içeren iki katmanlı grafik evrişimli ağ uygulanır. Öğretim görevlisi, derin ağlarla aşırı düzleştirmenin potansiyel dezavantajından bahseder ve başlangıç durumunun hafızasını korumak için geçitli tekrarlayan birimlerin kullanılmasını önerir. Ek olarak öğretim görevlisi, grafik sinir ağlarında daha yüksek dereceli temsilleri öğrenmek için dikkat tabanlı yöntemler ile yama tabanlı temsilleri birleştirme olasılığını tartışır.

  • 00:25:00 Bu bölümde öğretim görevlisi, grafik evrişimli ağlar, dikkat güncellemeleri ve mesaj iletme teknikleri dahil olmak üzere grafik sinir ağlarındaki farklı paradigmaları tartışır. Mesaj geçişinde grafikler çok yoğun hale geldiğinde ortaya çıkan potansiyel hafıza sorunlarını vurgularlar, ancak bu paradigmaların farklı öğrenme görevleri türleri için yararlı olduğunu vurgularlar. Daha sonra, transdüktif ayarın, açık düğüm özellikleri olmadan bile modellerin hızlı bir şekilde öğrenmesine izin verdiği grafikler üzerinde yarı denetimli sınıflandırmaya dalarlar. Son olarak öğretim görevlisi, doğal dil işlemede olduğu gibi çok-ilişkisel verileri modellemek için kullanılabilecek ilişkisel grafik evrişimli ağlara değinir.

  • 00:30:00 Bu bölümde öğretim görevlisi, grafik ağlar ile doğal dil işleme arasındaki bağlantıyı, özellikle NLP'de dönüştürücü modelinin kullanımını tartışır. Transformatör modeli genellikle dil çevirisi ve kelimelerin genel kavramsal anlayışını öğrenme gibi görevler için kullanılır. Dönüştürücü yaklaşımı, birçok kenarın eksik olduğu biyolojik ağların aksine tamamen bağlı bir grafikten başlar ve güncellenmiş bir sürümü çıkarmadan önce düğüm yerleşimlerini güncellemek için kendi kendine dikkat kullanır. Dönüştürücü yaklaşımı biyolojik ağlara mutlaka fayda sağlamayabilir, ancak iki alan arasında stratejilerin çapraz tozlaşması ve optimizasyon potansiyeli vardır.

  • 00:35:00 Bu bölümde, iki kelimelik bir cümle için kelime gömme güncellemesinin nasıl gerçekleştirileceğini ve belirli bir kelimenin diğer tüm kelimelere nasıl bakılacağını öğreniyoruz. Grafik dikkat ağları, tüm mahallenin grafik olduğunu varsaymaları ve konumsal yerleştirmeler olması dışında aynı yöntemi kullanır. Konuşmacı, grafik bağlantı bilgilerinin mimariye nasıl dahil edileceğini ve yalnızca daha önce bahsedilen sözcükleri kullanmak için grafiğin bazı bölümlerinin nasıl maskeleneceğini açıklar. Bu yöntemleri çapraz uygulamak için birçok fırsat vardır.

  • 00:40:00 Bu bölümde öğretim görevlisi, düğüm sınıflandırması veya grafik sınıflandırması gibi aşağı akış görevleri için öğrenme düğümü yerleştirmelerinin denetimsiz öğrenme ayarını tartışır. Sinir ağlarının iyi tanımlanmış olma yeteneğini geliştirmek için öğretim görevlisi, veri artırma kavramını açıklar ve karşılaştırmalı öğrenme yaklaşımlarında nasıl kullanıldığını açıklar. Ders aynı zamanda örnekleme stratejileri, farklı düğüm gösterimi türleri ve farklı puanlama işlevleri gibi tasarım parametrelerini de kapsar. Yaklaşımlardan biri, belirli bir sınıfın yerel ve genel temsilleri arasındaki ortak bilgileri en üst düzeye çıkarmak için puanlama işlevini kullanmaktır. Bu, ağı grafikten farklı bilgi alt kümelerinden sınıfla ilgili bilgileri çıkarmaya teşvik ederek daha sağlam düğüm yerleştirmelerine ve daha iyi aşağı akış performansına yol açar.

  • 00:45:00 Bu bölümde, konuşmacı grafik sinir ağlarında (GNN'ler) düğüm gömmelerinin boyutsallığını ve GNN'ler için karşılaştırmalı öğrenmenin kullanımını tartışıyor. Konuşmacı, pratikte, GNN'lerdeki düğümlerin özelliklerinin, büyük bir grafikte tek bir düğüm için 256 veya 512 boyut gibi yüksek boyutlu bir uzayda yaşayabileceğini açıklıyor. Konuşmacı ayrıca, grafik yapısını kodlamak için pozitif ve negatif örnekleri kullanmayı içeren karşılaştırmalı öğrenmenin, grafik yapısının kodlamasını geliştirmek için sınıflandırma yerine kullanılabileceğini belirtiyor. Son olarak, konuşmacı GNN'lerdeki tasarım kararlarının çıkarımlarını özetler, bağlantı tahmini ve düğüm sınıflandırması için komşu tabanlı puanlamanın etkinliğini ve düğüm gösterimi tipini seçerken hem düğümlerin özelliklerini hem de grafiğin yapısını dikkate almanın önemini vurgular. .

  • 00:50:00 Bu bölümde, konuşmacı bir grafik oluşturmanın iki yolunu tartışıyor; bunlardan ilki, kodlayıcı olarak standart bir grafik sinir ağı veya grafik evrişimli ağ ve aşağıdaki gibi yerleştirmelerin bir işlevini kullanarak bilinen varlıklar arasındaki yeni bağlantıları tahmin etmektir. bir kod çözücü. Herhangi bir kenarın var olma olasılığı, kendisine gelen düğümlere bağlıdır ve diğer tüm kenarlardan bağımsızdır. İkinci yol, her belirli düğüme eklerken bir dizi tahmin yapan bir Grafik RNN kullanılarak kodu çözülen belirli bir durumu kullanarak tüm grafik için tek bir gömme vektörü içeren bir grafik oluşturur. Bu yöntem, bir grafiğin nasıl oluşturulacağı hakkında mümkün olduğu kadar az tümevarımsal önyargı ortaya koymaya çalışır. İkinci yaklaşım, daha önce sentezlenmiş veya karakterize edilmiş olmalarına bakılmaksızın, yüksek potansiyele sahip de novo moleküller oluşturmak için özellikle Junction Tree Variational Autoencoder hakkındaki makalede ilaç keşfi için kullanılır.

  • 00:55:00 Bu bölümde, makalenin grafik sinir ağlarını kullanarak moleküllerin yapısını kodlama ve kodunu çözme yaklaşımı açıklanmaktadır. Yaklaşım, bir durumu kodlamak için ince taneli bir moleküler grafik ve grafiğin üst düzey yapısının kodunu çözmek için bir ağaç ayrışımı kullanır. Yazarlar, grafikteki döngüleri kaldırmak için bir bağlantı ağacı kullanarak, kod çözme sürecini basitleştirebilir ve yalnızca bir düğümün etiketini ve bir alt düğümün eklenip eklenmeyeceğini tahmin edebilir, bu da molekülün geçerli bir üst düzey yapısını sağlar. Yazarlar, şimdiye kadar inşa edilmiş olan alt ağacın tüm durumunu dahil etmek ve moleküler geçerlilik açısından yüksek bir yeniden yapılandırma yüzdesi elde etmek için kapılı bir tekrarlayan birim kullanır. Bayes optimizasyonu, yeni ilaçlar üretmek için gizli uzayın gezilebilirliğini değerlendirmek için kullanılır.

  • 01:00:00 Bu bölümde, konuşmacı grafik sinir ağlarının (GNN) yaşam bilimlerindeki iki uygulamasını tartışıyor. İlk uygulama, GNN'nin bir molekülün gizli değişkenini anlamak ve kimyasal özelliğini tahmin etmek için kullanıldığı ilaç keşfi alanındadır. Model, bir kodlayıcı-kod çözücü çerçevesi kullanılarak eğitilmiş ve Bayes optimizasyonu kullanılarak optimize edilmiştir. İkinci uygulama, GNN'lerin zaman içinde meydana gelen dinamikler kümesini kodlayarak bir problemdeki gizli yapıları modellemek için kullanıldığı gizli grafik çıkarımıdır. Model, gelecekteki sonuçları tahmin etmek için kullanılabilir ve nedensel keşfe uygulanabilir. Konuşmacı, GNN'lerin bu uygulamalardaki etkinliğini göstermek için oyuncak verilerini ve gerçek dünya hareket yakalama verilerini sunar.

  • 01:05:00 Bu bölümde, konuşmacı grafik sinir ağlarındaki sorunları ve olası yolları tartışıyor. Mesaj geçişinde ve komşu kümelemede izomorfizm testleriyle sınırlı güç ve teorik ilişki, grafiklerde döngü bulmada ağaç yapılı hesaplama grafiklerinin zorlukları ve aşırı yumuşatma sorunu dahil olmak üzere birkaç sorundan bahsedildi. Bununla birlikte, konuşmacı bu ağları ölçeklendirmede, büyük veri setlerinde öğrenmede ve diziler ve grafikler arasında çok modlu ve çapraz modlu öğrenmeyi denemede umut vaat ediyor. Bunu takiben, Stanford Üniversitesi'nden bir postdoc, biyolojik ağlarda derin öğrenmeyi ve bir grafik olarak temsil edilen veriler için daha geniş uygulanabilir derin sinir ağı çerçevelerine nasıl ihtiyaç duyulduğunu tartışıyor. Derin öğrenmenin, günümüzde makine öğrenimi yaşam döngüsüne ilişkin düşüncemizi dönüştürmesine rağmen, grafik olarak temsil edilen karmaşık veriler için derin öğrenmenin nasıl kullanılacağı ve uygulanacağı açık değildir.

  • 01:10:00 Bu bölümde, uzamsal yerelliğin ve sabit sıralamanın olmaması, referans noktalarının olmaması ve grafiklerin dinamik doğası da dahil olmak üzere grafik verilerini öğrenmenin karmaşıklıkları tartışılıyor. Grafikler üzerinde temsil öğreniminin amacı, düğümleri düşük boyutlu bir gömme uzayına eşlemek için grafiği girdi olarak alan bir eşleme işlevini öğrenmenin bir yolunu bulmaktır. Verimli, görevden bağımsız özellik öğrenimi, ağlarda makine öğrenimi için bu sürecin çok önemli bir hedefidir. Göz önünde bulundurulan kurulum, hedefin belirli bir düğümün türünü tahmin etmek, iki düğüm arasındaki bir bağlantıyı tahmin etmek, iki düğüm veya iki ağ arasındaki benzerliği ölçmek ve kümelenmek olan, bitişik matrisi ve her düğümle ilişkili düğüm özelliklerini içeren bir grafiği varsayar. ağda topluluk tespiti gerçekleştirerek düğümler. Derin sinir ağlarını grafiklere uygulamanın en naif yaklaşımı sunuldu, ancak düğüm sayısına bağlı olarak ağdaki parametre sayısındaki artış, eğitimin istikrarsızlığı ve artan aşırı uydurma olasılığı dahil olmak üzere sınırlamaları vurgulandı.

  • 01:15:00 Bu bölümde konuşmacı, grafik sinir ağlarının evrişimli sinir ağlarından ödünç alınan fikirleri kullanarak grafikleri nasıl verimli bir şekilde eğitebileceğini ve yerleştirebileceğini açıklıyor. Bir düğümün komşuluğu, sinir ağının yapısını tanımlar ve ana fikir, yerel ağ komşuluğuna dayalı düğüm yerleşimleri oluşturmaktır. Konuşmacı, permütasyon değişmezi olan mesaj dönüştürme ve toplama işleçleri üretmek için bilginin nasıl toplanıp dönüştürüleceğini göstererek bu kavramı açıklar. Bu işleçler, düğüm bilgisini dönüştürmek ve ilgilenilen özelliği tahmin etmek için öğrenilebilir.

  • 01:20:00 Bu bölümde konuşmacı, grafik sinir ağlarının dönüşüm ve toplama sürecini açıklıyor. Temel yaklaşım, düğümlerden gelen bilgilerin ortalamasını almak ve doğrusal olmayan dönüşümlerin ardından doğrusal dönüşümler için sinir ağlarını uygulamaktır. Konuşmacı, bir düğümün yerel komşuluğunun özelliklerini birleştirmek için genelleştirilmiş bir toplayıcı işlevinin tanıtıldığı GraphSAGE algoritmasının örneğini sunar. Ortalama, havuzlama veya LSTM hücreleri gibi farklılaştırılabilir toplama işlevleri, komşular arasında bilgi toplamak için kullanılabilir. Konuşmacı ayrıca biyolojide grafik sinir ağlarının kullanımını ve bunların belirli davranışları veya sonuçları tahmin etmek için nasıl kullanılabileceğini tartışıyor.

  • 01:25:00 Bu bölümde öğretim görevlisi, ilaçların kombinasyonundan kaynaklanan yan etkiler olan polifarmasi yan etkileri kavramını tartışır. Öğretim görevlisi, amacın, iki ilacı heterojen bir ağdaki düğümler olarak modelleyerek yan etki olasılığını tahmin etmek olduğunu açıklıyor. Öğretim görevlisi, ilaçların etki mekanizmalarını ve altta yatan biyolojik mekanizmaları yakalamak için ilaçların ve proteinlerin bir ağda nasıl modellenebileceğine dair bir örnek gösterir. Öğretim görevlisi daha sonra Grafik Sinir Ağlarının (GNN'ler) heterojen ağları gömmek için nasıl genişletilebileceğini, komşuluğun bir kenar tipiyle ayrılması gereken yerlerde ve düğümlerin ağ komşuluğu tarafından tanımlanan grafik boyunca bilginin nasıl dönüştürüleceğini ve yayılacağını açıklar. tip.

  • 01:30:00 Bu bölümde öğretim görevlisi, yaşam bilimlerindeki temsilleri otomatik olarak öğrenmek için iki yöntemi tartışıyor. İlk yöntem, grafikteki her düğüm için d-boyutlu vektör yerleşimlerini öğrenerek iki ilacın yan etkilere neden olup olmayacağını tahmin etmek için kullanılabilen ilişkisel grafik sinir ağlarına dayanmaktadır. İkinci yöntem, yeni, daha önce hiç görülmemiş hücre türlerine genelleme yapmak için önceden açıklamalı verilerden önceki bilgileri kullanan MARS adlı bir meta öğrenme modelidir. Açıklamasız deneyi ve meta veri setini optimize ederek MARS, hücrelere otomatik olarak hücre tiplerine açıklama ekleyebilir ve hücrelerin gen ifade profillerine dayalı olarak açıklama ekleme zahmetinden kaçınabilir.

  • 01:35:00 Dersin bu bölümünde, konuşmacı, hücre tiplerinin heterojenliğini yakalamak için çoklu veri setlerinde gizli hücre temsillerini öğrenmek için grafik sinir ağlarını kullanmayı tartışıyor. Yaklaşım, benzer hücre tiplerinin yakına gömüldüğü ve farklı hücre tiplerinin uzağa gömüldüğü düşük boyutlu bir gömme uzayında açıklamalı ve açıklamasız deneylerden hücrelerin ortak projeksiyonunu içerir. Bunu başarmak için yöntem, hücre tipi yer işaretlerini hücre tipi temsilcileri olarak ve derin sinir ağlarını kullanarak doğrusal olmayan bir eşleme işlevi olarak öğrenir. Yaklaşım, 20'den fazla dokudan 100.000'den fazla hücre içeren büyük ölçekli bir fare hücre atlası verileri üzerinde doğrulanmıştır ve Düzeltilmiş Rand İndeksi açısından mevcut yöntemlerden %45 daha iyi performans elde etmektedir.
Graph Neural Networks - Lecture 15 - Learning in Life Sciences (Spring 2021)
Graph Neural Networks - Lecture 15 - Learning in Life Sciences (Spring 2021)
  • 2021.04.19
  • www.youtube.com
MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisGuest lecturers: Neil Band, Maria Brbic / Jure LeskovecDeep Learning in the Life Scienc...
 

İlaç Tasarımı için Yapay Zeka - Ders 16


İlaç Tasarımı için Yapay Zeka - Ders 16 - Yaşam Bilimlerinde Derin Öğrenme (Bahar 2021)

Bu ders, ilaç tasarımı için derin öğrenmenin kullanımını tartışır. Antibiyotik dirençli yeni bileşikler bulmak için derin öğrenmenin nasıl kullanılabileceğini açıklıyor. Biyolojik bilgiyi dahil ederek derin öğrenme modellerinin nasıl geliştirilebileceğini de tartışır.

Dersin bu ikinci kısmı, özellikle ilaç kombinasyonlarının antiviral aktivitesini tahmin etmek için ilaç tasarımında derin öğrenmenin nasıl kullanılabileceğine dair genel bir bakış sunar. Model, hücre bazlı tahliller kullanılarak in vivo olarak test edildi ve iki yeni sinerjistik ilaç kombinasyonu tanımlandı.

  • 00:00:00 Konuşmacı, ilaç tasarımı ve zorlukları için derin öğrenmeyi tanıtacak. İşlevsel alanı ve kimyasal alanı tartışacak ve ilaçları otomatik olarak bulmak için derin öğrenmenin nasıl kullanılabileceğini açıklayacak.

  • 00:05:00 İlaç tasarımına yönelik üç yaklaşım, ilk ilkelere, simülasyona ve sanal taramaya dayanmaktadır. İlk ikisi, belirli özelliklere sahip bileşikleri bulmak için iyidir, ancak sonuncusu daha iddialıdır ve birbirinden bağımsız özelliklere bakarak doğru bileşiği bulmaya çalışır. Simülasyon genellikle çok yavaştır ve sanal tarama pahalıdır. Denoble ilaç tasarımı en iddialı yaklaşımdır ve bir dizi kritere bakarak bir bileşik bulma ters problemini çözmeye çalışır.

  • 00:10:00 Bu derste, konuşmacı ilaç keşfi için iki yöntem, sanal tarama ve asil ilaç tasarımı tartışıyor. Her iki yöntemin de kendi avantajları ve dezavantajları vardır; sanal tarama daha hızlı ve daha ucuzdur, ancak geleneksel yöntemlere göre daha az kapsama sahipken asil ilaç tasarımı daha yavaştır ancak daha yeni bileşikler bulabilir. Genetik algoritmalar, kimyasal uzayı keşfetmenin etkili bir yoludur, ancak bu görev için algoritmalarda hala iyileştirme için yer vardır.

  • 00:15:00 Bu derste Profesör, derin öğrenmenin ilaç tasarımında nasıl kullanıldığını ve bunun geleneksel tekniklerden nasıl daha verimli olabileceğini açıklıyor. Ayrıca nesnelerin gerçekçi görüntülerini oluşturmak için derin öğrenmenin nasıl kullanılabileceğini gösteren "Dolly" adlı bir makaleden de bahsediyor.

  • 00:20:00 Bu derste Profesör, ilaç keşfinde kullanılan derin öğrenme tekniklerini tartışıyor ve bu tekniklerin araştırmacıların yeni antibiyotikler bulmasına nasıl yardımcı olduğuna dair örnekler veriyor.

  • 00:25:00 Grafik sinir ağları, bakterileri öldürebilecek yeni bileşikler aramak için kullanılan bir tür yapay zekadır. Bu tür yapay zekayı kullanmanın amacı, geleneksel yöntemlerle keşfedilmemiş bileşikleri bulmaktır çünkü bu yöntemler bilinmeyen antibakteriyel kalıpları kaçırabilir.

  • 00:30:00 Bu ders, antibiyotik direnciyle ilgili verilerdeki kalıpları belirlemek için derin öğrenmenin nasıl kullanılabileceğini tartışıyor. Model, bir molekülün bakterilere karşı etkili olup olmayacağını yaklaşık 9.0 auc hassasiyetle tahmin edebiliyor.

  • 00:35:00 Video, mevcut antibiyotiklerin bazı bakteri suşlarına karşı nasıl artık etkili olmadığını ve "halüsin" adı verilen yeni bir bileşiğin bu suşlara karşı nasıl hem yeni hem de etkili olduğunu tartışıyor. Ayrıca, bileşiğin farelerde enfeksiyonlara karşı nasıl etkili olduğunu tartışır.

  • 00:40:00 Video, antibiyotik dirençli yeni bileşiklerin keşfedilmesinde derin öğrenme modellerinin geleneksel yöntemler üzerindeki başarısını tartışıyor. Video ayrıca, geleneksel bir yöntem olan el tasarımının antibiyotik dirençli belirli bileşikleri nasıl keşfedemediğini de gösteriyor. Derin öğrenme modelleri, alanın farklı bölümlerini yakalayabilir ve modeller tarafından üst sıralarda yer alır.

  • 00:45:00 Konuşmacı, ilaç tasarımı için kullanılan derin öğrenme modellerini anlatıyor ve modellerin biyolojik bilgiyi dahil ederek nasıl geliştirilebileceğini açıklıyor. Tek bir ilaçtan daha etkili olduğu bulunan bir ilaç kombinasyonunun vaka çalışmasını sunuyor.

  • 00:50:00 Video, ilaç tasarımı için yapay zekayı tartışıyor ve özellikle sinerjistik bileşikleri tanımlamak için derin öğrenmenin kullanımına odaklanıyor. Amaç, sinerjik ve daha az toksik olan ilaçları bulmak ve viral replikasyon döngüsü bilgisini modele dahil etmektir.

  • 00:55:00 Ders, bir ilacın çeşitli hedeflere karşı antiviral aktivitesini tahmin etmek için nasıl kullanılabileceğine odaklanarak ilaç tasarımı için derin öğrenme yöntemlerini tartışıyor. İlk adım, Campbell ve Ulusal Sağlık Enstitüsünden alınan bir veri setini kullanarak ilaç hedef etkileşimini tahmin etmektir. Ardından, ilaç tasarım sürecinin ikinci aşaması için gerekli olan molekül yapısının temsilini öğrenmek için bir sinir ağı kullanılır: ilacın çeşitli hedeflere karşı antiviral aktivitesini tahmin etmek. Derin öğrenme ve matris tamamlamanın bir kombinasyonu kullanılarak, ilaç tasarımını iyileştirme potansiyeli vurgulanır.

  • 01:00:00 Bu ders, özellikle ilaç kombinasyonlarının antiviral aktivitesini tahmin etmek için ilaç tasarımında derin öğrenmenin nasıl kullanılabileceğini tartışıyor. Model, hücre bazlı tahliller kullanılarak in vivo olarak test edildi ve iki yeni sinerjistik ilaç kombinasyonu tanımlandı.

  • 01:05:00 Bu ders, Yaşam Bilimlerinde Derin Öğrenmeye ve bunun ilaç tasarımındaki önemine odaklanır. Ders, ilaç tasarımına yönelik önceki iki yaklaşımı kapsar; biri sekansları kullanır, diğeri tekrarlayan sinir ağlarını kullanır. Ders, moleküllerin gülümseme akışı temsilinin oldukça kırılgan olduğunu ve tekniklerin ilaç keşfine uygulandığında düşük performans gösterdiğini belirtiyor. Ders, molekülleri temsil etmenin daha iyi bir yolunun, tekrarlayan sinir ağları ile verimli bir şekilde üretilebilen grafikler olduğunu belirtiyor.

  • 01:10:00 Ders, yaşam bilimlerindeki derin öğrenmeyi, özellikle de ilaç tasarımıyla ilgili olarak tartışıyor. Ders, derin öğrenmenin moleküller oluşturmak için kullanılabileceğini, ancak seyrek moleküller ve düşük ağaç dalga motifleriyle ilgili sorunları olduğunu belirtiyor. Çözüm olarak tekrarlayan sinir ağı önerildi ve düşük ağaç dalga motiflerine sahip moleküllerde daha başarılı olduğu görüldü.

  • 01:15:00 Bu ders, molekülleri düşük boyutlu bir vektöre kodlayabilen bir derin öğrenme otomatik kodlayıcıya odaklanarak yaşam bilimlerindeki derin öğrenmeyi tartışır. Bu, üretilebilecek motif sayısını ve sürecin zaman karmaşıklığını azaltır.

  • 01:20:00 Bu derste Profesör, ilaç tasarımında motif rekonstrüksiyonunun doğruluğunu artırmak için derin öğrenmenin nasıl kullanılabileceğini açıklıyor. Çok yönlü motif oluşturma modelleri, moleküllerdeki büyük döngülerin yakalanmasına izin verdiği için avantajlıdır. Düğüm düğüm yaklaşımı kullanılarak motif oluşturmanın başarı oranı, dizi uzayının yanlış temsil edilmesi nedeniyle düşüktür. Bununla birlikte, motif bazında bir yaklaşım kullanmak, başarı oranını önemli ölçüde artırır. Bunun nedeni, modelin ilaç benzerliklerini iyileştirmek için mevcut molekülleri değiştirmeyi öğrenebilmesidir.

  • 01:25:00 Konuşmacı, her alanın zorluklarını ve fırsatlarını vurgulayarak yaşam bilimlerindeki derin öğrenmeye kısa bir genel bakış sunar. Kimya ve ilaç tasarımı tartışmasıyla bitiriyor.

  • 01:30:00 Bu derste konuk öğretim üyesi, ilaç tasarımı için yapay zeka alanında projeler yürütmekle ilgilenen öğrencilere tavsiyelerde bulunur. İstenirse öğrencilerin kendilerinden mentorluk alabileceklerini belirtiyorlar.
AI for Drug Design - Lecture 16 - Deep Learning in the Life Sciences (Spring 2021)
AI for Drug Design - Lecture 16 - Deep Learning in the Life Sciences (Spring 2021)
  • 2021.04.21
  • www.youtube.com
MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisGuest lecture: Wengong JinDeep Learning in the Life Sciences / Computational Systems Bi...
 

Protein Katlanması için Derin Öğrenme - Ders 17



Protein Katlanması için Derin Öğrenme - Ders 17 - Yaşam Bilimlerinde MIT Derin Öğrenme (Bahar 2021)

Bu video, derin öğrenmenin protein katlanması alanında kullanımını ve özellikle geometrik derin öğrenmenin protein yapılarını incelemek ve ligand bağlama bölgeleri ve protein-protein etkileşimleri gibi şeyleri tahmin etmek için nasıl kullanılabileceğini tartışıyor. Video ayrıca şablon tabanlı ve şablonsuz modelleme yöntemlerini, protein katlanmasında temas tahmini için çeşitli yaklaşımları ve protein yapısı tahmininde görüntü modelleme için artık sinir ağlarının kullanımını kapsar. Genel olarak, konuşmacı, derin öğrenmenin protein yapılarını ve işlevlerini anlamamızı ilerletme vaadini vurguluyor ve bu iddiayı desteklemek için ayrıntılı örnekler ve sonuçlar sunuyor.

Video, ortak evrim tahminlerinin ve doğru modelleme için şablonların kullanımı, daha iyi homologlar bulmanın önemi ve geleneksel fiziğe dayanmadan karşılaştırılabilir sonuçlar elde etmek için derin öğrenmenin potansiyeli dahil olmak üzere protein katlanması için derin öğrenmeye yönelik çeşitli yaklaşımları tartışıyor. yöntemler. Konuşmacılar ayrıca, genetik varyasyon veya küçük moleküller gibi faktörlere dayalı olarak protein onaylarını tahmin etmek için algoritma alanının evrimi ve derin öğrenmenin potansiyelinin yanı sıra, farklılaştırılabilir çıktıların kullanımına ve küresel doğruluğun önemine de değiniyor. Genel olarak video, derin öğrenmenin protein yapısı tahmininde ve birçok uygulamasında devrim yaratma potansiyelinin altını çiziyor.

  • 00:00:00 Videonun bu bölümünde, Bruno Correa geometrik derin öğrenme kavramını ve bunun protein yapılarının incelenmesine nasıl uygulandığını tanıtıyor. Derin öğrenmenin görüntü sınıflandırmada ne kadar başarılı olduğunu, ancak biyolojideki veri setlerinin genellikle çok daha zengin ve yüksek boyutlu, çeşitli zaman ve diğer boyutlarda olduğunu ve geometrik derin öğrenmeyi değerli bir yaklaşım haline getirdiğini açıklıyor. Correa, protein yapılarının mekanik ve kimyasal işlevlerinden bağlanma ve tanımaya kadar işlevlerindeki önemini tartışıyor ve antikorlar, iyon pompaları, iletişim ve sertlik proteinleri gibi örnekler sunuyor. Ayrıca, protein yüzeylerini inceleme işinin AlphaFold tarafından ele alınıp alınmadığı sorusunu da ele alıyor ve AlphaFold'un protein yapılarını çözdüğünü ancak spesifik olarak protein yüzeyleri çalışmasını çözmediğini açıklıyor.

  • 00:05:00 Bu bölümde konuşmacı, proteinlerin birbirleriyle ve hücrelerdeki diğer metabolitlerle nasıl etkileşime girdiğini anlamak için önemli olan yapısından protein işlevini tahmin etmenin zorluklarını tartışıyor. Konuşmacı, farklı dizilimlere ve mimarilere sahip olmalarına rağmen benzer işlevlere sahip olabilen yüzey temsillerine odaklanarak protein yapılarını temsil etmenin çeşitli yollarını sunar. Konuşmacı, insanların yüzlerini incelemeye benzeterek, protein yüzeylerindeki kalıpları incelemenin onların işlevleri hakkında önemli bilgiler ortaya çıkarabileceğini savunuyor. Konuşmacı daha sonra, 3B moleküler yüzey temsillerini kullanarak protein ligand bağlama bölgelerini tahmin etmek için derin bir öğrenme yaklaşımı sunar.

  • 00:10:00 Videonun bu bölümünde, konuşmacı protein katlanması sorunu için geometrik derin öğrenmenin kullanımını tartışıyor. Geometrik derin öğrenme için prototipik nesnelerin grafikler veya yüzeyler olduğunu ve ekiplerinin onları incelemek için proteinlerin ağ temsillerini kullandığını açıklıyorlar. Daha sonra, her düğümde çeşitli vektör özelliklerine sahip ağın alt kümeleri olan "yamaların" kullanımını ve bunlara yerel ağırlıkların nasıl atandığını açıklarlar. Konuşmacı, şekil indeksi, mesafeye bağlı eğrilik, hidrofobiklik ve elektrostatik özellikler dahil olmak üzere her bir düğüme kodlanmış farklı özellik türlerini açıklar. Bu bilgi daha sonra daha fazla analiz için bir vektöre dönüştürüldü.

  • 00:15:00 Bu bölümde konuşmacı, geometrik derin öğrenme yaklaşımının bir molekülün yüzeyini sıralamasından bağımsız olarak nasıl kodlayabildiğini tartışıyor ve böylece atom modellerinin ve kimyasal özelliklerin incelenmesine olanak sağlıyor. Konuşmacı, belirli ligandların özelliklerine dayalı olarak protein ceplerini sınıflandırmak ve yüzey parmak izlerini kullanarak iki proteinin kenetlenme konfigürasyonlarını tahmin etmek gibi bu yaklaşımın potansiyel uygulamalarını not eder. Her ikisi de önemli bulunan kimya ve geometri ile hangi faktörlerin özgüllüğü tahmin etmeye daha fazla katkıda bulunduğunu anlamak için ablasyon çalışmaları yapıldı. Genel olarak, yaklaşım, protein yapılarının ve işlevlerinin anlaşılmasını ilerletmede umut vaat ediyor.

  • 00:20:00 Bu bölümde konuşmacı, belirli bir protein yüzeyindeki hangi bölgelerin diğer proteinlerle etkileşime girme olasılığının daha yüksek olduğunu tahmin edebilen, büyük bölge adı verilen bir ağı tanımlıyor. Ayrıca yerleştirme için kullanılan bir parmak izi tarama tekniğini ve bu yaklaşımın diğer yerleştirme programlarına kıyasla başarı oranlarını tartışıyorlar. Konuşmacı, protein yüzeyini ve elektrostatik özellikler de dahil olmak üzere geometrik ve kimyasal özelliklerin hesaplanmasını tanımlayan bir nokta bulutu oluşturmak için tamamen türevlenebilir bir ağ kullanan D masif adı verilen yeni nesil masifleri tanıtıyor. Son olarak, konuşmacı projenin heyecan verici tasarım yönünden kısaca bahsediyor ve kanser tedavisinde T hücrelerinin aktivitesini kontrol etmek için önemli bir hedefi tartışıyor.

  • 00:25:00 Bu bölümde konuşmacı, proteinleri hedefleyen moleküller tasarlamak için derin öğrenmeyi nasıl kullandıklarını tartışıyor. Tasarım molekülleri tarafından hedeflenmeye daha yatkın olan siteyi tahmin etmek için masif kullandılar ve hedef yüzey parmak izini çıkardılar. Daha sonra motifleri bu siteye yerleştirdiler ve ilgilenilen proteinle etkileşimleri tahmin ettiler. Sonuç, doğada daha önce bilinmeyen ve proteine bağlanan yüksek afiniteli bir bağlayıcıyı gösteren, yaklaşık bir angstromluk ortalama kare sapma ile deneysel yapıları başarıyla eşleştiren yeni bir motifti. Konuşmacı, bu araştırma alanını keşfetmekle ilgilenen öğrencilere potansiyel olarak tavsiyelerde bulunmayı teklif eder.

  • 00:30:00 Dersin bu bölümünde, konuşmacı protein yapısı tahmin yöntemlerinin iki ana kategorisini tartışıyor: şablon tabanlı modelleme ve şablonsuz modelleme. Şablon tabanlı modelleme, yeni yapıları tahmin etmek için şablonlar olarak PDB veri tabanındaki mevcut protein yapılarını kullanmaya dayanırken, şablonsuz modelleme, şablonlara dayanmadan yapıları tahmin etmek için homoloji arama ve makine öğrenimini içeren daha yeni bir yöntemdir. Konuşmacı, ikinci yönteme odaklanır ve şablonlara dayanmadan protein yapılarını tahmin etmek için dizi homolojisi arama, sinyal profili oluşturma ve makine öğrenimini kullanan daha yeni bir yaklaşımı açıklar; bu, birçok protein için şablon tabanlı yöntemlerden daha iyi doğruluk göstermiştir. Konuşmacı ayrıca geçmişte kullanılan popüler bir şablon tabanlı modelleme yaklaşımı olan parça birleştirme yöntemini de tartışıyor.

  • 00:35:00 Dersin bu bölümünde, konuşmacı protein katlamada şablonsuz modelleme için kullanılan boru hattını tartışıyor. Proteindeki herhangi iki atom veya kalıntı arasındaki mesafe hakkındaki tahmini bilgi, yapıyı oluşturmak için bir optimizasyon motoruna beslenir. Konuşmacı ayrıca, ihtiyaç duyulan kapsama veya karbon artıklarının sayısı için bir kesme değeri kullanmak da dahil olmak üzere çoklu dizi hizalamaları için farklı stratejileri tartışır. Bu modellemenin can alıcı bileşeni, tümevarım matrisini tahmin etmek, içerik ölçülerini veya mesafe ölçülerini kullanarak ünlem ölçülerini modellemektir. Konuşmacı, son yıllarda tahmini çok daha kolay ve işbirliklerini çok daha etkili hale getiren temas konumu tahmini için bazı etkili fikirler sunuyor.

  • 00:40:00 Bu bölümde, konuşmacı protein katlanmasında temas tahmini için üç farklı yaklaşımı tartışıyor. İlk yaklaşım, koalisyon analizi için küresel bir istatistik yöntemidir, ancak etkili olabilmesi için çok sayıda dizi homologu gerektirir. İkinci yaklaşım, temas mesafesinin tahmini için derin evrişimli artık sinir ağlarını kullanmaktır ve üçüncüsü, protein veri bankasından hem diziyi hem de yapısal bilgiyi hesaba katan temas tahmini için dönüştürücü bir ağdır. Konuşmacı ayrıca, temas tahmini için önceki denetimli öğrenme yöntemlerinin karşılaştığı zorlukları ve bunların daha gelişmiş makine öğrenimi modelleri kullanılarak nasıl iyileştirilebileceğini açıklıyor.

  • 00:45:00 Bu bölümde, konuşmacı, bir seferde yalnızca iki tortuyu dikkate alan ve bu nedenle tüm protein içindeki daha büyük ilişkileri göz ardı eden, protein katlanması için önceki temas tahmin yöntemlerinin sınırlamalarını tartışıyor. Bu sorunları ele almak için konuşmacı, bir proteindeki tüm temasları aynı anda tahmin etmek için derin öğrenmeyi kullanan yeni bir yöntem önerir. Bu yöntem, sorunu bir görüntü bölütleme görevi olarak formüle etmek için kullanılabilen bir görüntüdeki her atom çiftini bir piksel olarak ele almaya dayanır. Konuşmacı, tamamen evrişimli bir artık sinir ağı kullanarak, yöntemlerinin temas tahmini hassasiyetini önemli ölçüde artırabildiğini ve daha büyük ve daha sert proteinlerin katlanmasını sağlayabildiğini gösteriyor. Ayrıca, yöntem hem tek zincirli hem de zar proteinleri için iyi çalışır ve modeli değiştirmeden karmaşık temas tahmini için kullanılabilir.

  • 00:50:00 Bu bölümde, konuşmacı evrişimli sinir ağları kullanarak görüntü modelleme yoluyla protein yapısını tahmin etmek için artık sinir ağlarının kullanımını tartışıyor. Kalan bağlantıların kullanılmasının çok daha derin ağların kullanımına izin verdiğini ve bunun da fazla takma olmadan daha iyi hassasiyete yol açtığını açıklıyorlar. Konuşmacı, derin öğrenme yaklaşımının başarısını gösteren, diğer yöntemlerle karşılaştırıldığında sıralama ve doğruluk açısından kendi yönteminin performansının bazı sonuçlarını gösterir. Kesinlik son sekiz yılda arttı ve şimdi hassasiyet yüzde 80'e kadar çıkabiliyor.

  • 00:55:00 Bu bölümde konuşmacı, protein katlanması için derin öğrenme modellerini kullanarak temas konumu ve tasarım konumu üzerindeki ilerlemeyi tartışıyor. Temas hassasiyeti, önceki muayeneden çok daha kullanışlı olan %80'lik mevcut hassasiyetle önemli ölçüde iyileştirildi. Konuşmacı, tasarım konumu için bir dijital ağ kullanma sürecini ve bunun geçici tabanlı modellemeyi nasıl önemli ölçüde iyileştirebileceğini açıklıyor. Konuşmacı ayrıca rusça kodunun önemini tartışıyor ve bazı fermente proteinler için bile, onu kullanmadan da iyi bir tahmine ulaşılabileceğini gösteriyor. Sonuçlar, derin öğrenmenin yeni yapılar üretebileceğini ve doğru tahminler için az sayıda sekans hormonuna ihtiyaç duyulduğunu göstermektedir.

  • 01:00:00 Bu bölümde konuşmacılar, protein modellemeyi geliştirmek için dizi ve yapı bilgilerinin kullanımını tartışıyor. Birlikte evrim tahminlerini geliştirmek ve dizi tabanlı daha iyi tahmin edicilere yol açmak için mevcut tahminleri bir eğitim setine geri bildirim olarak kullanma fikrini keşfediyorlar. Ayrıca şablon bilgilerinin kullanılması ve doğru modelleme için iyi şablonlar bulmanın önemi tartışılır. Ek olarak, protein modellemede fiziğin rolünü sorguluyorlar ve fiziksel tabanlı yöntemlerin modelleri iyileştirmeye yardımcı olurken, derin öğrenmenin de fizik kullanmadan karşılaştırılabilir sonuçlar elde edebileceğini öne sürüyorlar.

  • 01:05:00 Bu bölümde, video gerçekten büyük proteinlerin şablon kullanmadan nasıl modelleneceğini tartışıyor. Örnek proteinin 13.000'den fazla kalıntısı vardır ve bu da geleneksel yollarla doğru bir şekilde modellemeyi zorlaştırır. Bununla birlikte, farklı birleştirme yöntemlerini birleştirerek ve iPhone2'nin iş akışını kullanarak, protein yüksek doğrulukla modellenir. Video ayrıca, bir transformatör kullanmanın çok fazla GPU gücü ve bellek gerektirdiğini ve bunun da çoğu insan için kullanımı zorlaştırdığını belirtiyor. Bununla birlikte, makine öğrenimi modeli, daha küçük bir eğitim verisi kümesiyle hala uygulanabilir. Ek olarak, modeli temel almak için daha iyi homologlar bulmak, daha fazla araştırma yoluyla iyileştirilebilecek potansiyel bir darboğazdır. Son olarak, 3B modelleme zorlu hedefler için bir ilerleme tablosu gösterilir ve daha yüksek puanlar, tahmin edilen modellerin daha iyi kalitesini gösterir.

  • 01:10:00 Bu bölümde, Muhammad Al-Qaraghuli son yirmi yılda protein yapısı tahmini için algoritma uzayının evriminden bahsediyor. Daha önceki yöntemlerin, bir proteinin en düşük enerji durumunu elde etmek için fizik tabanlı bir model ve enerji işlevi kullanmaya nasıl odaklandığını, daha yeni yöntemlerin ise çeşitli olasılıksal çıkarım tekniklerini kullanarak bilgi çıkarmak için birlikte evrimi kullandığını tartışıyor. Al-Qaraghuli, bu yöntemlerin doğruluğunun ek sekans bilgisi olmadan sınırlı kaldığını belirtiyor ve derin öğrenmenin, özellikle membran ve transmembran proteinler için protein yapısı tahmini için nasıl bir oyun değiştirici haline geldiğini tartışıyor.

  • 01:15:00 Bu bölümde, konuşmacı, 2010'ların başlarında denetimsiz yöntemlerin kullanımıyla başlayan ve Jim Wazoo'nun çalışması gibi benzersiz ağ tabanlı yaklaşımlarla derin öğrenmenin tanıtılmasıyla başlayan, protein katlama için derin öğrenme yaklaşımlarının gelişimini tartışıyor. 2016'da RaptorX ile ve büyük harfle artık bir ağ mimarisinin kullanılması X 18. Konuşmacı, 2018'de, mevcut yöntemlerle zorunlu olarak rekabet etmesi gerekmeyen ancak üretebilen ilk uçtan uca farklılaştırılabilir yaklaşımlar setinin gelişimini anlatıyor. tahminler çok daha hızlı. En son geliştirme olan AlphaFold 2, çoklu dizi hizalama (MSA) nesnelerini, daha yüksek dereceli korelasyonları ve dizi ve soyoluşun küresel yönlerini potansiyel olarak yakalamak için yasa nesneleri olarak ele alır. Son olarak, konuşmacı protein katlamanın kutsal kâsesini - en son çalışmalarının başarmayı amaçladığı bireysel protein dizilerinden AlphaFold 2'nin yanı sıra çalışma yeteneği - anlatıyor.

  • 01:20:00 Bu bölümde konuşmacılar, proteinlerin in vitro katlanma yeteneğini ve hücre içindeki şaperonların bu sürece ne ölçüde rehberlik ettiğini tartışıyorlar. Ayrıca, proteinlerin birincil diziliminde bulunan bilgi miktarını ve bunun protein değiştiren bir mutasyonun etkisini tahmin etmek için yeterli olup olmadığını araştırıyorlar. Tüm fiziksel yönlerin mevcut olmasını gerektirmeden bireysel dizilerden tahmin etmenin hala mümkün olabileceğini gösteren A2 protein tahminlerini tartışıyorlar. Son olarak, girdiyi, bir sinir ağı gövdesini ve genellikle yapıyla ilgili bir proxy nesnesi olan çıktıyı içeren uzay algoritması tanıtılır ve ardından nihai üç boyutlu oluşturmak için bir son işlem hattı yoluyla gönderilir. yapı.

  • 01:25:00 Bu bölümde, konuşmacı bir derin öğrenme modelinden elde edilen çıktı için farklılaştırılabilirliğin önemini tartışıyor. Çıktı gerçek hedeften uzaksa, potansiyel optimizasyonda bir kayıp olur. Konuşmacı ayrıca, kendi içinde tutarsız tahminlere yol açabilen son işlemenin kullanımını ve derin öğrenme modeli uygulamalarının, vekil niceliklere ihtiyaç duymadan nihai frekans yapısını nasıl tahmin ettiğini tartışır. Yaklaşımlarında, ayrı bir burulma açıları alfabesi kullanarak yerel geometriyi parametrelendiriyorlar ve bu alfabe üzerinden bir olasılık dağılımı tahmin ediyorlar. Bunu yaparak, nihai yapının verimli optimizasyonuna izin veren motor farklılaşmasını koruyabilirler.

  • 01:30:00 Bu bölümde, konuşmacı her kalıntıda serbest burulma açıları ve yinelemeli bir süreç kullanarak bir proteinin yapısını oluşturmaya yönelik yaklaşımlarını açıklıyor. Kayıp fonksiyonu, orijinal yapıyı şekillendirmede kalıntılar arasındaki etkileşimleri hesaba katmak için yalnızca yerel doğruluk değil, genel doğruluk açısından tanımlanır. Konuşmacı, yaklaşımları sınırlı olmakla birlikte, sinir ağında dahili olarak meydana gelen yapının örtülü bir homojenleşmesi olduğuna inandıklarını ve bunun da zaman içinde daha iyi tahminlere yol açtığını kabul eder. Konuşmacı ayrıca, konuma özgü puanlama matrisleri (PSSM'ler) ve tekrarlayan bir mimari kullanarak çıktıyı nasıl parametreleştirdiklerini tartışır. Son olarak, konuşmacı bu yaklaşımı kullanarak yaptıkları bazı tahminleri sunar ve yapının bazı yönlerinin iyi tahmin edildiğini, diğerlerinin ise iyi tahmin edilmediğini not eder.

  • 01:35:00 Bu bölümde konuşmacı, matematiği basitleştiren ve formülasyon sürecini basitleştiren frenesia yapısını kullanarak burulma parametreleştirme fikrini nasıl geliştirdiklerini tartışıyor. Artık yalnızca C alfaya odaklanıyorlar ve patolojik ikincil yapılar sorununu çözen rotasyon matrislerini kullanarak parametrelendiriyorlar. Temel değişiklik, bir dil modeli aracılığıyla besledikleri tek bir dizi fikrine geri dönmeleridir. Her bir kalıntıyı gizli bir alana gömmek için dönüştürücüler kullanıyorlar ve bunu tahminlerde bulunmak için girdi olarak kullanıyorlar, eğitim performansını artırmak için fragmanları uyarlama ve iki farklı proteini birleştirme zorluğu da ekleniyor. Konuşmacı, bir hedef döküm dizisini tahmin etmede RGN1 ve RGN2'yi karşılaştıran sonuçları gösterirken, RGN2, işleme sonrası iyileştirme adımı sayesinde önemli ölçüde daha iyi sonuçlar elde ediyor. Bunun, bir dil modelinden geçen tek bir dizi girişine dayandığına dikkat etmek önemlidir.

  • 01:40:00 Videonun bu bölümünde konuşmacı, protein yapılarını tahmin etme yöntemlerinin doğruluğunu tartışıyor. Alfa 2'ye göre hizalanmış örnekler gösteriyorlar ve doğruluk, son teknoloji kadar iyi olmasa da, tahmin yapmak için çok daha az bilgi kullanıyorlar. Ayrıca, sekans uzayının alacakaranlık bölgesinde bulunan ve sekans homologları olmayan tekil protein örneklerini de gösterirler; burada yaklaşımları, halka açık en son teknolojiye kıyasla önemli bir fark yaratır. Ek olarak, konuşmacı de novo proteinleri ve sistematik olarak başarılı oldukları tasarlanmış proteinleri tartışır; bu, bu tür dizi tabanlı yaklaşımların protein tasarımında faydalı olacağı için mantıklıdır. Son olarak konuşmacı, yöntemlerindeki önemli hızlanmanın çeşitli uygulamalar için yararlı olabileceğini açıklıyor.

  • 01:45:00 Bu bölümde konuşmacılar, genetik varyasyon veya küçük moleküller gibi farklı faktörlere dayalı olarak farklı protein onaylarını tahmin etmek için derin öğrenmeyi kullanma potansiyelini tartışıyorlar. Tek bir sinyal alanı yöntemine sahip olmak teoride daha iyi çalışsa da, alfa 2'nin ne zaman piyasaya sürüldüğü gibi farklı sürümleri kafa kafaya karşılaştırana kadar bunu bilmenin bir yolu yoktur. Bir MSA kullanarak genel arızayı tahmin etmek ve daha sonra başka bir aşama kullanarak gerçek yapıya rafine etmek gibi iyileştirme problemlerinden de bahsedilir. Hızla gelişen virüsler, derin öğrenmenin yararlı olabileceği başka bir alan olarak belirtilmektedir. Son olarak, konuşmacılar gelecekteki potansiyel işbirliği fırsatları ve dünyanın farklı yerlerinden insanlarla bağlantı kurabilme ayrıcalığı konusundaki heyecanlarını dile getiriyor.
Deep Learning for Protein Folding - Lecture 17 - MIT Deep Learning in Life Sciences (Spring 2021)
Deep Learning for Protein Folding - Lecture 17 - MIT Deep Learning in Life Sciences (Spring 2021)
  • 2021.04.26
  • www.youtube.com
MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisGuest lecturers: Bruno Correia, Jinbo Xu, Mohammed AlQuraishiDeep Learning in the Life ...
 

Patoloji için Makine Öğrenimi - Ders 19



Patoloji için Makine Öğrenimi - Ders 19 - Yaşam Bilimlerinde MIT Derin Öğrenme (Bahar 2021)

Ders, teknolojinin zorlukları ve sınırlamaları dahil olmak üzere hesaplamalı patolojide derin öğrenme uygulamasının çeşitli yönlerini kapsar. Konuşmacı, algoritmalara körü körüne güvenme konusunda dikkatli olunması gerektiğini tartışıyor ve bir ağın ne öğrendiğini anlamanın önemini vurguluyor. Ders, hassas tıp için prognostik ve öngörücü araçlar geliştirmek üzere kanser teşhisinde, prognozunda ve tedaviye yanıt değerlendirmesinde derin öğrenmenin nasıl kullanıldığına dair birkaç örneği araştırıyor. Konuşmacı ayrıca tüberküloz için çok ilaçlı tedaviler geliştirmenin zorluklarını tartışıyor ve sorunu çözmek için çeşitli laboratuvar projeleri öneriyor. Genel olarak ders, patolojide derin öğrenmenin potansiyelinin altını çizerken, sınırlamalarını ve klinik ortamlarda etkili bir şekilde uygulanmasını sağlamak için çok disiplinli bir yaklaşıma olan ihtiyacı kabul ediyor.

"Machine Learning for Pathology - Lecture 19 - MIT Deep Learning in the Life Sciences (Bahar 2021)" başlıklı bu YouTube videosunda konuşmacı, ekibinin patoloji için makine öğreniminde partiden partiye ve hücreden hücreye heterojenliği ele alma girişimlerini tartışıyor. varyasyon normalizasyonu (TVN) ve k-en yakın komşu yaklaşımı. Ayrıca ilaçları bakteriler üzerindeki etkilerine göre sınıflandırmak için morfolojik profil oluşturmayı ve hem denetimli hem de denetimsiz öğrenmeyi kullanarak ilaç kombinasyonlarını tasarlamak ve önceliklendirmek için veriye dayalı bir yaklaşım geliştirmeyi açıklıyorlar. Ek olarak, konuşmacı, laboratuvar üyelerine ilaç sinerjisine karşı antagonizma çalışmalarına katkılarından dolayı teşekkür ederek, alandaki araştırmaları anlamak ve ilerletmek için daha geniş bağlamı dikkate almanın önemini vurguluyor.

  • 00:00:00 Bu bölümde, Anand Madabhushi derin öğrenmenin hesaplamalı patoloji alanındaki etkisini, özellikle tıbbi görüntü analiziyle ilgili olarak tartışıyor. Patolojinin sayısallaştırılması, mevcut çok miktarda veri nedeniyle onu derin öğrenmenin uygulanması için bir yuva haline getirmiş olsa da Madabhushi, onlarca yıllık uzmanlık yoluyla el işçiliği özelliklerini içeren özel metodolojilerin derin öğrenme yöntemleri tarafından aşılamamış olabileceğine dikkat çekiyor. . Ayrıca, görüntüleme kullanımı yoluyla kanseri erken bir aşamada doğru bir şekilde teşhis etmenin önemini vurgulamak için kanser teşhisi ve ölüm oranları hakkında bazı istatistikler sağlıyor. Madabhushi, öğrendiği dersleri ve derin öğrenmenin bu alanda en çok nerede ve ne kadar faydalı olabileceğine dair düşüncelerini paylaşmayı umuyor.

  • 00:05:00 Bu bölümde konuşmacı, özellikle prostat kanseri gibi yavaş seyreden kanserlerde aşırı teşhis ve aşırı tedavi konusunu tartışıyor. Biyobelirteçler ve terapötiklerdeki ilerlemelere rağmen, aşırı teşhis ve aşırı tedavi sorunlu olmaya devam ediyor ve hastalar için finansal toksisiteye katkıda bulunuyor. Konuşmacı daha sonra, hassas tıp için prognostik ve tahmine dayalı araçların geliştirilmesine yardımcı olmak için kanser teşhisi, prognozu ve tedaviye yanıt değerlendirmesi bağlamında makine öğreniminin potansiyelini araştırıyor. Halihazırda gen ekspresyonuna dayalı analizler gibi araçlar olsa da, bunların sınırlamaları vardır ve tümör içi heterojenliği hesaba katmazlar. Makine öğrenimi, bu sınırlamaları iyileştirme ve kanserleri daha iyi yönetme ve tedavi etme fırsatı sunar.

  • 00:10:00 Bu bölümde öğretim görevlisi, insan patologlar tarafından görsel olarak ayırt edilemeyen özellikleri ve kalıpları belirlemek için sayısallaştırılmış patoloji slaytlarının ve gelişmiş makine öğrenimi görüntü analizinin kullanımını tartışıyor. Veri bilimcileri, tek tek hücreleri, lenfositleri ve kanser hücrelerini tanımlayarak, hastaların teşhisini, prognozunu ve tedavi yanıtını daha iyi anlamak için tek tek hücrelerin uzamsal mimarisini incelemek ve tek tek hücrelerin uzamsal düzenlemesinden farklı nicel ölçümleri analiz etmek için ağ teorisini kullanabilirler. . Bu süreç, patoloji analizine non-invaziv ve bulut tabanlı bir yaklaşım sağlar.

  • 00:15:00 Bu bölümde konuşmacı, patoloji slaytlarındaki veri miktarının diğer tüm tıbbi görüntüleme alanlarının yerini aldığı hesaplamalı patoloji alanında derin öğrenmenin etkisini tartışıyor. Altı yıl önce, tek tek hücrelerin ek açıklamalarını yığınlı seyrek otomatik kodlayıcıya kullanan ve hücrelerin ek açıklamalarına dayanarak öğrendiği, sinir ağının gradyanlar ve kaba eliptik şekiller gibi daha küçük ayrıntıları almasına izin veren bir sinir ağı yayınlandı. hücreler. Ağ, öğrenciler tarafından görüntüyü bir dizi sınırlayıcı kutuya bölerek elle etiketlenen hücreleri olan ve hücreleri olmayan yamalar üzerinde eğitildi. Bazı hücreler gözden kaçırılsa da ağ, farklı hücre tiplerinin nüanslarını yakalayabildi.

  • 00:20:00 Bu bölümde, konuşmacı patolojide derin öğrenmenin sınırlamalarını, özellikle de boyama ve açıklamalarla ilgili olarak tartışıyor. Boyama, segmentasyonların doğruluğu üzerinde önemli bir etkiye sahip olabilir ve küçük ve büyük hücreler arasındaki tutarsızlık nedeniyle ağ en sağlam şekilde eğitilmemiştir. Konuşmacı ayrıca, normal kalpler ile kalp yetmezliği riski taşıyanları ayırt etmek için denetimsiz özellik üretimine dayalı bir CNN algoritmasının eğitimindeki çalışmalarını tartışıyor. CNN algoritması, patologların yalnızca 0,74 olan AUC'sine kıyasla 0,97'lik bir AUC'ye ulaşarak patologlardan daha iyi performans gösterdi.

  • 00:25:00 Bu bölümde konuşmacı, aynı algoritmayı aynı kurumdan ve tarayıcıdan iki grup hasta üzerinde çalıştırırken yaptıkları şaşırtıcı bir keşfi tartışıyor. Görüntülerin patolojisinde hiçbir fark olmamasına rağmen, ikinci setin AUC'si, görüntü özelliklerini ustaca değiştiren küçük bir yazılım yükseltmesi nedeniyle önemli ölçüde düştü. Bu, görünüşte kontrol edilen ayarlarda bile, körü körüne güvenen algoritmalarda dikkatli olunması gerektiğinin altını çizdi. f'deki panel ayrıca, CNN'lerle denetimsiz öznitelik oluşturmanın esas olarak analitik öncesi varyasyon kaynaklarına duyarlı evrişimleri öğrendiğini, aynı zamanda belirli hücre türlerinin ve bunların uzamsal düzenlemelerinin önemini vurguladığını da gösterdi. Bu, başlangıçtaki yüksek puanla karşılaştırılabilir bir AUC oluşturan, ancak siteler ve tuvaller arasındaki varyasyonlara karşı daha dirençli olan sonraki bir yaklaşıma yol açtı.

  • 00:30:00 Bu bölümde konuşmacı, bir ağın ne öğrendiğini anlamanın ve tıbbi teşhiste kaba kuvvet algoritmalarına güvenme konusunda dikkatli olmanın önemini tartışıyor. Yalnızca arka planda karın varlığına dayanarak dış yapraklar ve kurtları ayırt etmeyi öğrenen ve ağ sonuçlarını yorumlarken dikkatli olunması gerektiğini vurgulayan bir ağ örneğini paylaşıyor. Bu sınırlamalara rağmen konuşmacı, derin öğrenmenin patolojideki algılama ve bölümleme görevlerindeki faydasını tanımlar ve kullanıcıların birkaç temsili örneği bölümlere ayırmasına, bir ağı arka planda eğitmesine ve ince ayar yapmasına olanak tanıyan Quick Annotator adlı etkileşimli bir aracı paylaşır. Etkileşimli bir öğrenme modunda sonuçlar.

  • 00:35:00 Bu bölümde konuşmacı, özellikle patologlar için yeterli zamanın olmayışı olmak üzere, patoloji görüntüleri için not alma sürecindeki zorlukları tartışıyor. Bu sorunu ele almak için konuşmacı, el yapımı özelliklerin açıklama sürecinin verimliliğini artırmaya nasıl yardımcı olabileceğini açıklıyor. Farklı doku bölmelerini ve hücre türlerini tanımlamak için derin öğrenmeyi kullanmanın örneklerini veriyorlar ve ardından doku bölmeleri içindeki farklı hücre türlerinin uzamsal istatistiklerine ve etkileşimlerine bakmak için grafik ağlarını kullanıyorlar. Konuşmacı ayrıca derin öğrenmenin kollajen liflerini segmentlere ayırmak ve bunların oryantasyonuna bir vektör atamak için nasıl kullanıldığını ve bunun daha sonra meme kanseri hastaları için entropi ve prognostik değeri belirlemek için kullanıldığını açıklıyor. Son olarak, konuşmacı prostat kanseri üzerine, bezlerin segmentasyonunu yapmak için derin öğrenmeyi kullanan ve ardından ameliyattan sonra hangi hastalarda nüksetme olacağını tahmin etmek için bezlerin uzamsal düzenlemesine ve mimarisine bakan yeni bir çalışma sunuyor.

  • 00:40:00 Bu bölümde konuşmacı, prostat kanseri sonuçlarını tahmin etmeye yönelik ticari bir moleküler test ile derin öğrenme algoritmalarını kullanan görüntü tabanlı bir yaklaşım arasındaki bire bir karşılaştırmayı tartışıyor. Sonuçlar, iki basit klinik faktörle birleştirilmiş görüntü tabanlı yaklaşımın, maliyetli moleküler tahlilin neredeyse iki katı kadar performans gösterdiğini gösterdi. Ayrıca, derin öğrenme algoritmalarını kullanan görüntü tabanlı yaklaşım, moleküler teste kıyasla çok daha düşük bir maliyetle analiz edilebilen, yorumlanabilir ve doğrulanmış özellikler sağladı. Konuşmacı ayrıca derin öğrenmenin klinik uygulamalarında yorumlanabilirlik ihtiyacının altını çizdi ve derin öğrenme yaklaşımlarıyla birlikte el yapımı özellik mühendisliğinin önemini vurguladı.

  • 00:45:00 Bu bölümde, özellikle tüberküloz (TB) için çoklu ilaç tedavileri tasarlama bağlamında, patoloji için makine öğreniminde yorumlanabilirliğin zorluklarına odaklanılmaktadır. Yorumlanabilirlik eksikliği, kararlarına güvenmek için modellerin altında yatan temsilleri anlaması gereken klinisyenler için önemli bir zorluk oluşturmaktadır. Konuşmacı, ağı sürekli sorgulamanın ve hiçbir şeyi hafife almamanın gerekliliğini vurguluyor. Ayrıca ilk önce en basit metodolojiyle başlamanın ve derin öğrenmeyi ne zaman kullanacaklarına karar vermenin önemini tartışıyorlar. Laboratuvarın tüberküloz üzerine çalışması, hastalığı tedavi etmenin zorluğunu, çoklu ilaç tedavilerine duyulan ihtiyacı ve söz konusu önemli heterojenliği vurgulamaktadır.

  • 00:50:00 Bu bölümde konuşmacı, duyarlılığı sağlamak için farklı ilaçlar gerektiren akciğerdeki bakterilerin çeşitli mikro ortamları nedeniyle tüberküloz için çoklu ilaç tedavileri geliştirmenin zorluklarını tartışıyor. Konuşmacı, şu anda TB tedavisi için pek çok ilaç bulunmasına rağmen, keşfedilmemiş geniş kombinasyon alanının her potansiyel kombinasyonu test etmeyi zorlaştırdığını belirtiyor. Konuşmacı, bu sorunu çözmek için iki laboratuvar projesi öneriyor: ilki, yeni ilaçların etki yolunu belirlemek için görüntüleme yoluyla tek ilaç alanını daraltmak ve ikincisi, sistematik kombinasyon ölçümleri yapmak ve en etkili olanı tahmin etmek için sınıflandırıcılar geliştirmek için makine öğrenimini kullanmak. yeni kombinasyonlar Laboratuvar, farklı tedavi sonuçlarını değerlendirmek için bakterinin hücre morfolojisindeki değişiklikleri yakalamak için hızlandırılmış görüntüleme kullanır.

  • 00:55:00 Bu bölümde konuşmacı, E.coli'deki benzer ilaç profillerini ilişkilendirmek için denetimsiz öğrenme ve kümeleme kullanan bir projeyi anlatıyor. Profiller aynı göründüğünde, bu ilaçların benzer bir etki mekanizmasına sahip olduğunu varsaydılar. Bu fikri tüberküloza uygulamışlar ancak hücreler beklendiği gibi lekeyi almamış ve morfolojik özellikler birbirinden çok farklı görünmemiştir. Ancak yine de bazı tedavi gruplarında tedavi edilmemiş hücrelerden istatistiksel olarak anlamlı farklılıklar buldular. Sitolojik profilleme için tipik boru hattı oluşturuldu ve hangi tedavi gruplarının birbirine en çok benzediğini anlamaya çalışmak için bir sınıflandırma denemesi yapmayı umdular. Patojenlerin ilaçlara yanıt verdiğini, ancak yanıt mekanizmalarında çeşitlilik olduğunu ve ilaçların içeri girmesini zorlaştıran son derece kalın hücre duvarlarına sahip olduğunu buldular.

  • 01:00:00 Dersin bu bölümünde konuşmacı, ekibinin patoloji için makine öğrenimindeki deneylerinin partiden partiye ve hücreden hücreye heterojenliğini ele alma girişimlerini tartışıyor. Değişken veriler nedeniyle çalışmayan bir sinir ağı kullanmayı denediler. Daha sonra, biyolojik olmayan varyasyonları azaltmak için her bir deneyden işlenmemiş kontrollerin temel bileşen analizi (PCA) tarafından üretilen kovaryans matrislerini hizalamak için Google'da işbirlikçileri Mike Ando tarafından geliştirilen tipik varyasyon normalizasyonu (TVN) adlı bir yöntem kullandılar. Ayrıca hücreden hücreye heterojenlik ölçümlerini dahil ettiler ve ince morfolojik değişiklikleri yakalamak için PCA kullanmaktan k-en yakın komşu yaklaşımına geçtiler. Kırılganlığı önlemek için stokastik bir yaklaşım kullandılar ve her bir sınıflandırma denemesi için yeni bir işlenmemiş kontrol seti seçtiler.

  • 01:05:00 Bu bölümde konuşmacı, ilaçları bakteriler üzerindeki etkilerine göre sınıflandırmak için morfolojik profillemeyi kullanma sürecini anlatıyor. Süreç, bakterileri düşük ve yüksek dozda bir ilaçla tedavi etmeyi, bakterileri sabitlemeyi ve boyamayı, özellikleri çıkarmayı, verileri normalleştirmeyi ve stokastik simülasyonu gerçekleştirmeyi içerir. Ortaya çıkan konsensüs sınıflandırması yaklaşık %75 doğrudur ve ilaçlar arasındaki bağlantıları görselleştirmek için bir ağ diyagramı kullanılır. Bununla birlikte, konuşmacı, bir ilacın, bedakuilin'in, bakteride bir enerji krizine neden olduğu hipotezine yol açan bir hücre duvarı etkili ajan olarak yanlış sınıflandırıldığını belirtiyor. Bu hipotez, bakterilerin yağ asitleri üzerinde çoğalmasıyla doğrulandı ve bu da farklı bir sınıflandırma ile sonuçlandı.

  • 01:10:00 Dersin bu bölümünde, konuşmacı Bedaquiline ilacının tüberküloz üzerindeki etki mekanizmasını ve bunun bakterilerin metabolik durumuna nasıl bağlı olduğunu tartışıyor. Konuşmacı ayrıca, antibakteriyellerin TB üzerindeki proksimal hasarlarını ve ikincil etkilerini belirlemek için morfolojik profillemenin nasıl kullanılacağını açıklar. Bu yöntemin, araştırmacıları ikincil çalışmalar için odaklanmaları gereken yol alanına yönlendirmeye yardımcı olacak hedefli bir yaklaşım sağladığını açıklıyorlar. Konuşmacı ayrıca, TB tedavisinde yüksek dereceli kombinasyonlar için geleneksel olarak verimsiz olan bir dama tahtası tahlili kullanarak ilaç kombinasyonlarının ölçülmesine de değiniyor.

  • 01:15:00 Bu bölümde, konuşmacı tüberkülozda yüksek dereceli ilaç kombinasyonlarını ölçmeyle ilgili zorlukları tartışıyor ve Elmas (n-yönlü ilaç etkileşimlerinin Çapraz Ölçümleri) adlı bir çözüm sunuyor. Diamond, bir doz-yanıt eğrisinin birimini koruyan ve dama tahtasının bilgi açısından en zengin kısımlarını ölçen, dama tahtası testinin geometrik bir optimizasyonudur. Konuşmacı, bir çizgi yansıtarak, ilaç etkileşimi derecesinin fraksiyonel inhibitör konsantrasyonla nasıl ölçülebileceğini açıklar. Elmas, 10'a kadar ilaç kombinasyonunu verimli bir şekilde ölçmek için kullanılmıştır. Konuşmacı, tüberkülozda in vitro çalışmalar kullanılarak çoklu ilaç kombinasyonlarının tasarlanmasında iki ana sorunun üstesinden gelmek için kullanılan geniş bir veri setini tartışıyor. Çalışma, farklı hayvan modellerinde neler olduğunu modelleyerek hesaplamalı olarak birleştirmek için sekiz farklı büyüme ortamında in vitro olarak tüm tekli, ikili ve üçlü ilaç kombinasyonlarını ölçtü. Konuşmacı, ilaç etkileşim profillerinin büyük ölçüde büyüme ortamına bağlı olduğu ve tüm koşullarda sinerjik olan tek bir kombinasyonun olmadığı sonucuna varır.

  • 01:20:00 Bu bölümde konuşmacı, makine öğrenimini kullanarak ilaç kombinasyonlarını tasarlamaya ve önceliklendirmeye yönelik veriye dayalı yaklaşımlarını tartıştı. Verilerini bir veri küpünde birleştirmek için hem denetimli hem de denetimsiz öğrenmeyi kullandılar ve standart bakım standardından daha iyi olup olmayacaklarına göre kombinasyonları tanımlayan güçlü bir sinyal buldular. Ayrıca rastgele orman modelleri gibi farklı denetimli öğrenme yöntemleri kullanarak ölçümlerini yaptıkları büyüme koşullarının sayısını sınırlamanın bir yolunu buldular. Konuşmacı, daha basit yaklaşımın, doğrulanmış in vitro modelleri kullanarak kombinasyon uzayını sistematik ve verimli bir şekilde en iyi nasıl keşfedeceklerine dair bir yol belirlemeleri için daha iyi çalıştığını vurguladı. Genel olarak, yaklaşımları, in vitro deneylerin sayısını azaltmaya yardımcı olabilir ve en iyi ilaç kombinasyonlarına yol açabilir.

  • 01:25:00 Bu bölümde konuşmacı, laboratuvarında ilaç sinerjisine karşı antagonizma çalışmalarını içeren çeşitli zor ve dağınık projelerde çalışan kişilere teşekkür eder. Bu çalışmalar nihayetinde yaşam bilimlerinde makine öğrenimi ve derin öğrenme için daha geniş bir bağlam sağlamaya yardımcı oluyor ve bunların çok daha büyük bir denklemin küçük bir parçası olduklarını vurguluyor. Her zaman doğru bir yaklaşım olmadığı, ancak alandaki araştırmaları anlamak ve ilerletmek için gerekli olduğu için bu daha geniş bağlamı dikkate almanın önemi vurgulanmaktadır. Genel olarak, konuşmacının konuşması çok aydınlatıcıydı ve makine öğrenimi ile patolojinin kesişimine ilişkin değerli içgörüler sağladı.
Machine Learning for Pathology - Lecture 19 - MIT Deep Learning in the Life Sciences (Spring 2021)
Machine Learning for Pathology - Lecture 19 - MIT Deep Learning in the Life Sciences (Spring 2021)
  • 2021.05.12
  • www.youtube.com
MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep Learning in the Life Sciences / Computational Systems BiologyGuest Lecturers: Anan...