Makine Öğrenimi ve Sinir Ağları - sayfa 23

 

Hücre Görüntüleme Segmentasyonu için Derin Öğrenme - Ders 20



Hücre Görüntüleme Segmentasyonu için Derin Öğrenme - Ders 20 - Yaşam Bilimlerinde MIT ML (Bahar 2021)

Bu videoda konuşmacılar, hızlandırılmış görüntülemede hücrelerin hareketini belirlemeyi içeren hücre izleme için derin öğrenmenin kullanımını tartışıyorlar. Geleneksel manuel izleme yöntemlerinin maliyetli ve zaman alıcı olduğunu ve derin öğrenme yöntemlerinin süreci önemli ölçüde hızlandırırken aynı zamanda daha yüksek doğruluk sağlayabildiğini açıklıyorlar. Konuşmacılar, hücre takibi için U-Net, StarDist ve DeepCell dahil olmak üzere çeşitli derin öğrenme mimarilerini tartışıyor. Ayrıca, hücre izlemedeki zorluklardan birinin birbirine yakın veya örtüşen hücreleri ayırt etmek olduğunu ve çoklu nesne izleme veya grafik tabanlı yaklaşımlar gibi yöntemlerin bu sorunu çözmeye yardımcı olabileceğini belirtiyorlar. Konuşmacılar, hücre takibi için farklı derin öğrenme yöntemlerini kıyaslamanın ve tekrarlanabilirlik ve karşılaştırma için açık erişim veri kümeleri sağlamanın önemini vurguluyor. Ayrıca kanser araştırması ve ilaç keşfi gibi çeşitli alanlarda hücre izlemenin potansiyel uygulamalarını vurguluyorlar.

  • 00:00:00 Bu bölümde Juan Casado, biyolojik sistemleri mikroskopi ve diğer görüntüleme tekniklerini kullanarak anlamaya yönelik bir yöntem olan görüntü tabanlı fenotipleme kavramını tartışıyor. Hücreler gibi biyolojik yapıların görüntülerinin hücre boyutu ve DNA içeriği dahil olmak üzere farklı fenotipler için nasıl ölçülebileceğini ve tedaviler ve ilaç keşfi ile ilgili kararlara rehberlik etmek için nasıl kullanılabileceğini açıklıyor. Casado, mikroskopi görüntüleri kullanılarak hücre boyutunun hassas ölçümü yoluyla keşfedilen ve nihai olarak FDA tarafından onaylanmasına yol açan lösemi için başarılı bir ilaç adayı örneği veriyor. Görüntü tabanlı profil oluşturmanın biyoloji ve ilaç geliştirme alanındaki potansiyel etkisini vurgulamaktadır.

  • 00:05:00 Bu bölümde, farklı özelliklere sahip hücre popülasyonlarının karşılaştırılmasına ve hangi tedavilerin etkili olduğunun belirlenmesine odaklanılmaktadır. Bu, hücre görüntülerinden bilgi çıkarmak için daha fazla bilgi ve strateji gerektirir; bu, görüntü tabanlı profillemenin devreye girdiği yerdir. Bu, ilaç keşfi ve fonksiyonel genomik için nicel bilgi çıkarmak için görüntüleri kullanarak hücrelerin morfolojisini veya hücrelerin durumunu genişletmeyi içerir. Bu yaklaşımla ilişkili iki hesaplama problemi, hücre segmentasyonu ve tek hücre temsili öğrenmedir; burada amaç, farklı görüntü türleri için segmentasyon algoritmalarını ayarlayarak zaman ve enerji harcamak zorunda kalmadan tek hücrelerin görüntülerde nerede olduğunu belirlemektir. Nihayetinde amaç, doğal görüntülerde faz dedektörlerinin yanı sıra çalışan hücreler için segmentasyon algoritmaları oluşturmaktır.

  • 00:10:00 Bu bölümde konuşmacı, bilgisayarlı görü teknolojilerinin biyolojide segmentasyon için çalışmasını amaçlayan BioImage Challenge 2018'den bahsediyor. Zorluk, açıklamalı bir veri kümesi oluşturmayı, bunu eğitim ve test bölümlerine ayırmayı, bir başarı ölçüsü tanımlamayı ve birleşim üzerinden kesişime dayalı bir puanlama sistemi aracılığıyla katılımcılara geri bildirim sağlamayı içeriyordu. Katılımcılardan, girdiler ve çıktılar arasındaki ilişkileri öğrenmek ve girdi olarak sağladıkları görüntünün bir segmentasyon haritasını oluşturmak için denetimli bir makine öğrenimi modeli kullanmaları bekleniyordu. Kazananlar, son test setini kullanılan metriğe göre daha doğru bir şekilde bölümlere ayırabilenlerdi.

  • 00:15:00 Bu bölümde, konuşmacı bir hücre görüntüleme segmentasyon yarışmasındaki ilk üç rakibi ve onların makine öğrenimi modelleri için farklı mimarileri kullanmalarını tartışıyor. Üçüncü sırayı alan ekip, nesneyi nesneden ayırmak için tam sınırlayıcı kutuyu ve maskeyi tanımlamadan önce, bir görüntüyü bölgelere ayıran ve gerçek nesneler olup olmadıklarını belirlemek için bir ağ tarafından incelenen adaylar oluşturan Mask RCNN mimarisini kullandı. arka plan. İkinci sıradaki ekip, ara çıktılar oluşturmak için çoklu özellik haritalarını hesaplayan ve nihai çıktıyı oluşturmak için tüm farklı çözünürlüklerden bilgileri toplayan bir görüntü piramidi ağı kullandı. Konuşmacı, hücre segmentasyonu için yüksek doğruluk elde etmede mimarinin bir rol oynamasına rağmen, düzenli kalibrasyon ve çapraz doğrulama deneylerinin yürütülme şeklinin de çok önemli olduğunu belirtiyor.

  • 00:20:00 Bu bölümde, konuşmacı görüntü bölütleme için yeni bir yaklaşımı tartışıyor. Çözüm, bir görüntüdeki nesnelerin konumunu belirlemek için ikili maskeler kullanmak yerine, hücrenin merkezinden farklı yönlerdeki mesafeleri ölçen mesafe haritalarını veya açı haritalarını tahmin etmeyi içerir. Çıktılar, nesne konumunun daha hassas ölçümlerini sağlamak için manuel olarak tasarlandı ve bu da yarışmada ikinci sırayı aldı. Bu fikir o zamanlar yeni olmasına rağmen, sonraki çalışmalar onun değerini değerlendirdi ve özellikle birçok nesne içeren kalabalık görüntüler için sağlam olduğunu buldu. Kullanılan kodlayıcı-kod çözücü mimarisi yenilikçi değildi, ancak yenilik, aynı mimariyi 32 farklı modelde kopyalayarak bir topluluk oluşturarak rekabeti kazanmalarına yardımcı oldu.

  • 00:25:00 Bu bölümde, konuşmacılar, hücre görüntüsü bölümleme için daha basit modellere karşı topluluk yaklaşımının performansını tartışıyor. Topluluk yaklaşımı hesaplama açısından yoğun olsa da, daha basit modellerin pratikte hala etkili olabileceğini açıklıyorlar. Ayrıca yarışmaların sınırlamalarını tartışıyorlar ve bir topluluk içindeki bireysel modelleri analiz etmenin, onları yalnızca en doğru olanlara indirgemek için yararlı olacağını belirtiyorlar. Konuşmacılar daha sonra, belirli görüntü türleri için algoritmaları optimize etmenin zaman alıcı olabileceğini ve doğruluğun görüntü türüne göre değişebileceğini göstererek, segmentasyon yoluyla biyoloji araştırmalarını kolaylaştırmada yapılabilecek iyileştirmeleri değerlendirerek devam ederler. Ek açıklamalardaki dengesizliklerin ve belirli görüntü türlerini bölümlere ayırmadaki zorluğun, gerçek dünyadaki durumlarda zorluklar yaratabileceğini de belirtiyorlar.

  • 00:30:00 Bu bölümde, konuşmacı, küçük flüoresanlardan, parçalanması daha zor olan pembe ve mor görüntülere kadar farklı görüntüleme tekniklerini ayrıştırmanın zorluklarını tartışıyor. Görüntü tipi başına bir model eğitmek veya ayarlanan parametrelerle klasik algoritmalar kullanmak gibi görüntüleri bölümlere ayırmak için farklı yaklaşımlar vardır. Ek olarak, artık Nucleizer, CellPose ve Mesmer gibi hücre segmentasyonu için önceden eğitilmiş modeller mevcuttur. Bununla birlikte, segmentasyonda, daha büyük veri kümeleri toplamak ve uzmanların nesneleri tanımlamaya harcadıkları zamanı optimize etmek gibi hala açık zorluklar var. Konuşmacı, klasik morfoloji ölçümlerinin ötesindeki özellikleri öğrenebilen makine öğrenimi yöntemleri kullanılarak hücrelerin fenotipinin ölçülmesinin önemine de kısaca değiniyor.

  • 00:35:00 Bu bölümde konuşmacı, ilaç keşfi için hücre görüntüleme segmentasyonunda makine öğrenimi yöntemlerinin kullanımını tartışıyor. Pertürbasyon deneyleri, hücrelerin bileşiklerle işlendiği durumlarda kullanılır, ancak parti etkileri gürültüye neden olabilir ve fenotipin anlaşılmasını zorlaştırabilir. Temel bir gerçek olmadığından, uygulanan bileşiği sınıflandırmak için bir sinir ağının kullanıldığı zayıf denetimli bir öğrenme yöntemi kullanılır. Amaç, hücreleri anlamlı bir şekilde organize etmek için bileşiklerin benzer olup olmadığını bildirebilecek özellikler elde etmektir. Değerlendirme, arama alanını yararlı bileşiklere indirgemek amacıyla benzer biyolojik etkileri paylaşan bileşik kümelerinin gözlemlenmesini içerir. Derin öğrenme özelliklerinin klasik özelliklerle karşılaştırılması, önemli bir fark gösterir.

  • 00:40:00 Bu bölümde konuşmacı, özellikle bileşikler arasındaki biyolojik olarak anlamlı bağlantıların belirlenmesi ve kanserdeki mutasyonların etkisinin belirlenmesi olmak üzere hücre görüntüleme segmentasyonu için derin öğrenmenin kullanımını tartışıyor. Araştırmacılar, bir genin orijinal tipini bir mutantla karşılaştırarak, mutantın kanseri tetikleyip tetiklemediğini belirlemek için aralarındaki fenotipik benzerliği ölçebilirler. Ancak toplu düzeltme, görüntülerden öğrenilen özellikleri etkileyebileceğinden, derin öğrenmede bir zorluk olmaya devam ediyor. Konuşmacı, bileşik sınıflandırma ve toplu belirleme için iki başlı bir sinir ağının kullanıldığı etki alanı uyarlamasının kullanılmasını önerir. Negatif gradyan daha sonra parti ile ilişkili potansiyel bilgileri yok etmek için kullanılır ve bu da daha net fenotipik belirleme sağlar. Genel olarak konuşmacı, görüntülerin biyolojik keşif için harika bir bilgi kaynağı olduğu sonucuna varıyor, ancak aynı zamanda temsili öğrenme ve açıklanabilir modellerdeki açık zorlukları da kabul ediyor.
Deep Learning for Cell Imaging Segmentation - Lecture 20 - MIT ML in Life Sciences (Spring 2021)
Deep Learning for Cell Imaging Segmentation - Lecture 20 - MIT ML in Life Sciences (Spring 2021)
  • 2021.05.12
  • www.youtube.com
MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep Learning in the Life Sciences / Computational Systems BiologyGuest lecture: Juan C...
 

Derin Öğrenme Görüntü Kaydı ve Analizi - Ders 21



Derin Öğrenme Görüntü Kaydı ve Analizi - Ders 21 - Yaşam Bilimlerinde MIT ML (Bahar 2021)

Bu derste Adrian Dalock, tıbbi görüntüleri hizalama konusunu ve bunun arkasındaki optimizasyon problemini derinlemesine inceliyor. Görüntü kaydı için sinir ağlarını eğitmek üzere etiketlenmemiş veri setlerinin kullanılmasını içeren voksel morf adı verilen yeni bir yöntem öneriyor. Konuşmacı ayrıca sinir ağlarının daha önce görmediği yeni veriler ve diziler için sağlamlığın zorluğunu tartışıyor ve sağlam modelleri eğitmek için çeşitli ve aşırı koşulları simüle etmeyi öneriyor. Konuşmacı, klasik kayıt modellerini voxel morph ve synthmorph modelleriyle karşılaştırır, ikincisi oldukça sağlamdır. Son olarak, konuşmacı doğrudan bir şablon öğrenmek yerine istenen özelliklere dayalı olarak şablonlar üreten bir işlevin geliştirilmesini ve kolon anormalliklerini saptamak için kapsül video endoskopinin potansiyel kullanımını tartışır.

Bu dersteki konuşmacı, özellikle polip tespiti için kolonoskopi videoları bağlamında, tıbbi veri eksikliğinin üstesinden gelmek için çeşitli makine öğrenimi yaklaşımlarını tartışıyor. Etki alanı kaymasını ele almak ve performansı artırmak için önceden eğitilmiş ağırlıklar ve rastgele başlatmayı kullanan derin öğrenme görüntü kaydı ve analiz mimarisi sunarlar. Ders aynı zamanda zayıf denetimli öğrenme, kendi kendine denetimli öğrenme ve zayıf denetimli video bölümleme konularını da kapsar. Konuşmacı, tıbbi veri analizinde makine öğrenimi yaklaşımlarını kullanırken karşılaşılan zorlukları kabul ediyor ve iş yükünü azaltmak için bu yaklaşımların gerçek tıbbi prosedürlerde test edilmesini teşvik ediyor.

  • 00:00:00 Dersin bu bölümünde Adrian Dalock, tıbbi görüntüleri hizalamanın önemini ve bunun arkasındaki optimizasyon problemini tartışıyor. Görüntüleri ortak bir referans çerçevesine hizalamanın, yapıların ve hastalıkların tanımlanmasının yanı sıra denekler arasında karşılaştırmaya izin verdiği için tıbbi görüntülerin analizinde merkezi olduğunu açıklıyor. Bununla birlikte, geleneksel hizalama adımı çok zaman alıcıydı ve beyin başına iki saat kadar sürüyordu, bu da gelişmiş modellerin geliştirilmesini engelledi. Dalock, CPU'da bir dakikadan ve GPU'da bir saniyeden daha kısa olan ve bu alanda daha hızlı ve daha verimli araştırma yapılmasına olanak tanıyan çok daha hızlı bir yöntem sunar. Hizalamayı veya kaydı, görüntülerle eşleşen bir deformasyon alanı bulmak olarak tanımlar ve bilgisayar görüşü ve hesaplamalı biyoloji dahil olmak üzere çeşitli alanlarda kapsamlı bir şekilde araştırılmıştır.

  • 00:05:00 Bu bölümde konuşmacı, klasik modellerden başlayıp üç yıl önce ortaya çıkan öğrenmeye dayalı yöntemlere doğru ilerleyerek görüntü kayıt yöntemlerinin gelişimini tartışıyor. Bununla birlikte, sonraki yöntemler, etkili olmalarına rağmen, denetlenen veriler için kullanılacak bir yer-gerçeği deformasyon alanının olmaması nedeniyle engellenmektedir. Konuşmacı, sinir ağlarını eğitmek için etiketlenmemiş veri kümelerinin kullanılmasını içeren ve görüntü kaydı için daha zarif ve verimli uçtan uca çözümler sağlayan yeni bir yöntem öneriyor. Çerçeve, tamamen yeni bir sinir ağını optimize etmek için klasik modellerdeki kayıp fonksiyonlarının kullanılmasını içerir, bu da daha yüksek doğruluk ve daha yüksek hızlar sağlar.

  • 00:10:00 Bu bölümde, konuşmacı, klasik yöntemlerden ödünç alan ancak alanları doğrudan optimize etmek yerine deformasyon alanlarını çıkarmak için bir sinir ağını optimize eden derin öğrenme tekniklerini kullanan bir görüntü kaydı yöntemini açıklamaktadır. Deformasyon alanı, bir veri setindeki tüm görüntülere uygulanır ve ağı optimize etmek için stokastik gradyan teknikleri kullanılır. Konuşmacı, deformasyon alanının düzgünlüğünü sağlamak için farklılaştırılabilir kayıpların nasıl kullanıldığını açıklar ve sonuçlar, çözgü işleminden önceki ve sonraki anatomik yapıların karşılaştırılmasının yanı sıra hacim örtüşmelerinin ölçülmesiyle değerlendirilir. Voksel morf adı verilen önerilen yöntem, bir optimizasyon prosedürünün çıktısını tahmin edebiliyor ve görüntüler, deformasyon alanları ve belirsizlik tahminleri arasında zarif bağlantılar sunarak olasılıksal modeller için bir yaklaşım sağlıyor.

  • 00:15:00 Bu bölümde, konuşmacı yalnızca birkaç görüntüyle bir voksel morf sinir ağı eğitimi analizini tartışıyor ve yalnızca 10 görüntüyle bile ağdan çıkan deformasyon alanının son teknolojiye yakın olduğunu ortaya koyuyor . Ek olarak, konuşmacı, beyindeki hipokampus gibi belirli ilgi alanlarının ana hatlarını çizme konusuna ve ağa bu alanı gerçekten etiketlemeden "yumuşak bir bölümleme" gerçekleştirerek tanımlamayı nasıl öğretebildikleri konusuna değiniyor. eğitim. Son olarak, konuşmacı, çeşitli tıbbi görüntülerin zorluklarını ve yalnızca bir modalite üzerindeki eğitim ağlarının diğer modalitelerle çalışma becerilerini nasıl sınırlayabileceğini tartışarak bu sorunu çözen bir proje sunuyor.

  • 00:20:00 Bu bölümde konuşmacı, daha önce görmedikleri yeni verilere ve dizilere dayanıklı sinir ağları oluşturmanın zorluğunu tartışıyor. Ağı önemli değişkenliğe maruz bırakmak için çeşitli ve aşırı koşulları simüle etmeyi önerirler, böylece bazı aykırı değerleri göz ardı etmeye karar verir ve gerçek dünya verilerine daha iyi genelleştirme sağlar. Bunu başarmak için görüntüleri rasgele deforme ederler, farklı gürültü modelleri eklerler, değerleri ve yoğunlukları rasgele doldururlar ve veri oluşturmak için çeşitli efektleri simüle ederler. Kayıtlar ve bölümleme kağıtları için çeşitli verileri simüle etmeyi ve bilginin kalitesini test etmek için kullanılabilecek bir deformasyon alanı sağlayan rastgele şekilleri simüle etmeyi denediler.

  • 00:25:00 Bu bölümde konuşmacı, görüntü kaydı ve analizi için farklı modellerin eğitiminin sonuçlarını tartışıyor. Eğitim için farklı ölçümler kullanarak voksel morf modellerini ve synthmorph modelinin iki versiyonunu eğittiler. Klasik modeller iyi performans gösterir, ancak değişkenlik ve sağlamlığa sahip voksel morf modelleri daha da iyi performans gösterir. Simüle edilmiş beyin veya leke görüntüleriyle eğitilen modeller, kabaca voksel morf modelleriyle aynı ve klasik modellerden daha iyi performans gösteriyor. Ancak, modaliteler arasında kayıt söz konusu olduğunda, aynı kontrastlı metriklerle eğitilmiş modeller çöker. Bu arada, synthmorph modelleri, gerçek görüntülerde bile oldukça sağlamdır. Ancak model kapasitesi, gerçek görüntülerin özelliklerinin yakalanmayabileceği bir soruna yol açabilir.

  • 00:30:00 Dersin bu bölümünde, konuşmacı makine öğrenimi modellerinin kapasitesini ve alanın daha fazla parametre kullanımına doğru nasıl ilerlediğini tartışıyor. Beyin taramalarını farklı modalitelerle simüle ederler ve klasik modeller olan voksel morf ile bunların yöntemi olan synthmorph'un performansını karşılaştırırlar. Kontrastı tamamen göz ardı edebildiği ve yalnızca ağın özelliklerindeki kontrast değişimine yanıtı göz ardı etmeyi öğrenerek yapılan gerekli anatomiyi çıkarabildiği için yöntemlerinin sağlam olduğunu buldular. Ayrıca hiperparametrelerin kayıt alanları üzerindeki etkisini öğrenen yeni yöntemleri hypermorph'u da tanıtıyorlar. Bu yöntemin potansiyeli, yalnızca bir modelin eğitilmesini ve daha sonra ayarlanmasını gerektirmesidir, bu da birden çok modelin eğitilme ihtiyacını ortadan kaldırır.

  • 00:35:00 Bu bölümde, konuşmacı, hiper ağlar adı verilen, girdi olarak bir hiper parametre değeri alan ve görüntü kaydı için deformasyon alanları oluşturan daha büyük bir ağın ağırlıklarını çıkaran küçük bir ağın eğitimini içeren bir tekniği tartışıyor. Hiper parametre değerini ayarlayarak, deformasyon alanı, yeniden eğitim gerektirmeden ayarlanabilir ve tek bir hipermorf modeli, çok çeşitli deformasyon alanı varyasyonlarını yakalayabilir. Bu teknik, görüntü kaydının ötesinde çeşitli makine öğrenimi ayarlarına uygulanabilir ve modelin etkileşimli olarak ayarlanmasına veya doğrulama verilerine göre ayarlanmasına izin vermede yararlı olabilir. Optimum hiper parametre değeri, diğer faktörlerin yanı sıra veri kümesine, hastaların yaşına ve kayıt görevine bağlı olarak değişir.

  • 00:40:00 Dersin bu bölümünde konuşmacı, görüntü kaydı gerçekleştirirken beynin farklı bölgeleri için farklı hiperparametre değerleri seçmenin önemini tartışıyor. Ayrıca, gerçek verilerle eğitilmiş bir modeli, rastgele verilerle eğitilmiş bir modelle karşılaştırarak, ilkinin farklı bölgelerde gürültüye nasıl daha duyarlı olduğunu açıklıyorlar. Daha sonra, merkezi bir beyin oluşturmadan veya bir şablon kullanmadan verileri ortak bir referans çerçevesine hizalama fikrine odaklanan bir proje sunarlar. Bunun yerine, görüntüleri kaydederken aynı zamanda bir atlası tahmin etmeyi öneriyorlar ve ortaya çıkan aracın esnek olduğu ve farklı popülasyonlar için ayrı şablonlar oluşturmak gibi önceden çözülmesi zor olan birçok sorunu çözebildiği gösteriliyor.

  • 00:45:00 Bu bölümde konuşmacı, istenen bir özelliğe (yaş, cinsiyet veya genetik gibi) dayalı bir şablon oluşturan bir işlevi öğrenmeyi içeren derin öğrenme görüntü kaydı ve analizinde "koşullu şablonlar" kavramını tartışır. bilgi) doğrudan bir şablon öğrenmek yerine. Ağ, hasta verilerini ve yaş bilgilerini besleyerek, ventrikül boyutundaki değişiklikler gibi farklı beyinler arasındaki belirli etkileri yakalayan, yaşa bağlı pürüzsüz bir atlası öğrenebiliyor. Konuşmacı ayrıca, benzer yöntemler kullanılarak genetikle ilgili analiz potansiyelinin yanı sıra bu alanda varyasyonel kodlayıcıların ve diğer makine öğrenimi kavramlarının kullanımını tartışıyor.

  • 00:50:00 Dersin bu bölümünde konuşmacı, Norveç Bilim ve Teknoloji Üniversitesi ile Norveç'teki bir hastane arasındaki bir işbirliği olan kapsül video endoskopi için otomatik patoloji tespiti konusundaki çalışmalarının arkasındaki motivasyonu tartışıyor. İnsan kolonu, kolon duvarlarının düzgünlüğünü aşındıran ve kanamaya veya diğer komplikasyonlara yol açabilen kolorektal kanser ve ülseratif kolit gibi hastalıklara karşı hassastır. Kolonoskopiler 50 yaş üstü bireylere doktorlar tarafından önerilmekle birlikte hastalar tarafından kabul edilmeyebilir. Kapsül video endoskopiler, büyük miktarda veri üretmek için neredeyse 50.000 kare ileten küçük hap boyutlu bir kamera kullanarak kolon duvarlarını görselleştirmenin ve anormallikleri saptamanın alternatif bir yolunu sunar.

  • 00:55:00 Bu bölümde konuşmacılar, sindirilebilir bir kapsülün sindirim sisteminden geçerken görüntüleri yakaladığı kapsül video endoskopi ile görüntülemenin zorluklarını tartışıyor. Kapsül aç karnına alınmalıdır ve kalın bağırsağın kıvrımlarındaki özellikleri kaçırabilir. Ek olarak, kapsül ince bağırsaktan geçerken sıkışabilir veya geometrik engellerle karşılaşabilir ve bu da potansiyel olarak ameliyata yol açabilir. Ortaya çıkan video kalitesi, sınırlı renk ve geçiş yumuşaklığı ile HD görüntü kalitesi kadar iyi değildir. Bu sınırlamalara rağmen, kapsüllü video endoskopi divertikülit gibi durumların teşhisinde yardımcı olabilir ve doktorlar tedaviyi yönlendirmek için videodaki anormallikleri ararlar.

  • 01:00:00 Dersin bu bölümünde, konuşmacı, özellikle polip tespiti için kolonoskopi videoları bağlamında, tıbbi veri analizinde makine öğrenimi yaklaşımlarını kullanmanın zorluklarını tartışıyor. Ana sorun, tıbbi veri toplamanın pahalı ve yavaş doğası ve çeşitli patologlar tarafından etiketleme almanın zorluğu nedeniyle veri eksikliğidir. Konuşmacı, veri eksikliğinin üstesinden gelmek için transfer öğrenme ve denetimli öğrenme gibi çeşitli makine öğrenimi yaklaşımlarını özetliyor ve RGB görüntüleri, geometrik özellikler ve 3B evrişimleri kullanan mevcut derin öğrenme yaklaşımlarını açıklıyor. Son olarak, konuşmacı, kolonoskopi görüntülerini hizalamak ve polip saptama performansını iyileştirmek için kaydın kullanılmasını içeren polip tespiti için yaklaşımı tanıtır.

  • 01:05:00 Dersin bu bölümünde, konuşmacı, etki alanı kaymasını ele almak ve nesne algılama ve görüntü bölümlendirme performansını iyileştirmek için önceden eğitilmiş ağırlıklar ve rastgele başlatma kullanan derin öğrenme görüntü kaydı ve analiz mimarisini tartışıyor. Mimari, biri ImageNet'ten önceden eğitilmiş ve diğeri rasgele ağırlıklara sahip iki kodlayıcıdan ve girdi görüntülerinin büyütülmesinden oluşur. Her kodlayıcı için öğrenme oranları, üzerinde çalıştıkları katmana bağlıdır ve ikili çapraz entropi ve zar kaybı işlevi kullanılır. Mimari, polip içeren bir video veri kümesi üzerinde test edildi ve aynı girdinin birden çok varyasyonunu kullanarak 85,9'luk bir F1 puanı elde etti. Son olarak, konuşmacı mimarinin etkinliğini sergileyen videolar sunar.

  • 01:10:00 Bu bölümde öğretim görevlisi, bir görüntü kayıt sorunu için etiketli veri toplamanın zorluğunu tartışıyor ve zayıf denetimle çoklu örnek öğrenme kavramını tanıtıyor. Varsayım, ilgilenilen patolojinin en az bir örneğine sahip bir pozitif çanta olduğu halde, negatif çantanın her zaman negatif örnekleri olduğudur. Sorun, hangi karelerin patolojiyi içerdiğini bulmak olarak formüle edilmiştir ve her kareden bireysel katkıyı tahmin ederek ve toplamanın son video etiketindeki kaybı optimize ederek optimize edilebilir. Sınırlı etiketli veriler ve tek tek bileşenlerle ilgili verilerin bulunmaması nedeniyle bu sorunun zorlayıcı olduğu ve zayıf bir şekilde denetlenen bir yaklaşım gerektirdiği belirtilmektedir.

  • 01:15:00 Bu bölümde konuşmacı, patolojileri olan videolardan ve normal videolardan rezonans 50 özelliğini nasıl çıkardıklarını ve bunları bir atlama bağlantısıyla çift yönlü LSTM içeren artık LSTM bloklarından nasıl geçirdiklerini tartışıyor. Hedefin, nihai video sınıflandırma problemine her karenin katkısı olan alfaları bulmak olduğunu açıklıyorlar. Ayrıca patolojileri tanımlamak ve onları negatif sınıflardan ayırmak için yüksek dikkat değeri çerçevelerinden yararlanmayı tartışıyorlar. Nihai kayıp fonksiyonu, video sınıflandırmasının çapraz entropisidir ve torbaların pozitif ve negatif kümeler arasında ayrılmasıdır. Konuşmacı daha sonra, son gizli temsile katılarak ve onu son çıktıya uygulayarak elde edilen en iyi sonuçlarla, dikkatin nerede öğrenileceğini belirlemek için bir adlandırma çalışmasını nasıl gerçekleştirdiklerini paylaşır. Yaklaşım, metrik öğrenmeyi kullanan diğer yöntemlere karşı test edildi.

  • 01:20:00 Bu bölümde, konuşmacı tıbbi görüntülemede kendi kendine denetimli öğrenmenin kullanımını ve ortaya çıkardığı zorlukları tartışıyor. Başarıya ulaşan bir yaklaşımın, görüntülerin yamalar halinde bölündüğü ve yeniden oluşturulduğu bir yapboz problemi kullanmak olduğunu belirtiyorlar. Bununla birlikte, tıbbi görüntüleme ile ilgili sorun, anlamlı kümeler bulmayı zorlaştıran, dönüş değişmezinin olmamasıdır. Konuşmacı, farklı hastalıkların nasıl ortaya çıktığını anlamak gibi alan bilgisi yoluyla video çerçevesi lokalizasyonunu geliştirmenin patoloji sınıflandırmasını iyileştirmede yararlı bir yaklaşım olabileceğini öne sürüyor.

  • 01:25:00 Bu bölümde konuşmacı, zayıf denetimli video bölümlemesini ve tıbbi ortamlarda daha iyi açıklamalar sağlamak için çerçevelerin nerede yerelleştirildiğini tespit etme ihtiyacını tartışıyor. Ayrıca, kendi kendini denetleyen ön test görevlerinin tasarımından ve karşılaştırmalı öğrenmeden bu alanda yeni ve heyecan verici yaklaşımlar olarak bahsediyorlar ve her gün yeni çalışmalar yayınlanıyor. Konuşmacı, icomet projesini takdir ediyor ve iş yükünü azaltmak için bu yaklaşımların gerçek tıbbi prosedürlerde test edilmesini teşvik ediyor. Toplantı sahibi, tıbbi sorunları çözen gerçek pratisyenler için minnettarlığını ifade eder ve konuşmacıya bilgilendirici ders için teşekkür eder.
Deep Learning Image Registration and Analysis - Lecture 21 - MIT ML in Life Sciences (Spring 2021)
Deep Learning Image Registration and Analysis - Lecture 21 - MIT ML in Life Sciences (Spring 2021)
  • 2021.05.12
  • www.youtube.com
MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep Learning in the Life Sciences / Computational Systems BiologyGuest lecturers: Adri...
 

Elektronik sağlık kayıtları - Ders 22



Elektronik sağlık kayıtları - Ders 22 - Yaşam Bilimlerinde Derin Öğrenme (Bahar 2021)

Sağlık hizmetlerinde makine öğreniminin ortaya çıkışı, hastanelerde elektronik tıbbi kayıtların benimsenmesi ve anlamlı sağlık hizmetleri içgörüleri için kullanılabilecek çok sayıda hasta verisinden kaynaklanmaktadır. Hastalık ilerleme modellemesi, hastalık kayıtlarında bulunan ve yüksek boyutlu uzunlamasına veriler, eksiklik ve sol ve sağ sansür nedeniyle zorluklar oluşturabilen uzunlamasına veriler kullanılarak tartışılmaktadır. Ders, bu zorlukların üstesinden gelmek ve uzunlamasına biyobelirteçlerin doğrusal olmayan yoğunluğunu etkili bir şekilde modellemek için derin Markov modelleri gibi doğrusal olmayan modellerin kullanımını araştırıyor. Ek olarak, konuşmacı, geçiş işlevi için yeni nöral mimariler geliştirmek için alan bilgisinin kullanımını ve daha iyi genelleme için alan bilgisinin model tasarımına dahil edilmesinin önemini tartışır. Tedavi etkisi fonksiyonlarına ilişkin model karmaşıklığı ile ilgili deneyler de vardır ve konuşmacı, daha fazla bulgu belirlemek için bu soruyu daha geniş bir kohort üzerinde yeniden ele almayı planlamaktadır.

  • 00:00:00 Bu bölümde, Microsoft Research'te kıdemli bir araştırmacı olan Rahul Krishnan, elektronik sağlık kaydı verilerinin dijitalleştirilmesi nedeniyle sağlık hizmetlerinde makine öğreniminin ortaya çıkışını açıklıyor. Hastanelerde elektronik tıbbi kayıt sistemlerinin benimsenmesi, anlamlı sağlık bilgileri için kullanılabilecek çok miktarda hasta verisine yol açtı. Krishnan, araştırmacıların soruları incelemesi ve yanıtlaması için kar amacı gütmeyen kuruluşlar tarafından yayınlanan, daha çok tek bir hastalığa odaklanan veri kümeleri olan hastalık kayıtlarının kullanımına dikkat çekiyor. Denetimsiz öğrenme gibi makine öğrenimi teknikleri, bu veri kümelerinin altyapısını araştırmak ve klinisyenlere yardımcı olacak araçlar oluşturmak için kullanılıyor. Sunum, hastalık ilerleme modellemesine ve bu alanda araştırmacılar tarafından yapılan bazı çalışmalara odaklanmaktadır.

  • 00:05:00 Bu bölümde, konuşmacı hastalık kayıtlarında bulunan boylamsal verileri kullanarak hastalık ilerleme modellemesini tartışıyor. Hastalık ilerleme modellemesi onlarca yıldır var olmuştur ve temel ortak değişkenler, boylamsal biyobelirteçler ve tedavi bilgileri dahil olmak üzere hastalık kayıtlarında bulunan karmaşık ve dağınık verileri yakalayabilen istatistiksel modeller oluşturmaya çalışmaktadır. Bu problem genellikle, modellerin, temel bilgilerine ve müdahale sırasına göre bir hastanın uzunlamasına biyobelirteç dizisini gözlemleme olasılığını en üst düzeye çıkarmayı amaçladığı denetimsiz öğrenme olarak ortaya konur. Konuşmacı, bu yıl ICML'de yayınlanacak olan hastalık ilerleme modellemesi için yeni bir yaklaşım sunuyor.

  • 00:10:00 Bu bölümde konuşmacı, nadir bir kemik iliği kanseri olan multipl miyelom bağlamında hastalık ilerlemesini modellemek için elektronik sağlık kayıtlarını kullanmanın zorluklarını tartışıyor. Hastalık çok nadir olduğu için, genellikle öğrenilecek az sayıda hasta vardır, bu da iyi bir modelleme ve yoğunluk tahmini yapmayı zorlaştırır. Ek olarak, sağlık hizmeti verileri, doğrusal olmayan varyasyon, eksiklik ve sol ve sağ sansür ile yüksek boyutlu boylamsal veriler gibi zorluklar sunar. Konuşmacı, bu zorlukların üstesinden gelmek ve uzunlamasına biyobelirteçlerin doğrusal olmayan yoğunluğunu etkili bir şekilde modellemek için derin Markov modelleri gibi doğrusal olmayan modellerin kullanılmasını önerir.

  • 00:15:00 Bu bölümde ders, verilerin gizli değişkenler ve zaman içinde elde edilen gözlemler tarafından üretildiği elektronik sağlık kayıtları için bir gizli değişken modelini açıklar. Model, bir doktor tarafından reçete edilen ilaç seçiminin önceki gözlemlerden elde edilen klinik biyobelirteçlerin değerlerine bağlı olduğunu varsayar. Konuşmacı ayrıca, maksimum olasılık tahmini sırasında eksik değişkenleri marjinalize ederek üstesinden gelinebilecek olan kayıp veri konusuna da değiniyor. Bununla birlikte, bir çıkarım ağı kullanan varyasyonel çıkarım için model, eksik verileri tahmin etmek için yaklaşık değerler gerektirir ve eksikliğin yaklaşık sonsal dağılımın yanlılığını nasıl etkilediğini anlamak için daha fazla araştırmaya ihtiyaç vardır.

  • 00:20:00 Bu bölümde konuşmacı, hastanın tıbbi geçmişini tahmin etmek için bir modelin nasıl kullanılabileceğini, hastanın doktorla zaman içindeki etkileşimlerini modelleyerek açıklamaktadır. Model, hastanın tıbbi durumunu tahmin etmek için zamanla değişen gizli bir temsil kullanır. Konuşmacı, doğrusal olmama ve belirli hastalıkların nadirliği nedeniyle tıbbi verilerin modellenmesindeki zorlukların altını çiziyor. Geçiş işlevi için yeni bir nöral mimari geliştirmek üzere alan bilgisinin kullanımını araştırıyorlar. Konuşmacı ayrıca, sırasıyla tedavi süresini ve büyük bir ilerleme olayına kadar geçen süreyi izlemek için küresel saatin ve yerel saatlerin kullanımını tartışır. İlaçların mekanik etkisine nasıl yaklaşılacağını ve bu bilgiyi modele nasıl dahil edeceklerini açıklarlar.

  • 00:25:00 Bu bölümde konuşmacı, kanser tedavisi için reçete edilen ilaçların bir hastanın tümörü üzerindeki etkisini yaklaşık olarak tahmin etmek için farmakokinetik ve farmakodinamiği kullanmayı tartışıyor. Hastalara birlikte verilen birden fazla ilacın etkisini tek bir işlev oluşturmak için bir dikkat mekanizması kullanarak birleştirerek modellemek için üç yeni sinir mimarisi öneriyorlar. Amaç, fazla uydurma ile mücadele etmek için alan bilgisini kullanarak koşullu yoğunluk tahmini yapmaktır. SSNPK adı verilen model, zaman içinde 16 klinik biyobelirteç, dokuz tedavi endikasyonu ve 16 temel özellik ile mevcut bakım standardına göre tedavi edilen multipl miyelom hastalarından oluşan bir kohorta uygulanır.

  • 00:30:00 Bu bölümde, konuşmacı, özellikle derin öğrenme ve durum uzayı modellerinin kullanımına odaklanarak, klinik verileri analiz etmek için farklı modeller kullanmanın sonuçlarını tartışıyor. Yeni verilere genelleştirmede farklı modellerin etkinliğini karşılaştırırlar ve ssnpkpd kullanımının doğrusal ve doğrusal olmayan temel hatlarda sürekli olarak daha iyi performansla sonuçlandığını bulurlar. Ayrıca, modellerde görülen kazanımlara en çok hangi biyobelirteçlerin katkıda bulunduğunu belirlemek için bir çıkarma analizi yürütürler ve yerel ve küresel saatlerin kullanımının verilerin dinamiklerini modellemede yardımcı olduğunu bulurlar. Ek olarak, verilerin zaman içindeki davranışını daha fazla araştırmak ve anlamak için eğitilmiş modelin gizli alanını kullanırlar.

  • 00:35:00 Dersin bu bölümünde, konuşmacı, temel biyobelirteçlerine dayalı olarak bir hastanın gelecekteki klinik biyobelirteçlerini tahmin etmek için SSNPKPD modelini kullanmanın sonuçlarını tartışıyor. Model, SSNPKPD tarafından yakalanan gizli temsillerin, gelecekteki klinik biyobelirteçleri tahmin etmek için ilgili hasta geçmişini koruduğunu gösteren, doğrusal bir taban çizgisine kıyasla verilere daha fazla uyum gösterir. Konuşmacı, daha iyi genelleme için alan bilgisini model tasarımına dahil etmenin önemi olan konuşmanın ana çıkarımını özetler ve sağlık hizmetlerinde farklı veri modalitelerini birleştirmede gelecekte yapılacak araştırmalar için fırsatları vurgular. Konuşmacı ayrıca sonuçların daha geniş bir kohortta devam eden doğrulamasını ve modeli klinik karar destek araçlarına ve model tabanlı pekiştirici öğrenme çerçevelerine dahil etme olasılığını da not eder.

  • 00:40:00 Bu bölümde, konuşmacı tedavi etkisi fonksiyonları açısından model karmaşıklığı ile deneylerini tartışıyor. Tedavi etkisi fonksiyonlarının üç ila on iki arasında değişen kopyalarını oluşturarak modelin varyasyonlarını denediler ve ek karmaşıklığın performansı önemli ölçüde artırmadığı ve hatta azalttığı bir nokta olduğunu gördüler. Bununla birlikte, tedavi etkisi işlevlerinden bazılarını çıkardıkları zaman, performansta bir miktar düşüş buldular, ancak yine de doğrusal modelden daha iyi performans gösterdiler. Konuşmacı, bu bulguların kapsamını belirlemek için VA ile daha geniş bir kohortta bu genelleme sorusunu tekrar gözden geçirmeyi planlıyor.
Electronic health records - Lecture 22 - Deep Learning in Life Sciences (Spring 2021)
Electronic health records - Lecture 22 - Deep Learning in Life Sciences (Spring 2021)
  • 2021.05.16
  • www.youtube.com
MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep Learning in the Life Sciences / Computational Systems BiologyGuest lecture: Rahul ...
 

Derin Öğrenme ve Nörobilim - Ders 23



Derin Öğrenme ve Nörobilim - Ders 23 - Yaşam Bilimlerinde Derin Öğrenme (Bahar 2021)

Ders, özellikle görsel bilim alanında, derin öğrenme ve nörobilim arasındaki etkileşimi tartışıyor. Amaç, insanların gözlerine çarpan fotonlara tepki olarak sergilediği davranışsal yeteneklere atıfta bulunan insan görsel zekasını tersine mühendislikle yapmaktır. Konuşmacı, hem beyin bilimlerine hem de yapay zekaya fayda sağlayabilecek tahmine dayalı inşa edilmiş sistemlere olanak sağlamak için bu yeteneklerin simüle edilmiş nöron ağları gibi mekanizmaların dilinde açıklanmasının altını çiziyor. Ders, derin öğrenme modellerinin beynin duyusal sistem süreçlerini nasıl yürüttüğüne dair hipotezler olduğunu ve beynin evrimini taklit etmenin ötesinde potansiyel uygulamaları araştırıyor. Ayrıca ders, sinir ağlarının anıları nasıl manipüle edebileceğine ve bir şeyin anlamını nasıl değiştirebileceğine dair pratik örnekler gösteriyor.

Bu video, derin öğrenmenin beynin bilişsel işlevlerini anlama ve bu anlayışı mühendislik amaçları için kullanma potansiyelini tartışıyor. Konuşmacı, bu alandaki hafıza ve iç dinamik yetenekleri ile tekrarlayan sinir ağlarının alaka düzeyini vurgular. Ders, sinir sistemlerinin taklit yoluyla öğrenme yeteneğini ve bunun çalışma belleğinin temsillerini, hesaplamalarını ve manipülasyonlarını öğrenmek için nasıl kullanılabileceğini araştırıyor. Video ayrıca, bir öğrenme koşulu olarak geri bildirimle öğrenmenin kanıtını bulmanın zorluğunu ve sistemi ayarlamak için hata düzeltme mekanizmalarının potansiyelini de kapsar. Ders, kursta işlenen konuların çeşitliliği ve gelecekte bilişsel sistemlerin yorumlanmasında derin öğrenmenin nasıl yardımcı olabileceği üzerine düşünerek sona erer.

  • 00:00:00 Bu bölümde, konuşmacı, özellikle görsel bilim alanında, derin öğrenme ve nörobilim arasındaki etkileşimi tartışıyor. Derin öğrenme modellerinin, beyin işlevinin çeşitli yönlerinin nasıl çalışabileceğine ilişkin bilimsel hipotezler olarak nasıl görülebileceğini ve sinirbilimciler ile bilişsel bilim adamlarının bu hipotezlerin kalitesini verilere göre nasıl değerlendirdiklerini açıklıyor. Carlo'nun konuşması, insanların gözlerine çarpan fotonlara yanıt olarak sergilediği davranışsal yeteneklere atıfta bulunan insan görsel zekasının tersine mühendislik hedefine odaklanıyor. Hem beyin bilimlerine hem de yapay zekaya fayda sağlayabilecek tahmine dayalı inşa edilmiş sistemler sağlamak için bu yetenekleri simüle edilmiş nöron ağları gibi mekanizmaların dilinde açıklamanın önemini vurguluyor.

  • 00:05:00 Bu bölümde, öğretim görevlisi görsel zekayı ve beynin bir sahnede orada olan şeyleri nasıl tahmin ettiğini, örneğin arabaları veya insanları tanımlamayı; ancak, bundan sonra ne olacağını tahmin etmek ve diğer fizik odaklı problemler, bilim adamlarının anlaması için hala bir zorluktur. Buna rağmen, bilim adamları, temel nesne tanıma olarak da bilinen bir sahnenin her 200 milisaniyelik görüntüsünde işlediğimiz temel görselleri modellemede önemli ilerleme kaydetti. Öğretim görevlisi, nesneleri tanıma yeteneğimizi ölçen ve bunları bilgisayarla görme sistemleri ve al yanaklı maymunlar gibi insan olmayan primatlar gibi diğer türlerle karşılaştıran test örnekleri sunar.

  • 00:10:00 Bu bölümde konuşmacı, insanların ve primatların nesneleri ayırt etme yeteneğini tartışıyor. İnsanların ve primatların görsel tanıma görevlerinde benzer şekilde performans gösterdiğini, insanların yalnızca biraz daha iyi performans gösterdiğini belirtiyor. Ek olarak, konuşmacı derin öğrenme sistemlerini ve bunların insanların ve primatların görsel tanıma yetenekleriyle nasıl karşılaştırıldığını tartışıyor. Konuşmacı daha sonra al yanaklı maymun beyninin görsel tanıma görevleriyle ilgili alanlarını tartışmaya geçer ve en üst düzey alan olarak zaman-altı korteksi vurgular. Son olarak, konuşmacı, zaman-altı kortekste ortaya çıkan nöral aktivite kalıpları için tipik zaman ölçeklerini ve bunun açık davranışsal örnekleme becerileri için gereken zamanla nasıl eşleştiğini not eder.

  • 00:15:00 Video dersinin bu bölümünde konuşmacı, araştırmacıların maymunlar gibi hayvanların görsel korteksindeki bireysel nöronların istilacı kayıt elektrotları kullanarak görüntülere tepkisini nasıl incelediklerini tartışıyor. Araştırmacılar, farklı görüntülere yanıt olarak nöronlardan gelen elektriksel aktivite kalıplarını ölçerek, ortalama yükselme oranlarını kullanarak yanıtı ölçebilirler. Bu aktivite kalıpları, seçiciliklerindeki benzerliklerle bir araya toplanabilir ve görsel kortekste yüzler gibi belirli nesne türleri için özel kümeleme alanları tanımlanmıştır. Kronik kayıt dizilerinin kullanılması, araştırmacıların aynı nöral bölgelerden haftalarca veya aylarca kayıt yapmasına ve binlerce görüntüye verilen yanıtları ölçmesine olanak tanır.

  • 00:20:00 Bu bölümde konuşmacı, bir hayvan sabitlenirken veya bir görevi yerine getirirken veya görüntüleri gözlemlerken nöral verilerin kaydedildiği bir deneyi açıklıyor. Doğrusal kod çözücüleri küçük veri örnekleri üzerinde eğiterek, insanlarda ve maymunlarda görülenlerden ayırt edilemeyen modeller ortaya çıktı. Bu, belirli algıları görselleştirmek için beyin-makine arayüzü uygulamalarında kullanılabilecek güçlü bir dizi özellik uzayının geliştirilmesine izin verdi. Konuşmacı daha sonra nöral aktivite ile görüntü arasında meydana gelen doğrusal olmayan dönüşümleri tartışır ve bu alanın derin öğrenme ile vizyon biliminin bir araya geldiği yer olduğunu öne sürer.

  • 00:25:00 Bu bölümde, konuşmacı derin evrişimli ağların başlangıçta sınır algılama, filtreleme, çıktı doğrusalsızlıkları ve kazanç kontrolü gibi nörobilimde bilinen ilkelere dayalı olarak nasıl inşa edildiğini tartışıyor. Bununla birlikte, bu modeller beynin görsel alanlarındaki nöral verilere karşı test edildiğinden, yetersiz kaldılar ve V4'teki bireysel nöronların yanıt modellerini tahmin edemediler. Bu modeller sinirbilimciler için hipotez inşaları iken, görsel sistemin nasıl çalıştığını açıklamakta yetersiz kalıyorlardı. Bu erken modellerin başarısızlığına rağmen, derin ağlardaki öğrenilmiş filtreleri V1'de gözlemlenenlerden ayırmada devam eden çalışmalara ilham kaynağı oldular.

  • 00:30:00 Bu bölümde, konuşmacı nörobilim ve derin öğrenme arasındaki işbirliğinin yapay sinir ağlarında bilinmeyen parametrelerin optimizasyonuna nasıl olanak tanıdığını ve bunun sonucunda primat beyninin sinirsel tepki kalıplarını yakından taklit eden modellerin ortaya çıktığını tartışıyor. Konuşmacı, mühendislerin derin evrişimli sinir ağlarındaki filtrelerin mikro parametrelerini optimize etmesine izin veren bir döngünün uygulanmasında atılım yapıldığını belirtiyor. Bu sayede üretilen modeller görsel sistemde neler olup bittiğine dair yeni hipotezler olarak görülerek beyindeki biyolojik sinir ağları ile karşılaştırılmasına olanak sağlanmıştır. Konuşmacı, bu karşılaştırmaların nasıl yapıldığına dair örnekler göstererek devam eder ve beyin işlevi hakkında erken dönem mekanik hipotezlerle sonuçlanır. Genel olarak, bu işbirliği, biyolojik ventral akışta bulunanları yakından taklit eden in silico ventral nöronların geliştirilmesine izin vererek, beynin görsel bilgileri nasıl işlediğine dair daha fazla içgörüye yol açtı.

  • 00:35:00 Bu bölümde konuşmacı, geliştirdikleri derin öğrenme modellerinin, özellikle görsel nesne tanıma alanında, beynin duyusal sistem süreçlerini nasıl yürüttüğüne dair hipotezler olduğunu açıklıyor. Bu modellerin mükemmel olmadığını ve gelecekte optimize etmeyi ve iyileştirmeyi amaçladıkları bazı tutarsızlıklar olduğunu belirtiyorlar. Konuşmacı ayrıca derin öğrenmenin mühendislik ve yapay zekadaki daha geniş uygulamalarını tartışıyor ve bu modellerin daha fazla bilimsel anlayış ve optimizasyona rehberlik edecek bir araç olarak kullanılabileceğini vurguluyor. Beynin süreçlerinin daha doğru temsillerine yönelik daha fazla veri ve modele ihtiyaç duyulduğunu belirterek sonuca varırlar.

  • 00:40:00 Bu bölümde, konuşmacı beynin evrimini taklit etmenin ötesinde derin öğrenme ve yapay zekadaki yenilik potansiyelini tartışıyor. İnovasyonun çoğunun mimari seçiminden geleceğini ve optimizasyon araçlarının bu optimizasyona izin verecek şekilde mevcut olacağını öne sürüyorlar. Tekrarlanan sorular, bilişin bilinçaltı unsurları hakkında fikir verebilir ve beynin anatomisi, bilişle daha fazla ilgili olan alt alanlara yol açabilecek olan tekrarlama fikirlerini birbirine bağlar. Konuşmacı ayrıca atlama bağlantılarına, gri alanlara ve şu anda yapılan işin bu konuya nasıl yaklaşmaya çalıştığına değiniyor.

  • 00:45:00 Videonun bu bölümünde, konuşmacı neoteni kavramını ve bunun farklı türlerde görsel korteksteki sabit kodlanmış işlevlerin ve filtrelerin oranını nasıl etkilediğini tartışıyor. Sistemde yukarı çıktıkça beyinde daha fazla plastisite olur ve maymunlarda belirli bir seviyeye kadar alanlar bulunurken, insanlarda daha fazla beyin dokusu bulunur ve bu da daha fazla esneklik sağlar. Konuşmacı, beyinde esneklik için bolca yer olduğuna inanıyor ve primat sistemimizin bir parçası olmasına rağmen, beynin bir kısmı bunun ötesinde ve bunda bir sorun yok. Bir sonraki konuşmacı daha sonra beyinleri tekrarlayan sinir ağları olarak düşünme konusundaki çalışmalarını ve yapay ve gerçek sinir sistemleri arasındaki kesişimi incelemenin onların nasıl çalıştığını anlamamıza nasıl yardımcı olabileceğini tartışıyor.

  • 00:50:00 Bu bölümde, yapay ve gerçek sinir sistemlerinde verimli bir temsili temeli öğrenmek için kodlamanın ne kadar verimli ve seyrek kullanılabileceğine odaklanılmaktadır. Tekrarlayan ağlardaki beyin benzeri davranışları inceleyerek, yapay tekrarlayan ağların yeteneklerini genişleten ve gerçek olanların nasıl çalıştığını anlamaya yardımcı olan ilkeler bulunabilir. Tekrarlayan sinir ağları, iç temsilleri ve anıları saklamayı ve değiştirmeyi öğrenerek, üst üste binen sinyalleri kokteyl partisi etkisine benzer bir şekilde ayırabilmelerini sağlar. Gerçek sinir sistemleri, tekrarlayan ağlarda çalışma belleği olarak adlandırılan beyin bölgesinde görüldüğü gibi, temsilleri depolamak ve manipüle etmek konusunda mükemmeldir. Amaç, yapay yinelenen ağların yeteneklerini genişleten ve gerçek ağların nasıl çalıştığını anlamaya yardımcı olan ilkeler bulmaktır.

  • 00:55:00 Dersin bu bölümünde, farenin konumunun kodu, farenin uzayda hareket ederken hareketini izleyen yer hücreleri adı verilen nöronlardan çözülür. Sıçan ayrıca hareket etmeden önce gelecekteki yörüngelerini planlamak için nöral temsilini manipüle edebilir. Ders daha sonra sinir ağlarının, ötücü kuşun yetişkinleri taklit ederek şarkı söylemeyi öğrenme yeteneği gibi anıları nasıl manipüle edebileceğini araştırıyor. Ders, örnekleri gözlemleyerek sinir ağlarının bilgileri manipüle etmenin karmaşık süreçlerini nasıl öğrenebileceğini tartışır ve bir hafıza modeli olarak kaotik bir çekici kavramını ve bir sinir ağı modeli olarak rezervuar adı verilen doğrusal olmayan basit bir dinamik sistemi tanıtır. Rezervuarın kontrol parametresi, ağın öğrendiği herhangi bir hafızanın temsilini değiştirmek için kullanılır ve ders, bu kontrolün bir şeyin anlamını nasıl değiştirebileceğine dair pratik örnekler sunar.

  • 01:00:00 Bu bölümde, konuşmacı bağlam düzenleme yeteneğinin öğrenmeyi ve sinir ağı kapasitesini nasıl etkilediğini tartışıyor. Ağı bağlam değişkenleriyle yönlendirmenin, ortak parametreleri öğrenmek için eğitim için daha fazla veriye ihtiyaç duyulduğu anlamına geldiğini açıklıyorlar. Konuşmacı ayrıca anıları sinir ağlarında depolamak için rezervuar hesaplama yönteminin kullanılmasından ve gözlemlenen girdileri taklit etmek için basit öğrenme şemalarının anıları depolamak için ne kadar yeterli olduğundan bahsediyor. Ardından, x1 yönündeki çekicilerin ötelenmesine bakarak ve her çeviri için c bağlam parametresinin değerini değiştirerek sinir ağları içindeki bellekleri değiştirmeyi tartışıyorlar.

  • 01:05:00 Bu bölümde konuşmacı, rezervuarların, çekici manifoldlarının dahili temsili üzerindeki dönüşüm operasyonlarını enterpolasyon ve ekstrapolasyon yapmayı öğrenme yeteneğini tartışıyor. Ekip, x1 yönünde sıkıştırılmış bir Lorenz çekicisinin dört eğitim örneğini verdi ve eğitim ve geri bildirim gerçekleştirdi. Rezervuarların, bir esnetme veya çok değişkenli dahil olmak üzere keyfi olabilecek dönüşüm operasyonlarını enterpolasyon ve ekstrapolasyon yapmayı öğrendiği bulundu. Ekip ayrıca, rezervuarların Lorenz çekicisinin küresel çatallanma yapısını tahmin edebildiğini ve eyer modu ve süperkritik dirgen çatallanmaları gibi diğer birkaç dinamik normal formun çatallanma diyagramlarını tahmin edebildiğini buldu. Sinir ağları, değiştirilmiş bir Jansen bağlantısı örneğinde olduğu gibi, dinamik olmayan kinematik yörüngeleri tahmin etmeyi bile öğrenebilir.

  • 01:10:00 Dersin bu bölümünde, konuşmacı uyaranları bir nöral sistemdeki nörodinamiğe göre eşleştirme fikrini resmileştirmenin bir yolu olan, tersine çevrilebilir genelleştirilmiş senkronizasyon adı verilen bir yöntemi tartışıyor. Konuşmacı, bir temsil oluşturmak için, nöronların girdi uyaranlarının belirli kısımlarını ayrı ayrı kodlamak yerine dağıtılmış bir temsil oluşturması gerektiğini açıklar. Ayrıca, girdileri bellek olarak depolamanın arkasındaki anahtar mekanizma olan kendi temsilleriyle kendilerini sürdürebilmelidirler. Son olarak konuşmacı, tekrarlayan nöral ağların kaotik anıları sürdürebildiğini, onların anıları tercüme etmelerine ve dönüştürmelerine izin verdiğini gösteriyor.

  • 01:15:00 Bu bölümde konuşmacı, nöral sistemlerin görülen örnekleri taklit ederek öğrenme yeteneğini ve bunun çalışan belleğin temsillerini, hesaplamalarını ve manipülasyonlarını öğrenmek için nasıl kullanılabileceğini tartışıyor. Konuşma daha sonra geri bildirimle öğrenme sorusuna ve bunun sunulan modellere nasıl uygulandığına geçer. Görsel korteksin belirli bölümlerinde terimlerin doğrusal olarak ayrılabilirliğine ve yeniden yapılandırılabilirliğine dair kanıtlar varken, konuşmacı oldukça aşırı bir öğrenme koşulu olduğu için geri beslemeli öğrenmenin kanıtını bulmanın zorluğuna dikkat çekiyor. Sistemi ayarlamak için hata düzeltme mekanizmalarını kullanma önerisi var, ancak sonucun dış dünyanın beklentisine göre değerlendirildiği sabit bir parametreler seti fikri ve beklenti büyük ölçüde saptığında göze çarpan anıların oluşumu da tartışılıyor.

  • 01:20:00 Bu bölümde öğretim görevlisi, derin öğrenmenin beynin bilişsel işlevlerini anlama ve bunları tasarlama konusundaki potansiyelini vurgular. Hafıza ve iç dinamik yetenekleri ile tekrarlayan sinir ağları bu alanda özellikle önemlidir. Öğretim görevlisi, bu sistemlerin sadece fonksiyon tahmincileri olmaktan ziyade yaşayan ve nefes alan varlıklar olarak düşünülmesini teşvik eder. Bu bilişsel sistemlerin çekirdeği, girdiler ve çıktılar için evrişimli sinir ağları ile artırılabilmesine rağmen RNN'de yatmaktadır. Hipokampus ve onun sinir sisteminin farklı yönleriyle kurduğu bağlantılar, anıların birlikte ateşlenen nöronların etkileşimli bir sisteminde nasıl kodlandığına dair büyüleyici bir örnek olarak gösteriliyor. Ders, kursta işlenen konuların çeşitliliği ve gelecekte bilişsel sistemlerin yorumlanmasında derin öğrenmenin nasıl yardımcı olabileceği üzerine düşünerek sona erer.
Deep Learning and Neuroscience - Lecture 23 - Deep Learning in Life Sciences (Spring 2021)
Deep Learning and Neuroscience - Lecture 23 - Deep Learning in Life Sciences (Spring 2021)
  • 2021.05.19
  • www.youtube.com
MIT 6.874/6.802/20.390/20.490/HST.506 Spring 2021 Prof. Manolis KellisDeep Learning in the Life Sciences / Computational Systems BiologyPlaylist: https://you...
 

MIT 6.S192 - Ders 1: Hesaplamalı Estetik, Tasarım, Sanat | Üreterek Öğrenmek



MIT 6.S192 - Ders 1: Hesaplamalı Estetik, Tasarım, Sanat | Üreterek Öğrenmek

Bu ders hesaplamalı estetik, tasarım ve sanatla ilgili çeşitli konuları kapsar. Yapay zekanın sanat yaratmaya erişimi demokratikleştirme, tasarım otomasyonu ve sanatın sınırlarını zorlamadaki rolü ve estetiğin nicelleştirilmesi ve yüksek ve düşük seviyeli temsiller kullanılarak tasarımda görsel dengeye ulaşılmasındaki zorluklar tartışılıyor. Öğretim görevlisi ayrıca, renk anlambilimi ve dergi kapağı tasarımı içeren örneklerle, hesaplamalı tasarımın kalıpları ortaya çıkarma ve mesajları etkili bir şekilde iletme potansiyelini vurgular. Kitle kaynaklı deneyler, çeşitli konulardaki renk ilişkilerini belirlemek için kullanılır ve bu yöntemin farklı alanlardaki potansiyel uygulamaları araştırılır. Genel olarak ders, yapay zekanın yaratıcı uygulamalardaki rolünü ve sanat, tasarım ve diğer yaratıcı ifade biçimlerini yaratma biçimimizde devrim yaratma potansiyelini tanıtıyor.

Video, StyleGAN ve DALL-E gibi üretken modelleri kullanarak yaratıcı işler üretmek için hesaplamalı estetik, tasarım ve sanatın kullanımını tartışıyor. Öğretim görevlisi ayrıca üreterek öğrenmenin önemini vurgular ve izleyicileri sorunları çözmeye ve yenilikçi ve yaratıcı çözümler bulmak için verileri kullanmaya teşvik eder. Bununla birlikte konuşmacı, önyargılı veriler ve genelleme yapma ve kutunun dışında düşünme yeteneği gibi üretici modellerin sınırlamalarına da değinir. Yine de öğretim görevlisi, öğrencileri sağlanan kodu gözden geçirmeye ve estetik açıdan hoş görüntüler oluşturmak için çeşitli tekniklerle deney yapmaya yönlendirirken, Berkeley ve MIT arasında bilişimsel estetik ve tasarım üzerine sokratik bir tartışmaya katılmayı teşvik ediyor.

  • 00:00:00 Dersin bu bölümünde, konuşmacı yapay zekayı sanat, estetik ve yaratıcılıkta uygulama motivasyonlarını tartışıyor. Sanatın insan evriminin ve iletişiminin önemli bir yönü olduğunu ve yapay zekanın sanat eserine erişimi demokratikleştirebileceğini, yaratıcılığı besleyebileceğini ve sanatın sınırlarını zorlayabileceğini açıklıyorlar. Her gün yüklenen milyonlarca fotoğraf ve her gün gösterilen 650 reklamla yapay zeka, iyi tasarımları otomatik olarak tasarlamaya ve bir tasarımı iyi ya da kötü yapan şeyin ne olduğunu anlamaya yardımcı olabilir. Son olarak, konuşmacı AI'nın gelecekte kritik bir rol oynayacağını, AI'nın her saniye filmler, oyunlar ve daha fazlasını yaratacağını ve bu geleceği şekillendirmek isteyip istemediğimiz sorusuna yol açacağını savunuyor.

  • 00:05:00 Bu bölümde konuşmacı yapay zekanın sanat, estetik ve yaratıcılıktaki rolünü tartışıyor. Evrişimli sinir ağlarının (CNN'ler) dokulara karşı önyargılı olabileceğini, ancak bunun farklı stiller üreterek ve bunları verilere dahil ederek azaltılabileceğini açıklıyor. Ayrıca 2018 yılında üretken model kullanılarak yapılan bir tablonun yarım milyon dolara satıldığından bahsediyor. Estetiğin ölçülüp ölçülemeyeceği sorusuna da değiniyor ve filozofların ve sanatçıların bu konuyu nesillerdir tartıştığını belirtiyor. Son olarak, AI algoritmalarının yaratıcı uygulamalara nasıl uygulanacağını öğrenmeyi ve ilginç problemleri çözmeyi içeren kursun hedeflerine değiniyor.

  • 00:10:00 Videonun bu bölümünde eğitmen, ders için önceden derin öğrenme bilgisinin gerekli olup olmadığıyla ilgili bir soruyu yanıtlıyor. Kursun derin öğrenmeye değineceğini, ancak birincil odak noktasının bu olmadığını ve konuyu öğrenmek için başka kaynaklar olduğunu açıklıyor. Daha sonra, estetiği ölçmeye ilişkin önceki çalışmalarını tartışmaya devam ederek, estetiği ölçmenin yeni bir kavram olmadığını ve Birkhoff'un 20. yüzyılın başlarındaki modeli gibi, estetiği ölçmek için kullanılabilecek halihazırda yerleşik modeller olduğunu belirterek devam ediyor. görsel tasarım, şiir ve hatta arayüzler olarak.

  • 00:15:00 Bu bölümde, konuşmacı görsel dengeyi örnek olarak kullanarak estetiğin sayısallaştırılmasını ve bunu başarmanın zorluklarını tartışıyor. Hem yüksek düzeyde hem de düşük düzeyde iyi temsiller gereklidir. Yüksek seviyeli temsiller görsel denge ve ritmi içerebilirken, düşük seviyeli temsiller sinir ağları kullanılarak çıkarılan özelliklere dayanır. Veriler, ne tür verilerin kullanıldığı ve nereden geldiği de dahil olmak üzere estetiği ölçmek için de gereklidir. Konuşmacı, dengenin genellikle tasarımcılara sezgiyle öğretildiğini açıklıyor, ancak mühendisler dengeyi ölçmek ve tasarımdaki anlamını belirlemek istiyor.

  • 00:20:00 Bu bölümde konuşmacı, uyum olarak da bilinen tasarımda görsel doğruluk ve denge kavramlarını tartışıyor. Tasarım öğelerinin belirli sıcak noktalara yerleştirilmesinin görsel denge yaratabileceğini öne süren Arnheim'ın çalışmalarından bahsediyor. Konuşmacı, bu hipotezin veriye dayalı analiz yoluyla doğrulanıp doğrulanamayacağını araştırıyor ve bir belirginlik algoritması kullanarak bir görüntünün belirgin kısımlarını inceliyor ve sonuçlarını yapısal ağ üzerinde paylaştırıyor. Bir fotoğraf web sitesinden 120.000'den fazla görüntü toplamak için bir tarayıcı kullanıyor ve bu görüntülerdeki belirginlik modellerini inceliyor.

  • 00:25:00 Bu bölümde, portreler, mimari ve moda gibi çeşitli kategorilerdeki toplu görüntülerde kalıplar bulmak için bir Gauss karışımına uyması için belirginlik algoritmasına sahip bir veri seti kullanıldı. Belirginlik noktaları, Arnheim'ın kütle merkezi ve üçte bir kuralı teorisine benzer şekilde analiz edildi. Ancak, üçte bir kuralının geçerliliği üzerine yapılan çalışmalarda gösterildiği gibi, sonuçlar fotoğrafçıların görüntüleri kırpma şeklinden etkilenebilir.

  • 00:30:00 Bu bölümde öğretim görevlisi hesaplamalı estetik ve tasarım konusunu tartışır. Estetik, anlambilim ve fotoğraf stili için ek açıklamalar içeren AVA veri setinin mevcudiyetinden bahsediyorlar. Öğretim görevlisi daha sonra, derin öğrenme algoritmalarının estetik derecelendirmeleri nasıl öğrenip tahmin edebildiğini gösterir ve bunun görüntüleri geliştirmek ve değiştirmek için kullanılabileceğini önerir. Ders daha sonra hesaplamalı tasarımın potansiyelini ve tasarımdaki kalıpları ortaya çıkarma ve kendini daha iyi ifade etmedeki önemini tartışmaya geçer.

  • 00:35:00 Dersin bu bölümünde, konuşmacı hesaplamalı tasarım kavramını tanıtıyor ve tasarım ile sanat arasındaki farkı tartışıyor. Tasarımda problem verilir ve tasarımcının işi bu problemi çözmek için bir mesaj iletmektir, bu arada sanatçılar problemi kendileri tanımlar ve çözmek için sanatsal teknikler kullanırlar. Dekorasyon yerine iletişim gibi tasarım ilkelerini bir makineye aktarmak zor olabilir, ancak gestalt ve renk uyumu da dahil olmak üzere çeşitli teoriler, ölçütler ve kurallar otomatik olarak içerik oluşturmak ve önermek için kullanılabilir. Konuşmacı ayrıca, metni ve tasarım öğelerini belirli bir arka plan görüntüsünün üzerine yerleştirebilen otomatik tasarım yazılımı örneği sağlar.

  • 00:40:00 Videonun bu bölümünde konuşmacı, tamamlayıcı renkleri seçerek ve 30 yıl boyunca renk kombinasyonları üzerinde çalışan Kobiashi ile birlikte Itten ve Matsuda tarafından yapılan çalışmaları inceleyerek dergi kapakları için nasıl otomatik bir tasarım oluşturduğunu tartışıyor. renkler romantik, yumuşak ve temiz gibi kelimelerle ilişkilendirilebilir. Konuşmacı, bu çalışmaya dayanarak, kullanıcılara seçtikleri renklere göre önerilerde bulunabilen ve dergi kapakları için stiller oluşturabilen otomatik bir tasarım sistemi oluşturdu. Ayrıca konuşmacı, profesyonel tasarımcılardan alınan verilerin dergi kapakları için renk paletlerindeki desenleri ayıklayıp çıkaramayacağını araştırdı.

  • 00:45:00 Videonun bu bölümünde konuşmacı, kapaklarda kullanılan metin, tür ve renk kombinasyonlarını aynı anda bulmak için 12 farklı türden dergi kapaklarından bir veri seti toplamayı içeren projelerini tartışıyor. Konuşmacı, kelimelerin ve renklerin birleşiminden oluşan farklı konuları çıkarmak için konu modellemeyi kullandı ve bu konuları görselleştirmek için kelime bulutları ve renk paletlerinin nasıl kullanılabileceğini gösterdi. Konuşmacı ayrıca projenin sonuçlarının evrensel olup olmadığını belirlemek için kitle kaynak kullanımından da bahsetti.

  • 00:50:00 Bu bölümde konuşmacı, farklı kültürlerin ve demografilerin çeşitli konularda renk çağrışımları konusunda hemfikir olup olmadığını anlamak için yürüttükleri bir kitle kaynak deneyini tartışıyor. Deney, bir konudan rastgele seçilen bir renk paletini göstermeyi ve ardından farklı kelime bulutlarını göstermeyi ve deneklerden bunları eşleştirmelerini istemeyi içeriyordu. Çeşitli ülkelerden 1.000'den fazla katılımcı katıldı ve ortaya çıkan korelasyon veya alaka matrisi bazı ilginç modelleri ortaya çıkardı. Deney, bazı istisnalar olmasına rağmen, katılımcıların çoğunlukla çeşitli konularda renk çağrışımları üzerinde anlaştıklarını gösterdi. Konuşmacı ayrıca, farklı ürün türleri için renk paletleri tasarlamada bu yöntemin potansiyel uygulamalarının altını çizdi.

  • 00:55:00 Dersin bu bölümünde, konuşmacı renk semantiğinin renk paleti tavsiyesi, görüntü alma, yeniden renklendirme ve hatta web tasarımı gibi çeşitli uygulamalarını tartışıyor. Belirli kavramlara veya temalara dayalı olarak renkleri ve dergi kapaklarını önermek ve ayrıca web tasarımındaki kalıpları zaman içinde analiz etmek ve görselleştirmek için algoritmaların nasıl kullanılabileceğini gösteriyor. Evrişimli sinir ağlarının kullanımı, belirli dönemlerden renk paletlerini ve web sitesi tasarım trendlerini belirlemede de gösterilmiştir.

  • 01:00:00 Bu bölümde konuşmacı, tasarım yılını tahmin etmede hesaplamalı tasarım ve estetiğin kullanımını tartışıyor. Modelin sadece renkleri değil, aynı zamanda tipografi gibi üst düzey özellikleri de dikkate aldığını açıklıyorlar. Sınıflandırmanın doğruluğundan bahsedilmedi ancak şanstan daha yüksek olduğu kaydedildi. Hesaplamalı tasarım ayrıca reklamları analiz etmek, logolar ve simgeler oluşturmak ve moda renk paletleri tasarlamak için de kullanılmıştır.

  • 01:05:00 Bu bölümde konuşmacı üretken modellerin moda, ürün tasarımı ve sanatta kullanımını tartışıyor. Renkler ve etiketler gibi moda öğelerini anlamak için kullanılan veri kümelerinin örneklerini gösteriyor ve ürün tasarımı önermek için benzer veri kümelerini kullanan meslektaşlarından bahsediyor. Konuşmacı ayrıca bir girdi taslağını alıp bir ürün tasarımının çıktısını alabilen veya farklı bir moda ürünü gibi görünmesi için bir görüntüyü değiştirebilen üretici modellerden de bahsediyor. Ek olarak, stil aktarımı ve içerik oluşturma araçları da dahil olmak üzere hesaplamalı sanat ve yaratıcılıkla ilgili konulara değiniyor.

  • 01:10:00 Videonun bu bölümünde profesör, görüntü ve stil aktarımı, içerik üretimi ve videolar için üretken modeller dahil olmak üzere yaratıcı işler üretmede bilişimsel sanat ve yapay zekanın kullanımını tartışıyor. Tartışma, StyleGAN, OpenAI'nin DALL-E'si ve video pozu modifikasyonu için üretken modeller dahil olmak üzere bu alanlardaki son çalışmalardan birkaç örneği içerir. Bu ilerlemelere rağmen, makinelerin gerçekten sanatçı olup olmayacağı veya yaratıcılığın ve sanatın yalnızca insanlara mı ait olduğu sorusu yanıtsız kalıyor.

  • 01:15:00 Bu bölümde konuşmacı öğrenme yönündeki heyecanlarını üreterek tartışır ve bazı sonuçları paylaşır. Üreterek öğrenmenin ilginç olduğunu açıklıyorlar çünkü bu, yapay zekayı insanların sorunları çözmeyi nasıl öğrendiğine dayalı algoritmalar geliştirmesi için eğitmenin bir yolu. Konuşmacı ayrıca estetiğin nicelleştirilmesiyle ilgili bir soruyu ele alıyor ve insan dilindeki üst düzey terimler ile hesaplama terimleri arasındaki uçurumu kapatmanın bir yolunun veri ve modeller kullanmak, kültürel kavramları dahil etmek ve hatta kitle kaynak kullanımı yoluyla insanlardan fikirlerini istemek olduğundan bahsediyor.

  • 01:20:00 Videonun bu bölümünde konuşmacı, önyargıyı önlemek ve ilginç sonuçlar elde etmek için makine öğreniminde veri kullanmanın önemini tartışıyor. Dinleyicileri, yenilikçi ve yaratıcı çözümlere yol açabilecek algoritmaların veya temsillerin nasıl tasarlanacağı hakkında düşünmeye teşvik ediyor. Konuşmacı, yaratıcılığın ve yenilikçiliğin yapay zekanın temel bileşenleri olduğuna inanıyor ve nesnelerin ve kavramların tasarımında nasıl kullanıldıklarına dair örnekler veriyor. Üreterek öğrenmenin problem çözme becerilerini geliştirmenin etkili bir yolu olduğunu vurguluyor ve dinleyicileri daha büyük problemleri daha küçük alt kümelere ayırmaya ve teker teker çözmeye teşvik ediyor.

  • 01:25:00 Videonun bu bölümünde konuşmacı, yaratıcılık ve yapay zekada genelleme ve alışılmışın dışında düşünme kavramını tartışıyor. Konuşmacı, üretken modellerin genelleme ve dağıtım dışı düşünme yeteneğine sahip olup olmadığı sorusunu sunar. Bu konuyu keşfetmek için konuşmacı, üretken rakip ağların (GAN'lar) yönlendirilebilirliği kavramını tanıtıyor ve üreticinin gizli alanında bir yürüyüş bularak görüntüleri manipüle etme yeteneğini gösteriyor. Mevcut GAN modellerinin yakınlaştırma ve uzaklaştırma, kaydırma ve döndürme gibi dönüşümler gösterebileceğini gösteriyorlar. Konuşmacı, görüntüyü manipüle etmek için gizli bir vektör bulma sürecini açıklıyor ve bunu üretken modellerin yaratıcılık ve yenilikçilikteki potansiyelini göstermek için kullanıyor.

  • 01:30:00 Videonun bu bölümünde, konuşmacı BigGAN gibi üretken modellerin sınırlamalarını ve bunlara neden sahip olduklarını tartışıyor. Modele, sınıfların anlambiliminde de bulunan önyargıların eklenebileceğini açıklıyor. Bu, bir modelin genelleştirebileceği, ancak bir insanın yapabileceği kadar iyi olamayacağı anlamına gelir. Konuşmacı, modelin veri kümesinin dağılımının dışına çıkabileceğini ve görüntülerin görünüşünü bir dereceye kadar değiştirebileceğini, ancak yalnızca temeldeki veri kümesinin çeşitli olması durumunda gösterebileceğini göstermeye devam ediyor. Makale, önyargılı verilerin sınırlamalarının üstesinden gelmenin bir yolunun, görüntüleri yakınlaştırarak veya döndürerek büyütmek olduğunu öne sürüyor.

  • 01:35:00 Videonun bu bölümünde öğretim görevlisi, dönüşümler yoluyla estetik açıdan hoş görüntüler oluşturmak için gizli alanın kullanımını tartışıyor. Dönüşümler, görüntü rengini, yakınlaştırmayı, döndürmeyi, kamera benzeri değişiklikleri ve daha fazlasını değiştirmek için gizli alanda yürüyerek veya yönlendirilerek elde edilebilir. Öğretim görevlisi ayrıca görüntü estetiğini saptamak için bir sinir ağının kullanımını tartışarak, yürüme yönünün mü yoksa dönüşümün daha estetik görüntüler mi ürettiğine dair geri bildirim sağlıyor. Ders, öğrencileri Berkeley ve MIT arasında bilişimsel estetik ve tasarım üzerine yaklaşan bir sokratik tartışmaya katılmaya teşvik ediyor. Ek olarak, öğretim görevlisi öğrencilere verilen kodu gözden geçirmelerini ve estetik açıdan hoş görüntüler oluşturmak için çeşitli teknikleri denemelerini ister.

  • 01:40:00 Videonun bu bölümünde, konuşmacı çalışmalarının deposundan bahsediyor ve izleyicileri sağlanan not defterlerini çalıştırmak için TensorFlow yerine PyTorch kullanmaya teşvik ediyor. Ayrıca kodun sonuçlarını görselleştirmek için kullanılan Colab sistemini açıklıyorlar ve görseller oluşturmanın ve sonuçları raporlamanın önemini vurguluyorlar. Konuşmacı ayrıca izleyicilere soruları için e-posta gönderebileceklerini hatırlatır ve kursa katıldıkları için teşekkür eder.
MIT 6.S192 - Lecture 1: Computational Aesthetics, Design, Art | Learning by Generating
MIT 6.S192 - Lecture 1: Computational Aesthetics, Design, Art | Learning by Generating
  • 2021.01.21
  • www.youtube.com
First lecture of MIT 6.S192: Deep Learning for Art, Aesthetics, and Creativity, by Ali Jahanian.In this lecture, I start introducing the course and discuss C...
 

MIT 6.S192 - Ders 2: Sokratik Bir Tartışma, Alyosha Efros ve Phillip Isola



MIT 6.S192 - Ders 2: Sokratik Bir Tartışma, Alyosha Efros ve Phillip Isola

Bu videoda Alyosha Efros ve Phillip Isola, paylaşılan deneyimler yaratmak için görüntüleri kullanma fikrini tartışıyor. Bunun anıları geri getirmeye ve bir nostalji duygusu yaratmaya yardımcı olabileceğini savunuyorlar.

Bu video, MIT'deki iki profesör arasında yapay zekada verilerin rolü hakkında bir tartışmadır. Efros, verilerin yapay zeka için gerekli olduğunu savunurken Isola, verilerin yapay zeka gelişimi için bir engel olabileceğini savunuyor.

  • 00:00:00 Bu derste Alyosha Efros ve Phillip Isola, yeni bir veri türü olarak üretken modellerin görüşünü tartışıyor. Efros, üretken modellerin mevcut çağının tıpkı veri gibi olduğunu, ancak daha iyi olduğunu savunuyor. Isola, üretici modellerin nasıl çalıştığını ve ilginç içerik oluşturmak için nasıl kullanılabileceğini açıklıyor.

  • 00:05:00 Bu derste, Alyosha Efros ve Phillip Isola üretken modellerin gücünü tartışıyor. Üretken modeller, görüntüyü değiştirmek için kullanılabilecek gizli bir değişken gibi ekstra işlevlerle süslenmiş veri noktaları oluşturmamıza olanak tanır. Bu, yaratıcılık ve bilimsel görselleştirme için pek çok olasılığın önünü açar.

  • 00:10:00 Video, gizli alan aracılığıyla görüntüleri manipüle etme fikrini tartışıyor. Görüntü uzayında anlamlı bir dönüşümle eşleşecek bir yön arayarak bunun nasıl yapılabileceğini açıklıyorlar. Bir görüntüyü yakınlaştırarak daha akılda kalıcı hale getirme örneğini veriyorlar. Son olarak, bu tekniğin nasıl kullanılabileceğini tartışırlar.
    bir şeyin unutulmaz olmasının ne anlama geldiği kavramını görselleştirmek.

  • 00:15:00 Bu video, yeni görüntüler oluşturmak için manipüle edilebilen bir veri türü olan üretken modeller kavramını tartışıyor. Video, bu modellerin farklı görüntülerin farklı kısımlarını bir araya getirerek yeni görüntüleri kompozisyon halinde oluşturma becerisini gösteriyor. Video ayrıca, belirli nesnelere yönelik önyargıları veya belirli sahneleri doğru bir şekilde tasvir edememeleri gibi üretici modellerin sınırlamalarını da tartışıyor.

  • 00:20:00 Alyosha Efros ve Phillip Isola, hem verinin kendisini hem de onu oluşturmak için kullanılan yöntemleri içeren veriler hakkında düşünmenin bir yolu olan veri artı artı kavramını tartışıyorlar. Efros, veri noktaları arasında daha anlamlı enterpolasyona izin verdiği için bu bakış açısının yararlı olduğunu savunuyor. Isola, iki veri noktası arasındaki yolun nasıl seçildiğini sorguluyor ve Efros, modelin genellikle en doğal görünen en kısa yolu seçtiğini açıklıyor.

  • 00:25:00 Bu videoda Phillip Isola ve Alyosha Efros, "Dall-E" algoritmasının erdemlerini tartışıyorlar. Efros, dili anlayabildiği için algoritmanın etkileyici olduğunu savunuyor. Isola, algoritmanın aslında dili anlamadığını, bunun yerine sözcükleri ve gramerleri anladığını söylüyor.

  • 00:30:00 Konuşmacı, GAN'ların gerçekten yaratıcı olmadığını çünkü yalnızca yüksek oranda derlenmiş veriler üzerinde eğitildiklerini savunuyor. Ödeyebiliyorsanız, çift yönlü haritalamanın en iyi yol olduğunu öne sürüyor.

  • 00:35:00 Bu derste Alyosha Efros ve Phillip Isola, yapay zeka araştırmalarında veriye dayalı ve modele dayalı yaklaşımların yararlarını tartışıyor. Efros, modellerin giderek verilere birincil arabirim haline geleceğini ve veri bilimcilerin veri kümeleri yerine modellerle nasıl çalışacaklarını öğrenmeleri gerekeceğini savunuyor. Isola, bu modelleri eğitmek için kullanılan veri setlerinin giderek daha büyük ve karmaşık hale geldiğini kabul ediyor ve ekliyor.

  • 00:40:00 Bu video, Alyosha Efros ve Phillip Isola tarafından sanatta bağlam konusu üzerine bir derstir. Efros, Michael Galinsky'nin Malls Across America adlı bir sanat eserinden bir fotoğrafın onun üzerinde nasıl derin bir etki bıraktığını ve fotoğrafın görüntülendiği bağlamın anlamını nasıl etkileyebileceğini anlatıyor. Isola, denize bakan bir kız fotoğrafının, çekildiği dönemde hayatta olanlara nasıl anıları ve hisleri geri getirebileceğini anlatıyor.

  • 00:45:00 Bu video, iki profesör arasında nostalji kavramı ve sanatı takdir etmek için nasıl kullanılabileceği hakkında bir tartışmadır. Sadece ortak anıları nedeniyle ikisi için anlamlı olan bir kapının önünde iki arkadaşın fotoğrafı örneğini kullanırlar. Bu tür nostaljinin birçok farklı biçimde bulunabileceğini ve anıları hatırlayabilenler için zevkli bir deneyim olabileceğini savunuyorlar.

  • 00:50:00 Bu videoda, Alyosha Efros ve Phillip Isola, belirli bir şehirdeki insanlar arasında paylaşılan deneyimleri canlandırmak için görüntüleri kullanma fikrini tartışıyorlar. Bunun anıları geri getirmeye ve bir nostalji duygusu yaratmaya yardımcı olabileceğini savunuyorlar.

  • 00:55:00 Edouard Monet'nin "Olympia" tablosu 1865'te gösterime girdiğinde çıplaklığı ve düzleşmiş ten rengi nedeniyle büyük bir skandaldı. Bazıları tablodaki el yerleşiminin insanları deli eden şey olduğuna inanıyor.

  • 01:00:00 Bu ders, sanatın görüldüğü bağlama göre nasıl farklı şekillerde yorumlanabileceği hakkındadır. Kullanılan örnek, Amedeo Modigliani'nin ünlü bir çıplak kadın tablosunun parodisi olarak görüldüğü için ilk sergilendiğinde tepkilere neden olan "Yatan Venüs" tablosudur. Ancak diğer çıplak kadın resimleri bağlamında bakıldığında geçerli bir sanat eseri olarak görülebilir.

  • 01:05:00 "MIT 6.S192 - Ders 2: Sokratik bir tartışma, Alyosha Efros ve Phillip Isola" adlı YouTube videosunda ikili, Rus ressam Zlotnikov ve Amerikalı ressam Hurst'ün resimlerinin ardındaki anlamı tartışıyor. Efros, resimlerin yönünü, çağrıştırdıkları özgürlük ve kalabalıklık duygularının belirlediğini savunuyor. Isola, yönün Malevich'in belirli bir yönün nihai çözümü olarak gördüğü siyah kare resmi tarafından belirlendiğini söylüyor.

  • 01:10:00 Phillip Isola ve Alyosha Efros, sanatın, özellikle de Malevich'in siyah kare resminin anlamını tartışıyorlar. Isola, resmin boşuna bir gösteren olduğunu savunurken, Efros bunun Malevich için doğal bir ilerleme olduğunu savunuyor.

  • 01:15:00 Bu videonun amacı, makinelerin karmaşıklığını abartıyor olabileceğimiz ve bize sihir gibi görünen şeylerin basit süreçlerin sonucu olabileceğidir. Braiterberg'in "Araçlar" adlı kitabı, karmaşık davranışların basit etkileşimlerden nasıl ortaya çıkabileceğinin bir örneği olarak kullanılıyor.

  • 01:20:00 Bu derste Efros ve Isola, yaratıcılığın ve yeniliğin doğasını tartışıyor. Efros, her ikisinin de artan değişikliklerin sonucu olduğunu ve yaratıcı sürecin genellikle çok pürüzsüz olduğunu savunuyor. Isola, yeniliğin genellikle rastgelelik ve şansın sonucu olduğuna karşı çıkıyor.

  • 01:25:00 Bu, sanat ve bilimde bağlamın rolü hakkında iki kişi arasındaki bir tartışmadır. Bir kişi sanatın anlamlı olması için bağlamın gerekli olduğunu savunurken, diğeri bağlamın gerekli olmadığını ve onsuz sanatın roman olabileceğini savunuyor.

  • 01:30:00 Bu derste Efros ve Isola, bilimsel başarıda şansın rolünü tartışıyorlar. Efros, şansın önemli bir rol oynadığını savunurken Isola, büyüklük için plan yapmanın yolları olduğunu savunuyor.

  • 01:35:00 Bu derste, Alyosha Efros ve Phillip Isola, Efros'un şanstan daha fazlası olması gerektiğini savunurken, şansın yaratıcılıktaki rolünü tartışıyorlar. Isola, veri artı artının (veri ve işlemlerin kombinasyonu) yaratıcılığın anahtarı olduğunu ve doğru verilere sahip olduğunuzda olasılıkların sonsuz olduğunu savunuyor.

  • 01:40:00 Bu YouTube videosu, Alyosha Efros ve Phillip Isola arasında, verilerle ve modellerle çalışma arasındaki farklar ve verilerin eskiyip eskimeyeceği hakkında bir tartışmadır. Efros, modeller daha gelişmiş hale geldikçe verilerin zaten daha az önemli hale geldiğini ve sonunda modellerin zekada insanları geride bırakacağını savunuyor. Isola, verilerin hala altın standart olduğunu ve modellerin hiçbir zaman dayandıkları verilerden fazlasını yapamayacağını savunuyor.

  • 01:45:00 Bu tartışmada, MIT profesörleri Alyosha Efros ve Phillip Isola, sanat ve yapay zeka arasındaki ilişkiyi tartışıyorlar. Efros, hesaplamanın ilişki hakkında düşünmenin en iyi yolu olduğunu ve sanat ile evrim arasında güçlü bir bağlantı olduğunu savunuyor. Isola, ikisi arasında bir bağlantı olduğunu kabul ediyor, ancak mevcut modellerin verilerden yeni bilgiler çıkaramayacağını ve bunun gerçekten yaratıcı yapay zekanın anahtarı olduğunu savunuyor.

  • 01:50:00 Phillip ve Alyosha ile sanat ve hesaplama hakkında sohbet etmek harikaydı. Her ikisi de sanatın yeni bir düşünme paradigmasının ön saflarında yer aldığını ve hesaplamanın yeni fikirleri keşfetmeye yardımcı olmak için kullanılabileceğini düşünüyor.

  • 01:55:00 Bu derste Alyosha Efros ve Phillip Isola, yapay zekada verilerin rolü hakkında Sokratik bir tartışma yürütüyorlar. Efros, verilerin yapay zeka için gerekli olduğunu savunurken Isola, verilerin yapay zeka gelişimi için bir engel olabileceğini savunuyor.
MIT 6.S192 - Lecture 2: A Socratic debate, Alyosha Efros and Phillip Isola
MIT 6.S192 - Lecture 2: A Socratic debate, Alyosha Efros and Phillip Isola
  • 2021.01.21
  • www.youtube.com
First, Phillip Isola: "Generative Models as Data++" Then, Alyosha Efros: "Nostalgia to Art to Creativity to Evolution as Data + Direction" 39:14The debase go...
 

MIT 6.S192 - Ders 3: Jun-Yan Zhu'dan "Etkin GAN'lar"



MIT 6.S192 - Ders 3: Jun-Yan Zhu'dan "Etkin GAN'lar"

Ders, yüksek hesaplama, büyük miktarda veri ve kapsamlı eğitim oturumları gerektiren karmaşık algoritmalar dahil olmak üzere GAN modellerini eğitmenin zorluklarını kapsar. Bununla birlikte öğretim görevlisi, GAN sıkıştırmasının genel amaçlı çerçevesini kullanarak öğretmen modellerini sıkıştırma, farklılaştırılabilir büyütme ve veri artırma gibi GAN'ların daha hızlı öğrenmesini ve daha az veri kümesi üzerinde eğitim yapmasını sağlayan yeni yöntemler sunar. Ders ayrıca GAN'larla etkileşimli görüntü düzenlemeyi gösterir ve başarılı GAN eğitimi için büyük ve çeşitli veri kümelerinin önemini vurgular. Modeli çalıştırmaya yönelik kodlar, modeli farklı veri türleri üzerinde çalıştırmak için adım adım talimatlarla birlikte GitHub'da mevcuttur. Ders, pratik amaçlar için model sıkıştırmanın önemini tartışarak sona erer.

  • 00:00:00 Bu bölümde, konuşmacı verimli GAN kavramını ve GAN'ların ne kadar pahalı olduğunu tanıtıyor. GAN'lar çeşitli içerik oluşturma ve yaratıcılık görevleri için kullanılsa da, yeni algoritmalar geliştirmek veya gerçek zamanlı performans gerçekleştirmek için üst düzey GPU'lar gerekir. Araştırmacı, GauGAN projesinin geliştirilmesi için eğitim için yüzlerce üst düzey GPU'ya ihtiyaç duydu ve bir yıllık geliştirmeden sonra bile, ekip projeyi taşımak için pahalı bir dizüstü bilgisayar satın almak zorunda kaldı. GAN'ları eğitmenin ve algoritma geliştirmenin maliyeti pahalıdır ve şu anda üniversitelerin NVIDIA veya DeepMind gibi büyük şirketlerle rekabet etmesi zordur.

  • 00:05:00 Bu bölümde konuşmacı, daha fazla kullanıcının GAN'ları etkili bir şekilde kullanmasının önündeki üç ana engeli açıklıyor: yüksek hesaplama gereksinimi, büyük miktarda veri ve çok sayıda eğitim oturumu gerektiren karmaşık bir algoritma. Modeli eğitmek için gereken yüksek kaliteli görüntüler ve ön işleme adımları nedeniyle GAN'ların hesaplama açısından pahalı olduğunu açıklıyor. Ek olarak, büyük veri kümeleri ve etiketlere olan ihtiyaç, GAN'ların eğitimini daha da zorlaştırıyor. Bununla birlikte, GAN'ların daha hızlı öğrenmesini ve daha az veri kümesi üzerinde eğitim almasını sağlayabilecek yeni yöntemler sunuyor; bu, içerik oluşturucuların ve kaynaklara sınırlı erişimi olan sanatçıların kendi modellerini eğitmelerine ve test etmelerine yardımcı olabilir.

  • 00:10:00 Dersin bu bölümünde Jun-Yan Zhu, genel amaçlı GAN sıkıştırma çerçevesini kullanarak öğretmen modellerini sıkıştırma yöntemini tanıtıyor. Amaç, öğretmen modeliyle aynı çıktıyı üretebilen daha az filtreli bir öğrenci modeli bulmaktır. Yöntem, öğrencinin zebra çıktısının dağılımının öğretmenin çıktısına çok benzer görünmesini, öğrencinin ara özellik temsilinin öğretmeninkine çok benzer olmasını ve öğrencinin çıktısının bir rakip kayba göre bir zebra gibi görünmesini sağlamak için bir kayıp fonksiyonu oluşturmayı içerir. . Süreç ayrıca, modelin boyutunu ve eğitim süresini azaltırken aynı sonuçları üretebilen en uygun sayıda kanalın aranmasını da içerir. Ağırlıkları farklı konfigürasyonlar arasında paylaşma süreci, birden fazla konfigürasyonu ayrı ayrı eğitmeden eğitmeyi mümkün kılar ve böylece eğitim süresini kısaltır.

  • 00:15:00 Bu bölümde, Jun-Yan Zhu, öğretmen modellerini taklit etmek ve farklı yapılandırmalar arasında ağırlıkları paylaşmak için çeşitli kayıp fonksiyonlarının kullanımının yanı sıra, farklı yapılandırmalar aracılığıyla GAN modellerini eğitme ve değerlendirme sürecini tartışıyor. Mobil cihazlarda gerçek zamanlı performans elde etmek için modelleri sıkıştırma fikriyle birlikte, farklı boyutlardaki ve hesaplama maliyetlerindeki modeller için sonuçlar sunuldu. Bu fikrin StyleGAN2'ye uygulanması da tanıtıldı ve orijinal modelden nihai çıktı uygulanmadan önce görüntü düzenleme için düşük maliyetli modellerin nasıl kullanılabileceğini gösterdi.

  • 00:20:00 Bu bölümde, konuşmacı GAN'larla etkileşimli görüntü düzenlemenin bir demosunu gösterir. Demonun amacı, kullanıcıların bir görüntüyü gülümseme eklemek veya saç rengini değiştirmek gibi çeşitli özelliklerde düzenlemesine ve değişikliklerine göre anında geri bildirim almasına olanak sağlamaktır. Sistem, önizlemenin bilgilendirici kalmasını sağlamak için büyük modelle tutarlı çıktılar üreten daha küçük bir model kullanır. Düzenlemeler tamamlandıktan sonra, yüksek kaliteli bir çıktı oluşturmak için orijinal model çalıştırılabilir. Etkileşimli düzenleme daha hızlıdır ve mevcut derin öğrenme olmayan içerik oluşturma yazılımına kıyasla yüksek kaliteli sonuçlar sağlar.

  • 00:25:00 Dersin bu bölümünde, Profesör Jun-Yan Zhu, etkili performans için büyük miktarda yüksek kaliteli veriye duyulan ihtiyaçtan bahsederek GAN modellerini eğitmenin zorluklarını tartışıyor. İşlemi hızlandırmak ve önizlemeler oluşturmak için işleme yazılımı veya diğer araçları kullanmak mümkün olsa da, özel modelleri eğitmek, önemli miktarda açıklamalı veri toplamayı gerektirir. Zhu, yalnızca 50 veya 100 yüz içeren bir veri kümesi üzerinde, bozuk görüntülerle sonuçlanan bir stylegan2 modeli eğitme örneğini veriyor. Ders, başarılı GAN eğitimi için büyük ve çeşitli veri kümelerinin önemini vurgulamaktadır.

  • 00:30:00 Bu bölümde konuşmacı, GAN modellerinde yeterli miktarda eğitim verisine sahip olmanın önemini tartışıyor. Daha küçük veri kümeleri üzerinde eğitim yaparken, ayrımcının tüm görüntüleri kolayca üst üste yerleştirebileceğini ve doğru bir şekilde sınıflandırabileceğini, ancak gerçek görüntülere genellemede sorun yaşayacağını gösteriyorlar. Bu, oluşturucunun birçok gereksiz görüntü üretmesine veya çökmesine yol açar. Konuşmacı, GAN'ları kendi amaçları için veya küçük veri kümeleri üzerinde kullanırsa, fazla uydurmanın çok daha ciddi hale geldiğini ve verimli GAN'lar oluşturmak için yeterli veri elde etmenin çok önemli olduğunu vurguluyor.

  • 00:35:00 Bu bölümde, profesör, yeni örnekler toplamadan veri kümesini artırmak için tek bir görüntünün birden çok sürümünün oluşturulmasını içeren makine öğrenimindeki aşırı uyumla mücadele etmek için veri artırma fikrini tartışıyor. Bununla birlikte, bu yöntemi GAN eğitimine uygulamak daha karmaşıktır, çünkü oluşturulan görüntüler aynı zamanda gerçek görüntülere uygulanan aynı dönüştürme veya büyütme etkisine sahiptir, bu da yinelenen eserlere yol açabilir. Profesör, bu sorundan kaçınmak için hem gerçek hem de sahte görüntüleri artırmayı ve bunu yalnızca ayrımcı eğitimi için yapmayı ve üretici ile ayırıcı arasındaki artırılmış verilerdeki farklılıkları dengelemeyi öneriyor.

  • 00:40:00 Bu bölümde konuşmacı, GAN'larda üreticinin ve ayrımcının hedefleri arasındaki boşluğu doldurmaya yönelik bir yaklaşım olarak türevlenebilir artırma kavramını tartışıyor. Ana fikir, ayrımcıdan gelen gradyanların jeneratöre geri yayılabilmesi için hem sahte hem de gerçek görüntüleri ayırt edilebilir bir şekilde artırmaktır. Konuşmacı, türevlenebilir büyütmenin minimum eğitim verisiyle daha iyi sonuçlara izin verdiğini, böylece büyük ölçekli veri kümelerine olan ihtiyacı azalttığını örneklerle gösterir. Konuşmacı, türevlenebilir artırmanın GAN'ları eğitirken hatırlanması gereken çok önemli bir teknik olduğu sonucuna varır.

  • 00:45:00 Bu bölümde öğretim görevlisi, modeli çalıştırmak için tüm kodların GitHub'da mevcut olduğunu, modeli farklı türde veriler üzerinde, hatta kişisel yüz görüntülerinde bile çalıştırmak için adım adım talimatlarla açıklıyor. Ayrıca tasarımcılar ve sanatçılar için mevcut olan belirli araçları tartışıyorlar ve öğretim görevlisi, David Bau'nun iç birimleri görselleştirmek ve izlemek için çevrimiçi araçlar hakkında konuşacağından bahsediyor. Model sıkıştırma işlemi, bir modeli bir kez sıkıştırma ve onu birden çok cihaza dağıtma yeteneğini geliştirme hedefiyle de ele alınmıştır; bu, geliştiricilerin zamandan tasarruf ederken kullanıcıların modele erişmesi için gereken süreyi azalttığı için pratik amaçlar açısından önemlidir. .
MIT 6.S192 - Lecture 3: "Efficient GANs" by Jun-Yan Zhu
MIT 6.S192 - Lecture 3: "Efficient GANs" by Jun-Yan Zhu
  • 2021.01.21
  • www.youtube.com
Jun-Yan Zhu Assistant Professor, School of Computer Science, Carnegie Mellon Universityhttps://www.cs.cmu.edu/~junyanz/More about the course: http://deepcrea...
 

MIT 6.S192 - Ders 5: "Bir GAN'ın Nöronları ile Boyama", David Bau



MIT 6.S192 - Ders 5: "Bir GAN'ın Nöronları ile Boyama", David Bau

David Bau, makine öğreniminin evrimini ve kendi kendine programlama sistemleri yaratma potansiyelini tartışıyor. Üretken çekişmeli ağları (GAN'lar) tanıtıyor ve bunların gerçekçi görüntüler oluşturmak için nasıl eğitilebileceğini açıklıyor. Bau, Aşamalı bir GAN'daki belirli nöronlar ile oluşturulan görüntülerdeki belirli anlamsal özellikler arasındaki korelasyonları belirleme sürecini tartışıyor. Bir GAN yardımıyla bir görüntüye kapılar, çimenler ve ağaçlar gibi çeşitli öğeleri nasıl ekleyebileceğini gösteriyor. Ek olarak, bir GAN'a yeni unsurlar eklemenin zorluğunu ve dünyanın gerçekçi sunumlarını çevreleyen etik kaygıları tartışıyor.

  • 00:00:00 Bu bölümde David Bau, istatistiksel analizdeki köklerinden kendi kendini programlama sistemleri yaratma potansiyeline kadar makine öğreniminin gelişimini tartışıyor. Akademik bir araştırmacı olarak, alanın yönü ve makine öğrenimi modellerinin sonuçları hakkında sorular sormak için ilginç bir zaman olduğuna inanıyor. Konuşmasında ele alacağı ana sorun, görüntü üretimidir ve gerçek görüntülerden oluşan bir veri kümesi toplama ve bunları yeniden oluşturmak için bir üretici ağı eğitme sürecini tanıtmaktadır.

  • 00:05:00 Bu bölümde David Bau, üretken rakip ağları (GAN'lar) tanıtıyor ve gerçekçi görüntüler oluşturmak için nasıl eğitilebileceklerini açıklıyor. GAN'ların püf noktasının, önce bir görüntünün gerçek mi yoksa sahte mi olduğunu sınıflandırması için bir ayrımcıyı eğitmek ve ardından ayrımcıyı kandıran görüntüler oluşturmak için bu ayrımcıyı jeneratöre bağlamak olduğunu açıklıyor. Bununla birlikte, üreticinin ayrımcıyı gerçekçi görüntülere benzemeyen basit kalıplarla kandırmayı öğrenebileceğini ve bu nedenle GAN'lardaki hilenin, süreci yinelemek ve üretici ile ayrımcı arasında giderek daha fazla üretmek için gidip gelmek olduğunu belirtiyor. gerçekçi görüntüler Son olarak, genellikle gerçek görüntülerden ayırt edilmesi zor olan GAN'lar tarafından oluşturulan görüntü örneklerini gösterir.

  • 00:10:00 Bu bölümde konuşmacı, filigranlar gibi GAN tarafından oluşturulan görüntülerde görülen bazı yapıları ve bunların eğitim setinden gelen kökenlerini tartışır. Konuşmacı, filigran izlenimlerine bağlı nöronları nasıl bulduğunu ve bunları nasıl kapatabileceğini açıklamaya devam etti. Filigran nöronlarını kapatarak, oluşturucudan elde edilen çıktıda herhangi bir filigran veya ilgili eserler bulunmaz, bu da onu heyecan verici bir bulgu haline getirir ve ağlar içinde oluşturulan görüntünün farklı özelliklerini kontrol eden anahtarlar olduğunu kanıtlar.

  • 00:15:00 Bu bölümde David Bau, Aşamalı bir GAN'daki belirli nöronlar ile oluşturulan görüntülerdeki belirli semantik özellikler arasındaki korelasyonları belirleme sürecini tartışıyor. Bunun, en çok nerede aktive olduğunu görmek için her bir nöronu ayrı ayrı test ederek elde edildiğini ve ilişkili olduğu belirli özellikleri gösterdiğini açıklıyor. Bu süreç boyunca, ağaçlarla, pencereler ve kapılar, sandalyeler ve hatta kubbeler gibi parçalar inşa eden nöronları tanımlayabildi. Bau, bunun herhangi bir denetimli eğitim veya etiket olmadan başarıldığını belirtiyor ve ağın bu özelliklerin farklı örneklerini farklı bileşenlerde temsil ederek ayırt etmeyi nasıl öğrendiğini gösteriyor.

  • 00:20:00 Bu bölümde, David Bau, mutfaklar oluşturmak için bir modeldeki tüm farklı nöronların haritasını çıkarma hedefini tartışıyor, bu da farklı ilişkili nöron türlerinin kataloglarıyla sonuçlandı. Bau, modelin orta katmanlarının semantik nesnelerle yüksek oranda ilişkili nöronlara sahip olduğunu, sonraki katmanların ise daha fazla fiziksel korelasyona sahip olduğunu buldu. Bau, korelasyonların o kadar çarpıcı olduğunu keşfetti ki, bu, bir görüntü üretiminde farklı nesneleri açıp kapatmak da dahil olmak üzere ilginç uygulamalara yol açtı. Bau, bazı ağaç nöronlarının kapatılmasının ağaçları olay yerinden nasıl kaldırdığını ve jeneratörün ağaçların arkasındakileri nasıl doldurduğunu gösterdi. Tersine, nöronların açılması, jeneratörün kapının uygun boyutunu, yönünü ve stilini doldurduğu sahnede bir kapının görünmesine neden oldu.

  • 00:25:00 Videonun bu bölümünde, David Bau bir görüntüye bir GAN yardımıyla kapılar, çimenler ve ağaçlar gibi çeşitli öğeleri nasıl ekleyebileceğini gösteriyor. Yalnızca belirli bir nesne veya öğeyle ilişkili olan belirli nöronları etkinleştirerek, görüntünün anlamını değiştirebilir. Ayrıca, modelin geriye doğru nasıl çalıştırılacağını öğrenmeyi gerektiren bir ters çevirme problemiyle çözülebilen, yalnızca rastgele oluşturulmuş görüntüleri düzenleyebilmek gibi GAN'ların sınırlamalarını da tartışıyor.

  • 00:30:00 Bu bölümde, David Bau, ağın yapamayacağı şeyleri ortaya çıkarabileceğinden, görüntüler oluşturmak için Üretici Düşman Ağı (GAN) kullanmanın sınırlamalarını tartışıyor. Bununla birlikte, ağı nispeten değiştirmeden, düzenlemeyi hala mümkün kılarak, hedef görüntüyü tam olarak vuran çok yakın bir ağ oluşturmak için ağ ağırlıklarında ince ayar yapmak mümkündür. Bau, fotoğrafı ağ üzerinden ters çevirerek, bir başlangıç görüntüsü elde ederek, hedef görüntüyü çıkarmak için ağda ince ayar yaparak ve ardından görüntüyü düzenleyerek gerçek fotoğrafları değiştirmek için bu tekniğin kullanıldığını gösteriyor. İşlem, görüntünün mimari tarzına uyan kubbeler ve kapılar gibi nesnelerin eklenmesine veya çıkarılmasına izin verir.

  • 00:35:00 Videonun bu bölümünde David Bau, belirli bir görüntünün üzerine sığdırmak için ince ayarlı bir ağ kullanarak görüntüleri değiştirmek için GAN teknolojisini nasıl kullandığını açıklıyor. Bau, çekirdek ekran katmanlarını çok fazla değiştirmemeye çalışacak şekilde ağın önceden eğitilmiş ağırlıklarını değiştirerek görüntüleri düzenleyebildi ve hedef görüntü için kabaca bir yaklaşım oluşturabildi. Ancak ağ bu bilgiyi genelleştirmez, yani hedef görüntü dışında herhangi bir görüntü için anlamlı değişiklikler üretemez.

  • 00:40:00 Bu bölümde David Bau, üretken bir rakip ağa (GAN) yeni öğeler eklemenin zorluğunu tartışıyor. Sistem, belirli bir nesnenin görüntülerini oluşturmak için eğitilebilse de, önceden veri kümesi veya kodlanmış kural yoksa ona yeni kavramları öğretmek zordur. Bu nedenle Bau, önceden eğitilmiş bir modelin ağırlıklarını, modeli yeniden eğitmeden kulelerin tepesine ağaç eklemek veya binaların önüne Cadillac çizmek gibi yeni kurallara uyacak şekilde değiştirmek için bir teknik geliştirdi. Kullanıcıların bir kural belirleyebildiği ve çıktıyı kendi tercihlerine göre değiştirebildiği StyleGAN2'deki uygulamayı gösteriyor.

  • 00:45:00 Bu bölümde David Bau, oluşturduğu görüntülerden birkaç örneği nasıl seçebileceğini ve GAN'ı kullanarak şekillerinden sorumlu paylaşılan nöronları nasıl bulabileceğini tartışıyor. Seçildikten sonra, örneğin sivri kulelerin tepelerini ağaçlara dönüştürmek için GAN modelinde doğru değişiklikleri hesaplayarak temsillerini yeniden tanımlayabilir ve yeni görüntüler oluşturabilir. Bau, arama sonuçlarında bu sürecin tüm sivri kule görsellerinden etkilendiğini ve bunun da sivri kule görsellerinin tamamen yeni bir temsiline yol açtığını gösteriyor. Buna ek olarak Bau, GAN'ın her katmanının, bağlam gösterimi için bir bellek olarak kullanılan anahtar-değer çiftlerini eşleştirme gibi basit bir sorunu çözdüğünün düşünülebileceğini açıklıyor. Ağırlık matrisinin en küçük kareler probleminin çözümü olduğunu ve bir katmanın anahtar-değer çiftindeki bir kuralı değiştirmenin de bir en küçük kareler problemi olduğunu ve karşılaştırma için aynı şekilde yazılabileceğini belirtiyor.

  • 00:50:00 Bu bölümde David Bau, bir ağın ezberlediği bir şeyi tüm kuralı değiştirmeden değiştirme yöntemini tartışıyor ve henüz var olmayan şeyleri temsil eden modellerin oluşturulmasına izin veriyor. Bu, bir anahtar bulup yeni bir değer yazarak, yalnızca anahtarın değerlerini değiştirmek için belirli yönlerde birinci derece güncellemeleri kullanarak gerçekleştirilir. Bu, kullanıcıların bir GAN içindeki kuralları değiştirmesine ve bunları yalnızca eğitim verileri yerine hayal güçlerine dayalı şeyler oluşturmak için kullanmasına olanak tanır. Bu yöntem, yeterli verinin olmadığı yerlerde de kullanılabilir ve makine öğrenimini kullanarak yeni dünyalar yaratmak için potansiyel bir yol sağlar.

  • 00:55:00 Bu bölümde David Bau, yönteminin dünyanın kurallarını insanlar tarafından daha görünür ve manipüle edilebilir hale getirerek ve insanların daha iyi bir dünya inşa etmesine izin vererek değiştirme potansiyelini tartışıyor. Bu yöntemin birden fazla farklı modelle çalışıp çalışmadığı veya sadece bu modelin içinden bir şapka alıp kornaya takıldığında başarılı olup olmadığı sorusuna da değiniyor. Şu anda, yöntemin yalnızca bir modeli yeniden bağlayabildiğini, ancak bir hesaplama parçasını bir sinir ağından diğerine taşıyabilmenin açık bir hedef olduğunu açıklıyor. Son olarak, derin sahtecilik olgusuna ve yüz oluşturucular kullanılarak milyonlarca sahte Facebook profilinin oluşturulmasına atıfta bulunarak, dünyanın gerçekçi sunumlarını çevreleyen etik kaygılardan ve bunun nasıl zaten kötüye kullanıldığından bahsediyor.

  • 01:00:00 Bu bölümde, David Bau, derin sinir ağlarını kullanarak gerçekçi görüntüler oluşturmanın olası sonuçlarını tartışıyor. Sahte görüntülerin tespiti için adli tıp çalışması gerekli olmakla birlikte, iç yapıyı anlamanın ve bu modellerin içeride nasıl çalıştığını öğrenmenin daha heyecan verici olduğunun altını çiziyor. Derin ağı anlamada şeffaflık önemlidir, çünkü bu sinir ağları neden belirli kararlar aldıkları sorusunu yanıtlamada iyi değildir. Bau'nun amacı, karar vermek için ağ içinde uygulanan kuralları parçalara ayırmak ve neden diye sormanın bir yolunu geliştirmek, şeffaflığı derin sinir ağlarının çok önemli bir etik yönü olarak tanımlamaya yardımcı olmaktır. Ayrıca, Bau'nun tarama diseksiyonu üzerindeki çalışması, bu ağlarda çıktı kalitesini artırabilen, kötü görünen eserlere katkıda bulunan nöronları tanımlayabileceğinizi gösteriyor.

  • 01:05:00 Bu bölümde David Bau, bazı GAN'ların oluşturdukları görüntülerde bazen belirli öğrenme yöntemleriyle kaldırılabilen veya azaltılabilen yapı veya bozulmalara sahip olduğunu tartışıyor. Mevcut nesil GAN'lar, denediğinden daha gelişmiş olsa da, bu fenomenin hala devam edip etmediğini araştırmaya değer olacağını öne sürüyor. David, bu alanda doğru soruları sormanın ve bunu yapmayı öğrenmenin çok önemli olduğunu belirtiyor ve çalışmalarıyla ilgilenen herkesi kendisine ulaşmaya davet ediyor.
MIT 6.S192 - Lecture 5: "Painting with the Neurons of a GAN" by David Bau
MIT 6.S192 - Lecture 5: "Painting with the Neurons of a GAN" by David Bau
  • 2021.01.27
  • www.youtube.com
https://people.csail.mit.edu/davidbau/home/More about the course: http://deepcreativity.csail.mit.edu/Information about accessibility can be found at https:/...
 

MIT 6.S192 - Ders 7: "Makinenin Gözünde Sanat Tarihinin Şekli", Ahmed Elmal



MIT 6.S192 - Ders 7: "Makinenin Gözünde Sanat Tarihinin Şekli", Ahmed Elmal

Bilgisayar Bilimi profesörü ve Sanat ve Yapay Zeka Laboratuvarı'nın kurucusu Ahmed Elgamal, insan düzeyinde yaratıcı ürünlerin anlaşılması ve üretilmesinde yapay zekanın kullanımını tartışıyor. Elgamal, sanat tarihine bilimsel yaklaşımı ve sanatı insanlar gibi anlamak için yapay zekayı geliştirmenin önemini tartışıyor. Ayrıca sanat stillerini sınıflandırmak, iç temsilleri analiz etmek, sanat stilleri arasındaki farkları belirlemek ve yapay zeka aracılığıyla sanatta yaratıcılığı ölçmek için makine öğreniminin kullanımını tartışıyor. Elgamal ayrıca sanat tarihinde birincil nesneler kavramını öneriyor ve yaratıcı arayışlardaki mevcut AI yaklaşımlarının sınırlamalarını kabul ederek AI'nın sanat üretme potansiyelini araştırıyor. Ancak Elgamal, soyut ve ilginç sanat yaratmak için yapay zeka ağının sınırlarını zorlamaya yönelik devam eden deneyleri de tartışıyor.

Ahmed Elgammal ayrıca, sanat eserlerini temel alarak insanların bir GAN tarafından oluşturulan sanatı insanlarınkinden ayırt edip edemediğini belirlemek için yapılan bir ayarlama testinin sonuçlarını tartışıyor. İnsanlar, GAN makineleri tarafından yapılan sanatın zamanın %75'inde insanlar tarafından üretildiğini düşündüler; bu, stil belirsizliği kavramını ve bunun bilgisayarla görme ve makine öğrenimini sanat tarihi ve sanatsal ilgilerle ilişkilendirmedeki önemini vurguladı.

  • 00:00:00 Bu bölümde, Rutgers Üniversitesi Bilgisayar Bilimleri Bölümü'nde profesör ve Sanat ve Yapay Zeka Laboratuvarı'nın kurucusu Profesör Ahmed Elgammal, sanata olan tutkusunu ve yapay zeka ile sanatı birleştirmenin önemini nasıl fark ettiğini tartışıyor. . Sanatın nesne tanımadan çok daha fazlası olduğunu ve insanlarınkine benzer bilişsel ve entelektüel yetenekler gerektiren bağlam katmanları, duyguları anlama ve tarihsel ve sosyal bağlamları içerdiğini açıklıyor. Yapay zeka algoritmalarının akıllı olduğunu göstermek için insan düzeyinde yaratıcı ürünleri anlamanın ve üretmenin temel olduğuna inanıyor ve estetik ve öznelliği nesnellik ve bilimle birleştirme sorununu tartışıyor. Profesör Elgammal, sanat tarihine bilimsel bir yaklaşımı savunuyor ve sanatı insanlar gibi anlamak için yapay zekayı geliştirmenin önemini vurguluyor.

  • 00:05:00 Bu bölümde Ahmed Elmal, sanatın herhangi bir yönünün, hatta yaratıcı ve öznel unsurların bile bir makinenin gözünden objektif olarak incelenebileceği fikrini tartışıyor. Amacının, sanata yapay zeka aracılığıyla bakmanın sonuçlarını ve bunun yapay zekayı ve sanat tarihi anlayışını nasıl geliştirebileceğini anlamak olduğunu açıklıyor. Elgemal, sanat ve stilin farklı unsurlarını ve ilkelerini nicelleştirme konusundaki çalışmalarından bahsediyor; sanat stilindeki değişimin zaman içindeki sıralamasını ve gelişimini nasıl karakterize edeceği ve bu değişiklikleri hangi faktörlerin etkilediği de dahil. Ayrıca, sanatta stil kavramını anlamada mevcut yapay zeka yaklaşımlarının sınırlamalarını tartışıyor.

  • 00:10:00 Bu bölümde konuşmacı, farklı düzeylerdeki özellikleri yakalamak için görsel kodlamalar kullanarak farklı sanat tarzlarını sınıflandırmak için denetimli bir makine öğrenimi problemini tartışıyor. Bu tür araştırmaların ilerlemesi, domuz yıllarından derin öğrenmeye kadar karşılaştırılır. Makine, sanat stillerini birinci sınıf bir sanat tarihi öğrencisiyle aynı seviyede sınıflandırabiliyor. Konuşmacı, sanatı makineye göre sınıflandırmanın, stilin özelliklerini ve stil değişikliklerini neyin yönlendirdiğini anlamak için önemli olduğunu savunuyor. Makinenin bu tarzlara ilişkin dahili temsillerini yorumlamak zordur, ancak makinenin stili nasıl tanımladığı ile sanat tarihçilerinin stil hakkında nasıl düşündükleri arasındaki ilişkiyi incelemek faydalı bilgiler sağlayabilir. Örneğin, Heinrich Wolfflin'in üslup hakkındaki teorisi, farklı üslupların unsurlarını farklılaştıran görsel şemalar önerir.

  • 00:15:00 Bu bölümde Elgemal, sanat stillerini sınıflandırmak ve makinenin sınıflandırmasının içsel temsilini analiz etmek için makine öğreniminin kullanımını tartışıyor. Denetimli bir şekilde stil sınıflandırması yapmak için VGGNet ve ResNet dahil olmak üzere birkaç CNN modelini eğittiler. İç temsili analiz ederek, az sayıda faktörün Batı sanat tarihindeki varyasyonların çoğunu açıklayabildiğini buldular; ilk iki varyasyon modu, kullanılan ağdan bağımsız olarak varyansın %74'ünü açıklıyor. Ayrıca, sanat stillerini sınıflandırmak söz konusu olduğunda, nesne veya kompozisyon hakkında önemli olan hiçbir şeyin olmadığını da keşfettiler. Bu yaklaşım, makinenin sanatı nasıl sınıflandırdığını anlamanın veriye dayalı bir yolunu sunar ve sanat tarihinin yapısına ilişkin kavrayışlar sağlar.

  • 00:20:00 Bu bölümde öğretim görevlisi, makinelerin çeşitli sanat stillerinin zaman çizelgeleri hakkında bilgi sahibi olmasalar da, sağlanan resimler aracılığıyla bu stilleri kendi kendilerine sınıflandırmayı nasıl öğrenebileceklerini tartışıyor. Bu, stillerin ilerlemesi ile zaman arasında 0,7'lik bir korelasyon olduğu için makinenin sanatı tarihsel sıraya koymasıyla doğrulanır. Öğretim görevlisi, sanat tarihinin %75'ini açıklamaya yardımcı olan, düzleme karşı durgunluk ve doğrusala karşı ressam olan iki faktörü derinlemesine araştırır. Batı medeniyetinde sanat tarihinin son 500 yılda 360 derecelik bir döngüden geçtiğini ve bunun, makinenin sanat stillerine bakarak öğrendiği temsilden oluşturulan bir diyagramda yakalandığını belirtiyor.

  • 00:25:00 Bu bölümde konuşmacı, sanat stilleri arasındaki farkları belirlemede yapay zekanın kullanımını tartışıyor. Rönesans ve Barok gibi bazı stiller, renk ve doku gibi belirli faktörler kullanılarak ayırt edilebilirken, Empresyonizm gibi diğer stiller bu faktörler aracılığıyla tanımlanamaz. Yapay zeka ağlarının aktivasyon manifoldları, İzlenimcilik ile Kübizm ve Soyutlama gibi 20. yüzyılın başlarındaki stiller arasında bir köprü görevi gören Cezanne'nin çalışmalarına özellikle vurgu yaparak, sanat hareketlerinin zaman içinde nasıl değiştiğini gösteriyor. Ek olarak, El Greco ve Durer gibi belirli sanatçıların modern sanatı etkilemesiyle, belirli Rönesans sanat eserleri Rönesans bulutundan çekilir. Ardından konuşma, yapay zeka aracılığıyla sanatta yaratıcılığın ölçülmesi tartışmasına geçer.

  • 00:30:00 Bu bölümde Elgemal, bağlamı ve sanat tarihi göz önüne alındığında bir resmin yaratıcılığını değerlendirmek için bir algoritmanın geliştirilmesini tartışıyor. Sanat yaratan makineler için yaratıcılığı değerlendirme yeteneğinin kritik olduğunu ve algoritmanın yaratıcılığı ölçülebilir bir şekilde tanımlaması gerektiğini savunuyor. Elgemal, bir ürünün yaratıcı olarak adlandırılabilmesi için iki temel koşul olduğunu öne sürüyor: önceki çalışmalara kıyasla yeni olması ve etkili olacağı anlamına gelen bir değeri olması gerekiyor. Yaratıcılığı tanımlamanın farklı yollarına bakıyor ve sanat tarihi bağlamını dikkate almaları gerektiğini savunarak yaratıcılığı değerlendiren algoritmaların sınırlarını araştırıyor.

  • 00:35:00 Bu bölümde Ahmed Elgamal, mevcut verilerin "kapalı dünya sınırlaması" dediği şey ve kullanılan görsel kodlamanın "sanatsal kavram niceleme sınırlaması" da dahil olmak üzere, sanat tarihindeki algoritmaların sınırlamalarını tartışıyor. Algoritmanın parametrelerinin yaratıcılık puanlarını yorumlamak ve sonuçları nasıl etkilediğini anlamak için kullanılabileceğini öne sürüyor. Elgamal, görsel benzerliklerini yansıtan bir ağırlığa sahip resimler arasında yönlendirilmiş bir grafik önerir ve bunu etki ve yeniliğe dayalı bir yaratıcılık formülasyonu oluşturmak için kullanır. Ortaya çıkan formül, bir ağ merkezilik sorununun bir örneğidir ve alfa bire ayarlanmış bir Markov zincirinde rastgele bir yürüyüş olarak yorumlanabilir.

  • 00:40:00 Bu bölümde öğretim görevlisi, sayfa sıralamasının ağırlıklı değişkenini ters çevirerek sosyal ağlarda ağ merkeziliğini ölçmek için özvektör merkeziliğinin nasıl kullanılabileceğini tartışıyor. Bu, orijinalliği etkiden ayırmak için bile genişletilebilir ve algoritmanın doğruluğu, denetlenmeyen wikiart ve arşiv gibi setler kullanılarak değerlendirilebilir. Öğretim görevlisi, test edildiğinde sonuçların, makinenin Picasso'nun Cezayirli Hanımları gibi çeşitli yaratıcı sanat eserlerini kübizmin başlangıcı olarak tanımlayabildiğini gösterdiğini açıklıyor.

  • 00:45:00 Bu bölümde Ahmed Elgemal, Mondrian'ın sanat eserinin tarihlendirilmesindeki bir hata nedeniyle ortaya çıkan bir arşiv makinesi kullanarak sanat eseri yaratıcılığının değerlendirilmesini tartışıyor. Yöntem, Rönesans veya barok dönemden sanat eserlerini alıp daha sonraki bir döneme taşımayı ve aynı zamanda modern sanat eserlerini alıp Rönesans dönemine taşımayı içeriyordu. Sonuçlar, Rönesans ve barok sanat eserlerini zamanda ileriye taşırken yaratıcılıkta tutarlı bir düşüş ve modern sanat eserlerini Rönesans dönemine geri taşırken yaratıcılıkta bir artış gösterdi. Kullanılan algoritma, yaratıcılığı ölçebildi ve yenilik ve etkiyi yakalayan bir puan vererek, algoritmanın sanat eseri yaratıcılığını değerlendirme yeteneğini doğruladı.

  • 00:50:00 Bu bölümde Ahmed Elmal, sanat tarihinde birincil nesneler kavramını ve bunların nasıl yeni stiller doğurabileceğini tartışıyor. Asal nesneleri matematikteki asal sayılarla karşılaştırır, tahmin edilemez yapıları ile sonraki çalışmaları etkileme yetenekleri arasında paralellikler kurar. Elgemal ayrıca, Creative Adversarial Networks ve bunların stil hakkında bilgi edinme ve normlardan sapma yeteneklerini tartışarak AI'nın sanat üretme potansiyelini araştırıyor. Ancak Elgemal, herhangi bir yaratıcılık motivasyonu olmadan ayrımcıyı kandıran örnekler oluşturmak üzere eğitildiğinden, GAN'lardaki üreticinin sınırlı olduğunun farkındadır.

  • 00:55:00 Bu bölümde konuşmacı, sanatçıların alışkanlığa karşı koymak için nasıl her zaman yenilik yapmak zorunda olduklarını tartışıyor, ancak çok fazla yenilik yaparlarsa insanların bundan zevk alması zor olacak. Ağı yenilikçi olmaya zorlamayı, ancak sınırları zorlamak için ağı aynı dağıtım içinde tutmayı hedefliyorlar. Konuşmacı, üreticinin yarattığı sanatın stillere uyup uymadığını veya sınıflandırma açısından belirsiz olup olmadığını görmek için ayrımcıya stil belirsizliği kaybını eklediklerini açıklıyor, bu da makinenin farklı sınırları keşfetmesine yardımcı olacak. Deneyler yaptılar ve makinenin stil belirsizliği ekleyerek, çekici olanın dağılımında olan yeni kompozisyonlar ve renk kombinasyonları ile ilginç soyut sanat eserleri ürettiği sonucuna vardılar.

  • 01:00:00 Bu bölümde Ahmed Elgammal, bir insanın bir GAN tarafından yaratılan sanat ile bir insanın yarattığı sanat arasında ayrım yapıp yapamayacağını belirlemek için bir ayarlama testinin sonuçlarını araştırıyor. Ünlü bir sergideki sanat eserleri bir temel olarak hizmet ediyor ve insanların GAN makineleri tarafından yapılan sanatın zamanın yüzde 75'inde insanlar tarafından üretildiğini düşündüğü, soyut sanat için yüzde 85 ve Sanattan sanat için sadece yüzde 48 olduğu keşfedildi. Basel koleksiyonu. Elgammal ayrıca stil belirsizliği kavramını ve bunun belirli bir stil olmadan sanata ait sanat yaratmaya izin verme yeteneğini tartışıyor. Bilgisayarlı görü ve makine öğrenimini sanat tarihi ve sanatsal ilgi alanları ile bağlantılandırmanın önemini vurguluyor.
MIT 6.S192 - Lecture 7: "The Shape of Art History in the Eyes of the Machine " by Ahmed Elgemal
MIT 6.S192 - Lecture 7: "The Shape of Art History in the Eyes of the Machine " by Ahmed Elgemal
  • 2021.01.28
  • www.youtube.com
Abstract: In this talk, I will argue that teaching the machine how to look at art is not only essential for advancing artificial intelligence, but also has t...
 

MIT 6.S192 - Ders 8: "Makine Öğrenimi İnsan Yaratıcılara Nasıl Fayda Sağlayabilir", Rebecca Fiebrink



MIT 6.S192 - Ders 8: "Makine Öğrenimi İnsan Yaratıcılara Nasıl Fayda Sağlayabilir", Rebecca Fiebrink

Müzik ve yapay zeka alanında araştırmacı olan Rebecca Fiebrink, yaratıcı amaçlar için makine öğreniminin kullanımı ve geliştirilmesinde insan etkileşiminin ve insanları döngüde tutmanın önemini vurguluyor. İnsan yaratmak için gerçek zamanlı müzikte makine öğreniminin kullanılmasını sağlayan aracı Wekinator'dan bahsediyor. Bir davul makinesi, Blotar adlı bir ses sentez algoritması ve üflemeli bir çalgı olan üflemeli çalgı gibi hareketle kontrol edilen çeşitli enstrümanların yapımını gösteriyor. Karmaşık ve incelikli ses paletlerini keşfetmelerine ve sensörler ile gerçek zamanlı veriler için veri analizini kolaylaştırmasına olanak tanıyan makine öğreniminin içerik oluşturucular için nasıl faydalı olabileceğini vurguluyor. Ayrıca eğitim verilerini etkileşimli olarak manipüle etmenin faydalarına değiniyor ve yaratıcı çalışma sürecine sürprizler ve zorluklar eklemenin yanı sıra makine öğreniminin bilgisayarlarla daha doğal bir şekilde iletişim kurmamızı nasıl sağladığını açıklıyor.

  • 00:00:00 Videonun bu bölümünde, müzik ve yapay zeka (AI) alanında araştırmacı olan Rebecca Fiebrink, insan etkileşiminin önemini ve makine öğreniminin geliştirilmesinde ve kullanılmasında insanları döngüde tutmanın önemini tartışıyor. yaratıcı amaçlar Otonom olarak insan benzeri yaratıcı çıktılar oluşturmak için makine öğrenimini kullanmanın kendi içinde insan yaratıcılara destek olduğu varsayımını sorguluyor. Fiebrink'in araştırmaları sanat pratiği ve oyunlar gibi diğer alanları da kapsayacak şekilde genişledi ve makine öğreniminin insan yaratıcılar için teorik ve pratik faydası hakkında düşünmenin gerekliliğini vurguluyor.

  • 00:05:00 Bu bölümde konuşmacı, müzik ve sanat alanlarında veri veya makine öğrenimi ile çalışmak isteyen içerik oluşturucuların kullanabileceği araç setindeki boşluğu tartışıyor. Birkaç kişi c plus kitaplıkları veya Python kullanırken, gerçek zamanlı olarak kullanmak veya medya verileriyle, özellikle de ses verileriyle çalışmak için neredeyse hiç araç yoktu. Birçok içerik oluşturucu, bilgisayar bilimi veya elektrik mühendisliği alanında doktora derecelerini zaten almıştı ve verilerle çalışmak isteyen içerik oluşturucular için daha erişilebilir araçlara yer vardı. Makine öğrenimi, çevrimiçi depolar veya Google görselleri, biyosensörler veya sosyal medya verileri gibi çevrimiçi kaynaklar gibi kendilerini çevreleyen çeşitli veri türlerini anlamlandırmak isteyen yaratıcılar için harika bir araç olabilir.

  • 00:10:00 Bu bölümde, Rebecca Fiebrink, makine öğreniminin gerçek zamanlı müzikte insan yaratımlarında kullanılmasını sağlayan Wekinator adlı bir yazılım oluşturma konusundaki çalışmalarını açıklıyor. Jestlere yanıt veren yeni bir enstrüman yapmanın, kullanıma hazır yer gerçeği eğitim setleriyle çalışmaktan farklı olduğunun altını çiziyor. İşleri kolaylaştırmak için Wekinator, kullanıcıların gerçek zamanlı olarak eğitim için örnekler göstermelerine ve ardından nerede hata yaptığını görmek için modeli test etmelerine olanak tanır. Wekinator, kullanıcıların eğitim örneklerini yerinde değiştirmelerine de olanak tanır. Daha sonra, hareketi yakalamak için bir web kamerası kullanan ve hareketleri veya hareketi tahmin etmeyi kolaylaştırmak için 100 sayı veren 10'a 10 renkli bir ızgaraya aşağı örnekler kullanan Wekinator yazılımını kullanarak çok basit, hareket kontrollü bir davul makinesi yapmayı gösterdi.

  • 00:15:00 Bu bölümde konuşmacı, Blotar adlı bir ses sentezi algoritmasını kontrol eden bir müzik enstrümanı oluşturmak için Wekinator'un regresyon ile nasıl kullanılacağını gösteriyor. Bu enstrüman, bir kullanıcının dokuz kontrol parametresini değiştirerek birçok farklı ön ayar dahil olmak üzere büyük bir ses alanını kontrol etmesine izin verir. Konuşmacı, makine öğreniminin profesyonel bestecilere karmaşık ve incelikli ses paletlerini keşfetmelerini sağlayarak nasıl fayda sağlayabileceğini gösteriyor.

  • 00:20:00 Bu bölümde Rebecca Fiebrink, bir oyun kumandası kullanarak üflemeli çalgıyı kontrol etmek için makine öğrenimini nasıl kullandığını gösteriyor. Aletin dokuz boyutlu uzayında manuel olarak iyi konumlar bulmanın uzman bir programcı için zor olacağını, ancak makine öğreniminin karmaşık işlevlerin kolayca yazılmasına izin verdiğini açıklıyor. Sistemi eğiterek, enstrümanın istenen sonucu verene kadar nasıl iyileştirilebileceğini ve performanslar sırasında veya beste yaparken kaydedilebileceğini ve kullanılabileceğini gösteriyor. Aracın bir araştırmacısı olarak Fiebrink, içerik oluşturucuların çalışmalarını iyileştirmek için makine öğrenimini kullandıkları çeşitli yolları ve bunun ne öğrettiğini tartışıyor.

  • 00:25:00 Bu bölümde konuşmacı, Anne Hege'nin Wekinator ve Michelle Nagai'nin kompozisyonu gibi örnekler kullanarak, makine öğreniminin içerik oluşturuculara nasıl fayda sağlayabileceğini ve daha fazla kişinin özellikle sensörler ve gerçek zamanlı veri analiziyle verilerle etkili bir şekilde çalışmasını nasıl sağlayabileceğini tartışıyor. müzik enstrümanı. Ayrıca Wekinator'un sanat, kukla gösterileri, engelli insanlar için teknolojiler ve etkileşimli prototipler tasarlama gibi alanlardaki kullanımlarıyla makine öğreniminin etkileşim oluşturmayı nasıl yaratıcı ve kolay hale getirebileceğini vurguluyorlar. Yazar, makine öğrenimi yoluyla etkileşimleri yaratıcı bir şekilde oluşturmanın, inandırıcı çıktılar üreten bir model oluşturma hedefleri nedeniyle genellikle geleneksel makine öğreniminden farklı bir yaklaşım gerektirdiğini ve modelin amaçları karşılamadığında nasıl davrandığının bir zorluk haline geldiğini açıklıyor.

  • 00:30:00 Bu bölümde Fiebrink, doğru tahminler yapmak amacıyla bir makine öğrenimi modeli oluşturmakla yararlı veya eğlenceli bir şey oluşturmak amacıyla etkileşimli bir makine öğrenimi modeli oluşturmak arasındaki farkları araştırıyor. Etkileşimli bir makine öğrenimi modeli oluştururken, verilerin bir oluşturucu ile bilgisayar arasındaki iletişim için bir arabirim olduğu düşünülür, bu da verilerin öznel olarak seçildiği ve bağımsız ve aynı şekilde dağıtılmış (iid) olma ihtimalinin düşük olduğu anlamına gelir; bu yaygın bir varsayımdır. makine öğreniminde. Bu, stratejik olarak yerleştirilmiş çok az örnekten öğrenmeye yol açabilir. Fiebrink, k en yakın komşu gibi basit bir algoritmanın, etkileşimli olarak kullanıldığında, uygulamalı deneylere ve veri iyileştirmeye izin vererek, az miktarda veriyle hala nasıl iyi karar sınırları üretebildiğini gösteriyor.

  • 00:35:00 Bu bölümde Rebecca Fiebrink, yaratıcı alanlarda eğitim verilerini etkileşimli olarak manipüle etmenin faydalarını tartışıyor. İnsanların birçok alternatif fikri keşfetmesine izin vermenin, tasarım gereksinimlerini karşılayan bir şey yaratmak için gerekli olduğunu açıklıyor. Fiebrink, Wekinator gibi makine öğrenimi algoritmalarını kullanmanın, insanların modelleri çok hızlı bir şekilde yeniden eğitmelerine ve sonuçları anında görmelerine olanak tanıyarak hızlı prototip oluşturmayı çok etkili bir şekilde desteklemeyi mümkün kıldığını buldu. Ayrıca resim yapmak veya müzik enstrümanı çalmak gibi alanlarda uzman programcılar için bile insan uygulamalarını veya eylemlerini kodla yakalamanın zor olduğunu belirtiyor.

  • 00:40:00 Bu bölümde Rebecca Fiebrink, makine öğreniminin bilgisayarlarla daha doğal bir şekilde iletişim kurmamızı nasıl sağladığını açıklıyor; çünkü bu, insanların fikirlerini örneklerle iletmelerine olanak tanıyor; bu, bizim hakkında konuşurken nasıl iletişim kurduğumuza benzer. birbirleri ile yaratıcı faaliyetler. Makine öğrenimi, bir standarda uymak için büyük veri kümelerinden yararlanarak yeni başlayanların oluşturmasını da kolaylaştırır. Bununla birlikte, Fiebrink'in Sound Control adlı son projesi, makine öğrenimi ile daha fazla kişinin arayüzleri kişiselleştirmesine ve kendileri ve başkaları için bir şeyler yapmasına izin verme olasılığını gösteriyor. Müzik öğretmenleri ve terapistlerle işbirliği içinde Sound Control, çocukların ısmarlama enstrümanlar yapmalarını sağlar, ancak aynı zamanda dinleme oyunları, doğaçlama oyunları ve performans etkinlikleri yapmak gibi başka beklenmedik ve yararlı şeyler yapmalarına da yol açar.

  • 00:45:00 Bu bölümde Rebecca Fiebrink, makine öğreniminin yaratıcı çalışma sürecinde nasıl üretken sürprizler ve zorluklar sağlayabileceğini tartışıyor. Wekinator gibi araçları kullanarak, çalışma sürecine beklenmedik fikirler ekleyen yaratıcı araçlara sahip olmanın önemini vurguluyor. Bu nedenle, diğer makine öğrenimi türlerini ve hatta makine öğrenimi olmayan verilerle çalışma yöntemlerini gözden kaçırmama konusunda uyarıda bulunuyor. Veriler ve makine öğrenimi ile oluşturmanın, insanların daha önce yapamadıkları şeyleri yapmalarını sağlayabileceğini öne sürüyor ve yaratıcı uygulamaların, insanların diğer veri ve makine öğrenimi deneyimlerini daha güçlü hale getirmek için örnek olay incelemeleri olarak nasıl hizmet edebileceğini araştırıyor.

  • 00:50:00 Bu bölümde konuşmacı, makine öğrenimini sesle kullanmanın zorlukları hakkında izleyicilerden gelen bir soruyu yanıtlıyor. Konuşmacı, sesin kültürel öznellik açısından bazı benzersiz zorluklar sunduğunu kabul eder, ancak genel olarak sese, diğer medyaya benzer sonuçlarla tipik makine öğrenimi süreçleri kullanılarak yaklaşılabilir. Konuşmacı, verilerin ve sorunlu alanları ele almak için nasıl kullanıldığının ortamın kendisinden daha önemli olduğunu vurgular. Konuşmacı ayrıca, makine öğreniminin bir şeyler yaratmak için bir arayüz olarak nasıl kullanılabileceğini ve makinelerle insan uyumunu ve hedefleri kimin tanımlaması gerektiğini tartışmanın önemini tartışıyor.

  • 00:55:00 Bu bölümde konuşmacı, makine öğrenimi için bir hedef tanımlamanın zorluğunu ve bunun ne kadarının yaratıcının bir veri kümesi oluşturduğu, bir şeyler denediği ve ardından verileri modeli yönlendirmek için kullandığı deneysel bir süreç olduğunu tartışıyor. belirli bir yöne doğru. Sürecin deneyimsel yönü, içerik oluşturucunun belirli bir bağlamda deneme yanılma yoluyla makine öğrenimi hakkında bilgi edinmesine olanak tanır ve bu yön, insanların makine öğrenimi hakkında bilgi edinmesi için güçlü bir araç olabilir. Carrie Cai ve diğerleri tarafından yapılan son araştırmalar, benzer deneysel keşif prosedürlerinin, insanların önceden makine öğrenimi uzmanlığına sahip olmayabilecekleri uygulamalarda bile insanların güven oluşturmasına ve neyin modellendiğini anlamasına yardımcı olabileceğini gösteriyor.
MIT 6.S192 - Lecture 8: "How Machine Learning Can Benefit Human Creators" by Rebecca Fiebrink
MIT 6.S192 - Lecture 8: "How Machine Learning Can Benefit Human Creators" by Rebecca Fiebrink
  • 2021.01.28
  • www.youtube.com
Speaker title: Dr. Rebecca Fiebrink, Reader at the Creative Computing Institute, University of the Arts Londonhttps://www.doc.gold.ac.uk/~mas01rf/homepage/Mo...