Alım-satım fırsatlarını kaçırıyorsunuz:
- Ücretsiz alım-satım uygulamaları
- İşlem kopyalama için 8.000'den fazla sinyal
- Finansal piyasaları keşfetmek için ekonomik haberler
Kayıt
Giriş yap
Gizlilik ve Veri Koruma Politikasını ve MQL5.com Kullanım Şartlarını kabul edersiniz
Hesabınız yoksa, lütfen kaydolun
6. Süperskalar ve VLIW
6. Süperskalar ve VLIW
Video, işlemcilerin performansı artırmak için ikili yönergeler arasındaki paralelliği algılamak ve çıkarmak için süper skalar yürütmeyi nasıl kullandığını araştırıyor. Talimatların aynı anda çalışabileceği, örneğin aralarında bağımlılık olmaması gibi durumların belirlenmesinde kontrol mantığının önemini tartışır. Video ayrıca iki işlemci tasarımı örneğini, süper skalar ve VLIW'yi tanıtıyor; ikincisi, bağımlılıkları tespit etme sorumluluğunu derleyicilere kaydırıyor ve paralel olarak yürütülecek uzun talimat sözcükleri üretiyor. VLIW çalışma zamanı denetimini azaltırken, uzun komut sözcüğündeki kullanılmayan noktalar yine de yürütme biriminde israfa neden olabilir.
7. SIMD ve Donanım Çoklu Kullanım
7. SIMD ve Donanım Çoklu Kullanım
Video, paralellik zorluklarını ele almanın iki yolunu açıklıyor: Tek Yönerge, Çoklu Veri (SIMD) ve donanım çoklu kullanım (SMT). SIMD, donanım yönergelerinin birden çok veri öğesi üzerinde paralel olarak yürütülmesine izin vererek programlamayı ve kod çözme mantığını basitleştirir. SMT, bağımsız talimat akışlarını aynı anda çalıştırarak, ek kayıt dosyaları ve dikkatli önbellek paylaşımı talep ederek iş parçacığı düzeyinde paralellikten yararlanır. Videoda ayrıca, iş parçacıklarının sırayla işlemcinin veri yolunu sırayla işgal ettiği, gecikmeyi azalttığı ve birden çok iş parçacığının aynı anda bilgi işlem birimlerine ve bellek sistemlerine erişmesine izin verdiği, zaman dilimli iş parçacığı planlamasının uygulanması tartışılıyor. Sonuç olarak, işlemci gerektiği kadar iş parçacığını barındırabilir, ancak performans kazancı tek iş parçacıklı bir işlemcide o kadar önemli olmayabilir.
8. Çok Çekirdekli İşlemci Mimarisi
8. Çok Çekirdekli İşlemci Mimarisi
Bu video, çok çekirdekli işlemcilerin mimarisini ve her çekirdeğin kendi işlem hattına ve veri önbelleğine sahipken bağımsız olarak çalışması ve bazı bileşenleri paylaşması gibi avantajları açıklamaktadır. Mikroişlemci ve bellek erişimi arasındaki hız boşluğunu doldurmada önbellek hiyerarşisinin önemi, zamansal ve uzamsal konumlardan yararlanan birden çok önbellek düzeyi kullanılarak vurgulanır. Video ayrıca maliyeti ve form faktörünü azaltmak için farklı işlev birimlerini ve arabirimleri tek bir yongada birleştiren çip üzerinde sistem tasarımına da değiniyor. Genel olarak, video, çok çekirdekli işlemcilerin tasarımında yer alan karmaşıklık ve değiş tokuşlara yararlı bir giriş sağlar.
9. GPU Mimarisi
9. GPU Mimarisi
Hızlandırılmış işlem birimi (APU), tümü aynı çip üzerinde bulunan düşük güçlü çekirdeklere ve GPU birimlerine sahip heterojen bir işlemcidir. GPU'lar, talimatlarla programlanabilen çok sayıda gölgelendirici çekirdeğine sahiptir ve önbellekleri genellikle tutarlı değildir, bu da tasarımlarını daha basit hale getirir ve birçok çekirdek aynı anda çalışırken çok daha yüksek performans sağlar. AMD ve Nvidia, aynı anda birden çok veri parçası üzerinde işlemi desteklemek için küçük bilgi işlem birimleri kullanır ve hızlı içerik değiştirmeyi desteklemek için büyük kayıt dosyalarına sahiptir. Konuşmacı ayrıca GPU mimarisinde kontrol akışının nasıl yönetileceğini, özellikle de geçersiz sonuçlara yol açabilecek dal yönergeleriyle uğraşırken açıklar, ancak işlemci satıcıları donanımda zaten kontrol mantığı sağladığından programcıların bu sorunlar hakkında fazla endişelenmesine gerek yoktur. Genel olarak, GPU'lar modern pazarda, özellikle yapay zeka ve makine öğrenimi alanında karmaşık iş yükleri için popüler işlemcilerdir.
10. FPGA Dahilileri
10. FPGA Dahilileri
Bu video, sahada programlanabilir kapı dizilerinin (FPGA'ler) mimarisini ve özelliklerini tartışıyor. FPGA'lar, yeni işlevsellikleri barındıracak şekilde yeniden programlanmalarına ve büyük miktarda girdi ve çıktı (I/O'lar) yoluyla verilere doğrudan erişime sahip olmalarına izin veren programlanabilir mantığa sahiptir. FPGA'lardaki arama tablosu yapısı, mantık fonksiyonlarını tanımlamak için programlanabilen çok sayıda çoklayıcı seviyesinden oluşur. FPGA'lar sayaçlar, kaydırma kayıtları, durum makineleri ve DSP işlevleri için kullanılabilen programlanabilir kayıtlar kullanır. Çip üzerindeki her dikdörtgen blok, her LAB'nin on Uyarlanabilir Mantık Modülü (ALM) içerdiği bir Mantık Dizisi Bloğunu (LAB) temsil eder. FPGA'lar, tüketici cihazları, otomotiv, tıbbi enstrümantasyon ve iletişim ve yayın gibi sektörlerde kullanılmaktadır.
ve taşıma bitleri ve kayıtlara girişin önceki mantık öğelerinden nasıl gelebileceği.
11. Bir GPU Sisteminde OpenCL Belleği
11. Bir GPU Sisteminde OpenCL Belleği
Eğitmen, OpenCL belleğinin AMD GPU'ya eşlenmesini ve bir GPU sistemindeki farklı bellek katmanlarını açıklar. Bilgi işlem aygıtında, çoklu SIMD şeritli çekirdekler, özel kayıt dosyaları ve özel bellek işlevi gören işlem birimlerine yönelik yönergeleri yöneten bir komut işlemcisi bulunur. Çekirdek programı, mevcut tüm çekirdeklerin kullanılmasını sağlayan ve bellek erişim gecikmesini azaltan otonom işler sağlamayı amaçlar. Konuşmacı ayrıca, hesaplama ve bellek ekseni hareketi arasındaki orana atıfta bulunan aritmetik yoğunluk kavramından ve GPU'nun bellek bant genişliğinin sınırlayıcı faktör olmasını önlemek için ne kadar yüksek olması gerektiğinden bahseder.
12. OpenCL Örneği: Matris Çarpımı
12. OpenCL Örneği: Matris Çarpımı
Bu video, OpenCL programlamanın bir örneği olarak matris çarpımını tanıtır. Konuşmacı, matris satırlarını ve sütunlarını kat edebilen bağımsız döngüler oluşturmak için C kodunun nasıl yazıldığını gösterir. İş öğeleri tartışılır ve bunların OpenCL'deki matris öğeleriyle nasıl eşlenebileceği tartışılır. Çekirdek işlevi argümanlarını, nasıl adlandırıldığını ve gövdesini kapsayan bir çekirdek uygulaması açıklanır. Konuşmacı, dizinleri hesaplamak için satır ve dizin numaralarını kullanarak giriş matrisinin tek boyutlu bir dizide nasıl depolandığını gösterir. Son olarak, çekirdek işlevi çıktı matrisindeki öğeyi üretmek için iç çarpımı hesaplar. Matrisleri fiziksel bellekte depolamaya yönelik doğrusal yaklaşım vurgulanmaktadır.
13. Bir OpenCL Programının Yapısı (kısım 1)
13. Bir OpenCL Programının Yapısı (kısım 1)
"Structure of an OpenCL Program (part1)" adlı videoda OpenCL uygulaması oluşturma süreci anlatılmaktadır. Program, kaynaklarını anlamak ve bir OpenCL bağlamı ve komut sırası oluşturmak için önce OpenCL platformunu sorgulamalıdır. Ardından, ana bilgisayar ve aygıt belleği arasında veri alışverişi için arabellekler oluşturulur ve çekirdek programı, aygıtta yürütülmek üzere bir ikili dosyada derlenir. Video, salt okunur ve salt yazılır arabelleklerin nasıl oluşturulacağını, çıktı matrisleri için yer nasıl ayrılacağını ve sonuçların ana bilgisayara nasıl kopyalanacağını açıklamaya devam ediyor. Başarılı yürütme için API çağrılarını kontrol etmenin önemi vurgulanmıştır.
14. Bir OpenCL Programının Yapısı (kısım 2)
14. Bir OpenCL Programının Yapısı (kısım 2)
OpenCL programlamadaki üçüncü adım, çevrimdışı yapıldığından FPGA cihazları için farklı olan çekirdek derlemesini içerir. Kaynaklı CL oluşturma programı ve C TX, bir program oluşturmak için kullanılır, ardından CL oluşturma programı, programı ikili olarak oluşturmak için kullanılır. Uygun giriş noktası kullanılarak doğru çekirdek işlevi seçilir ve çekirdek bağımsız değişkenleri, doğru işaretçi ile CL set çekirdek bağımsız değişkeni kullanılarak başlatılmalıdır. Konuşmacı, matris çarpımında bağımsız değişkenlerin doğru şekilde ayarlanması hakkında ayrıntılara giriyor. Daha sonra, yerel ve genel çalışma grubu boyutlarını ayarlamayı, çekirdeği çalıştırmayı ve CL'yi kuyruk arabelleği API'sinde kullanarak sonuçları almayı tartışırlar. Son olarak, konuşmacı OpenCL programlamasındaki olaylardan kısaca bahseder.
15. OpenCL Matris Çarpma Demosu
15. OpenCL Matris Çarpma Demosu
"OpenCL Matris Çarpma Demosu" videosu, OpenCL çerçevesini kullanarak bir matris çarpma örneğini çalıştırma sürecini açıklar. Ana bilgisayar tarafı için bir ana C programı, çekirdek programı ve bir makefile gibi birden çok kaynak kodu dosyası içerir. Video, OpenCL çerçevesinin farklı yönlerini, platform ve cihaz kimliklerinin alınmasını, bir OpenCL bağlamı, program ve çekirdek nesneleri oluşturmayı, ana bilgisayar için arabellek yönetimini ve aygıtta arabellekleri oluşturmayı ve başlatmayı kapsar. Sunum yapan kişi ayrıca nokta ürün işlemlerini gerçekleştiren örnek bir çekirdeği ve bir AMD Radeon pro 575 bilgi işlem motorunda nihai sonucun bir demosunu gösterir.