Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1269

 

AlphaGo Zero'nun yaratıcılarından, taze, keyfini çıkarın :)


 
Maksim Dmitrievski :

AlphaGo Zero'nun yaratıcılarından, taze, keyfini çıkarın :)


Eski zanaat için modellerin nasıl oluşturulacağı/eğitileceği/bağlanacağı konusunda ayrıntılı bir talimat var mı?

 
Maksim Dmitrievski :

oynamıyorum sadece maç izliyorum

tekrarlara bakılırsa, AlfaTrader, bunu yaparlarsa, herhangi bir kemik torbasından daha iyi ticaret yapacaktır.

Bana öyle geliyor ki böyle bir robot yaparak MO'da yeni beceriler kazanabilirsiniz ve bu sadece ilginç. Yeni bölümlerin yayınlanmasından sonra birkaç kez StarCraft 2 oynadım (orada arsa birkaç bölüme ayrılmıştır). AI'ya karşı oynadığınızda, genellikle eylemlerin mantığıyla değil, birimleri kontrol ederek kazanır - bir kişi fiziksel olarak tüm haritayı ve her birimi aynı anda kontrol edemez.

 
Vladimir Perervenko :

Benimkini izlemiyorum, başkalarını tanımıyorum. Yukarıda belirtilen makale, kodu yeniden oluşturmak ve fazla karmaşık hale getirmek için yeterli bilgiden yoksundur. Her şeyin R6 kullanmadan paketlerden standart katmanlarla uygulanabileceğini düşünüyorum.

İyi şanlar

Ne tür bir şans diledin, hiç anlamıyorum.

lütfen demoya bakın

Uzmanın ML öğeleriyle yaptığı çalışmanın sonucu kabul edilebilirse, o zaman tüm dalı baştan sona tekrar okuyacağım.

 
Maksim Dmitrievski :

Burada durum böyle değil, bir kişinin gördüğüne ve nasıl yaptığına yakın - sınırlı bir görüş alanı, ortalama apm profesyonel bir oyuncununkinden daha düşük. onlar. akılların mücadelesi, yani. hızlar değil stratejiler (makinenin doğal olarak her zaman kazandığı yer)

ve SC'deki yerleşik AI, yalnızca komut dosyasıyla yazılmıştır, ilginç olmayan rakipler. Bu insan gibi oynuyor. Profesyonel oyuncuya bu yapay zekadan, yani. Turing testi geçti

elektronik beynin aktif nöronlarından oluşan bir bulut bile görselleştirilir


Ekrandan kesin sonuçlar çıkarılamaz. Evet, sadece ekrana neyin sığacağını kontrol etmek mümkündür - bu bir sorun değildir, bu amaçlar için bir ünite / bina veya bir grup ünite üzerinde kısayol tuşlarını kullanırlar, o zaman şu anda onları görsel olarak gözlemlemek gerekli değildir. , ancak ekranda da her zaman görünen harita üzerinde koordine edebilirsiniz. Çip tamamen mikro kontrolde, kişisel olarak birkaç video izledim ve orada strateji açısından akıllı bir şey görmedim, ancak bireysel birimlerin potansiyelinin kullanımı orada tamamen açıklanıyor. Onlar. potansiyel tehdidi ve ona karşı koyma seçeneklerini değerlendirmeye yapılan vurgu - rakiplerin gelişim şubesine bağlı olarak, kendi şubesi gelişir ve ayrıca ekonomi üzerinde ayrı bir modül - farklı yöntemler ve kontrol gördüm ve sanırım ilk iki modül (geliştirme dalı ve ekonomi) programlanır veya bulanık mantık kullanılır, istikrar için nispeten beceriksiz bir şeydir, ancak duruma göre kontrol gerçekleşir ve AI'nın tam olarak çalıştığı yer burasıdır. Bu arada, nesneler hakkındaki bilgilerin nasıl iletildiği, karar vermek için nasıl genelleştirileceği ve sürekli hareketlerini, özelliklerini ve hedeflerini nasıl dikkate alacağı net değil.

 
Bu arada, bazen Blizzard ağında Warcraft III oynuyorum ve beni orada yapay zeka ile suçluyorlar, orada da kullanılabilir mi diye merak ediyorum. Ve eğer kullanılıyorsa, böyle bir AI ile kaç kez oynadığımı merak ediyorum.
 
Maksim Dmitrievski :

bu arada, orada, başlangıçta bot için tüm harita ekrana yerleştirildi ve daha sonra oyuncununki gibi yaptılar ve ardından bot aptallaşmaya başladı ve insanlar kazandı (videonun sonunda). Eh, böyle bir durum için MB'ye çok uyuyorlar. Evet, stratejiler tamamen aynı, insanlar bunu daha ilginç hale getirirdi .. diğer yandan, etkinliği nasıl değerlendirebiliriz - belirli katmanlar başarıya yol açtığından, o zaman bot onları seçti

Kontrol kısıtlaması bir kişiyle orantılı yapılırsa, kalabalığın davranışı benzer olduğundan ve en sık görüleni olacağından, botların ortalama kullanıcıdan daha iyi performans göstereceğini düşünüyorum. Bu arada, oğlumla ağ üzerinden Warcraft 3 oyuncağının botlarına karşı bir klan için oynamaya çalıştığımda, ilk başta aynı derecede zordu (ve ondan önce insanlara karşı battlenet'te klan oyunlarında zengin deneyime sahiptim) ), ancak daha sonra botun davranışına alışırsınız ve standart olmayan çözümler kullanarak yavaş yavaş tekrarlarsınız (örneğin, ağaçların arasından madene giden bir geçişi keserek birimleri yerden saldırılara karşı korursunuz). Bu nedenle standart dışı stratejilere ML'de dikkate alınması için ne kadar ağırlık verilebileceğini merak ediyorum, yani. standart davranışı ve standart olmayanı bir şekilde ayırmanız ve onlara farklı bir yaklaşım göstermeniz ve aynı zamanda birbirinize müdahale etmemeniz gerekir. Bir trend ve bir daire gibi - bir modeli aynı anda ikisi için eğitmek çok zor, her halükarda nasıl olduğunu bilmiyorum.

 
Maksim Dmitrievski :

Bence ağırlık yok. Durumlar nadir ise, bot bu tür seçenekleri görmezden gelir. Bir kişi botun stratejilerine uyum sağlarsa, botun chela katmanları altında her zaman eğitilmesi gerekir, aksi takdirde durum eşit olmaz)

Bilmiyorum, o zaman burada çok şeyin örneğe bağlı olduğu ortaya çıkıyor, örnek farklıysa, o zaman botlar birbirleriyle kavga ederken farklı davranacaklar, yani. sadece eğitim değil, şans faktörü de var (kimin ne üzerine çalıştığı).

Onlar. sonuçları karşılaştırmak için geçerli bir örnek olmadığı için eğitimin sonucu her zaman görünür değildir (doğru bir şekilde değerlendirmek mümkündür).

 
Maksim Dmitrievski :

Evet, öğrenme böyle olur - bir nevi hasım ağları aracılığıyla. AI, binlerce kez AI'ya karşı oynar ve birçok farklı stratejiyi çoğaltır. Sonuç olarak, ağ optimal stratejiler geliştirir. Oyun sayısı profesyonel bir oyuncunun oyun sayısını aşarsa (dedikleri gibi 200 yıllık oynamaya eşdeğerdir), o zaman stat avantajı bot tarafında olacak, daha fazla kombinasyonu hesaba kattı. Ancak, benzersiz bir kazanan tabaka seçme olasılığı, elbette, kişiyle birlikte kalır.

Konu ilginç ama karanlıkta :) Alım satım burada farklıdır çünkü davranışlarımızla piyasayı çok fazla etkileyemiyoruz ve belki de pozisyonun ortalamasını almak dışında hataları düzeltme fırsatımız yok...

 
Maksim Dmitrievski :

Grafiği binlerce ve milyonlarca parçaya bölerseniz ve botu birçok kez ona karşı oynamaya zorlarsanız, belki de her zaman onu yenmeyi öğrenir, yine özelliklere bağlıdır.

Biraz farklı görüyorum, oyuncakta, birçok faktörden oluşan her iki tarafın da matematiksel bir değerlendirmesi var - botların sayısı ve potansiyelleri, mülkleri, paraları ve düşmanın amacı bu tahmini göstergeyi böyle bir şekilde azaltmaktır. Tahmini göstergelerini düşmandan daha yüksek tutacak şekilde, t .e. sonuca daha az enerji harcamak için. Böylece, bir birimi feda ederek, rakibin varlıklarının tahmini değerini, birimin tahmini değerinden daha büyük bir miktarda azaltacağınızın açık olduğu, karşılıklı olarak etkileyen bir sistem elde edilir, o zaman bu doğru karardır ve eğer değilse. , o zaman doğru değil. Ve ticarette hiçbir garantimiz yok, sadece olasılık ve oyuncakta hesaplanabilecek matematiksel garantiler var.

Durumu etkileyemeyiz, ancak oyunda kendimiz için uygun durumlar yaratmak da dahil olmak üzere mümkündür.