Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1271

 
Sonra, normal bir dağılımın yalnızca tamamlanmış süreçlerde beklenebileceği fikri geldi (sadece bir düşünce - kontrol etmedim), ancak yara böyle değil, bu nedenle eşit olmayan dağılımı ve durağan olmamasıyla ilgili tüm varsayımlar sadece Piyasa varken doğrulanamayan tahminler.
 
Maksim Dmitrievski :

Pazar için, teknoloji aynı olduğu için tamamen aynı şekilde eğitim alıyor. "Etki"yi unutun, hayal ettiğiniz eğitimde bu açıkça yoktur. Ancak stratejiler, optimal stratejiler vb. (RL'de bunlara politika denir)

Bir bot yaratıcımız olsaydı, ona bir dizi soru sorabilir ve cevaplara çok şaşırabilirdik. Tüm bu RL'ler, çevre üzerindeki sabit etki faktörleri konusunda iyi eğitilmiştir, ancak başka bir oyuncuya karşı oynarsanız, RL çıplak haliyle çalışmayacaktır. Bu alanı derinlemesine incelemedim, yanılıyor olabilirim. Ancak burada değişen bir ortamla net bir etkileşim var, botların davranışından bir şey beklentisi olduğu net değil, hiç görünmüyor, ikinize de zarar verme olasılığı üzerinde bir kontrol var. ve düşman ve burada yanlış hesaplamalar basittir ve daha düşük bir olumsuz sonuç olasılığına doğru hareket eder, ancak bu, oyunun başındaki politika tarafından belirlenen olasılık değildir - bu, değişen ortam üzerindeki etkidir.

 
Arkadaşlar burada okuyorum. Birkaç gönderi ve teorinin tamamen acele ettiğini fark ettim. Ancak uygulamaya başladığınızda çok şaşıracaksınız. Yeni çözümler aramak için modeller oluşturmak, gerçek ticarete kıyasla hiçbir şey değildir, her şeyi kurduğunuzda, kurun ve bekleyin ...... Ardından ilk sinyal belirir ve robot bir anlaşma açar. Ancak en pusu, bu işlemin sonucunu ve (robot) kararını analiz ettiğinizde ortaya çıkar. Kazanmaya devam edecek mi yoksa değiştirmenin zamanı geldi. Son zamanlarda, genellikle optimizasyondan sonra kırmızıda bir veya üç işlem yaptığını ve ancak o zaman yükselmeye başladığını anlıyorum. Ve bu anlarda da telaşlanmaya, kontrol etmeye başlıyorsunuz. Hayır yükselecek. Yani gerçek ticarete geçtiğinizde arama ve optimizasyon döneminde aklınıza bile gelmeyen sorunlarla karşılaşıyorsunuz. Bu nedenle, ne kadar erken uygulamaya başlarsanız, proaktif bir tüccarın sorunlarıyla o kadar erken karşılaşırsınız. IMHO doğal olarak
 
 
Videoyu ve yorumları Rusça izledim ve davranışı oldukça doğru bir şekilde temsil ettiğime bile şaşırdım - varlıkların bir değerlendirmesi var, bir sonuç olasılığı var, mikro kontrol var, gelişme için gözetlenen ilk stratejiler var. Mikro kontrol verimliliğine sahip ve görünüşe göre ekonomik açıdan en etkili olan savaş için kesin birimlerin seçimine çok büyük önem verilmektedir ve ayrıca, savaşlar hızlı bir şekilde kazanıldığı için diğerlerine ihtiyaç yoktur. Genel olarak, açıkça bir dizi bileşen vardır ve büyük olasılıkla tek bir nöron değil, farklı bileşenlerden sorumlu farklı modeller vardır. Artı, geliştiricilerin kendileri, farklı temel strateji modellerinin kullanıldığını, böylece belirli bir rastgele olacağını söyledi.
 

Merhaba. Buradaki HERKESİn yeterince zeki olduğunu öğrendiğimizden beri ve bu alaycılıktan uzak, gerçeklerin bir ifadesi. İstihbarattan mahrum olmayanlar MO alanına geliyor, o zaman topluluğa bir sorum olacak. UBUNTU'yu kim yönetti? Yönetimden bahsediyorum. Görev şu. Bölünemez bir süreç vardır ve optimizasyon sürecinde bu süreç sistemde çekirdek sayısı kadar başlatılır, dolayısıyla paralel hesaplamalar vb.

Soru: 2 veya 4 çekirdeği, çalışan bir bölünemez sürece hizmet etmeye zorlamak mümkün müdür? Eh, o benim.. belki bilen birileri ve mahalleli...

 

Google bugün çalışıyor

https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/

tamam dün yine umutsuz bir tartışmaya girdim

 
Maksim Dmitrievski :

Google bugün çalışıyor

https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/

tamam dün yine umutsuz bir tartışmaya girdim

Savaşın sonucunu bekleme grafiğine dikkat edin, bahsettiğim olasılık tam olarak var - nöronların geri bildirimini harekete geçiren durumsal. Bu olasılığın keşif ve her iki taraftaki birimlerin kaybı sırasında nasıl değiştiği açıkça görülüyor - yani. güç dengesi ve beklentileri sürekli olarak yeniden hesaplanıyor. Bu açıkça klasik bir RL varyantı değil.


 
Alexey Vyazmikin :

Savaşın sonucunu bekleme grafiğine dikkat edin, bahsettiğim olasılık tam olarak var - nöronların geri bildirimini harekete geçiren durumsal. Bu olasılığın keşif ve her iki taraftaki birimlerin kaybı sırasında nasıl değiştiği açıkça görülüyor - yani. güç dengesi ve beklentileri sürekli olarak yeniden hesaplanıyor. Bu açıkça klasik bir RL varyantı değil.


yani o kadar dilsizsin ki bunu açıklamaya çalıştığını sandım :D

linkte Nash dengesi hakkında da okuyun, dün 1'i 1 arada algoritmayı okumadan tanımladım

ihtimal değerlendirilmediğini yazmışsın ama rakibe ETKİ var :)) mesajlarını tekrar oku

bu açıkça klasik bir derin RL LOL, konuyla ilgili olmadığında saçma sapan konuşmayı bırak

 
Maksim Dmitrievski :

yani o kadar dilsizsin ki bunu açıklamaya çalıştığını düşündüm :D

linkte Nash dengesi hakkında da okuyun, dün 1'i 1 arada algoritmayı okumadan tanımladım

ihtimal değerlendirilmediğini yazmışsın ama rakibe ETKİ var :)) mesajlarını tekrar oku

bu açıkça klasik bir derin RL LOL, konuyla ilgili olmadığında saçma sapan konuşmayı bırak

Ticaret, otomatik ticaret sistemleri ve ticaret stratejilerinin test edilmesi hakkında forum

Ticarette makine öğrenimi: teori ve uygulama (ticaret ve daha fazlası)

Aleksey Vyazmikin , 2019.01.25 17:15

Biraz farklı görüyorum, oyuncakta , birçok faktörden oluşan her iki tarafın da matematiksel bir değerlendirmesi var - botların sayısı ve potansiyelleri, mülkleri, paraları ve düşmanın amacı bu tahmini göstergeyi böyle bir şekilde azaltmaktır. Tahmini göstergelerini düşmandan daha yüksek tutacak şekilde, t .e. sonuca daha az enerji harcamak için. Böylece, bir birimi feda ederek, rakibin varlıklarının tahmini değerini, birimin tahmini değerinden daha büyük bir miktarda azaltacağınızın açık olduğu, karşılıklı olarak etkileyen bir sistem elde edilir, o zaman bu doğru karardır ve eğer değilse. , o zaman doğru değil. Ve ticarette hiçbir garantimiz yok, sadece olasılık ve oyuncakta hesaplanabilecek matematiksel garantiler var.

Durumu etkileyemeyiz, ancak oyunda kendimiz için uygun durumlar yaratmak da dahil olmak üzere mümkündür.

Ticaret, otomatik ticaret sistemleri ve ticaret stratejilerinin test edilmesi hakkında forum

Ticarette makine öğrenimi: teori ve uygulama (ticaret ve daha fazlası)

Aleksey Vyazmikin , 2019.01.26 00:06

Bir bot yaratıcımız olsaydı, ona bir dizi soru sorabilir ve cevaplara çok şaşırabilirdik. Tüm bu RL'ler, çevre üzerindeki sabit etki faktörleri konusunda iyi eğitilmiştir, ancak başka bir oyuncuya karşı oynarsanız, RL çıplak haliyle çalışmayacaktır. Bu alanı derinlemesine incelemedim, yanılıyor olabilirim. Ancak burada değişen bir ortamla net bir etkileşim var, botların davranışından bir şey beklentisi olduğu net değil, hiç görünmüyor, ikinize de zarar verme olasılığı üzerinde bir kontrol var. ve düşman ve burada yanlış hesaplamalar basittir ve daha düşük bir olumsuz sonuç olasılığına doğru hareket eder, ancak bu, oyunun başındaki politika tarafından belirlenen olasılık değildir - bu, değişen ortam üzerindeki etkidir.


Bilmiyorum belki beyniniz kitaplara göre düşünmeye alışmıştır ama benim için daha az önemli konularla çalışmak daha kolay, bu yüzden kendi kelimelerimle anlattım.