Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3175
Alım-satım fırsatlarını kaçırıyorsunuz:
- Ücretsiz alım-satım uygulamaları
- İşlem kopyalama için 8.000'den fazla sinyal
- Finansal piyasaları keşfetmek için ekonomik haberler
Kayıt
Giriş yap
Gizlilik ve Veri Koruma Politikasını ve MQL5.com Kullanım Şartlarını kabul edersiniz
Hesabınız yoksa, lütfen kaydolun
Aşırı antrenmanı kontrol etmek için kullanılabilir.
Bu yüzeyde bir hücrenin yaklaşık olarak aynı renkteki diğer hücrelerle çevrili olduğu bir parça tanımlamak mümkünse, bu merkezi hücre aşırı eğitilmemiş TC'nin parametrelerini verecektir. Bu konum, bulunan optimumun bir plato olduğu gerçeğine karşılık gelir.
Ancak, "yüzey" bir leopar derisine benziyorsa, TS umutsuzdur, çünkü test eden kişi çok sayıda maksimum bulmuştur ve bu da gelecekte onlara çarpma olasılığının son derece düşük olduğunu gösterir.
Bunu yapamazsınız.
Desenin (yüzeyin) doğası sadece belirli bir optimizasyon kriterine göre TS'nin özellikleri hakkında bilgi verir. Eğer başka bir kriter alırsak, desen farklı olacaktır. Bunun yanlış anlaşılması, optimizasyonun (öğrenmenin) küresel maksimuma kadar yapılmaması gerektiği, aksine yapılması gerektiği gibi yanlış anlamalara yol açar. Doğru öğrenmenin anahtarı, stratejiye uygun bir optimizasyon kriterinin seçilmesidir.
Tüm bunlar daha önce birçok kez tartışılmıştır.
Lütfen açıklayın, bu aralıkların anlamı nedir?
Şu anda bu şemayı onların üzerinde hayal ediyorum.
İlk nokta garip görünüyor. Test cihazında "ileri test" gibi. Filtreleme olmadan sadece optimizasyondan daha mı iyi, ancak birleşik bir aralıkta: eğitim + test?
Tıpta, yaklaşık olarak eşit derecede hasta olan 60 kişilik bir hasta grubu rastgele üç gruba ayrılır, ilk grup yeni bir ilaçla, ikinci grup eski bir ilaçla tedavi edilir, üçüncü grup tedavi edilmez, onlara plasebo verilir. Eğer birinci grup ikinci ve üçüncü gruptan daha iyiyse, ilacın iyi olduğu kabul edilir ve deney bir süre çok sayıda tekrarlanır, yani izlenir ve daha sonra serbest bırakılır.
Yanlış pozitif ve negatif sonuç olasılığının azalması mantıklı görünüyor, ancak bana göre bu hatalara karşı her derde deva değil.
Ayrıca)))) gürültülü çalışmalarda sonuçların kategorik olarak değerlendirilmesini de anlamıyorum ve kabul etmiyorum.
Hayır, yapamazsın.
Desenin (yüzeyin) karakteri sadece belirli bir optimizasyon kriterine göre aracın özellikleri hakkında bilgi verir. Eğer başka bir kriter alırsak, desen farklı olacaktır. Bunun yanlış anlaşılması, optimizasyonun (eğitimin) küresel maksimuma kadar yapılmaması gerektiği, aksine yapılması gerektiği gibi yanlış bir kanıya yol açmaktadır. Doğru eğitimin anahtarı, stratejiye uygun bir optimizasyon kriterinin seçilmesidir.
Tüm bunlar daha önce birçok kez tartışıldı.
Ve herkes kendi görüşünde kaldı. Bana öyle geliyor ki, bir tek siz varsınız.
Sürecin rastlantısallığı nedeniyle bir daha asla ortaya çıkmayacak olan bireysel zirveleri değil, platoları aramanız gerekir.
Tıpta, yaklaşık olarak eşit derecede hasta olan 60 kişilik bir hasta grubu rastgele üç gruba ayrılır, birincisi yeni bir ilaçla, ikincisi eski bir ilaçla tedavi edilir, üçüncüsü ise tedavi edilmez, onlara plasebo verilir. Eğer birinci grup ikinci ve üçüncü gruptan daha iyiyse, ilacın iyi olduğu kabul edilir ve deney bir süre çok sayıda hasta üzerinde tekrarlanır, yani izlenir ve daha sonra serbest dolaşıma bırakılır.
Yanlış pozitif ve negatif sonuç olasılığının azalması mantıklı görünüyor, ancak bana göre hatalara karşı her derde deva değil.
Ve)))) gürültülü çalışmalarda sonuçların kategorik olarak değerlendirilmesini anlamıyorum veya kabul etmiyorum.
Dosyayı farklı bölümlere ayırmak ve verdiğiniz örnekte benim örneğime karşılık gelen gruba hastaları rastgele dahil etmek, yalnızca tahmin ediciler hedef değişkenle ilgiliyse işe yarar. yani saçma değildir. Tıpta, bir ilacın (öngörücünün) bir hastalıkla ilişkisini bulmak, ilacın vücuda girme sürecinin fizyolojisini anlayarak yapılır. Tahmin edici ile hedef değişken arasındaki ilişkiyi belirlemek için başka yöntemlere sahip olmamız gerekir - tüm bunlar modeli eğitmeden ÖNCE yapılan ön işlemedir ve bu adım zorunludur.
Aynı şekilde, test mimarisi de zorunludur ve modelin aşırı eğitiminden ÖNCE yapılmalıdır.
Ve herkes kendi fikriyle baş başa kalır. Bana öyle geliyor ki sen türünün tek örneğisin.
Sürecin rastlantısallığı nedeniyle bir daha asla ortaya çıkmayacak olan bireysel zirveleri değil,platoları aramanız gerekir.
Tek sayıda olmam gerçekten umurumda değil, bu sadece sorunsalı anlayan çok az insan olduğunu gösteriyor))))
plato mu yoksa tepe mi - optimizasyon kriterinin yüzeyine, kritere bağlıdır! MO'da neden sıklıkla hata kriterini kullandıklarını düşünüyorsunuz? Çünkü yüzey monoton))) yani her zaman mümkün olduğunca monoton olan ve mümkünse tek bir global olan böyle bir kriter seçmeye çalışırlar.
Bu yüzden bir plato değil, mümkün olduğunca monoton bir hiper yüzeye sahip bir kriter aramalıyız.
Bu arada, hata kriterinin 0 değerine sahip tam olarak bir global değeri vardır. Ve global değere ulaşmadan eğitimi durdurmanız gerektiği gerçeği başka bir konudur ve kriter yüzeyi ile ilgisi yoktur.
Bunu yıllardır yaptığınız sonucuna varılabilir. Ya da şu anda yaptığınız gibi rastgele bir arama yapabilirsiniz.
Az önce rastgele aramanın verimsiz bir yaklaşım olduğunu yazdım.
Örnekleme potansiyelini test ederken tahminci seçiminde bir rastgelelik unsuruyla birlikte rastgeleleştirmeyi kullanıyorum ve bunu CatBoost'ta yıllardır kullanıyorum.
Rastgeleleştirme, modelin çalışmaya devam etmesini beklemek için herhangi bir gerekçe sunmaz, çünkü tahminci yanıtları modele rastgele yerleştirilmiştir.
IMHO, Maxim'in yakın zamanda yazdığı pi-hacking'e benziyor. Tahsis edilen kuantumların önemini belirlemek için bazı istatistik testleri kullanılmadığı sürece, kesinlikle o.
Bir keresinde SB'de alım satım için haftanın en iyi saatinin seçildiği basit bir örnek vermiştim (açıkça mevcut olmadığı halde). Sadece 5*24=120 varyant vardı, ancak böyle bir saatin her zaman bulunması yeterliydi (zaman aralığı sanırım yarım yıldı). Orada da "örnekleme istikrarı" var.
Hangi anlamlılık testlerini önerirsiniz? Kuantum segmentlerini seçme algoritmasının mükemmel olduğunu söylemiyorum, tam tersine - çok fazla saçmalık var ve bunu geliştirmek istiyorum.
Bunun bir tür "pi-hacking" olduğuna hangi işaretlere dayanarak karar verdiğinizi anlamıyorum - ve tam olarak hangi kısmı, kuantum segmentlerinin seçimi mi yoksa kuantum segmentleri (yani benim oluşturduğum grafikler) tarafından iyi ve eğitimsiz bir şekilde taranan dizilerin taranması mı? Evet, yöntem ahşap modeller oluşturmaya yönelik yaygın yaklaşımdan biraz farklı, ancak gerçekten çok değil, konsept kalıyor.
SB'deki örnekle ilgili olarak, burada iki husus var:
1. Süreç bilinmiyorsa ve yalnızca veriler varsa, o zaman ticaret yapmak için en iyi saatin olduğu bir model varsayılabilir. Yoksa bu hipotezi reddetmek için bir düşünce var mı?
2. Bu gözlemler zaman içinde nispeten eşit bir şekilde dağılmışsa (olay geçmişi), bu daha çok rastgele sayı üreteci hatasına benzer.
Eğitimde, genellikle en az 10 yıl olmak üzere geniş bir dönemdeki örnekleri kullanıyorum.
Dosyayı farklı bölümlere ayırmak ve verdiğiniz örnekte hastaları rastgele bir gruba dahil etmek, ki bu benim örneğime karşılık geliyor, yalnızca tahmin ediciler hedef değişkenle ilgiliyse işe yarar. yani saçma değildir. Tıpta, bir ilacın (öngörücünün) bir hastalıkla ilişkisini bulmak, ilacın vücuda girme sürecinin fizyolojisini anlayarak yapılır. Tahmin edici ve hedef değişken arasındaki ilişkiyi belirlemek için başka yöntemlere sahip olmamız gerekir - tüm bunlar modeli eğitmeden ÖNCE yapılan ön işlemedir ve bu adım zorunludur.
Aynı şekilde, test mimarisi zorunludur ve modelin aşırı eğitiminin ÜZERİNDE yapılmalıdır.
Ne yazık ki hayır. Fagositoz mikroskopta görülebilir, ancak mikroskobun yardımcı olmadığı tıp biliminde hipotezler uygun deneylerle doğrulanır)
Ve bu arada, hastalar hangi grupta olduklarını bilmiyorlar.))))
Genel olarak, benzer koşullar, neden-sonuç ilişkileri anlaşılmadan bu ilişkiler araştırılır.