Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3332
Alım-satım fırsatlarını kaçırıyorsunuz:
- Ücretsiz alım-satım uygulamaları
- İşlem kopyalama için 8.000'den fazla sinyal
- Finansal piyasaları keşfetmek için ekonomik haberler
Kayıt
Giriş yap
Gizlilik ve Veri Koruma Politikasını ve MQL5.com Kullanım Şartlarını kabul edersiniz
Hesabınız yoksa, lütfen kaydolun
Beyler! Konuyu karıştırmıyor musunuz? Konu dışı 2-3 sayfayı temizlemek iyi olur.
Alexey'in makalesi bir saat önce yayınlandı, okuyun.
Sanırım onun zamanındaki niceliğini her yönden zaten tartışmıştık. Daha önce söylediklerime ekleyebileceğim tek şey, ona en azından 200 dolar kazandırdığı için onun adına mutlu olduğumdur.
Sanırım onun zamanındaki niceliğini her yönden zaten tartışmıştık. Daha önce söylediklerime ekleyebileceğim tek şey, ona en az 200 dolar kazandırdığı için onun adına mutlu olduğumdur.
Teşekkür ederim, gelirim için mutlu olmak güzel - nadir!
Makale giriş niteliğinde - haklısınız, orada yazdığım her şey - bence ve çok açık.
İkinci kısım ise biraz daha ilginç. Ancak, şu anda kendi yöntemimi açıklamaktan vazgeçtim ve testler üzerinde küçük bir etki sağlayan basitleştirilmiş bir versiyon buldum. Bu yöntem ikinci bölümde açıklanacaktır.
Ancak, yeni fikirler metnin %5'inden fazlasını almadığında durum böyle olacaktır.
Dilerseniz okumak ve yorum yapmak için geri gelin.
Hangi Diyojen'i kastettiğinizi bilmiyorum ama trollük anlamında Sinoplu Diyojen ya da Laertesli Diyojen'e kıyasla hepimiz çocuğuz.
Başlığımın, kaynağa kaydımın ve bugünkü başlığımın tarihlerine bakarsanız, daha açık hale gelecektir. Kayıttan iki yıl sonra forumda yapıcı ve faydalı diyalog için hala umut vardı ve altı buçuk yıl sonra neredeyse hiç umut kalmadı. Sadece eğlence için.
Buyurun teşekkürler, gelirim için mutlu olmak güzel - nadir bir durum!
Makale giriş niteliğinde - haklısınız, orada yazdığım her şey - yeterince açık olduğunu düşünüyorum.
İkinci bölüm moderasyon altında, biraz daha ilginç. Ancak, şu anda kendi yöntemimi açıklamaktan vazgeçtim ve testler üzerinde küçük bir etki sağlayan basitleştirilmiş bir versiyon buldum. İkinci bölümde açıklanacaktır.
Ancak bu durum, yeni fikirlerin metnin %5'inden fazlasını almaması halinde geçerlidir.
Dilerseniz okumak ve yorum yapmak için geri gelin.
Neden rastgele?
Bir sınıftaki tüm noktalar arasında dolaşın ve diğer sınıftaki tüm noktalara olan mesafeyi ölçün, minimum mesafeyi alın.
Her şey elde edildiğinde, sıralayın, ihtiyacınız olan mesafeye kadar silin, her seferinde bir çift. Silinen nokta başka bir çiftte kullanılmışsa, yeni bir minimum mesafeye sahip yeni bir nokta bulun, tekrar sıralayın ve devam edin.
Belki daha iyi bir yol düşünebilirsiniz. Belki sıralama yapmadan - sadece gerekli mesafeye kadar silin.
Sanırım doğru anlamıyorum:
Algoritmanın prototipini doğru anladım mı?
Konuya böyle bir gecikmeyle dönüyorum, çünkü CatBoost modellerindeki ve diğer ağaç topluluklarındaki yaprakların aktivasyonda güçlü bir şekilde ilişkili olabileceği fikrinden biraz etkileniyorum, bu da eğitim sırasında güvenlerini bozuyor ve bir bütün olarak model için yaprak değerinin fazla tahmin edilmesine yol açıyor.
Eh, sanırım biraz yavaş anlıyorum:
Algoritmanın prototipini doğru anladım mı?
Konuya böyle bir gecikmeyle dönüyorum, çünkü CatBoost modellerindeki ve diğer ağaç topluluklarındaki yaprakların aktivasyonda güçlü bir şekilde ilişkili olabileceği fikrinden biraz etkileniyorum, bu da eğitim sırasında güvenlerini bozuyor ve bir bütün olarak model için yaprak değerinin fazla tahmin edilmesine yol açıyor.
1) Bir matris de kullanabilirsiniz, ancak zorunlu değildir, ancak hemen 0 sınıfının her noktasını 1 sınıfının en yakın noktasını bulun, yani bir kerede 2. noktayı elde ederiz.
3) hiçbir şeyi saymayın ve kümelere atıfta bulunmayın, sadece en yakın noktaların çiftlerini çıkarın. Mesafe eşikten az olduğunda, bu örnekteki eşik 0,6 olacaktır. Diğer problemlerde muhtemelen bunu seçmemiz gerekecektir.
Silinen 1 sınıflı bir nokta 0 sınıflı başka bir nokta ile eşleştirilmişse, o zaman çiftsiz kalır, 1 sınıflı yeni bir en yakın nokta bulmak zorundadır (yine bir hesaplama yapın veya 1. maddede önerdiğiniz gibi bir matris kullanın, bellek yeterliyse, 1 milyona 1 milyonluk bir matrisin herhangi bir belleğe sığmayacağını düşünüyorum, belki 100 bine kadar).
4) kalana kadar değil, eşik mesafesine kadar. Çok büyükse, başlangıçta daha fazla olan sınıflardan sadece 1'inin noktaları kalacaktır.
Ancak daha önce de yazdığım gibi, bu gürültüyü ortadan kaldırmanın iyi bir fikir olduğunu düşünmüyorum (bkz. https://www. mql5.com/ru/forum/86386/page3324#comment_50171043). Tahmin yaparken bu gürültüyü ortadan kaldıramazsınız diye bir şey yok. Ağacın kendisi gürültülü yaprakları yaklaşık %50 olasılık vererek işaretleyecek ve örneğin sınıflardan birinin olasılığı >%80 olan gürültülü olmayan yaprakları alacaktır (veya uygun gördüğünüz kadarını).
Kümelerin bununla hiçbir ilgisi yoktur. Sadece birbiriyle çelişen farklı sınıflara sahip en yakın noktaları, yani gürültüyü ortadan kaldırır. Ve sonra kümeleme veya ağaç kullanabilirsiniz - eğitmek istediğiniz her neyse.
.
1) Bir matris de kullanabilirsiniz, ancak zorunlu değildir, ancak hemen 0 sınıfın her noktasını 1 sınıfın en yakın noktasını bulun, yani bir kerede 2. noktayı elde ederiz.
3) hiçbir şey saymayın ve kümelere atıfta bulunmayın, sadece en yakın noktaların çiftlerini kaldırın. Mesafe eşikten az olduğunda, bu örnekteki eşik 0,6 olacaktır. Diğer problemlerde muhtemelen bunu seçmemiz gerekecektir.
Silinen 1 sınıflı bir nokta 0 sınıflı başka bir nokta ile eşleştirilmişse, o zaman çiftsiz kalır, 1 sınıflı yeni bir en yakın nokta bulmak zorundadır (yine bir hesaplama yapın veya 1. maddede önerdiğiniz gibi bir matris kullanın, bellek yeterliyse, 1 milyona 1 milyonluk bir matrisin herhangi bir belleğe sığmayacağını düşünüyorum, belki 100 bine kadar).
4) kalana kadar değil, eşik mesafesine kadar. Çok büyükse, başlangıçta daha fazla olan sınıflardan sadece 1'inin noktaları kalacaktır.
Ancak daha önce de yazdığım gibi, bu gürültünün giderilmesinin iyi bir fikir olduğunu düşünmüyorum (bkz. https://www. mql5.com/ru/forum/86386/page3324#comment_50171043). Tahmin yaparken bu gürültüyü ortadan kaldıramazsınız diye bir şey yok. Ağacın kendisi gürültülü yaprakları yaklaşık %50 olasılık vererek işaretleyecek ve örneğin sınıflardan birinin olasılığı >%80 (veya uygun gördüğünüz kadar) olan gürültülü olmayan yaprakları alacaktır.
Henüz kafamda tam olarak oturtamadım. Her şey tek bir alanda gerçekleşiyor - bir tahmin edicinin metriğinde, ama diğerlerini nasıl hesaba katacağız?
Tahmin yaparken ne yapacağıma gelince - iki model kullanmayı düşünüyordum - biri neyin düştüğünü tespit eden veya verilerin "kümelenme" bölgesinde olduğunu doğrulayan, diğeri ise zaten kalanlar üzerinde çalışan.
Henüz kafamı toparlayamadım. Her şey tek bir alanda gerçekleşiyor - bir tahmincinin metriğinde, ama diğerlerini nasıl hesaba katacağız?
Tahmin yaparken ne yapacağıma gelince - iki model kullanmayı düşünüyordum - biri neyin elendiğini tespit ediyor veya verilerin "kümelenme" alanında olduğunu doğruluyor ve diğeri zaten geriye kalanlar üzerinde çalışıyor.
https://www.mql5.com/ru/articles/9138
Bir yıldır kimse umursamıyor.
Bunun gibi bir düzine ya da yirmi algoritma yazdım, bazıları iyi kurulmuş. Makaledeki, sonuçların istikrarı açısından en iyisi değil, ilk gözleme.
Bu yüzden tartışacak bir şey yok, çünkü henüz daha iyi bir şey yok.