Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3015

 
Maxim Dmitrievsky #:

Bir tahta tabakasının bazen tahtadan daha iyi sonuç vermesi gibi mi?

minimumda hazır tc

Yeni verilere göre, evet. Sadece tutarlı bir modele ulaşılmıştır ve ağaçtan geriye kalan yapraklar sadece rüzgar gürültüsüdür. Gürültü, ağacı tüm sorulara yanıt vermeye, yani örneği tamamen sınıflandırmaya zorlamaktan kaynaklanmaktadır.

 
Geceleri uyumak zorundasın.
 
Aleksey Vyazmikin #:

Yeni verilere göre, evet. Sadece sabit bir modele ulaşılmıştır ve ağacın geri kalanı sadece rüzgar gürültüsü bırakır. Gürültü, ağacı tüm sorulara yanıt vermeye, yani tüm örneği sınıflandırmaya zorlamaktan kaynaklanmaktadır.

Ben bunu (yaprak seçimi) otomatik olarak yapıyorum - yaprak aktivasyon seviyesini değiştirerek. Klasik olarak, sınıflandırma için 0,5 kullanılır. Olasılığı 0,5'ten yüksek olan tüm yapraklar etkinleştirilir, geri kalanlar sessiz kalır (bu da ağaçtan çıkarılmalarıyla eşdeğerdir). Bu yöntem bu sitede ve forumda birden fazla makalede açıklanmıştır.

Seviyeyi 0,9 veya 0,95 olarak ayarlayabilirsiniz, o zaman sadece doğru sınıftaki örneklerin %95'ine sahip süper temiz yapraklar çalışacaktır. Regresyon için de benzer şekilde, sadece seviye 0'dan 1'e değil, abs değerlerindedir. Yukarıdaki resimler aynı modeli, ancak farklı aktivasyon seviyelerini göstermektedir. İlki 0.00020, ikincisi 0.00040pts ile. İkincisi, kârsız ticaret aralıklarını atladı ve 1-2 yıllık duraklamalarla çalışmasına rağmen yalnızca en kârlı olanlar üzerinde çalıştı ve kâr gösterdi. Aktivasyon 400000 vakadan 70000'inde gerçekleşti, yani en iyi yaprakların yaklaşık %17'si çalıştı.

Sonuç benzerdir, koddaki tek bir komutla elde edilir if(leaf_value>0.00040){...}. Yaprakları ve şimdi de kümeleri seçerken yaptığınız tüm oynamalar olmadan.

Ama siz bunları zaten biliyorsunuz....

 
Aleksey Vyazmikin #:

Yeni verilere göre, evet. Sadece tutarlı bir modele ulaşılmıştır ve ağacın geri kalanı sadece rüzgar gürültüsü bırakır. Gürültü, ağacı tüm sorulara yanıt vermeye, yani tüm örneği sınıflandırmaya zorlamaktan kaynaklanmaktadır.

Sorun, ağacın kar maksimizasyonu koşuluna göre değil, paketin programlanmasına uygun bir kayıp fonksiyonuna göre inşa edilmiş olmasıdır.

Bu yüzden hoş olmayan bir seçim yapmak zorundasınız - ya karmaşık, kandırılmış bir paketi yeniden yapılandırmaya çalışın ya da sıkışık bir bisiklet inşa edin. Bu iki seçeneği "başarıyla" birleştirmek de mümkündür).

IMHO, ağaçlar üzerinde mevcut bir paketle oynamayı seçerseniz, budama (budama) kullanmayı denemelisiniz - örneğin ileride kar maksimizasyonu koşulu ile. Kurallarla elle oynamaktan kaçınmak mümkün olabilir.

 
Maxim Dmitrievsky #:
Çok umutlu değilim, sadece arada bir göz atıyorum. Sonuçta gpt bu konuda durgunluk ve durgunluk öngörüyorum. Hiçbir atılım görünmüyor. Kriptoda olduğu gibi bu da tamamen bir aldatmaca. Şimdi para kazanacaklar ve sakinleşecekler.
Sana katılıyorum!

Tüm mahallem propagandası yapılan sinir ağlarını övüyor, ancak onlara basit görevler verdiğinizde, bunlarla başa çıkamıyorlar
 
Stanislav Korotky #:

Verdiğim örnek sadece kategorik çapraz entropi bölümünden (ve muhtemelen oradaki değerlerin toplamının her örnekte 1 olduğuna dikkat etmediniz). Keras'taki gibi çalışmaması benim için bir gösterge, bu da MQL5'teki CCE'nin ya uygulamasının ya da açıklamasının beklenene uymadığı anlamına geliyor. O zaman detaylı bir açıklama gerekiyor. Bu arada, pytorch CrossEntropyLoss içinde bir ön softmax içerir. Ancak genel olarak, MQL5'teki matrislerle ilgili dokümantasyon, arayüzün python arayüzüne benzer olduğu fikrini içerdiğinden, davranışların çakıştığı ima edilir. Ve eğer tesadüf yoksa, sorunlara ve şaşkınlığa neden olur.

Çok sayıda sınıfa sahip olmak matrislerle çalışmak anlamına gelir (her biri sınıflara sahip bir grup örneğimiz/satırımız olduğunda), bu nedenle vektörle verdiğiniz örnek hala soruyu yanıtlamıyor.

Anladım. Kayıp fonksiyonları vektörlerle olduğu gibi matrislerle de çalışır. Bu yerde bitirmedik (eksen parametresini eklemedik)

Yani, örneğinizde satır satır çözmemiz gerekiyor.

İlginiz için teşekkür ederim

 
Aleksey Vyazmikin #:

Yeni verilere göre, evet. Sadece tutarlı bir modele ulaşılmıştır ve ağacın geri kalanı sadece rüzgar gürültüsü bırakır. Gürültü, ağacı tüm sorulara yanıt vermeye, yani tüm örneği sınıflandırmaya zorlamaktan kaynaklanmaktadır.

ve eğer onu ormandan çıkarırsanız, oradaki tüm ağaçların kurallarının ağaç sayısına göre bir ortalaması olacaktır

 
Forester #:

Bunu (yaprak seçimi) yaprak aktivasyon seviyesini değiştirerek otomatik olarak yapıyorum. Klasik olarak, sınıflandırma için 0,5 kullanılır. Olasılığı 0,5'ten yüksek olan tüm yapraklar etkinleştirilir, geri kalanlar sessiz kalır (bu da onları ağaçtan çıkarmakla eşdeğerdir). Bu yöntem bu sitede ve forumda birden fazla makalede açıklanmıştır.

Ve seviyeyi 0,9 veya 0,95 olarak ayarlayabilirsiniz, o zaman sadece doğru sınıftaki örneklerin %95'ine sahip süper temiz yapraklar çalışacaktır. Regresyon için de benzer şekilde, sadece seviye 0'dan 1'e değil, abs değerlerindedir. Yukarıdaki resimler aynı modeli, ancak farklı aktivasyon seviyelerini göstermektedir. İlki 0.00020, ikincisi 0.00040pts ile. İkincisi, kârsız ticaret aralıklarını atladı ve 1-2 yıllık duraklamalarla çalışmasına rağmen yalnızca en kârlı olanlar üzerinde çalıştı ve kâr gösterdi. Aktivasyon 400000 vakadan 70000'inde gerçekleşti, yani en iyi yaprakların yaklaşık %17'si çalıştı.

Sonuç benzerdir, koddaki tek bir komutla elde edilir if(leaf_value>0.00040){...}. Yaprakları ve şimdi de kümeleri seçerek yaptığınız tüm oynamalar olmadan.

Ama siz bunları zaten biliyorsunuz....

Bir ormanınız var, modeli oluşturduktan sonra yeniden ağırlıklandırmıyor musunuz? Yoksa sadece aktif yaprakların ortalamasını mı alıyorsunuz?

Mesele de bu, bir yaprak seçerken tarih boyunca yanıt dağılımının istikrarını ve tekdüzeliğini dikkate alıyorum. İki boyutlu göstergeler oluşturuyorum ve bunları toplu olarak değerlendiriyorum. Dolayısıyla, yanıt vermeyen yapraklar benim için son derece nadirdir.

Bana öyle geliyor ki yaprakları kolayca kaydedebilir, binlerce ağaç oluşturabilir ve sadece onlarla çalışabilirsiniz.

 
Aleksey Nikolayev #:

Sorun, ağacın bir kar maksimizasyonu koşuluna göre değil, paket programlama için uygun bir kayıp fonksiyonuna göre oluşturulmasıdır.

Yani hoş olmayan bir seçeneğiniz var - ya karmaşık, zor bir paketi yeniden yapılandırmaya çalışın ya da sıkışık bir bisiklet inşa edin. Bu iki seçeneği "başarıyla" birleştirmek de mümkündür)

IMHO, ağaçlar üzerinde mevcut bir paketle oynamayı seçerseniz, budama (budama) kullanmayı denemelisiniz - örneğin ileride kar maksimizasyonu koşuluyla. Kurallarla elle oynamaktan kaçınmak mümkün olabilir.

Ağacı oluşturmak için kullandığım varyant derin ağaçlar oluşturmuyor - budama orada gereksiz olabilir.

Evet, neredeyse tüm işlemler otomatiktir ve otomatik olmayanlar ise daha ziyade benim R konusundaki cehaletimden kaynaklanmaktadır.

Gürültüden bahsediyorum, çünkü kök tahmincisi %10 veya daha az bölgede belirli sınıflara yatkınlık olasılığı içerebilir ve olasılığın geri kalanı eşit olarak dağıtılır ve kalıntının geri kalanı kalan yaprakları kesmek için kullanılır.

 
Maxim Dmitrievsky #:

ve eğer onu ormandan çıkarırsanız, ağaç sayısına göre tüm ağaçların bir ortalaması olacaktır.

Ağaçlar bağımsız olarak inşa ediliyor ve daha sonra yapraklardaki cevaplara göre ağırlıklandırılıyor. Ben bir ormanla değil, tek bir ağaçla çalıştım. Genetik üzerine bir orman hiç duymadım.