Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3170

 
fxsaber #:

Bu, test cihazının hemen hemen her kullanıcısı tarafından görülen resimdir. Açıklama ile ilgileniyorum.

Bu resimde, istatistiksel anlamlılık oldukça yüksektir: 3000'den fazla örtüşmeyen pozisyon.

Bunun Sample'ın kendi içindeki piyasa değişikliklerinin etkisi olduğunu varsayıyorum. Örneğin, Sample başlangıçta gerçek bir modele sahipti ve sonra hiçbir şey olmadı. Ancak uyum tüm Örneklem için gerçekleşti.

Örneklem içinde bu tür arızalardan bir şekilde kaçınmalıyız.


Ters etki de olabilir: solda OOS - aşağı, sağda - yukarı. Yani, Numunenin ilk parçasında hiçbir desen bulunamamıştır, sadece uyum sağlanmıştır.

Aşırı eğitim ya da durağan olmama sanırım. Tabii ki ham verilerde veya algoritmanın kendisinde sorunlar yoksa.

Genellikle sorunu biraz "hareket ettirmeye" çalışırım - tüm olası parametreleri (ve mevcut metaparametreleri) hafifçe değiştirir ve sonucun nasıl değiştiğini görürüm. Bazen biraz daha netleşir.

 
mytarmailS #:
Eğitimde olduğu gibi OOS'ta da kar elde ederseniz, bu etkinin (OOS'a yönlendirilmiş tahliye) yalnızca piyasaların doğasında olduğu anlamına gelir ve daha fazla hipotez kurabiliriz

Ticaret, otomatik ticaret sistemleri ve ticaret stratejilerinin test edilmesi üzerine forum.

Ticarette makine öğrenimi: teori, modeller, uygulama ve algo ticareti

fxsaber, 2023.08.16 11:38 AM

İşte böyle saçmalıklar oluyor. Solda OOS geçer, sağda geçmez. Ve sağ taraf kelimenin tam anlamıyla hemen "dalar".

OOS'un soldan geçtiğini görebiliyor musunuz?

 
fxsaber #:

Soldan geçen OOS'u görebiliyor musunuz?

Sağ taraftaki etkiden bahsediyoruz

Deneyi tamamen tekrarlayın, ancak sentetik verilerle.


======================================

Soldaki OOS da bir uyumdur, ancak bir tür ikinci dereceden


Genel olarak sadece 1000 TC varyantınız olduğunu düşünün.


1. ve 2. adımlarınız

1) İyi bir TS için optimizasyon/arama yapmaya başlarsınız, bu tren verisidir (uydurma/arama/optimizasyon).

Diyelim ki TC'nin para kazandığı 300 varyant buldunuz...

2) Şimdi bu 300 varyant arasından OOS test verilerini geçecek bir TC arıyorsunuz. Hem traine hem de testte ( OOS ) kazanan 10 TC buldunuz.


Peki ikinci nokta nedir?

Bu aynı fittingin devamıdır, sadece aramanız(fitting/arama/optimizasyon) biraz daha derin veya karmaşık hale gelmiştir, çünkü artık optimizasyon için tek bir koşulunuz (traine'i geçmek) değil, iki koşulunuz (testi geçmek + traine'i geçmek) vardır.

 
fxsaber #:

Bu, test cihazının hemen hemen her kullanıcısı tarafından görülen resimdir. Açıklama ile ilgileniyorum.

Bu resimde, istatistiksel anlamlılık oldukça yüksektir: 3000'den fazla örtüşmeyen pozisyon.

Bunun Sample'ın kendi içindeki piyasa değişikliklerinin etkisi olduğunu varsayıyorum. Örneğin, Sample başlangıçta gerçek bir modele sahipti ve sonra hiçbir şey olmadı. Ancak uyum tüm Örneklem için gerçekleşti.

Örneklem içinde bu tür kırılmalardan bir şekilde kaçınmalıyız.


Ters etki de olabilir: solda OOS - aşağı, sağda - yukarı. Yani, Numunenin ilk parçasında hiçbir desen bulunamamıştır, sadece uyum sağlanmıştır.

OOS her zaman SAĞDA olmalıdır.

Eğer OOS SOLDA ise, TC'nin aşırı eğitimli OLMADIĞINI ve ileriye BAKMADIĞINI garanti etmenin hiçbir yolu yoktur. Bunlar, her şeyden ÖNCE bir TC'yi test ederken ele alınması gereken ilk önemli konulardır.


Sizde hangisi var? Hiç fark etmez! İkisinden biri ya da ikisi birden olması fark etmez. Doğru ve basta - OOS'u doğru şekilde test etmeniz gerekir.

Ve test ediciyi unutmak ve aşağıdaki gibi test etmek için dosyalar oluşturmak daha iyidir:


İki dosyamız var.


İlk dosya rastgele örneklemle üç bölüme ayrılmıştır: eğitim, test ve doğrulama. (Rastgele) bir eğitim örneği üzerinde çalışın, ardından rastgele bir test ve doğrulama örneği üzerinde kontrol edin - bunların hepsi ilk dosyanın FARKLI parçalarıdır. Sonuçları karşılaştırın. Yaklaşık olarak eşitlerse, ikinci "doğal dizi" dosyasını kontrol edin. Burada da yaklaşık olarak eşitlerse, ana sonuca ulaşırız: TC'miz aşırı eğitimli DEĞİLDİR ve ileriye BAKMAZ. Yalnızca bu sonuca sahip olduktan sonra başka herhangi bir şey hakkında konuşmak mantıklıdır: doğruluk, karlılık ve diğer şeyler, bunların hepsi İKİNCİLDİR.


İleriye bakmayı ve yeniden eğitimi kontrol etmenin aslında başka bir yolu olmadığını not ediyorum.

 
fxsaber #:

İşte böyle bir şey oluyor. Solda OOS geçer, sağda geçmez. Ve sağ tarafta, kelimenin tam anlamıyla hemen "dalar".


Bu çoğu zaman olur.

Yani, kelimenin tam anlamıyla hemen önemli bir dalış. Dalışın niteliği net değil. Bence SB'ye yakın bir şey olmalı ama böyle bir tabloyu çok sık görüyorum.


Optimizasyondan sonra ters bir TC çalıştırırsanız, drenaj bile yapamayabilirsiniz gibi geliyor.

P-hacking (veya data-dredging), bir araştırmacının istatistiksel olarak anlamlı bir sonuç bulana kadar verileri analiz ettiği istatistiksel bir uygulamadır. Araştırmacı analizin parametrelerini değiştirebilir, yalnızca belirli verileri seçebilir veya verilerde önemli ilişkiler ya da farklılıklar bulmak için çoklu karşılaştırmalar yapabilir. Bu durum yanlış pozitif sonuçlara yol açabilir ve bilimsel sonuçları çarpıtabilir. P-hacking bir tür bilimsel sahtekârlıktır ve yanlış öncüllere dayalı yanlış tavsiyelere ve kararlara yol açabilir.


***Haklı olarak belirttiğiniz gibi, bunun tersi de olabilir
 
fxsaber #:

Soldan geçen OOS'u görebiliyor musunuz?

Eğitim süresi kısalırsa, grafik trendinin tersine dönmesi o kadar çabuk gerçekleşir mi?

Tik stratejileri hakkında fazla bilgim yok, ancak bu davranışın faktörlerinden biri, eğitim sırasında karşılaştırılabilir verilerin olmamasıdır, örneğin - eğitim çoğunlukla bazı TF'lerde düşüş eğilimindeydi.

Hangi eğitim yöntemini kullandığınızı bilmiyorum, eğer ağaç sistemleri veya sadece koşullu bir göstergenin (fonksiyon) aralığını sıkıştıran filtreler ise, bu tür aralıkların her birine düşen örnek sayısını tahmin etmeye değer.

Olası bir durum, veri kayması ve filtre/liste için olasılık sonuç dağılımında bir kaymadır.

Örneğin, eğitim için bir örnek üzerinde kuantum segmentleri seçtiğimde ve daha sonra bunların dağılımını (0||1 hedefine doğru ve yanlış yanıtların yüzdesi) diğer iki örnek üzerinde tahmin ettiğimde, 3 örnek üzerinde kararlılık kriterini karşılama %25-%30 aralığında bulunur - bu durumda modelin, sitelerden birinde çalışmayı durduracak kararsız bir tahminci seçme şansının daha fazla olduğu açıktır.

Sonuçta her şey basit düzenlilikleri analiz etmeye, yani bir kuyruklu yıldızın kuyruğunun teleskopta rastgele gözlemlenmesinden ziyade bunları bu şekilde değerlendirmek için nedenler aramaya dayanıyor.

 
fxsaber #:

Soldan geçen OOS'u görebiliyor musunuz?

Sistem ne kadar süre kârlı kalıyor?

Sistemin benzer davranışlarıyla karşılaştım, sağdaki OOS'ta keskin bir erik olduğunda, bunun doğrudan bulunan piyasa modellerinin keskin bir 180 derece tersine çevrilmesiyle bağlantılı olduğunu düşünmüyorum (mistik doğanın nedenlerini, vudu uygulamalarının uygulanmasını ve genel olarak yeniden eğitim veya ayarlama gibi gerçek sorunlardan ziyade herhangi bir şeyi gösterir, çünkü en azından gariptir, keskin bir erik her zaman eğitimin bitiminden sonra gerçekleştiğinde). Genellikle Max'in yukarıda söylediği gibi yanlış pozitiflere (veya yanlış negatiflere) neden olan koddaki bazı hatalardan kaynaklanır, bunların düzeltilmesi en kötü durumda OOS sağında rastgele davranışa (aşırı eğitim) veya en iyi durumda karlılığın kademeli olarak azalmasına (bulunan kalıpların solması ve/veya kademeli olarak değişmesi) yol açar.

 
Andrey Dik #:

si̇stem ne kadar süre karli kaliyor?

Sistemin benzer davranışlarıyla karşılaştım, OOS'ta sağ tarafta keskin bir düşüş olduğunda, bunun doğrudan bulunan piyasa modellerinin 180 derece keskin bir şekilde tersine çevrilmesiyle bağlantılı olduğunu sanmıyorum (mistik doğanın nedenlerini, vudu uygulamalarının uygulanmasını ve genel olarak yeniden eğitim veya ayarlama gibi gerçek sorunlardan ziyade herhangi bir şeyi gösterir, çünkü en azından eğitimin bitiminden sonra keskin bir düşüş olması gariptir). Genellikle Max'in yukarıda belirttiği gibi yanlış pozitiflere (veya yanlış negatiflere) neden olan koddaki bazı hatalardan kaynaklanır, bunların düzeltilmesi en kötü durumda OOS sağında rastgele davranışa (aşırı eğitim) veya en iyi durumda karlılığın kademeli olarak azalmasına (bulunan kalıpların solması ve/veya kademeli olarak değişmesi) yol açar.

Ve eğer TS'nin birçok parametresi varsa veya çok iyi takılmışsa, düşüşler her zaman keskindir. Çünkü "ince" üzerinde çalışmıştır. Çok sayıda parametre hataların artmasına neden olur, bunlar toplanır. TS'yi sadece kabalaştırır ve daha az parametre yaparsanız, test cihazında o kadar güzel değildir, ancak daha düzgün bir şekilde çöker.

Martingale'de poker ile bir benzetme yapabiliriz. Çok sayıda başarısız pozisyon var. Bunu çok sayıda başarısız parametre veya başka bir şeyle değiştirin. Sonuç aynıdır.

Çünkü pi hackleme sorunu çözmez, halının altına süpürür. Önyargıyı azaltarak ve varyansı artırarak ya da tam tersi. Hatalar hala oradadır, sadece gizlenmiştir.
 

Test ve sınav alt örneklerinde grafiklerin görselleştirilmesini ekledim ve treni kestim - resimlerin uyumlu olması için ilk parçayı kaldırdım.

Aslında bunlar tren->test->sınav şeklinde zaman sıralı bölümlerdir.

Gif'e baktıktan sonra, test ve sınav örneklerinin herhangi bir yönde bir eğilim elde etmekten ziyade salınımın genliğini azalttığı anlaşılıyor.

Bununla birlikte, yakından bakarsanız, bazı iterasyonlarda bu örneklerde bir iyileşme olduğunu görebilirsiniz, yani bunların farklı örneklerde kararlılık gösteren kurallar (kuantum segmentleri şeklinde) olduğunu varsayabiliriz. Farklı bölümlerin iterasyondan iterasyona farklı şekilde değiştiği de not edilebilir, yani testteki iyileşmenin sınavdaki iyileşme ile doğrudan bir korelasyonu yoktur.

Yukarıda yazdığım gibi - bu, bireysel bir kuantum segmentinin bir sınıfına ait olma olasılığının yanlılığındaki değişiklikle açıklanmaktadır.

Kuantum segmentlerinin kendileri, hedef sinyali atlamak, yani sıfıra getirmek veya başka bir deyişle örneği iki parçaya bölmek için bir sinyal olarak, maliyet tahminlerine göre seçilir. Yani, hatalı sinyalleri azaltmanın maliyeti tahmin edilir. Her iterasyonda yeniden hesaplama yapılır ve en düşük fiyata sahip varyant çıkarılır.

İşte hesaplama yöntemlerinden birine göre fiyatın nasıl değiştiği. Aşağıda, her noktanın bir kuantum segmenti olduğu bir gif yer almaktadır (x ekseni bir sıra numarasıdır).

Fiyat ilk iterasyonda rastgele seçilirse test/sınav örneklerinde sonuç önemli ölçüde değişir mi?

 

4. ve 5. yinelemeler arasında, test alt örneğinin hedefin doğru yanıt sayısını nasıl önemli ölçüde kaybettiğini ve bunun sınav örneğiyle hemen bir sapmaya (delta artar) yol açtığını görebiliriz.