Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3171

 
Aleksey Vyazmikin #:

İlk yinelemede fiyat rastgele seçilirse test/sınav örneklerinde sonuç önemli ölçüde değişir mi?

Kendi kendime cevap vereceğim - evet, olacak.

Sinyali (dizeyi) 1000 kez dışlamak için ilk kuantum segmentini rastgele seçtim.

İşte birkaç örnek gif, sürecin farklı rastgele ilk kuantum yinelemeleri ile nasıl gittiği (bırakılabilir).


Ve işte ara yineleme anındaki statik resimler - farklı seçim ve rastgeleleştirme aşamaları.

Ne gibi sonuçlar çıkarılabilir?

1. Şansınız yaver gidebilir ve rastgele çalışan bir model bulabilirsiniz :)

2. Yanlış modellerin sayısını azaltmadan, sadece açgözlülük ilkesini kullanarak bir model oluşturmak zordur.

3. Bir kuantum segmentinde veya tabakasında gözlemlenen düzenliliği tahmin etmek için yöntemler geliştirmeniz gerekir.

4. Rastgelelik, kişinin makine öğreniminde başarılı olduğunu kanıtlamaz.

5. Başarılı olmak için mantıksal olarak geçerli bir model gereklidir.

6. Bir test örneğindeki başarı her zaman bir sınav örneğindeki başarı anlamına gelmez ve bunun tersi de geçerlidir.

Başka hangi sonuçlar çıkarılabilir?

 
Aleksey Vyazmikin #:
...

Nasıl bir sonuç çıkarılabilir?

1. Şansınız yaver gidebilir ve rastgele çalışan bir model bulabilirsiniz :)

2. Yanlış modellerin sayısını azaltmadan, sadece açgözlülük ilkesini kullanarak bir model oluşturmak zordur.

3. Bir kuantum segmentinde veya tabakasında gözlemlenen düzenliliği tahmin etmek için yöntemler geliştirmeniz gerekir.

4. Rastgelelik, kişinin makine öğreniminde başarılı olduğunu kanıtlamaz.

5. Başarılı olmak için mantıksal olarak geçerli bir model gereklidir.

6. Test örneğindeki başarı her zaman sınav örneğindeki başarı anlamına gelmez ve bunun tersi de geçerlidir.

Başka ne gibi sonuçlar çıkarılabilir?

Konu sırasında niceleme yönteminizi gözden kaçırdım, özür dilerim, lütfen bana hatırlatın.

zaman serilerinin nicelleştirilmesi çok önemlidir, örneğin, bir fiyatı renko yöntemiyle nicelleştirirsek SB (en azından istatistiksel olarak alakalı) elde ederiz, bu nedenle "nicelleştirin, nicelleştirmeyin, yine de xxx elde edersiniz" ifadesi en azından hafife alınmış gibi görünüyor, çünkü bilgiyi yok eden nicelleştirme varsa, muhtemelen bilgiyi çıkaran nicelleştirme de vardır. Tabii ki kene akışında bilgi olması şartıyla (bunu hararetle umuyoruz, çünkü aksi takdirde MO uygulaması anlamsız olurdu).

 

Andrey Dik #:

renko yöntemini kullanarak fiyatı ölçtüğümüzde, SB'yi (en azından istatistiksel olarak ilgili) elde ederiz

Bence barlardan daha fazla SB yok.

Andrey Dik #: tabii ki tik akışında bilgi olması koşuluyla (öyle olmasını umuyoruz, çünkü aksi takdirde MO kullanımı anlamsız olurdu).
Burada henüz kimsenin MO kullanarak keneleri araştırdığını sanmıyorum.
 
Forester #:

Barlardan daha fazla SB olduğunu sanmıyorum.

Bence çok daha büyük bir SB, çünkü barlardaki istatistikler SB performansından çok farklı

Forester #:

Burada henüz kimsenin MO ile tiki'yi keşfettiğini sanmıyorum.

belki de değil, en azından seriyi sayısallaştırmak değil.

 

"Aksine yöntemle" hareket etmek umut verici görünüyor. yani düzenlilikleri değil, fiyat (tik) serilerinin ("zaman serileri" kullanmak istemiyorum) asla ulaşılamayan ve tarihte meydana gelmeyen durumlarını aramak.

Bu, tüccarlar için uygun bir strateji oluşturmak için sınır koşullarının kullanılmasına izin verecektir.

 
Andrey Dik #:

Konunun akışı içinde gözden kaçırmışım, özür dilerim, sizin nicelleştirme yönteminizi, lütfen bana hatırlatın.

"Nicelleştirilmiş kesme" kavramı basit bir kavramdır - örneğin her satırında sayısal bir değere sahip olan tahmin edicinin aralığıdır. Aralık içindeki her şey bir birim haline gelir.

Aralıklara bölme yöntemleri farklı olabilir ve ben hem CatBoost'ta yerleşik olan varyantları (bousting'de genellikle hem gerekli RAM'i azaltmak hem de boyutluluğu azaltmak için kullanılır) hem de kendime ait bazı varyantları, örneğin farklı sayısal dizileri kullanıyorum.

Tahmin edici, elde edilen ızgarayı bir şekilde kullanarak aralıklara bölündükten sonra, her segment sırayla alınır ve içindeki bilgi değeri için değerlendirilir.

Bir sınıfa ait olma olasılığında, örneğin ortalama değerinden %5 veya daha fazla bir kayma değerli bilgi olarak kabul edilir, ayrıca sinyallerin sayısı ve örnekteki dağılımı da dikkate alınır.

Örnek ikili bir hedefe sahipse, 0 veya 1'e isabet etme olasılığının buna göre kaydırıldığı iki grup kuantum segmenti elde ederiz.

Her kuantum segmentinin kendi sütununa sahip olduğu yeni bir örnek oluşturuyoruz - aralıkta bir sinyal varsa - "1", yoksa - "0" koyun.

 
Burada yaptığım gibi bir seriyi dönüştürmenizi / nicelleştirmenizi engelleyen nedir https://www.mql5.com/ru/forum/86386/page3166#comment_48559717.
Ya da benzer bir şey. Ve iyi bir sonuç elde edin.
 
Aleksey Vyazmikin #:

Bunun cevabı evet, olacak.

Sinyali (dizeyi) 1000 kez dışlamak için rastgele ilk kuantum segmentini seçtim.

İşte birkaç gif örneği, sürecin farklı rastgele ilk kuantum segmentleriyle nasıl gittiği (bırakılabilir).


Ve işte ara yineleme anındaki statik resimler - seçim ve rastgeleleştirmenin farklı aşamaları.

Nasıl bir sonuç çıkarılabilir?

1. Şansınız yaver gidebilir ve rastgele çalışan bir model bulabilirsiniz :)

2. Yanlış modellerin sayısını azaltmadan, sadece açgözlülük ilkesini kullanarak bir model oluşturmak zordur.

3. Bir kuantum segmentinde veya tabakasında gözlemlenen düzenliliği tahmin etmek için yöntemler geliştirmeniz gerekir.

4. Rastgelelik, kişinin makine öğreniminde başarılı olduğunu kanıtlamaz.

5. Başarılı olmak için mantıksal olarak geçerli bir model gereklidir.

6. Test örneğindeki başarı her zaman sınav örneğindeki başarı anlamına gelmez ve bunun tersi de geçerlidir.

Başka ne gibi sonuçlar çıkarılabilir?

Birkaç yıldır saçmaladığınız sonucuna varabilirsiniz. Ya da şu anda yaptığınız gibi rastgele örnekleme yapmış olabilirsiniz.
 
Aleksey Vyazmikin #:

Bir sınıfa ait olma olasılığının örnek ortalamasından %5 veya daha fazla kayması, sinyal sayısı ve bunların örnek üzerindeki dağılımının yanı sıra değerli bir bilgi olarak kabul edilir.

IMHO, Maxim'in yakın zamanda yazdığı pi-hacking'e benziyor. Tahsis edilen kuantumların önemini belirlemek için bazı istatistik testleri kullanılmadığı sürece, bu kesinlikle odur.

Bir keresinde SB'de alım satım için haftanın en iyi saatinin seçildiği basit bir örnek vermiştim (açıkça mevcut olmadığı halde). Sadece 5*24=120 varyant vardı, ancak böyle bir saatin her zaman bulunması oldukça yeterliydi (zaman aralığı sanırım yarım yıldı). Orada da "örnekleme istikrarı" var.

 
Andrey Dik #:

"Aksine yöntemle" hareket etmek umut verici görünüyor. yani düzenlilikleri değil, fiyat (tik) serilerinin ("zaman serileri" kullanmak istemiyorum) asla ulaşılamayan ve tarihte meydana gelmeyen durumlarını aramak.

Bu, tüccarlar için uygun bir strateji oluşturmak için sınır koşullarının kullanılmasına izin verecektir.

Zaman serisi analizinde geçerli olan tek yaklaşım, örüntüleri aramak ve aykırı değerleri :) herhangi bir şekilde hariç tutmaktır.

Zamansız bir seri olarak tanımlanırsa veya hiç bir seri değil, ama diyelim ki bir yığın veya bir demet çok, başka seçenekler olabilir 😁