Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 104

 
Dr.Tüccar :

Vtreat daha iyi. Belirli bir tahmin modeline uymadan, hedef değişkeni tahmin etmek için tahmin edicinin genel olarak ne kadar iyi/kötü olduğunu istatistiksel olarak her şeyi değerlendirir. Skoru 1/(öngörücü sayısı) üzerinde olmayan tahmin edicilerin kullanılması tavsiye edilir. Örneğin, 200 tahmin edici varsa, yalnızca 1/200'den az puanı olanları alırız. Tahminciler tahmin edilebilir ve tüm tahminler eşiğin üzerindeyse - başarısız bir şekilde modeli eğitmeye ve yeni verileri tahmin etmeye çalışmak yerine - hemen diğer tahmin edicileri aramaya başlamak daha iyidir.

Birkaç dezavantaj vardır - paket, tahmin edicilerle tek tek çalışır ve etkileşimlerini dikkate almaz. Ayrıca, tamamen aynı veya yüksek korelasyonlu tahminciler olsa bile, vtreat'in yinelenenleri kaldırmayacağından, bazen yoluma çıkmasından hoşlanmıyorum.

Aslında, ilişkili tahminciler kötüdür.

Belki paket genellikle tahmin edicilerin ön işlenmesini gerektirir, örneğin, ölçekleme, merkezleme, korelasyonlu kaldırma ..... şapkadaki gibi

Belki bu yüzden?

 
San Sanych Fomenko :

Aslında, ilişkili öngörücüler kötüdür.

Belki paket genellikle tahmin edicilerin ön işlenmesini gerektirir, örneğin, ölçekleme, merkezleme, korelasyonlu kaldırma ..... şapkadaki gibi

Belki bu yüzden?

Bu arada, kimse veri madenciliğini iptal etmedi. Burada sitede meslektaşımızın bu konuyla ilgili şık bir makalesi var. Ne yazık ki, yazar bu konuya katılmıyor.
 
Dr.Tüccar :

Buluşsal yöntemleri sağlam bir şekilde değerlendirmek için iyi bir araç takımı geliştirdiniz. Geliştirdiğiniz modelin (komitenin) eğitim yönteminin Forex'e uygun olmadığını kanıtladınız, peki sırada ne var?


Henüz yönteme son vermedim. En azından merak uyandırıyor çünkü eğitim ve testteki en iyi modellerin 1/3'ü bir artı ile birlikte 5 yıllık bir doğrulama sürecinden geçiyor. Her şey sızıyor olsaydı.

Ayrıca, programımla ilgili bir düşünce daha var. Model o kadar iyiyse, değerlerinin %95'i doğrulama sırasında 0'ın üzerinde olacaksa, doğrulama ve test arasındaki bağlantıyı unutabilir ve herhangi bir eğitimli modeli alabilirsiniz.

Güçlü modeller aramanın amacı budur (iyi bir genelleme etkisi olan).

 
Karmaşık ticaret teorileri oluşturmaya çalıştıkları bu tür konuları (sadece bu forumda değil) her zaman okurum.
Genetik algoritmalar , sinir ağları, yalnızca yazarın kendisi için net olan kafa karıştırıcı formüller vb.

Ve her zaman bu tür sistemlerin piyasada çalışmadığını görüyorum. İzleme ya sıfıra ya da eksiye gider.
Ama diğer yandan, bir sonraki konuda, birisi iki hareketli ortalamada danışman olarak kazanıyor. Ve iyi kazanıyor.

Soru şu ki, her şey mantıklı mı?
Çünkü benim tecrübeme göre sistem ne kadar basit ve anlaşılırsa o kadar karlı.
 
San Sanych Fomenko :

.... Ama sadece gürültüyü filtreledikten sonra. Ve gürültü olmaması gerçeği, modelin performans göstergelerinin farklı örnekler üzerinde yaklaşık değişmezliği ile belirlenir. Tahmin hatasının mutlak değeri değil, (eşitlik) modelin fazla uydurma olmadığının kanıtı olarak yorumlanan performans göstergelerinin yaklaşık eşitliği gerçeği. HİÇBİR YENİDEN EĞİTİM bizim her şeyimiz değildir.

Ben de sana cevap vermek istiyorum.

Burada göstergelerin eşitliğine bakıyorsunuz. Buna yeniden eğitim eksikliği diyelim. Seçtiğiniz modelin başka bir büyük örneklem - ertelenmiş testiyle fazla uydurmanın olmadığını gerçekçi bir şekilde değerlendirmeye çalıştınız mı? Verilerin bir kısmındaki eşitliğin yozlaşarak modeli bu veriye uydurması ve modelin gelecekte birleşmesi olmayacak mı? Araştırmamda bu modeli takip ediyorum.

 
Elastik ağ hakkında bilgi edinin. Bu bir metot ve bir pakettir. Lineer modeller için hibrit düzenlileştirme. Orada, tahmin edicilerin korelasyonu henüz işleniyor.
 
Modellerini satın almak ve oturmak için ayrı ayrı eğiten var mı?
 
Alexey Burnakov :

Ben de sana cevap vermek istiyorum.

Burada göstergelerin eşitliğine bakıyorsunuz. Buna yeniden eğitim eksikliği diyelim. Seçtiğiniz modelin başka bir büyük örneklem - ertelenmiş testiyle fazla uydurmanın olmadığını gerçekçi bir şekilde değerlendirmeye çalıştınız mı? Verilerin bir kısmındaki eşitliğin yozlaşarak modeli bu veriye uydurması ve modelin gelecekte birleşmesi olmayacak mı? Araştırmamda bu modeli takip ediyorum.

Kendi gürültü filtreleme algoritmam var.

Uygulanırsa, model seçilen tahmin ediciler üzerinde eğitilir, daha sonra herhangi bir örnekte bu modelin yaklaşık olarak eşit performans göstergeleri vardır. Güven aralıkları hakkındaki düşüncelerim, "yaklaşık eşit" kelimelerinden kurtulmak için buradan.

Bundan daha fazlasını söyleyeceğim.

Pratik farklı görünüyor.

Bir pencerede çalışmalısın. Bu nedenle, önceden seçilmiş tahminci setimden pencerede çalışmak için, işaretten rfe ile tahmin edicileri seçmeye başlıyorum. Belirli bir pencere için, hatayı %5-7 oranında azaltan bir alt küme alıyorum. H1'de haftada bir yapıyorum. Bu alt küme her hafta sonu değişir. Geçen yıldan beri böyle yaşıyorum.

Ancak gürültüden ön kurtulmak zorunlu bir adımdır. Değilse, o zaman mucizeler bekleyin.

 
Andrey Dik :
Modellerini satın almak ve oturmak için ayrı ayrı eğiten var mı?

Sadece 2 sınıf tahmin ediyorum - "satın al" ve "sat", yani her zaman bir tür anlaşma açık olacak. Bir modelle çalışıyorum, tamamen zıt sonuçlar veren iki model yapmak için hiçbir neden göremiyorum.

Ama kademeli olarak 3 sınıfa geçmek istiyorum - "satın al" / "her şeyi kapat ve ticaret yapma" / "sat". Bu, daha karmaşık bir strateji ile ticaret yapmanızı sağlayacaktır. Birkaç kez denedim, ancak üç sınıf için eğitim modelleriyle ilgili sorunlar yaşadım, özellikle model, sonucun daha sonra sınıflara yuvarlanmasıyla regresyon ise.
Orijinal sınıfların 1/0/-1'in ilk model için 1/0/0'a ( yalnızca satın al ) ve ikinci model için 0/0/1'e (satış) dönüştürüldüğü iki model oluşturmaya değer olduğunu düşünüyorum. bir tek). Bu, her modelde dengesiz sınıflara yol açacaktır (bir sınıfa sahip örneklerin sayısı diğerinden çok daha fazladır), ancak bu koşullarda çalışan modelleri değerlendirmek için iyi ölçümler buldum - F-skoru ve kappa. Henüz bu yönde gerçekten hiçbir şey yapılmadı, ancak böyle bir plan oldukça mümkün görünüyor.

 
San Sanych Fomenko :

Aslında, ilişkili öngörücüler kötüdür.

Belki paket genellikle tahmin edicilerin ön işlenmesini gerektirir, örneğin, ölçekleme, merkezleme, korelasyonlu kaldırma ..... şapkadaki gibi

Belki bu yüzden?

Hayır, vtreat ne yazık ki tahmin edici etkileşim analizi yapmıyor. Onları kesinlikle tek tek inceler. Bu bir kase paketi değil :(
Ölçekleme veya merkezlemenin sonucu bir şekilde etkileyeceğini düşünmüyorum. Ve y-aware seçeneğini etkinleştirirseniz, paket verinin kendisini ölçeklendirir ve ortalar.

Vladimir'den ilginç makale, bağlantı için teşekkürler. Tahmin edicilerin etkileşiminin analizi hakkında sadece konuyla ilgili.