Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 43

 
birleştirici :
Ve Sanych'in yolunu izlerseniz, zaten düşük olan yüzde 1'e ulaşma olasılığını önemli ölçüde azaltacağınızı düşünüyorsunuz?

Her gösterge bazı ek bilgiler taşır ve yalnızca yüzde biri değil, tümü yararlıdır. RSI için ">0,99'dan al, <0,01'den sat" diye bir strateji yok, bu talihsiz bir örnekti.

Örneğin, bir gösterge alabilir, ona dayalı bir Uzman Danışman yapabilir, parametrelerini en iyi sonuç için optimize edebilirsiniz. Ancak böyle bir danışman gelecekte her zaman birleşecektir. EA'nın sızdırmasını önlemek için, gösterge değerlerinin farklı koşullarla karmaşık mantığa göre kontrol edileceği onlarca göstergeye (belki daha az ama benim için daha kolay olmuyor) ihtiyacınız var. Örneğin, MA(20)>MA(16) ise RSI>0.3 ise satın alın. Ve eğer MA(20)<MA(16), o zaman rsi'ye değil, stokastik'e bakın. Mantık böyle bir şey olmalı, ama daha da karmaşık ve süslü. Rastgele orman modeli böyle bir mantık oluşturabilir ki bu çok iyidir.

Göstergenin tüm değerleri, modeli oluşturmak için önemlidir. Modelin kendisi, karar ve alım / satım için bu değerlerin eşiklerini ve bunların uygulanma koşullarını diğer göstergelerin değerlerinden belirleyecektir.

 
Dr.Tüccar :

Her gösterge bazı ek bilgiler taşır ve yalnızca yüzde biri değil, tümü yararlıdır.

Occam'ın ustura prensibine aşina mısınız?

 

Göstergenin belirli bir değer aralığı varsa , bu aralıktaki herhangi bir değer bir şey söyler, kendi ek anlamını taşır. Göstergenin üst ve alt limitlerinden sadece %1 alarak ve sadece bunlarla işlem yapmaya karar vermenizi önermiyorum. Elbette deneyebilirsiniz, ancak bunun kârlı olmadığı ortaya çıktı ve stratejiye daha fazla koşul eklemek için daha birçok göstergeyi tekrar toplamanız gerekiyor. Yani, bir dizi başka göstergeyi kullanarak tüm RSI değerlerinde işlem yapabilirsiniz. Veya bir dizi başka göstergenin yardımıyla yalnızca belirli bir RSI değeri aralığında işlem yapabilirsiniz. İkinci yöntemin bana nasıl bir avantaj sağlayacağını göremiyorum.

Ancak başlangıçta düzinelerce gösterge olduğunda ve hepsinde yüzlerce gecikme veya parametre seçeneği olduğunda, o zaman bazılarının ayıklanması gerekir, burada Occam'ın usturası tam olarak yürürlüktedir. Bu sayede, neredeyse 9000 tahminciden sadece yüz tane kaldı (farklı gecikmelere sahip bir düzine gösterge (vardiya)). Ve bu kalan tahminciler, en az %60 doğrulukla bir tahmin verir.

 
Dr.Tüccar :

Ne kadar çok gürültü tahminciniz varsa, bunlardan birinin faydalı verilere benzer olması o kadar olasıdır.

Sanych'in yokluğuyla çok övünen bir ön eğitim

 
birleştirici :

Ne kadar çok gürültü tahminciniz varsa, bunlardan birinin faydalı verilere benzer olması o kadar olasıdır.

Sanych'in yokluğuyla çok övünen bir ön eğitim

Gürültü tahmincileri pahasına, oldukça hatalıydım.

Burada gürültü tahmin edicilerini ayıklayan bir algoritmam olduğu için övünüyorum. Ancak benim için %100 gürültü ve %100 gürültü olmayan tahmin ediciler olmadığı için bu tamamen doğru değil. Gördüğüm tüm tahminciler (birkaç yüz, farklı insanlardan 10'dan fazla set) kısmen gürültülü veya kısmen gürültülü değil. Her zaman. Diğerlerini görmedim. Aşağıda rakamlarla açıklayacağım.

Şimdi ne için savaşıyoruz?

Algoritmamda, eğer tamamen gürültü tahmin edicileri alırsak, o zaman yaklaşık %50'lik bir sınıf tahmini doğruluğu olasılığını elde ederiz - yazı tura atarız. Dahası, anlamsızlık, tamamen gürültü tahmincileri üzerinde öğrenirken, neredeyse her zaman çok iyi sonuçlar almanız ve bunu zaman örneğinden çıkarırsanız, bu %50'yi elde etmemiz gerçeğinde yatmaktadır.

Her tahmincinin soyut bir "gürültü" değeri var. Bu değer 0 ile 1 arasındaysa, gürültü ve tam bir umutsuzluk. 1'den 2'ye kadar ise yapabilirsiniz, ancak kullanmamak daha iyidir. 3 üzeri ölçümle alınmalıdır. 6 üzerini hiç görmedim.

Diyelim ki benim "gürültü üzeri 3" ölçümle tahmin ediciler seçtik. Bir model kurarsak, farklı tahmin edici kümeleri için %25 ila 35 arasında bir hata alıyorum. Tüm numune türlerinde (eğitim-test-doğrulama) - tümü rastgele karıştırma ve örnek dışı - kesinlikle çubukların geliş sırasına göre) yaklaşık olarak eşittir, örneğin %32-30-33-35 Hatayı iyileştirmek mümkün değildir, örneğin iki kez Yani, model hatasının değeri, belirli bir tahmin ediciler kümesi tarafından belirlenir. hata.

Aldığım hata tabii ki biraz büyük ama benim için önemli olan örneklem dışında eğitim ve test sırasında hatanın yaklaşık olarak eşit olması. Ancak kendim için en önemli sonucu çıkarıyorum: Bu tahmin ediciler seti, modele fazla uyum sağlamaz - gelecekte yaklaşık olarak aynı tahmin hatasına sahip olacağım. . Bu, rastgele ormanlar , ada, SVM'nin farklı varyasyonları üzerinde test edilmiştir. Diğer modelleri denemedim.

 
birleştirici :

Ne kadar çok gürültü tahminciniz varsa, bunlardan birinin faydalı verilere benzer olması o kadar olasıdır.

Sanych'in yokluğuyla çok övünen bir ön eğitim

Andrey. Bu açıkça kabul edilmektedir. Tüm sonuçlar doğrulama üzerine yapılır. Tamamen gürültü tahmincisinin binlerce tahmin edilen ve bağımsız gözlem üretme şansı çok küçüktür, ihmal edilebilir. Sonuçlar ayrıca benimle yapılan doğru stat testleri ile kontrol edilir.

Gürültü çalışmalarından tahmin edicilerin seçimi .
 
Vladimir Perervenko : 2. rminer'da ltahmini işlevi - Girdi olarak 1 ileri tahminleri yinelemeli olarak kullanarak çok adımlı tahminleri gerçekleştirir. Birkaç adım ilerisini tahmin etmekten bahsetmişken, kesinlikle gerilemeyi mi kastediyorsunuz?

Evet, kendimi bilmiyorum)) Tahmin için tahmin edicilere sahip bir matris kullanarak birkaç adım ileriyi tahmin edecek böyle bir araca ihtiyacım var, nasıl bir tahmin yapacağı o kadar önemli değil, regresyon sadece zaman serisinin kendisini alır. bir girdi, bu bana uymuyor, tahmin edicilerle bir matris almam gerekiyor ...

"Öngörü" işlevine baktım, girdi olarak gerileme için bir zaman serisi alıyor, bu değil mi, yoksa bir şeyi yanlış mı anladım?

 
Dr.Tüccar :

Her gösterge bazı ek bilgiler taşır ve yalnızca yüzde biri değil, tümü yararlıdır. RSI için ">0,99'dan al, <0,01'den sat" diye bir strateji yok, bu talihsiz bir örnekti.

Evet, ne şaka yapıyorsun? Abarttığımı yazdım (olamayacak kadar sadeleştirdim) ve iki kere yazdım :) Yoksa sistem için 135 kurallı gerçek bir örnek versem daha mı iyi olur? Açıklamak istediklerim için bir kuralın fazlasıyla yeterli olmasına rağmen
 

Seçim temasına devam

Sorum şu: bir dizi değere sahip bir tahmincimiz var (birçoğundan biri), bunlardan 10 tane olsun

tahmin ediciyi bu aralıklara böleriz X1, X2....X10

tahmin edicideki her aralığın önemini bir şekilde hesaplayalım, şimdi nasıl olduğu önemli değil

belirli bir önem tablosu elde edeceğiz (hatırlayın, bunların hepsi alt öngörücülere bölünmüş gibi tek bir tahmin edicidir)

X1 = %0.5

X2 = %0.01

X3 = %0,003

X4 = %0,0033

X5 = %0,0013

X6 = %0,0039

X7 = %0,0030

X8 = - 0.0000%

X9 = - 0.0001%

X10 \u003d - %0,0002

sadece bir "X1" aralığının gerçekten güçlü bir etkiye sahip olduğunu görüyoruz, geri kalanının etkisi ya olumsuz ya da olumsuzdan yarım adım uzakta ve bu X2....X7 aralıklarının kendilerini göstereceği çok şüpheli. yeni verilerde daha iyi..

Soru :

daha iyi ne X1...X7 pozitif aralığının tamamını bırakın veya yalnızca şüphenin olmadığı, yani yalnızca X1 aralığını bırakın

Ve size bir kez daha hatırlatmama izin verin, bunun sadece bir tahminci tarafından yapılan seçim olduğunu, ancak bunun gibi 200 tahminciyi temizlerseniz? Algoritma hangi verilerde temizlenmiş verilerdeki yeni verileri daha iyi tanıyabilir veya tanıyamaz?

Bunun hakkında kim düşünüyor?

 
mytarmailS :

Seçim temasına devam

Sorum şu: bir dizi değere sahip bir tahmincimiz var (birçoğundan biri), bunlardan 10 tane olsun

tahmin ediciyi X1,X2....X10 aralıklarına ayıralım

tahmin edicideki her aralığın önemini bir şekilde hesaplayalım, şimdi nasıl olduğu önemli değil

belirli bir önem tablosu elde edeceğiz (hatırlayın, bunların hepsi alt öngörücülere bölünmüş gibi tek bir tahmin edicidir)

X1 = %0.5

X2 = %0.01

X3 = %0,003

X4 = %0,0033

X5 = %0,0013

X6 = %0,0039

X7 = %0,0030

X8 = - 0.0000%

X9 = - 0.0001%

X10 \u003d - %0,0002

sadece bir "X1" aralığının gerçekten güçlü bir etkiye sahip olduğunu görüyoruz, geri kalanının etkisi ya olumsuz ya da olumsuzdan yarım adım uzakta ve bu X2....X7 aralıklarının kendilerini göstereceği çok şüpheli. yeni verilerde daha iyi..

Soru :

daha iyi ne X1...X7 pozitif aralığının tamamını bırakın veya yalnızca şüphenin olmadığı, yani yalnızca X1 aralığını bırakın

Ve size bir kez daha hatırlatmama izin verin, bunun sadece bir tahminci tarafından yapılan seçim olduğunu, ancak bunun gibi 200 tahminciyi temizlerseniz? Algoritma hangi verilerde temizlenmiş verilerdeki yeni verileri daha iyi tanıyacak veya tanımayacak?

Bunun hakkında kim düşünüyor?

Ve deneyebilirsiniz. Bazen dağıtımların kuyrukları kaldırılır ve bazen yardımcı olur.