Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3009

 
СанСаныч Фоменко #:
Ancak en önemlisi, mevcut özelliklerin tahmin gücünün gelecekte değişmediğine veya zayıf bir şekilde değiştiğine dair teorik bir kanıt olmalıdır. Buharlı silindirin tamamında en önemli şey budur.

Ne yazık ki kimse bunu bulamadı, aksi takdirde burada değil tropik adalarda olurdu))))

SanSanych Fomenko #: Bence model son derece küçük bir rol oynamaktadır, çünkü özelliklerin tahmin yeteneğinin istikrarı ile hiçbir ilişkisi yoktur: tahmin yeteneğinin istikrarı "öğretmen-özellik" çiftinin bir özelliğidir.

Evet. 1 ağaç veya regresyon bile, eğer varsa ve değişmiyorsa bir örüntü bulabilir.

SanSanych Fomenko #:

1. 20'den daha az sınıflandırma hatası olan bir öğretmen-özellik çiftine sahip olan başka biri var mı?

Çok kolay. Düzinelerce veri kümesini oluşturabilirim. Şu anda TP=50 ve SL=500'ü araştırıyorum. Öğretmenin işaretlemesinde ortalama %10 hata var. 20 olursa erik modeli olur.
Yani mesele sınıflandırma hatasında değil, tüm kar ve zararların toplanması sonucu ortaya çıkan sonuçta.

Gördüğünüz gibi, en iyi model %9,1'lik bir hataya sahip ve %8,3'lük bir hata ile bir şeyler kazanabilirsiniz.
Grafikler sadece haftada bir yeniden eğitim ile Walking Forward tarafından elde edilen OOS'u göstermektedir, 5 yıl boyunca toplam 264 yeniden eğitim.
Modelin %9,1'lik bir sınıflandırma hatası ile 0'da çalışması ilginçtir ve 50/500 = 0,1, yani %10 olmalıdır. Görünüşe göre %1 spread'i yedi (çubuk başına minimum, gerçek olan daha büyük olacaktır).

 

Öncelikle modelin içinin çöplerle dolu olduğunu fark etmelisiniz...

Eğer eğitimli bir ahşap modeli içindeki kurallara ve bu kuralların istatistiklerine ayırırsanız.

:

     len  freq   err                                                                                 condition pred
315    3 0.002 0.417    X[,1]>7.49999999999362e-05 & X[,2]<=-0.00026499999999996 & X[,4]<=0.000495000000000023    1
483    3 0.000 0.000     X[,1]<=0.000329999999999941 & X[,8]>0.000724999999999976 & X[,9]>0.000685000000000047    1
484    3 0.002 0.273      X[,1]>0.000329999999999941 & X[,8]>0.000724999999999976 & X[,9]>0.000685000000000047   -1
555    3 0.001 0.333   X[,5]<=0.000329999999999941 & X[,7]>0.000309999999999921 & X[,8]<=-0.000144999999999951   -1
687    3 0.001 0.250 X[,2]<=-0.00348499999999996 & X[,7]<=-0.000854999999999939 & X[,9]<=-4.99999999999945e-05    1
734    3 0.003 0.000    X[,7]>-0.000854999999999939 & X[,8]>0.000724999999999865 & X[,9]<=0.000214999999999965    1
1045   3 0.003 0.231   X[,1]<=-0.000310000000000032 & X[,4]>0.000105000000000022 & X[,4]<=0.000164999999999971   -1
1708   3 0.000 0.000    X[,3]>0.00102499999999994 & X[,6]<=0.000105000000000022 & X[,7]<=-0.000650000000000039    1
1709   3 0.002 0.250     X[,3]>0.00102499999999994 & X[,6]<=0.000105000000000022 & X[,7]>-0.000650000000000039   -1
1984   3 0.001 0.000     X[,1]<=0.000329999999999941 & X[,8]>0.000724999999999976 & X[,9]>0.000674999999999981    1
2654   3 0.003 0.000        X[,4]<=0.00205000000000011 & X[,5]>0.0014550000000001 & X[,9]<=0.00132999999999994    1
2655   3 0.000 0.000         X[,4]<=0.00205000000000011 & X[,5]>0.0014550000000001 & X[,9]>0.00132999999999994   -1
2656   3 0.001 0.200         X[,3]<=0.00245499999999998 & X[,4]>0.00205000000000011 & X[,5]>0.0014550000000001   -1
2657   3 0.000 0.000          X[,3]>0.00245499999999998 & X[,4]>0.00205000000000011 & X[,5]>0.0014550000000001    1
2852   3 0.000 0.000                X[,2]<=-0.001135 & X[,8]>-0.000130000000000075 & X[,8]>0.00128499999999998   -1
2979   3 0.001 0.200     X[,1]>0.000930000000000097 & X[,1]>0.00129000000000012 & X[,8]<=-0.000275000000000025   -1


ve kural hatasının örneklemde ortaya çıkma sıklığına bağımlılığını analiz ederseniz.


elde ederiz


O zaman bu alanla ilgileniyoruz


Kuralların çok iyi işlediği, ancak o kadar nadir görülürler ki, bunlara ilişkin istatistiklerin gerçekliğinden şüphe etmek mantıklıdır, çünkü 10-30 gözlem istatistik değildir

 
mytarmailS #:

Öncelikle modelin içinin çöplerle dolu olduğunu fark etmelisiniz...

Eğitimli bir ahşap modeli, içindeki kurallara ve bu kurallara ilişkin istatistiklere ayrıştırırsanız.

gibi:

ve err kuralının hatasının örneklemde meydana gelme sıklığına olan bağımlılığını analiz edin

elde ederiz

Son gönderilerin karanlığında sadece bir güneş ışığı
Modelin hatalarını düzgün bir şekilde ayrıştırırsanız, ilginç bir şey bulabilirsiniz. Çok hızlı bir şekilde ve herhangi bir gpu, sms ve kayıt olmadan kabul edeceğiz.
 
Maxim Dmitrievsky #:
Son gönderilerin karanlığında sadece bir güneş ışığı
Model hatalarını düzgün bir şekilde ayrıştırırsanız, ilginç bir şey bulabilirsiniz. Çok hızlı bir şekilde ve herhangi bir gpu, sms ve kayıt olmadan kabul edeceğiz.

eğer varsa, bununla ilgili bir makale olacak.

 
mytarmailS #:

Eğer varsa, bununla ilgili bir makale olacak.

Norm, son makalem de aynı şey hakkındaydı. Ama sizin yönteminiz daha hızlıysa, bu bir artı.
 
Maxim Dmitrievsky #:
Norm, son makalem de aynı şey hakkındaydı. Ama sizin yönteminiz daha hızlıysa, bu bir artı.

Ne demek daha hızlı?

 
mytarmailS #:

Ne demek daha hızlı?

Hız açısından.
 
Maxim Dmitrievsky #:
Hız açısından.

5 km'lik bir örnekte yaklaşık 5-15 saniye

 
mytarmailS #:

5 km'lik bir örnekte yaklaşık 5-15 saniye.

Başlangıçtan TC'yi almaya kadar olan tüm süreci kastediyorum.

Birkaç kez yeniden eğitilen 2 modelim var, bu yüzden çok hızlı değil, ama kabul edilebilir.

Ve sonunda tam olarak neyi elediklerini bilmiyorum.

 
Maxim Dmitrievsky #:

Yani, başlangıçtan TC'yi almaya kadar olan tüm süreç.

Birkaç kez yeniden eğitilen 2 modelim var, bu yüzden çok hızlı değil ama kabul edilebilir

ve sonunda, tam olarak neyi taradıklarını bilmiyorum.

5 bin tren.

Geçerli 60k.


model eğitimi - 1-3 saniye

kural çıkarma - 5-10 saniye

her kuralın (20-30 bin kural) geçerliliğini kontrol etmek 60k 1-2 dakika


Elbette her şey yaklaşıktır ve özelliklerin ve verilerin sayısına bağlıdır