Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2634

 

Biraz daha yarı-felsefe. Önyargı ve varyans arasındaki değiş tokuş, model karmaşıklığını her zaman sınırlayacaktır. Bu nedenle, modelin tüm tahmin ediciler kümesinde iyi performans göstereceğinden asla emin olamaz. Buna göre görev, bu modelin çalışma alt kümesini belirlemektir. Doğru anladıysam, Maxim'in son zamanlarda yazdığı şey tam olarak buydu (yaklaşık iki model). Bu, "sürekli piyasada olmaya çalışmanıza gerek yok" şeklindeki eski düşünceye çok iyi uyuyor.

Tüm bunları tek bir modelde birleştirmeye çalışmak güzel olurdu. Örneğin, böyle bir fikir (aleksey Vyazmikin'in biraz benzer bir fikri vardı) - her bir tahminciyi bölümlere ayırıyoruz, bu da tüm tahmin edici setinin çok boyutlu küplere bölünmesini sağlıyor. Sonra tüm bu küplerden bir dizi uygun olanı seçiyoruz. Büyük bir boyutla, bu problem birleşimsel olarak çözülemez olacak, ancak bunu Rand ormanına benzeterek yapabilirsiniz - rastgele düşük boyutlu tahmin kümeleri seçin. Her tahmin edici için ilk bölümlere ayırma, eşitliği (anlaşmalar zamana göre değil, bu tahmin ediciye göre sıralandığında) monoton parçalara bölerek yapılabilir.

Tüm bunları çapraz doğrulama (ileri) ve olması gereken her şeyle tamamlayın) Belki de tamamen saçmalık olmadığı bile ortaya çıkacaktır) Eh, ya da birileri zaten benzer bir şey yaptı.

 
Mikhail Mishanin # :
Faydalı makale.
https://habr.com/ru/company/ods/blog/544208/
Şapka. Farklı stat testlerinden Solyanka
 
Maxim Dmitrievsky # :
Şapka. Farklı stat testlerinden Solyanka

Bunu yansıtmak / anlamak için bir konu olarak

Korelasyon != Nedensellik

1-4.

Ve her durumda testleri yapmak için. Ve böylece makale neredeyse reklam veriyor)

 
Mikhail Mishanin # :

Bunu yansıtmak / anlamak için bir konu olarak

Korelasyon != Nedensellik

1-4.

Ve her durumda testleri yapmak için. Ve böylece makale neredeyse reklam veriyor)

Aynı olduğunu kim söyledi. Yanlış bir beyanda bulunmak, sonra onu reddetmek gibi
 
Sentetik verilerde kalıp aramanın mümkün olup olmadığını merak ediyorum. Açıklamama izin verin - 100-200 gözlemlik küçük bir örneklemden, dağılımlarından çok sayıda sentetik veri üretin ve orada zaten bir tür karmaşık diziler arayın, vb.
 
mytarmailS # :
Sentetik verilerde kalıp aramanın mümkün olup olmadığını merak ediyorum. Açıklamama izin verin - 100-200 gözlemlik küçük bir örneklemden, dağılımlarından çok sayıda sentetik veri üretin ve orada zaten bir tür karmaşık diziler arayın, vb.
Mantıken hayır.
 
Valeriy Yastremskiy # :
Mantıken hayır.
Niye ya?
 
mytarmailS # :
Niye ya?

mantıksal olarak :-)

PS/ çok az veri var ve bunlar ohlc'ye ve hatta bireysel ölçümlere göre hadım ediliyor

PPS / ancak böyle düzenli örnekler alırsanız, tamamen farklı bir patiska. İzle / ara - işte ortak noktaları olan bir şablon paketi. Burada, her parçanın boyutu büyük olmayabilir ve bunların toplam sayısı da olabilir. Takım oluştururken ana kalıbı belirttiğiniz için

 
Bu ne anlama geliyor - düzenli bu tür örnekler?