Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 86

 
Michael Marchukajtes :

Peki, diyelim ki karıştırdı ve ikiye böldü, eğitim ve test örneklerinde her iki sınıftan aynı sayıda olacağı ortaya çıktı, değil mi?

Örneklemdeki her iki sınıfın örnek sayısı aynı değilse, test kısmında da aynı olmayacaktır. Örnekler yalnızca temsili olmayan bir sınıf için ikiye bölünecektir: bunların yarısı eğitim bölümüne, ikinci yarısı ise test bölümüne düşecektir. Eğitim bölümünde, en temsili sınıfın, daha az temsili sınıfın tam olarak aynı sayıda örneği olacaktır. Ve örneğin eğitim bölümüne girmeyen en temsili sınıfın kalan örnekleri test bölümüne düşecektir.

Sonuç olarak, erken sürümlerde hiç dengeleme yoktu. Orada, numune PRNG ile karıştırıldı ve üç parçaya bölündü: örneklerin yarısı eğitime, yarısı teste. Sonra her iki sınıfın da örneklerinin çok dengesiz olduğu bir örnekle karşılaştım. En temsili sınıfın genelleme yeteneğinde mükemmel sonuçlara sahip olduğu, daha az temsili sınıfın ise kaidenin altında olduğu oldukça açıktır. Bu tür rezaletlerden kurtulmak için ayırıcı algoritmaya dengeleme eklemek zorunda kaldım.

 
Ve değil ... her şey yolunda .... yanlış alarm :-)
 
San Sanych Fomenko :
Tahmin edicilerin listesi gürültü tahmin edicilerinden temizlenmediği için model yeniden eğitildi. Bu bir öğreticidir ve kasıtlıdır. O yüzden bu kadar emin konuşuyorum

Hakkında düşündüm.
Orman verileri hatırlar, bu bir gerçektir ve ağaçlar büyüdükçe hatırlamak için daha fazla "hafıza kapasitesi" olacaktır. Ancak yeteri kadar fazla sayıda ağaç olmasına rağmen yine de %100 doğruluk sağlayamıyorsa, eğitim verilerinde çelişkili örnekler vardır. Tahmin edicilerin değerlerinin tamamen aynı olduğu ancak farklı sınıflara sahip olduğu bazı eğitim örnekleri seti. Bu tür veriler, eğitim verilerinde bile asla %100 tahmin edilemez. Modelin tam olarak öğrenemeyeceği, sadece yeterli veriye sahip olmadığı ve bu da yeniden eğitim olasılığını azalttığı ortaya çıktı.
Eğitim örneklerinin tutarsızlığı, bir hatadan bile değil, %100 doğruluk elde edilmesini sağlayabilecek bazı öngörücülerin özel olarak kaldırılmasından kaynaklanmaktadır. Ancak onsuz, yeni verilerle ilgili tahminler daha iyi olacak.
Buna dayanan çok ilginç bir kural, eğitimden ve modellerin çapraz doğrulamasından önce bile bazı kümeleri atmak için bir dizi tahmincinin ön tahmini için bazı basit yöntemler yapabilirsiniz.

 

Merhaba!

1) Dediğinden bir şey deneyen var mı? sonuç var mı

2) Test stratejilerini doğrudan R'de deneyen var mı? Oldukça ilkel olan R-ke'de ticareti simüle etmem gerekiyor, ancak duraklar ve diğer küçük şeyler var, bunu mümkün olduğunca basit ve hızlı bir şekilde yapmanıza izin verecek bir tür araç var mı?

 
Yuri Reshetov :

Tarihsel veriler biçimindeki gerçek hacimleri nereden alabilirim? MetaTrader yalnızca "hacimler" adı verilen bir onay sayacı sağlar. Ayrıca, farklı mutfaklarda, bu tür sayaçların değerleri büyüklük sıralarına göre değişebilir.

...

Tik hacimleri sadece farklı mutfaklarda değil, birinde bile farklılık gösterir. Bazen adımı doğrudan görebilirsiniz, burada yoğun bir dere vardı, sonra bam seyrekleşti.

Bunun nedeni, işlem içindeki kene filtresinin değişmesidir.

İşte ilginç bir soru: Gerçek hacimler ile kene hacimleri arasında bir korelasyon var, tik hacimleri ile çubuk boyutu arasında da bir korelasyon var, bu gerçek hacimler ile çubuk boyutu arasında bir korelasyon olduğu anlamına mı geliyor?

 
Nikolay Demko :

bu, gerçek hacimler ve çubuk boyutu arasında bir korelasyon olduğu anlamına mı geliyor?

kesinlikle
 
mytarmailS :
kesinlikle
Hacim ve çubuk arasındaki harmanlama ne anlama geliyor? Hacim yüksek olabilir ve mumun gövdesi ve sakalı eksik olabilir. Hacim küçük ve mum büyüdü... her şey piyasanın o andaki durumuna bağlıdır....
 
Michael Marchukajtes :
Hacim ve çubuk arasındaki harmanlama ne anlama geliyor? Hacim yüksek olabilir ve sakalın yanı sıra mumun gövdesi de olmayabilir. Hacim küçük ve mum büyüdü.... hepsi piyasanın o anki piyasa durumuna bağlı ....

:)

Cevap verirken, vadeli işlemler olan oldukça likit piyasalardan bahsettiğimizi varsaydım - döviz piyasaları, sanırım burada kimse hisse senedi ticareti yapmıyor

http://prntscr.com/c10p51

Şek. 100 büyüklüğünde bir kayan pencerede korelasyon, volatiliteye karşı hacim, hatırladığım kadarıyla, 0,6'dan büyük bir değer zaten önemli bir pozitif korelasyon olarak kabul ediliyor

Скриншот
Скриншот
  • prnt.sc
Снято с помощью Lightshot
 
mytarmailS :

Belki birisi ilgilenir, ticareti simüle edebileceğiniz ve quantstrat adlı ticaret sistemleri oluşturabileceğiniz bir paket buldum.

http://www.rinfinance.com/agenda/2013/workshop/Humme+Peterson.pdf

repost, uçmuş olabilir

ve başka bir faydalı bağlantı http://www.r-programming.org/papers

Yoksa bu paketler kimseyi ilgilendirmiyor mu? ilgilenmiyorsa neden olmasın Kimin modellerini nasıl ve nerede test ettiğini merak ediyorum.

 
mytarmailS :

repost, uçmuş olabilir

ve başka bir faydalı bağlantı http://www.r-programming.org/papers

Yoksa bu paketler kimseyi ilgilendirmiyor mu? ilgilenmiyorsa neden olmasın Kimin modellerini nasıl ve nerede test ettiğini merak ediyorum.

Tüm paketler (modeller) iki kategoriye ayrılabilir:

  • temelde uygun
  • temelde uygun değil.

"Prensip olarak uygun" olan paketlerin etkinliği yaklaşık olarak aynıdır, farklar önemli değildir.

Tüm problemler modelde değil, tahmin ediciler setinde ve ön hazırlıklarındadır. Belirli bir tahmin ediciler seti alırsak, fazla UYMAYAN bir model oluşturma yeteneği ve hatanın büyüklüğü, modeldeki değişime çok az bağlıdır. Bu nedenle, “prensipte uygun” olanlardan en basit ve en hızlı modeli almak gerekir.

not.

Kendi deneyimimden. Benim için, bir TS oluşturmadaki karmaşıklığın %75'inden fazlası, belirli bir hedef değişken için böyle bir set seçmek mümkünse, tahmin edicilerin seçimidir.