Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1012

 
Alexey Panfilov :

Çok ilginç, ama bana tahmin yeteneğinin ölçümü hakkında daha fazla bilgi verebilir misiniz?

Ve hepsinden önemlisi, nasıl ölçülür?

Yazdım, grafikler verdim, kod yazdım - ustalar her şeyi bu 1000 sayfaya gömdüler ...

Tekrarlamak için çok tembel. Burada en çok vtreat kullanılıyor, ben kullanmıyorum. Ana şey, bu konu hakkında düşünmek ve diğer her şeyi atmak.

 
Alexey Vyazmikin :

Yani ZZ'de hangi ayarların olması gerektiği sorusunu gündeme getirmediniz?

ZZ parametresi, her enstrüman ve zaman dilimi için farklıdır. Örneğin, EURUSD M15 için iyi bir başlangıç değeri 15 piptir (4 basamak). Ayrıca, kullandığınız tahmin edicilere de bağlıdır. İyi için, tahmin edici parametreleri ve ZZ parametresini birlikte optimize etmek gerekir. Bu nedenle, parametrik olmayan tahmin edicilere sahip olmak arzu edilir, yaşam büyük ölçüde basitleştirilmiştir. Bu kapasitede dijital filtreler iyi sonuçlar vermektedir. Toplulukları ve basamaklamayı kullanarak ortalama bir Doğruluk = 0,83 elde ettim. Bu çok iyi bir sonuç. Yarın doğrulama için sürecin açıklandığı bir makale göndereceğim.

İyi şanlar

 
Vladimir Perervenko :

ZZ parametresi, her enstrüman ve zaman dilimi için farklıdır. Örneğin, EURUSD M15 için iyi bir başlangıç değeri 15 piptir (4 basamak). Ayrıca, kullandığınız tahmin edicilere de bağlıdır. İyi için, tahmin edici parametreleri ve ZZ parametresini birlikte optimize etmek gerekir. Bu nedenle, parametrik olmayan tahmin edicilere sahip olmak arzu edilir, yaşam büyük ölçüde basitleştirilmiştir. Bu kapasitede dijital filtreler iyi sonuçlar vermektedir. Toplulukları ve basamaklamayı kullanarak ortalama bir Doğruluk = 0,83 elde ettim. Bu çok iyi bir sonuç. Yarın doğrulama için sürecin açıklandığı bir makale göndereceğim.

İyi şanlar

Son derece ilginç. Bekleriz.

 
Kâse :

Teklifin satırlarını paylaşıp 2004'e sorarsanız güncel tarihe göre deneyeceğim, genellikle 1-3 yıl çalışıp %20-30'luk bir sınava giriyorum.

veri kümesi, lern ve testin yanı sıra dukas'tan ilk satırlar

Güzel bir eğri :) Ama kimsenin ilgisini çekmesi pek olası değil, ne tür bir yazılım, bu eğriyi nasıl hesapladığınız belli değil. Veri kümelerinizde, %52'den biraz daha fazla doğruluk elde ettim, bu arada, oradaki işaretçileriniz özelliklerden önce tükendi, onları evde kestim. Öğrenciyi ve testi aldığınız daha fazla indirim fiyatı eklemeniz gerekir, böylece daha sonra sınıflandırıcının sonucunu geriye dönük test cihazında çalıştırabilirsiniz.

Not: Aslında, herhangi bir test verim eğrisi ve ortaya çıktığı gibi, sınıflandırma / regresyon kalitesine ilişkin raporlar halka hiçbir şey kanıtlayamaz. Kısa bir süre önce, kapalı bir algo-tüccar grubunda, örneğin C++ dll'de pişirilmiş hazır modelleri değiştirmek için bir arayüz üzerinde anlaşmaya varmak için ilginç bir fikir ortaya çıktı (ki şu ya da bu şekilde tüm algo tüccarları ve makine- öğrenenler, girdi olarak bir miktar json, geçmiş satır paketi alan ve daha sonra yeni verilerle (mumlar, keneler, takanlar, vb.) Kısacası, fikrin özü, veri olduğunda test cihazında gelecek geldiğinde kontrol edilebilecek bazı standartlaştırılmış "kara kutuları" değiş tokuş etmektir. Modelin çalışıp çalışmadığını anlamanın tek yolu bu, peki, web api'yi de kullanabilirsiniz, ancak bunun için vpn tutmak hemoroid vb. özellikle çok sayıda model varsa. Ve böylece tüm bu rakamlar doğruluk, Keskin oran vb. çok az şey, bilinçli olarak uymamanın 100.500 yolu var ve bilinçli olarak ve hiç kimse bunu anlamayacak kadar, daha sağlam kanıtlara ihtiyaç var.

 
Maksim Dmitrievski :

Bir sınıflandırmanız varsa, göreli bir sınıflandırma hatası veya logloss (çapraz entropi) aracılığıyla değerlendirebilirsiniz, eğer regresyon ise rmse uygundur. Ayrıca trende hata farkını ölçebilir ve test edebilir ve en küçük farkı elde edebilirsiniz.

Sadece ayarlar, trende, doğrulama ve testte tahmin edilen sınıflara göre yaklaşık olarak aynı bölüm olacak şekilde seçilir.

Bütün bunların nedeni, orman, sığ ağaçlarla bile kolayca yeniden eğitilebilir ve eğer ağaçlar çarşafları temizlemek için yaratılırsa, o zaman daha büyük bir olasılıkla yeniden eğitim olacaktır.

Ve nasıl önlenir? Eh, burada yine "çöpte çöp dışarı" başlayacak. Genel olarak, doğada önemsiz olmayan tahmin ediciler var mı?

Teoride, ROC_AUC alınır ve tahmin edicide değerli bir şey varsa, değerin yatay eksen boyunca büyümesi durmalıdır. Ama her yeri aradığımda hiçbirini bulamadım.

Kesinlikle düz bir çizgi yukarı doğru çizilir.

Ama öte yandan tarihe göre tek bir gösterge bile piyasayı bu şekilde yönlendirmez tabii ki evet)

SVM pahasına, çok uzun, onunla birçok kez test etmeye başladım, ancak bir şekilde özellikle etkilenmedim, ayrıca yavaşlıyor ve onu tam olarak keşfetmeme izin vermiyor.

 
forexman77 :

Sadece ayarlar, trende, doğrulama ve testte tahmin edilen sınıflara göre yaklaşık olarak aynı bölüm olacak şekilde seçilir.

Bütün bunların nedeni, orman, sığ ağaçlarla bile kolayca yeniden eğitilebilir ve eğer ağaçlar çarşafları temizlemek için yaratılırsa, o zaman daha büyük bir olasılıkla yeniden eğitim olacaktır.

Ve nasıl önlenir? Eh, burada yine "çöpte çöp dışarı" başlayacak. Genel olarak, doğada önemsiz olmayan tahmin ediciler var mı?

Teoride, ROC_AUC alınır ve tahmin edicide değerli bir şey varsa, değerin yatay eksen boyunca büyümesi durmalıdır. Ama her yeri aradığımda hiçbirini bulamadım.

Kesinlikle düz bir çizgi yukarı doğru çizilir.

Ama öte yandan tarihe göre tek bir gösterge bile piyasayı bu şekilde yönlendirmez tabii ki evet)

eğer geçerliyse. bölüm hata trendeki ile aynı, o zaman her şey çalışmalı. yapmadığın çok açık

 
Maksim Dmitrievski :

eğer geçerliyse. bölüm hata trendeki ile aynı, o zaman her şey çalışmalı. yapmadığın çok açık

Tam olarak aynı değil, yakın. Tamamen aynılarsa, o zaman bu ağaç üç derindir, bir resim verdi.

Testi az çok gösteren Derinlik 15 seçilir.

Yaklaşık 20 dakika içinde sınıf bölümünü yayınlayacağım.

 

Derinlik üç:

[[ 8010 7122 ]
 [ 7312 8410 ]]
трайн наоборот

[[ 8026 7105 ]
 [ 7209 8512 ]]
трайн 

[[ 5538 5034 ]
 [ 5117 5395 ]]
предсказание по обученной модели на трайн, эти данные не участвовали в обучении.
Поясню данные для теста берутся не из не использованных выборок, это данные, которые вообще не доступны для
алгоритма в процессе обучения(находятся вне временного промежутка участка обучения).

Derinlik 15:

[[ 7667 7464 ]
 [ 7227 8494 ]]
трайн наоборот

[[ 14430    702 ]
 [   661 15061 ]]
трайн 

[[ 5405 5167 ]
 [ 4958 5554 ]]
тест

Aynı zamanda, 15 derinliği açıkça yeniden eğitime yol açsa da, ileri onunla daha iyidir. Ayrıca elimdeki diğer modellerde. Güçlü aşırı takma olmadığında.

Forvet:

on beş

3

İstenen sınıfın etiketlerini negatif olandan %4-6 daha fazla tahmin ettiği ortaya çıkıyor..

 
Zhenya :

Güzel bir eğri :) Ama kimsenin ilgisini çekmesi pek olası değil, ne tür bir yazılım, bu eğriyi nasıl hesapladığınız belli değil. Veri kümelerinizde, %52'den biraz daha fazla doğruluk elde ettim, bu arada, oradaki işaretçileriniz özelliklerden önce tükendi, onları evde kestim. Öğrenciyi ve testi aldığınız daha fazla indirim fiyatı eklemeniz gerekir, böylece daha sonra sınıflandırıcının sonucunu geriye dönük test cihazında çalıştırabilirsiniz.

Not: Aslında, herhangi bir test verim eğrisi ve ortaya çıktığı gibi, sınıflandırma / regresyon kalitesine ilişkin raporlar halka hiçbir şey kanıtlayamaz. Kısa bir süre önce, kapalı bir algo-tüccar grubunda, örneğin C++ dll'de pişirilmiş hazır modelleri değiştirmek için bir arayüz üzerinde anlaşmaya varmak için ilginç bir fikir ortaya çıktı (ki şu ya da bu şekilde tüm algo tüccarları ve makine- öğrenenler, girdi olarak bir miktar json, geçmiş satır paketi alan ve daha sonra yeni verilerle (mumlar, keneler, takanlar, vb.) Kısacası, fikrin özü, veri olduğunda test cihazında gelecek geldiğinde kontrol edilebilecek bazı standartlaştırılmış "kara kutuları" değiş tokuş etmektir. Modelin çalışıp çalışmadığını anlamanın tek yolu bu, peki, web api'yi de kullanabilirsiniz, ancak bunun için vpn tutmak hemoroid vb. özellikle çok sayıda model varsa. Ve böylece tüm bu rakamlar doğruluk, Keskin oran vb. çok az şey, bilinçli olarak uymamanın 100.500 yolu var ve bilinçli olarak ve hiç kimse bunu anlamayacak kadar, daha sağlam kanıtlara ihtiyaç var.

Orada, eğitim ve test veri örneklerinin başında, azalan sıfır özellik demetleri var, muhtemelen bunları hesaplamak için yeterli geçmiş yoktu ve algoritma bunu kontrol etmedi, bu yüzden doğru işlem için silinmeleri gerekiyor.

Ve bu grup bir sır değilse nerede ve oraya bakmak mümkün mü?

 
forexman77 :

Derinlik üç:

Derinlik 15:

Aynı zamanda, 15 derinliği açıkça yeniden eğitime yol açsa da, ileri onunla daha iyidir. Ayrıca elimdeki diğer modellerde. Güçlü aşırı takma olmadığında.

Forvet:

on beş

3


Bana öyle geliyor ki, her çubukta olduğu gibi anlaşma sayısını azaltmanız gerekiyor..