Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 453

 

Konu kahve telvesi falına kaydı - en azından bilimi cezbettiler, buna astroloji deniyor.


Neden saçma sapan şeyler yapıp her şeyi modelin girdisine bağlıyorsunuz? Sadece hedef değişkeni etkileyen tahmin edicileri almanın gerekli olduğu neredeyse yüz sayfa boyunca tartışılmış görünüyor. Her zaman veri madenciliği yapıyorum ve hiçbir zaman %40'tan fazla hataya sahip modellerim yok. Doğru, %30'dan daha az hataya sahip modellerde gergin. Ama asla %50 gibi bir rezalet değil.

 
San Sanych Fomenko :

Konu kahve telvesi falına kaydı - en azından bilimi cezbettiler, buna astroloji deniyor.


Neden saçma sapan şeyler yapıp her şeyi modelin girdisine bağlıyorsunuz? Sadece hedef değişkeni etkileyen tahmin edicileri almanın gerekli olduğu neredeyse yüz sayfa boyunca tartışılmış görünüyor. Her zaman veri madenciliği yapıyorum ve hiçbir zaman %40'tan fazla hataya sahip modellerim yok. Doğru, %30'dan daha az hataya sahip modellerde gergin. Ama asla %50 gibi bir rezalet değil.

Çünkü "atlar, insanlar, özellikler, hedefler, ZZ..." karıştı ve bir mumun rengini veya bir dönüşü bu tür frekanslarda (> 5 dakika) tahmin ettiyseniz, aynı şeyi elde edersiniz.

 
Dr. tüccar :

Deney. Peki ya farklı gbpusd, usdchf, usdrub ve diğer popüler sembolleri alıp eurusd'u tahmin etmek için kullanırsak?

İşte saldırıdaki 2 tablo, train.csv ve test.csv, içlerinde hedef bir sonraki çubuk için eurusd m5'in büyümesidir ve tahminciler audusdOpen[0]-audusdOpen[1], audusdOpen[2]- audusdOpen[3], audusdOpen[ 3]-audusdOpen[4], eurusdOpen[0]-eurusdOpen[1], eurusdOpen[1]-eurusdOpen[2], vb. Toplamda 12 sembol vardır, her birinden önceki 3 geçmiş çubuğun kazanımları alınır. Genel olarak, sütunların adıyla her şey açıktır.
Yaklaşık 7 hafta olan antrenman tablosunda 10.000 satır bulunmaktadır.

Bir modeli eğitmeye çalıştım, eğitim verilerinde r^2 = 0.0006164161 elde ettim ve hedefi ve sonuçları -1 ve 1 sınıflarına yuvarlarsak, doğruluk 0,5052'dir. Bu çok kötü. Ancak her eğitim örneği için düzinelerce çubuk ve kendileri için düzinelerce sembol almak gerçekçi değildir, modelim bu yüzlerce sütun üzerinde haftalarca eğitilecek.
Test tablosunda, model doğrulama sonuçları düştü, r^2 = -0.003390913 ve doğruluk 0.4907. Rastgele oldu, rastgele ve kaldı.

Ama hepsi sıkıcı ve anlamsız.
Modelin her bir tahminciye hangi ağırlıkları verdiğine baktığımda ilginç çıktı (ağırlık ne kadar yüksekse o kadar iyi):


Sonuç: eurusd'un bir sonraki m5 çubuğunda nereye gideceğini tahmin etmeye çalışmak, her şeyden önce audusd, usdrub, usdsgd kullanarak daha iyidir

Evet, sonuç boktan, ama dürüst, test eden kişi ilgili hakkaniyete sahip olacak ve bazı insanların ileriye dönük %30 ve Sharp oranı + -0.5, her şeyin 10 olması gerektiği zaman hatası olduğu gibi değil)))

Özellikleriniz çok kötü, en azından her enstrüman için katlanarak artan bir pencere (1,2,5,10,30,60...) ile birkaç geçmiş getiri var, bir dakikanızı almak daha iyi

 

Dürüst olmak gerekirse, uzun bir süre Yura Reshetov hakkında da böyle düşünmeye başladım. Bir şekilde ima etti, "Yakında buradan gideceğim." Hala çok şaşırdım, ilk başta belki bir yerde gizli bir organizasyonda işim olduğunu düşündüm, asla bilemezsin ... sonra site çalışmayı durdurdu vb. Yazık böyleyse dünya nur içinde yatsın.....

Aslında, işinin ciddiyeti yadsınamaz ..... Ama bana öyle geliyor ki, biraz bitirmedi ..... Sanırım yöntemini ve neyi tutturacağımı daha ayrıntılı olarak analiz edeceğim. buna ... genel olarak, göreceğiz .....

 
toksik :

Çünkü "atlar, insanlar, özellikler, hedefler, ZZ..." karıştı ve bir mumun rengini veya bir dönüşü bu tür frekanslarda (> 5 dakika) tahmin ettiyseniz, aynı şeyi elde edersiniz.


Burada benim için hiçbir şey karışık değil: asıl sorun veri madenciliği, ana işçilik maliyeti .... Ve burada entelektüel eğlence var.

 
San Sanych Fomenko :

Burada benim için hiçbir şey karışık değil: asıl sorun veri madenciliği, ana işçilik maliyeti .... Ve burada entelektüel eğlence var.

HFT tahminlerinde her şey son derece asil, veri setini ortaya koydum ve 10 dakika ve üzeri hiçbir şey yok, fiyatların kendisinde başka verilere, makrolara, haberlere vb. ihtiyacı var. fiyatın kendisinde, sıfır, kötü şöhretli verimlilik.

 
toksik :

HFT tahminlerinde her şey son derece asil, veri setini ortaya koydum ve 10 dakika ve üzerinde hiçbir şey yok, fiyatların kendisinde , başka verilere, makrolara, haberlere vb. ihtiyaç duyuyor. fiyatın kendisinde, sıfır, kötü şöhretli verimlilik.

Aksine sizinle aynı fikirde olmaya meyilli. Peki ya TA gibi işaretlere göre açılan ve düzenli ve zevkle kazanmalarını sağlayan insanlar ne olacak?

2 seçenek var: 1. onlar hüsnükuruntu ve tüm bunlar sadece la-la dili ve 2. hala tahmin değeri olan 10 dakikadan daha eski bir şey var.

 
toksik :

HFT tahminlerinde her şey son derece asil, veri setini ortaya koydum ve 10 dakika ve üzeri hiçbir şey yok, fiyatların kendisinde başka verilere, makrolara, haberlere vb. ihtiyacı var. fiyatın kendisinde, sıfır, kötü şöhretli verimlilik.

Ve HFT ticareti için çıkıyor? Bir sır değilse, doğal olarak ve "sarımsakla"...

 
Sihirbaz_ :

Beni korkutma, Mishka herkesi geride bırakmasına rağmen, uzun zamandır Vova ile onlara gülüyorum)))
Girişi parlatmayın ve tartışmayın, kendinize izin verin)))


Şey... yine de..... Kıpırdamayacaksın, kim mantıklı bir şey sunacak ki... Köşeden bakınca güldüğünü görüyorum.... Sana ne faydası var???

Muhtemelen benimkiyle aynı. Hiçbir şey .... Ama en azından komikim :-)

 
Sihirbaz_ :

üzgünüm öğretmenim


Pekala, tamam... Sana kızgın değilim..... Sadece merak ediyorum, peki, tamamen teorik olarak... Deney uğruna. Veri setimi tekrar atacağım, 3 vadeli yani neredeyse 9 aylık veriyi etkileyecek, ona dayalı bir model oluşturacak ve bir tür hüküm vereceksiniz. İdeal olarak, modelinizi bilgisayarımda çalıştırmak isterdim, ama gerçekten ısrar etmiyorum ..... Sadece merak ediyorum ....

Ne olmuş??? Yayılmış?