Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1354

 
Yuri Asaulenko :

Arşivleri saklayın. Eki görmek.

Learn.csv - girdiler. Her satırdaki ilk hane geçmişe bir bağlantıdır, silinmesi gerekir.

Cell.scv - hedef.

Bu veriler üzerinde eğitim aldıktan sonra, bu grafik gibi bir şey elde etmelisiniz.

Filtre yaklaşık olarak ЕМА(16), tahmine karşılık gelir - 5 dak.

ZY Testi o zaman, gerektiğinde yapacağım.

Bu grafiğin sizin için hangi örnek üzerinde ortaya çıktığı tam olarak belli değil - eğitimde mi yoksa testte mi?

İşte testte CatBoost - 100 son değer.

Sapmaların histogramı

Eğitim için 4000, doğrulama için 2000 ve test için 100 satır aldım. Eğitimli 1000 ağaç derinliği 6, RMSE formülü ( Poisson ile değiştirildi).

Bir örnek ve ayarlar ekliyorum, oynatma için CB'yi indirmeniz ve Kurulum dizinine koymanız gerekiyor.

Eğitim örneğinde, dağılım da sizinkine benzemiyor.

Eklendi: Modeli doğru kullanmıyorum - olasılık grafiklerinde ortaya çıktı...

Dosyalar:
Setup.zip  587 kb
 
Alexey Vyazmikin :

Bu grafiğin sizin için hangi örnek üzerinde ortaya çıktığı tam olarak belli değil - eğitimde mi yoksa testte mi?

İşte testte CatBoost - 100 son değer.

Sapmaların histogramı

Eğitim için 4000, doğrulama için 2000 ve test için 100 satır aldım. Eğitimli 1000 ağaç derinliği 6, RMSE formülü.

Bir örnek ve ayarlar ekliyorum, oynatma için CB'yi indirmeniz ve Kurulum dizinine koymanız gerekiyor.

Eğitim örneğinde, dağılım da sizinkine benzemiyor.

Grafiğim yalnızca tüm örnek üzerinde eğitim. Bu testi yapmadı. Eğitimle hemen hemen aynı olacak.
Negatif değerler x ekseni grafiğinde nereye gitti? Ve x aralığı y ile aynı değil mi? Bunun gibi?
Tahmin ve gerçek değerleri (hedef) karşılaştıran bir grafiğim var. Dağıtım yok.
 
Yuri Asaulenko :
Grafiğim yalnızca tüm örnek üzerinde eğitim. Bu testi yapmadı. Eğitimle hemen hemen aynı olacak.
Negatif değerler x ekseni grafiğinde nereye gitti? Ve x aralığı y ile aynı değil mi? Bunun gibi?
Öngörülen ve gerçek değerleri karşılaştıran bir grafiğim var.

Evet daha önce regresyon ile ilgilenmedim, birçok belirsiz uygunluk fonksiyonu var, sınıflandırmadan farklı olarak farklı sonuçlar veriyorlar ve yanlış değer almışım.

İşte test örneğinde ortaya çıktı

Ama eğitimde - 4000 satır

Test numunesi için sapmaların histogramı

İşte 3 örnek için genel grafik

Test setinde eğitim almak için kullanılan metrik

250 yinelemede eğitimi durdurmanın mümkün olduğunu söylüyor - model yeniden eğitildi.

 
Alexey Vyazmikin :

Evet daha önce regresyon ile ilgilenmedim, birçok belirsiz uygunluk fonksiyonu var, sınıflandırmadan farklı olarak farklı sonuçlar veriyorlar ve yanlış değer almışım.

İşte test örneğinde ortaya çıktı

Ama eğitimde - 4000 satır

Test numunesi için sapmaların histogramı

İşte 3 örnek için genel grafik

Tamam gibi. Testte de., Yeniden eğitilmiş olmasına rağmen.)
 
Yuri Asaulenko :
Tamam gibi.

Evet, istersen geliştirebilirsin - sadece regresyon modelleriyle deneyimim yok.

Yani ana öngörücüler çalışan araçlardır :)

Ayarlarla birlikte son sürüm eklendi - farklı Seed ile 10 modeli eğitir

Dosyalar:
Setup.zip  588 kb
 
Alexey Vyazmikin :

Evet, istersen geliştirebilirsin - sadece regresyon modelleriyle ilgili deneyimim yok.

Yani ana öngörücüler çalışan araçlardır :)
Girişte ölçekli bir fiyat aralığı var. - 20 yakın değer, hepsi bu. Bu, tahmin edicilerle ilgili değil, sorunu belirlemeyle ilgili - çözülebilir. Ve ormanınız tahmin edicilerle gelecek.)
 
Yuri Asaulenko :
Girişte ölçekli bir fiyat aralığı var. - 20 yakın değer, hepsi bu. Bu, tahmin edicilerle ilgili değil, sorunu belirlemeyle ilgili - çözülebilir. Ve ormanınız tahmin edicilerle gelecek.)

Evet, mesele sorunun formülasyonunda, burada katılıyorum. Sadece fiyatı turtaların yapıldığı hamur olarak düşünmüyorum ve bu turtaların şekli için tahmin edicilere ihtiyaç var.

 
Maksim Dmitrievski :

Modeli geliştirebilecek klasik tekniklerden biri. Daha doğrusu, en uygun olanı bulun. Monte Carlo'nun orijinal uygulaması.

https://en.wikipedia.org/wiki/Importance_sampling

Oluşunuzda bu yöntemi kullanmadınız mı?

 
Maksim Dmitrievski :

Politika dışı (politika gradyanı) RL için

https://medium.com/@jonathan_hui/rl-importance-sampling-ebfb28b4a8c6

Rusçada, kendi sözlerinle, fikrin özünün ne olduğunu açıklayabilir misin? Popüler dil, tabiri caizse :)

 
Yuri Asaulenko :

LPF filtresini başarıyla tahmin ettik. Şimdi bile sadece Millet Meclisi değil, orman da bir arada. Şimdi genellikle anlamsız olan fiyatı tahmin etmeye çalışalım.) Şu anda bilinmeyen (beklenti) fiyat beklentisindeki beklenen değişimin düşük frekanslı bileşenini tahmin etmek daha iyidir. Ve burada her türlü hareket, yüksek frekanslı titreşimler ve diğer her şey koşullarında.

Olan şudur: 1 m'lik bir TF'de tahmin süresi 5 m'dir.

Her zamanki gibi: x için - tahmin, y için - gerçek değer. Eh, 45 derece eğimli. dikdörtgen hatırlatıyor, daire olmadığın için teşekkürler. X'te sıfırın biraz sağına veya soluna giderseniz, %50'den biraz daha fazla bir olasılıkla bile oynayabilirsiniz (bkz. alana).

Elbette, her türlü regresyon çizgisini, dağılımı oluşturmak güzel olurdu, ancak bunun yapılması gerekiyor, en azından birkaçı - bu daha sonra.

PS Eh, biraz değiştirilmiş bir algoritma için yığın tahminine. TF 1m'de aynı 5 dakika

Zaten çok daha iyi.) x için > 2 ve < -2 tahmininden başlayarak, 5 dakika içinde aptalca kapatırsanız neredeyse hiçbir kârsız işlem öngörülmez.

İkinci resim gerçekten çok iyi! Algoritmadaki hangi değişiklikler onu elde etmeyi mümkün kıldı?