Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3095

 
GPT'nin bazen internette arama yapmaktan daha kullanışlı olduğunu birkaç kez belirtmiştim, örnek olarak python kullanıyorum. Aynı Pandas'ta milyonlarca ifade var, hepsini hatırlayamazsınız ve Google daha uzun sürerken hızlı bir şekilde cevap verir. Ve cevap sadece soyut bir örnek değil, soru bağlamında hemen verilir. Fena değil.
 
Renat Fatkhullin #:
R için önceden yazılmış bir paketi halka açabiliriz. Bunu revize etmeli ve eksik işlevleri eklemeliyiz.

Daha önce yayınlanan Python paketi patlayıcı bir büyüme gösterdi ve büyümeye devam ediyor. Bunun gerçekleşmesini beklemiyorduk.

Bu çok iyi bir karar olacaktır. Gerekirse testlere katılmaya hazırım.

İyi şanslar

 
Vladimir Perervenko #:

Bu çok iyi bir çözüm olurdu. Gerekirse testlere katılmaya hazırım.

İyi şanslar.

Ben de katılmaya hazırım.
 
Makalede önerilen yöntemle, en iyisini (ptu stili) seçmek için farklı modelleri inceleyemezsiniz. Bu https://en.wikipedia.org/wiki/Multiple_comparisons_problem.
 
mytarmailS #:

bir deneyde bir araç yer almaktadır

Uzun zamandır overfit ile mücadele ediyorum ve birkaç kez fısıldadım - kozul'a bakın. Tüm bu teknikler oradan geliyor, Prado (kısmen) oradan ilham aldı.

Bu, istatistiğin makine öğrenimine genelleştirilmesidir.

Belirli bir kritere (tritment) göre modellerin çıkarımını yapabilirsiniz. Yeni veriler üzerinde daha iyi çalışmak için verilerdeki önyargı ve varyansı ortadan kaldırmakla ilgilidir.
 
Maxim Dmitrievsky #:
Makalede önerilen yöntemle, en iyisini (ptu tarzı) seçmek için farklı modelleri inceleyemezsiniz. Bu https://en.wikipedia.org/wiki/Multiple_comparisons_problem.

Daha fazla ayrıntı için hala merak ediyorum... binlerce seçenek arasından çalışmak için bir modeli nasıl seçmeyi öneriyorsunuz?
Bu paket daha ziyade seçilen hedefin seçilen tahmin ediciler üzerinde başarılı bir şekilde eğitilme olasılığını değerlendirir. Modellerin çoğu başarılıysa, seçilen modelin de başarılı olması muhtemeldir.
Belirli bir model seçimi yoktur (anladığım kadarıyla). Makalede tartışılmayan başka bir yöntemle seçilmelidir. Ve çok sayıda uyarı ve kısıtlama var (birkaç sayfa), bunlardan bazılarını anlattım.

mytarmailS #: makalede, deneyde yalnızca bir TC yer alıyor.

Oradaki modeller farklıdır, çünkü farklı gösterge parametrelerine sahiptirler. Ancak gösterge seti aynı olabilir. Sanırım kafa karışıklığı bu.
Şöyle diyebilirsiniz - strateji aynı, ancak modeller (varyantlar) farklı

 
Forester #:

Yine de, daha fazla ayrıntı merak ediyorum... binlerce seçenek arasından çalışmak için bir modeli nasıl seçmeyi öneriyorsunuz?
Bu paket daha ziyade seçilen hedefin seçilen tahmin ediciler üzerinde başarılı bir şekilde eğitilme olasılığını değerlendirir. Modellerin çoğu başarılıysa, seçilen modelin de başarılı olması muhtemeldir.
Belirli bir model seçimi yoktur (anladığım kadarıyla). Makalede tartışılmayan başka bir yöntemle seçilmelidir. Ve bazılarını anlattığım birçok uyarı ve kısıtlama (birkaç sayfa) var.

Buradaki modeller farklıdır, çünkü farklı gösterge parametrelerine sahiptirler. Ancak gösterge seti aynı olabilir. Bence kafa karışıklığı burada.

Eğer hepsi iyiyse, sadece iyiler arasından seçim yapabilirsiniz. Seçim sorusunu bu şekilde veya bir güven aralığıyla sorarsanız, hepsi iyidir. Aksi takdirde daha fazla çaba gerektiren yukarıdaki sorun ortaya çıkar.

Kimin tam olarak ne yaptığını bilmiyorum, bu yüzden soru benim için belirsiz.

 

deneyler yapıyorum, kod yazıyorum...

Denedim, çalışıyor, sonra hangi TC'leri kullanmanın daha iyi olduğunu düşünüyorum, vb. daha ileri ve daha derine gidiyorum...

Ve bir yılınızı daha teori tartışarak geçirirsiniz, sonra pes edersiniz ve bu iş biter.

 
Bunu hala anlamıyorum.
Forester #:
Ancak eğitim olmadan çapraz doğrulamayı nasıl yaptıklarını anlamıyorum. Sadece hazır bir getiri setini besliyorlar ve ardından 12000 varyant üzerinde karıştırıyorlar. Bu 12000 IS'nin her biri üzerinde eğitilmeli ve karşılık gelen her bir OOS üzerinde tahmin edilmelidir.
Geri dönüşleri trayne'den mi besliyorlar? Ve sonra bunu sözde IS ve OOS olan 12000'den fazla varyant üzerinde karıştırıyorlar.
Bence bu, trayne üzerindeki denge eğrisinin düzlüğünü değerlendirmek için seçeneklerden biridir.
 
Maxim Dmitrievsky #:

Çapraz doğrulama yoluyla önyargıyı (asıl önemli olan budur) ve varyansı ortadan kaldırdığımız için, model yeni veriler üzerinde +- yeterli davranmaya başlar. Daha sonra ince ayar yapılabilir.

Güzel denge çizgisi)
Bunu ticarete de koyabilirsiniz.