Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3355

 
Maxim Dmitrievsky #:
Birinin en azından ipucunu Google'da aratacağını umuyordum.

Eğitiminizde olasılık eğrileri olsa bile, hangi yeni verilerden bahsedebilirsiniz. Bousting ve Forrest bu konuda büyük günah işliyor. Busting aşırı güven, Forrest ise az güven demektir. Tabii ki eşiği kullanmayı planlıyorsanız.

Eşiği artırdığınızda, işlemlerin kalitesinin traine'de bile iyileşmediğini gözlemledim. O zaman ne getirme olasılıkları var? Hiçbir şey :)

Nedense yazılarıma dikkat etmiyorsunuz, olasılıklara odaklanıyorsunuz. Olasılığın ne olduğu önemli değil, önemli olan iyileşmezse modelin aşırı eğitilmiş, çöp kutusuna girmiş olmasıdır. OOV, OOS ve VNU'daki tahmin hatası yaklaşık olarak aynı olmalıdır.

İşte başka bir histogram

Farklı algoritma - etiketler ve tahmin ediciler aynı olmasına rağmen farklı histogram. Farklı sınıflandırma algoritmalarının aynı histogramları üreteceğini ima eden bir tür teorik olasılık arıyorsanız ... Bu benim aklıma gelmiyor, çünkü belirli algoritmalarla çalışmak zorundasınız ve tahmin edecekler ve değerlendirilmeleri gerekiyor, teorik bir ideal değil. Buradaki ana değerlendirme, olasılıkların bazı teorik ideallere yakınlığı değil, modelin aşırı uyumudur.

 
СанСаныч Фоменко #:

Nedense yazılarıma dikkat etmiyorsunuz, olasılıklara odaklanıyorsunuz. Olasılığın ne olduğu önemli değil, önemli olan iyileşmezse modelin aşırı eğitilmiş, çöp kutusuna girmiş olmasıdır. OOV, OOS ve VNE'deki tahmin hatası yaklaşık olarak aynı olmalıdır.

Kutudan çıkan bir model, herhangi bir model doğru olasılıkları vermez. Hikaye bu. Tahmin edilen etiketlerin tamamen eşleşmesini sağlayabilirsiniz, ancak olasılıklar sonucun gerçek olasılığını yansıtmaz, yansıtmayacaktır.
Beni anlıyor musunuz?
 
Maxim Dmitrievsky #:
Kutudan çıkan model doğru olasılıkları vermiyor, hiçbirini. Hikaye bu. Tamamen eşleşen etiketler tahmin etmiş olabilirsiniz, ancak olasılıklar eşleşmiyor.
Beni anlıyor musun?

Yazımı ekledim. Herhangi bir model, sınıflandırma hatasının dalgalanmayacağı anlamında doğru olasılıklar verir.

 
СанСаныч Фоменко #:

Nedense yazılarıma dikkat etmiyorsunuz, olasılıklara odaklanıyorsunuz. Olasılığın ne olduğu önemli değil, önemli olan iyileşmezse modelin aşırı eğitilmiş, çöp kutusuna girmiş olmasıdır. OOV, OOS ve VNU'daki tahmin hatası yaklaşık olarak aynı olmalıdır.

İşte başka bir histogram

Farklı algoritma - etiketler ve tahmin ediciler aynı olmasına rağmen farklı histogram. Farklı sınıflandırma algoritmalarının aynı histogramları üreteceğini ima eden bir tür teorik olasılık arıyorsanız ... Bu benim aklıma gelmiyor, çünkü belirli algoritmalarla çalışmak zorundasınız ve tahmin edecekler ve değerlendirilmeleri gerekiyor, teorik bir ideal değil. Buradaki ana değerlendirme, olasılıkların bazı teorik ideallere yakınlığı değil, modelin aşırı uyumudur.

Vaz mı geçtiniz? Google'da sınıflandırma olasılığı kalibrasyonunu arayın, R'de olması gerekir.

Ve modelinizin olasılık eğrisini karşılaştırma ölçütüne göre çizin.
 
Maxim Dmitrievsky #:
Vazgeçmek mi? Google sınıflandırma olasılığı kalibrasyonu, R'de olmalı.
.

Ve modelinizin olasılık eğrisini karşılaştırma ölçütüne göre çizin.

Farklı şeylerden bahsediyoruz.

Ben sonuç hakkında yazıyorum, siz ise ara verilerin ideali hakkında yazıyorsunuz.

Benim için RF ve ada tarafından verilen belirli etiketlerin olasılık değerlerinin farklı olacağı açıktır, ancak belirli etiketlerin tahminleri neredeyse aynıdır. Ben olasılık değerleriyle ilgilenmiyorum, tahmin hatasıyla ilgileniyorum

Eğer teori üretirseniz, sizin anladığınız anlamda sınıf olasılığını elde etmek büyük olasılıkla imkansızdır, çünkü olasılığınızın limit teoremini karşıladığını kanıtlamanız gerekir ki bu da çok şüphelidir.

 
СанСаныч Фоменко #:

Farklı şeylerden bahsediyoruz.

Ben sonuç hakkında yazıyorum, siz ise ara veri ideali hakkında yazıyorsunuz.

RF ve ada tarafından verilen sınıf olasılığı değerleri farklı olacaktır, ancak belirli etiketlerin tahminleri neredeyse aynıdır. Ben olasılık değerleriyle değil, tahmin hatasıyla ilgileniyorum.

Eğer teori üretirseniz, sizin anladığınız anlamda sınıf olasılığını elde etmek büyük olasılıkla imkansızdır, çünkü olasılığınızın limit teoremini karşıladığını kanıtlamanız gerekir ki bu da çok şüphelidir.

Yine de, orijinal soru oradaydı, kimse cevaplamadı. Ben tam olarak sorduğum şeyden bahsediyorum.
Yani çabalanacak bir şey var.
 
Maxim Dmitrievsky #:
Yine de asıl soru oradaydı ve kimse cevap vermedi.
Yani dört gözle beklenecek bir şey var.

Neden mi? Eğer bir tez anlamında....

 
СанСаныч Фоменко #:

Neden mi? Eğer bir tez anlamında....

Çünkü olasılık eğrileriyle ticaret yapmak kazanç yerine kayıpları göze almak anlamına gelir. Herhangi bir sınıflandırıcı, riske duyarlı bir uygulama ise kalibrasyona ihtiyaç duyar.
 
Sonunda.