Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası

СанСаныч Фоменко 2023.12.24 19:25 #33541

Maxim Dmitrievsky #:
Birinin en azından ipucunu Google'da aratacağını umuyordum.

Eğitiminizde olasılık eğrileri olsa bile, hangi yeni verilerden bahsedebilirsiniz. Bousting ve Forrest bu konuda büyük günah işliyor. Busting aşırı güven, Forrest ise az güven demektir. Tabii ki eşiği kullanmayı planlıyorsanız.

Eşiği artırdığınızda, işlemlerin kalitesinin traine'de bile iyileşmediğini gözlemledim. O zaman ne getirme olasılıkları var? Hiçbir şey :)

Nedense yazılarıma dikkat etmiyorsunuz, olasılıklara odaklanıyorsunuz. Olasılığın ne olduğu önemli değil, önemli olan iyileşmezse modelin aşırı eğitilmiş, çöp kutusuna girmiş olmasıdır. OOV, OOS ve VNU'daki tahmin hatası yaklaşık olarak aynı olmalıdır.

İşte başka bir histogram

Farklı algoritma - etiketler ve tahmin ediciler aynı olmasına rağmen farklı histogram. Farklı sınıflandırma algoritmalarının aynı histogramları üreteceğini ima eden bir tür teorik olasılık arıyorsanız ... Bu benim aklıma gelmiyor, çünkü belirli algoritmalarla çalışmak zorundasınız ve tahmin edecekler ve değerlendirilmeleri gerekiyor, teorik bir ideal değil. Buradaki ana değerlendirme, olasılıkların bazı teorik ideallere yakınlığı değil, modelin aşırı uyumudur.

Elliot Dalga Teorisine dayalı Bu kaosun bir düzeni Stratejik tahmin sistemleri

Maxim Dmitrievsky 2023.12.24 19:26 #33542

СанСаныч Фоменко #:

Nedense yazılarıma dikkat etmiyorsunuz, olasılıklara odaklanıyorsunuz. Olasılığın ne olduğu önemli değil, önemli olan iyileşmezse modelin aşırı eğitilmiş, çöp kutusuna girmiş olmasıdır. OOV, OOS ve VNE'deki tahmin hatası yaklaşık olarak aynı olmalıdır.

Kutudan çıkan bir model, herhangi bir model doğru olasılıkları vermez. Hikaye bu. Tahmin edilen etiketlerin tamamen eşleşmesini sağlayabilirsiniz, ancak olasılıklar sonucun gerçek olasılığını yansıtmaz, yansıtmayacaktır.

Beni anlıyor musunuz?

СанСаныч Фоменко 2023.12.24 19:32 #33543

Maxim Dmitrievsky #:
Kutudan çıkan model doğru olasılıkları vermiyor, hiçbirini. Hikaye bu. Tamamen eşleşen etiketler tahmin etmiş olabilirsiniz, ancak olasılıklar eşleşmiyor.

Beni anlıyor musun?

Yazımı ekledim. Herhangi bir model, sınıflandırma hatasının dalgalanmayacağı anlamında doğru olasılıklar verir.

Maxim Dmitrievsky 2023.12.24 19:34 #33544

СанСаныч Фоменко #:

Nedense yazılarıma dikkat etmiyorsunuz, olasılıklara odaklanıyorsunuz. Olasılığın ne olduğu önemli değil, önemli olan iyileşmezse modelin aşırı eğitilmiş, çöp kutusuna girmiş olmasıdır. OOV, OOS ve VNU'daki tahmin hatası yaklaşık olarak aynı olmalıdır.

İşte başka bir histogram

Farklı algoritma - etiketler ve tahmin ediciler aynı olmasına rağmen farklı histogram. Farklı sınıflandırma algoritmalarının aynı histogramları üreteceğini ima eden bir tür teorik olasılık arıyorsanız ... Bu benim aklıma gelmiyor, çünkü belirli algoritmalarla çalışmak zorundasınız ve tahmin edecekler ve değerlendirilmeleri gerekiyor, teorik bir ideal değil. Buradaki ana değerlendirme, olasılıkların bazı teorik ideallere yakınlığı değil, modelin aşırı uyumudur.

Vaz mı geçtiniz? Google'da sınıflandırma olasılığı kalibrasyonunu arayın, R'de olması gerekir.

Ve modelinizin olasılık eğrisini karşılaştırma ölçütüne göre çizin.

СанСаныч Фоменко 2023.12.24 19:45 #33545

Maxim Dmitrievsky #:
Vazgeçmek mi? Google sınıflandırma olasılığı kalibrasyonu, R'de olmalı.
.

Ve modelinizin olasılık eğrisini karşılaştırma ölçütüne göre çizin.

Farklı şeylerden bahsediyoruz.

Ben sonuç hakkında yazıyorum, siz ise ara verilerin ideali hakkında yazıyorsunuz.

Benim için RF ve ada tarafından verilen belirli etiketlerin olasılık değerlerinin farklı olacağı açıktır, ancak belirli etiketlerin tahminleri neredeyse aynıdır. Ben olasılık değerleriyle ilgilenmiyorum, tahmin hatasıyla ilgileniyorum

Eğer teori üretirseniz, sizin anladığınız anlamda sınıf olasılığını elde etmek büyük olasılıkla imkansızdır, çünkü olasılığınızın limit teoremini karşıladığını kanıtlamanız gerekir ki bu da çok şüphelidir.

stokastik rezonans Martin gerçekten o kadar [ARŞİV] Forumu kirletmemek için

Maxim Dmitrievsky 2023.12.24 19:46 #33546

СанСаныч Фоменко #:

Farklı şeylerden bahsediyoruz.

Ben sonuç hakkında yazıyorum, siz ise ara veri ideali hakkında yazıyorsunuz.

RF ve ada tarafından verilen sınıf olasılığı değerleri farklı olacaktır, ancak belirli etiketlerin tahminleri neredeyse aynıdır. Ben olasılık değerleriyle değil, tahmin hatasıyla ilgileniyorum.

Eğer teori üretirseniz, sizin anladığınız anlamda sınıf olasılığını elde etmek büyük olasılıkla imkansızdır, çünkü olasılığınızın limit teoremini karşıladığını kanıtlamanız gerekir ki bu da çok şüphelidir.

Yine de, orijinal soru oradaydı, kimse cevaplamadı. Ben tam olarak sorduğum şeyden bahsediyorum.

Yani çabalanacak bir şey var.

СанСаныч Фоменко 2023.12.24 19:48 #33547

Maxim Dmitrievsky #:
Yine de asıl soru oradaydı ve kimse cevap vermedi.

Yani dört gözle beklenecek bir şey var.

Neden mi? Eğer bir tez anlamında....

Maxim Dmitrievsky 2023.12.24 19:49 #33548

СанСаныч Фоменко #:

Neden mi? Eğer bir tez anlamında....

Çünkü olasılık eğrileriyle ticaret yapmak kazanç yerine kayıpları göze almak anlamına gelir. Herhangi bir sınıflandırıcı, riske duyarlı bir uygulama ise kalibrasyona ihtiyaç duyar.

mytarmailS 2023.12.24 19:51 #33549

Kalibrasyon nedir

https://stats.stackexchange.com/questions/552146/probability-calibration-of-statistical-models

Nasıl kalibre edilir

https://www.tidymodels.org/learn/models/calibration/

https://mlr.mlr-org.com/articles/tutorial/classifier_calibration.html

Maxim Dmitrievsky 2023.12.24 19:52 #33550

Sonunda.

Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3355