Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1304

 
Maksim Dmitrievski :

~10k örnek için test ve eğitim başına %10 hata , artışla birlikte sorunsuz büyür

böyle bir hata ile modeller yeni veriler üzerinde çalışmaya başladı

doğrulamada farklı şekillerde, seçenekleri sıralamanız gerekir

Artık algoritmaları ifşa etmiyorum, sadece iletişim kuruyorum

Şüphe uyandıracak kadar küçük bir şey. Perervenko makalelerinde zikzaklarda bile bunu başaramadı.

Testin ve trenin her birinin %10 olması ve doğrulamanın "farklı" olması da şüphelidir. Onlar. daha ne? En kötüsü, doğrulama değil, test olmalıdır.

 
elibrarius :

Şüphe uyandıracak kadar küçük bir şey. Perervenko makalelerinde zikzaklarda bile bunu başaramadı.

Ayrıca testin ve trenin her birinin %10 olması ve doğrulamanın "farklı" olması da şüphelidir. Onlar. daha ne? En kötüsü bir test olmalı, doğrulama değil.

"Zigzaglarda bile")))

En kötüsü, eğitime hiçbir şekilde, hatta dolaylı olarak katılmayan doğrulama olabilir.
 
Maksim Dmitrievski :

"Zigzaglarda bile")))

En kötüsü , eğitime hiçbir şekilde, hatta dolaylı olarak katılmayan doğrulama olabilir.
Neden bir test sitesi değil? Sonuçta o da "dolaylı olarak da olsa hiçbir şekilde eğitime katılmadı"
 
elibrarius :
Neden bir test sitesi değil? Sonuçta o da "dolaylı olarak da olsa hiçbir şekilde eğitime katılmadı"

test her zaman dolaylı olarak öğrenmeye dahil olur, aynı katbust'u alın .. peki, sen

 

Ah... ya da bölümlere farklı diyoruz.

Ararım

1 eğitim alanı (tren)
2 doğrulama (geçerli) - öğrenme sürecinde kontrol ve erken durdurma için birçok pakette kullanılır. Ve ona Valid diyorlar
3 test - sistemi yeni veriler üzerinde değerlendirmek için

Görünüşe göre 2. bölüme test dedin

 
Maksim Dmitrievski :

test her zaman dolaylı olarak öğrenmeye dahil olur, aynı katbust'u alın .. peki, sen

Catbust hakkında bilgim yok. İşte XGBoost'tan bir alıntı

Early_stopping_rounds
NULL ise, erken durdurma işlevi tetiklenmez. Bir k tamsayısına ayarlanırsa, eğitim
performans k için iyileşmezse bir doğrulama seti ile duracaktır
mermi.

 
elibrarius :

Ah... ya da arsalara farklı diyoruz.

Ararım

1 eğitim alanı (tren)
2 doğrulama (geçerli) - öğrenme sürecinde kontrol ve erken durdurma için birçok pakette kullanılır. Ve ona Valid diyorlar
3 test - sistemi yeni veriler üzerinde değerlendirmek için

Görünüşe göre 2. bölüme test dedin

bence, aksine, doğrulama yeni, yazdıkları yerde

iyi anladın sen

https://tech.yandex.com/catboost/doc/dg/concepts/cli-reference_train-model-docpage/

-t

-- test seti

Doğrulama veri kümesi açıklamasını içeren giriş dosyalarının virgülle ayrılmış listesi (biçim, eğitim veri kümesinde kullanılanla aynı olmalıdır).

Atlandı. Bu parametre atlanırsa doğrulama veri kümesi kullanılmaz.


)))) ne istersen yaz ona denir

 
Maksim Dmitrievski :

bence, aksine, doğrulama yeni, yazdıkları yerde

iyi anladın sen

İlk başta anlamadım.
Çünkü terimleri farklı tanımlıyoruz.

Tek bir terminolojiye bağlı kalmak gerekli olacaktır.

 
elibrarius :

İlk başta anlamadım.
Çünkü terimleri farklı tanımlıyoruz.

Tek bir terminolojiye bağlı kalmak gerekli olacaktır.

İkinci bölümün (öğrenmeyi ve/veya erken durdurmayı kontrol eden) doğrulama değil test olarak adlandırıldığı herhangi bir paketin belgelerini gösterin.

yukarıda gösterdi, işte başka

https://tech.yandex.com/catboost/doc/dg/concepts/output-data_training-log-docpage/

CatBoost — Metrics and time information — Yandex Technologies
  • tech.yandex.com
The table below lists the names of parameters that define the metric values to output. The values of all functions defined by these parameters are output. Information about the number of seconds of training: The resulting JSON file consists of the following arrays: meta Contains basic information about the training. Format of the array with...
 
Maksim Dmitrievski :

yukarıda gösterdi, işte başka

https://tech.yandex.com/catboost/doc/dg/concepts/output-data_training-log-docpage/

görmüştü)
Genel olarak, terminoloji ile karışıklık