Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1308

 
elibrarius :

ISO her şey için yayınlanmıyor.) Bu durumda MO paktlarında 2. bölümün nasıl çağrıldığına odaklanabilirsiniz.

Kullandığınız catbust'ta test yazmalarına rağmen doğrulama için ne kullanıldığını açıklamada yazıyorlar. Diğer paketlerde XGBoost, Darch - hemen doğrulama yazıyorlar.

Başlangıçta, bir test ve eğitim seti vardı, bir çapraz doğrulama yöntemi ortaya çıktı ve böyle bir örnek bir doğrulama olarak adlandırılmaya başlandı (eğitim ve test aslında bunun üzerinde çapraz eğitilir). Şimdi, eğitimi durdurmak için bir örneğe ihtiyaç duyan güçlendirme ortaya çıktı - buna test adı verildi ve aynı zamanda öğrenme sonuçlarını kontrol etmek için kullanılması nedeniyle doğrulamadır, ancak çapraz doğrulamanın aksine eğitmez.

Yani farklı öğrenme yöntemleri örneklemeyi farklı şekillerde kullanabilir. Doğrulama, bir örnek türünden çok bir eylemdir...

 
Vladimir Perervenko :

Doğrulama seti eğitimde yer alır. Buna göre, eğitim sırasında modelin parametreleri ayarlanır. Bazı paketler bir doğrulama seti gerektirmez, bu durumda eğitim seti eğitim sırasında eğitim/geçerli olarak fit() işlevinin kendisinde bir oranda bölünür. Ama kendine sormak daha iyi.

Test setinde eğitilen modelin kalitesi kontrol edilir ve modelin eğitim sırasında bu verileri görmemesi gerekir.

Bu nedenle, bunların hepsi aynı farklı şeyler, karıştırmayın.

İyi şanlar

Tamam, öyle olsun. Çeşitli ML yöntemlerinin oluşturulmasına dahil olan yüzlerce kişinin ifadelerine ilişkin istatistiklerim yok, tartışmak istemiyorum, çünkü başlangıçta kavramları kafamda ayırmanın benim için ne kadar uygun olduğundan ve eğer Başkaları için uygun değil, o zaman kavramlarımla baş başa kalayım.

 
Alexey Vyazmikin :

Tamam, öyle olsun. Çeşitli ML yöntemlerinin oluşturulmasına dahil olan yüzlerce kişinin ifadelerine ilişkin istatistiklerim yok, tartışmak istemiyorum, çünkü başlangıçta kavramları kafamda ayırmanın benim için ne kadar uygun olduğundan ve eğer Başkaları için uygun değil, o zaman kavramlarımla baş başa kalayım.

Evet, konu zaten oldukça spamlandı ve artık herkes kendi terminolojisini icat etmek zorunda :)

Özellikle veri örneklerinin adı üzerinde olsa da, tartışmanın bir anlamı olmadığını düşünüyorum. bunların oluşumu ve kullanımı için birçok farklı yöntem vardır ve yalnızca bir gerçek önemli kalır, IMHO - bu veriler öğrenme sürecine katıldı (Örnek İçi) veya katılmadı (Örnek Dışı).
Tüm IS örnekleri bir şekilde modele uyması için kullanıldığından ve OOS yalnızca kalitesini değerlendirmek için kullanılır.


Ve net bir anlayışa sahip olmak için, sonuçları, eğitimde kullanılan tüm örneklerin IS'yi bir geri test ve OOS'u ileri olarak temsil ettiği, testçiye tanıdık bir biçimde sunmanın mantıklı olacağını düşünüyorum.

 
Ivan Negreshniy :

Evet, konu zaten oldukça spamlandı ve artık herkes kendi terminolojisini icat etmek zorunda :)

Özellikle veri örneklerinin adı üzerinde olsa da, tartışmanın bir anlamı olmadığını düşünüyorum. bunların oluşumu ve kullanımı için birçok farklı yöntem vardır ve yalnızca bir gerçek önemli kalır, IMHO - bu veriler öğrenme sürecine katıldı (Örnek İçi) veya katılmadı (Örnek Dışı).
Çünkü tüm IS örnekleri bir şekilde modele uyması için kullanılır ve OOS yalnızca kalitesini değerlendirmek için kullanılır.


Ve net bir anlayışa sahip olmak için, sonuçları, eğitimde kullanılan tüm örneklerin IS'yi bir geri test ve OOS'u ileri olarak temsil ettiği, testçiye tanıdık bir biçimde sunmanın mantıklı olacağını düşünüyorum.


Ayrı grafiklerle göstermek daha iyidir, çünkü eğitime katılmayan örnek genellikle katılandan çok daha küçüktür ve şahsen benim için böyle yırtık bir grafikte görsel olarak hiçbir şey net değildir.

 
Bu arada, Catbust'ta çapraz doğrulama var - o zaman orada "test" anahtarına gerek yok, ancak farklı şekillerde parçalara ayrılan bir örnek kullanılıyor.
 
Alexey Vyazmikin :
Bu arada, Catbust'ta çapraz doğrulama var - o zaman orada "test" anahtarına gerek yok, ancak farklı şekillerde parçalara ayrılan bir örnek kullanılıyor.

Bilim adamları bu tür şeylerle çalışırlar, ancak sinir ağlarında ve hatta ormanlarda neler olduğunu anlamazlar, her şey tam olarak nasıl ve hangi nedenle ortaya çıktığı gibi, nerede, hangi anda ve neden değişir, biz sadece onların otoritesine güvenebilir ve daha yüksek güçlere dayanarak modellerini uygulayabiliriz.

 
Keşa Kökü :

Bilim adamları bu tür şeylerle çalışırlar, ancak sinir ağlarında ve hatta ormanlarda neler olduğunu anlamazlar, her şeyin nasıl ve neden olduğu ortaya çıktığı gibi tam olarak orada, neyin hangi anda ve neden değiştiğini, biz sadece otoritelerine güvenebilir ve daha yüksek güçlere dayanarak modellerini uygulayabilirler.

Belli ki ormanlarla/ağaçlarla uğraşmamışsınız. Kararları insanlar tarafından kolayca yorumlanır. Birkaç sayfada ağaç oluşturma algoritmasıyla ilgili herhangi bir temel makale bunu size açıklayacaktır.
 
Alexey Vyazmikin :

Tamam, öyle olsun. Çeşitli ML yöntemlerinin oluşturulmasına dahil olan yüzlerce kişinin ifadelerine ilişkin istatistiklerim yok, tartışmak istemiyorum, çünkü başlangıçta kavramları kafamda ayırmanın benim için ne kadar uygun olduğundan ve eğer Başkaları için uygun değil, o zaman kavramlarımla baş başa kalayım.

İnatçılık, anlam olarak sebat etmeye yakındır. Umarım MO'da fikirlerinizin başarılı bir şekilde uygulanmasına ulaşmanıza yardımcı olurlar. Araştırmacılar için bunlar yararlı niteliklerdir. ;-)

Not: Yaprak seçimi için sisteminiz için bir isim buldum: "Herbaryum" - ağaçlardan, ormanlardan, kütüklerden, ormanlardan yöntem koleksiyonunu yenileyin.
 
elibrarius :

Not: Yaprak seçimi için sisteminiz için bir isim buldum: "Herbaryum" - ağaçlardan, ormanlardan, kütüklerden, ormanlardan yöntem koleksiyonunu yenileyin.

))) Lesopoval veya Kereste Fabrikası derdim.

 
Kesha Kökleri :

Bilim adamları bu tür şeylerle çalışırlar, ancak sinir ağlarında ve hatta ormanlarda neler olduğunu anlamazlar, her şeyin nasıl ve neden olduğu ortaya çıktığı gibi tam olarak orada, neyin hangi anda ve neden değiştiğini, biz sadece otoritelerine güvenebilir ve daha yüksek güçlere dayanarak modellerini uygulayabilirler.

Kısmen katılıyorum, şimdi hızlı hesaplamalar çağıdır ve daha önceki insanlar bilgisayarlara erişmeden önce kağıt üzerinde hesaplamalar yaptılarsa, şimdi bilgi miktarı ve işleme yöntemleri o kadar büyüktür ki, genellikle daha uygun olana odaklanmak daha uygundur. süreç, ama sonuçta.