Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2426

 
mytarmailS :

şimdi ilk sorunun cevabı

Teşekkür ederim!

Bunu anlamaya çalışacağım, ancak hemen zor - yine de, kodun sözdizimi C ++ 'dan önemli ölçüde farklı.

 
elibrarius :

Modelinizi testteki en başarılı sürüme ayarladığınızı düşünmüyor musunuz?

Ve sizce testi hangi noktada ayarlıyorum? "Test" örneği eğitimi durdurmak için kullanılır, Projelerde biri hariç, hiç orada değil, sonra son eğitimde kullandım - peki, sabit sayıda ağaçla değiştirebilirsiniz - 50/100 /300/500/800 ve tüm numuneler için sonucu görüyorsanız, sonucun çok daha kötü olacağını mı düşünüyorsunuz?

 
Alexey Vyazmikin :

Teşekkür ederim!

Bunu anlamaya çalışacağım, ancak hemen zor - yine de, kodun sözdizimi C ++ 'dan önemli ölçüde farklı.

Birçok yabancı işlev, çünkü dil üst düzey.
Ama C++'da 300 satırda yazdıklarını ben 3 satırda yazacağım))

 
Alexey Vyazmikin :

Ve sizce testi hangi noktada ayarlıyorum? "Test" örneği eğitimi durdurmak için kullanılır, Projelerde biri hariç, hiç orada değil, sonra son eğitimde kullandım - peki, sabit sayıda ağaçla değiştirebilirsiniz - 50/100 /300/500/800 ve tüm numuneler için sonucu görüyorsanız, sonucun çok daha kötü olacağını mı düşünüyorsunuz?

Evet - eğitimi durdurmak da test için uygundur. Sisteminizin diğer detaylarını bilmiyorum, daha fazla bir şey söyleyemem.
Çapraz doğrulamada, tüm veriler bir testtir ve tümü bir trendir. Sadece sırayla. Sadece tren alanını %40 artırmak istediniz.
 
mytarmailS :
Birçok yabancı işlev, çünkü dil üst düzey.
Ama C++'da 300 satırda yazdıklarını ben 3 satırda yazacağım))

Tüm sapıklıklarımın R'de kolayca uygulanabileceğini sanmıyorum :)

 
elibrarius :
Evet - eğitimi durdurmak da test için uygundur. Sisteminizin diğer detaylarını bilmiyorum, daha fazla bir şey söyleyemem.

Teoride bunun test örneğindeki sonucu artırdığına katılıyorum, ancak sonucu sınav örneğinde değerlendiriyorum!

Eh, tüm detayları anlattım gibi geldi, herhangi bir sorunuz varsa, sorun.

elibrarius :
Çapraz doğrulamada, tüm veriler bir testtir ve tümü bir trendir. Sadece sırayla. Sadece tren alanını %40 artırmak istediniz.

Tamam, çapraz doğrulamayı kullanma amacınız nedir? Şimdilik, ortalama olarak rastgele alanlarda hangi ayarların en iyi olduğunu göstereceğinden, model hiperparametrelerini aramanın anlamını görüyorum.

 
Alexey Vyazmikin :

Tüm sapıklıklarımın R'de kolayca uygulanabileceğini sanmıyorum :)

ahahah))))

Sapıklıklarımı fark edebilirsem, o zaman seninki nasıl rahatlarsın)

 
Alexey Vyazmikin :

Tamam, çapraz doğrulamayı kullanma amacınız nedir? Şimdilik, model hiperparametrelerini aramanın anlamını görüyorum, çünkü ortalama olarak rastgele bölümlerde hangi ayarların en iyisi olduğunu gösterecektir.

Bunun için. Başka bir şeye ihtiyacın var mı? Ve belirli bir dizi özellik. Farklı özelliklerle hiperparametreler büyük olasılıkla farklı olacaktır. İşte en iyi hiperparametrelerle seçtiğiniz ve devreye alınması gerekenler.

Alexey Vyazmikin :
Eh, tüm detayları anlattım gibi geldi, herhangi bir sorunuz varsa, sorun.

Derine inmek çok tembel.

 
mytarmailS :

ahahah))))

Sapıklıklarımı fark edebilirsem, o zaman seninki nasıl rahatlarsın)

Pekala, buradayım, veri hazırlamak için bir komut dosyası yaptığım için, hariç tutulan sütunları listeleyen bir dosya da yapmam gerekiyor, bu da şunları içerir:

1. İlişkili öngörücülere sahip sütunlar (bu arada, hangi sütunun atılacağı nasıl seçilir, diyelim ki 5 ilişkili öngörücü?).

2. Hedefteki sütun haricinde, ilk dosya tablosundan atılan sütunlar.

Ayrıca, dosyaya hedef etiketli bir sütun yazmanız gerekir, sütun adına göre aramanız önerilir.

Dosya yapısı şu şekilde

 5336     Auxiliary
5337     Auxiliary
5338     Label
5339     Auxiliary
5340     Auxiliary
 
elibrarius :

Bunun için. Başka bir şeye ihtiyacın var mı? Ve belirli bir dizi özellik. Farklı özelliklerle hiperparametreler büyük olasılıkla farklı olacaktır. İşte en iyi hiperparametrelerle seçtiğiniz ve devreye alınması gerekenler.

Derine inmek çok tembel.

İstenen tahmincileri daha kısa sürede seçmem gerekiyor. Tahmin edicilerden daha fazla geçmek, işlem süresini yüzlerce kez artırmaktır. Benim yöntemim, model tarafından tüm örnekleme aralıklarında iyi bir tahmin edicinin (belirli bir öğrenme yöntemi için uygun olanı da dahil olmak üzere) gerekeceği mantığı üzerine inşa edilmiştir; bu, örnek alana uydurmayı hariç tutar.