Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2255

 
elibrarius :
Sınavda nadir görülen bir aktivasyon, daha ziyade pazarın değiştiği ve trende sık sık olanların artık olmadığı anlamına gelir. Ve trende birkaç yaprak aktivasyonunun olması gerekli değildir.

Evet, pazar değişikliği etkisinin de olduğuna katılıyorum.

Trene bakalım.

Durum biraz daha iyi, ancak nadir sayıda aktivasyona sahip yapraklar da var.

Eğitimin nasıl gerçekleştiğine dikkat edin - büyük bir ağırlığa sahip bir ağaç inşa edilir - şartlı olarak başarılı ve sonra küçük ağırlıklara sahip bir set ve sonra tekrar büyük bir - böyle bir pasta ve küçük ağırlıklarla çizgileri kaldırırsanız, sonra bir olasılık kayması elde edersiniz.

 
Alexey Vyazmikin :

Evet, pazar değişikliği etkisinin de olduğuna katılıyorum.

Trene bakalım.

Durum biraz daha iyi, ancak nadir sayıda aktivasyona sahip yapraklar da var.

Eğitimin nasıl gerçekleştiğine dikkat edin - büyük bir ağırlığa sahip bir ağaç inşa edilir - şartlı olarak başarılı ve sonra küçük ağırlıklara sahip bir set ve sonra tekrar büyük bir - böyle bir pasta ve küçük ağırlıklarla çizgileri kaldırırsanız, sonra bir olasılık kayması elde edersiniz.

Acaba bu diyagram üzerinde yeni bir model eğitirsek ne olacak?

Genel olarak, fikir, ikinci modeli birincinin "iç kısımları" üzerinde eğitmektir.

 
Maksim Dmitrievski :

neden bu karbüratörü seçiyorsun? iyi çalışıyor. Bununla hiçbir şeyi iyileştirmeyeceksin.

Sorunun ne olduğunu anlarsanız, bir çözüm arayabilirsiniz. Açıkçası, bu tür ağaçların dezavantajları vardır.

Ama ne yazık ki değişiklik yapmak için CatBoost kodunu anlamayacağımı kabul ediyorum.

Bununla birlikte, modeli etkilemek mümkündür, belki yapraklardaki nadir örneklerin sıfırlanması olumlu bir etki verecektir, ancak yaprakların katsayılarının daha sonra yeniden tartılması arzu edilir - bu daha zordur, ancak küresel olarak çözülebilir.

Maksim Dmitrievski :

yaprakları olmayan basit bir sinir ağı alın. Güçlendirme kadar yeni veriler üzerinde de kötü çalışacak. Ne diyor?

Fazla uydurma bir etki olacağına katılıyorum, ancak farklı bir doğaya sahip - soru, bu etkilerden hangisinin daha doğru bir şekilde tanımlanıp değerlendirilebileceği ve hangisinin daha kolay ele alınabileceğidir.

Maksim Dmitrievski :

özellikleri seçmek ve yorumlamak için harika bir SHAP aracı var, ancak python'da. Her şey zaten sizin için yapıldı)

Aslında bu yöntemlerin büyük çoğunluğu modellerde tahmin edicilerin kullanımından bahsetmekte, kendileri hakkında herhangi bir değerlendirme yapmamaktadır. Modelden bağımsız tahmin edici tahminlere ihtiyaç var - üzerinde çalışıyorum, mütevazı olumlu sonuçlar var.

Tabii ki, hazır çözümleri python veya R'de bükmek istiyorum, ancak yeni sözdiziminde ustalaşacağım konusunda şüpheler var.

 
mytarmailS :

Acaba bu diyagram üzerinde yeni bir model eğitirsek ne olacak?

Genel olarak, fikir, ikinci modeli birincinin "iç kısımları" üzerinde eğitmektir.

Bu model eski tortulardan bir örnekte, şimdi modellerimde 60k yaprak var, ki bu elbette örnekleme için çok fazla. Ağaç sayısını önemli ölçüde azaltmayı denemek mümkündür. Ancak, CatBoost'un yapraklarını değerlendirdiğimi ve genetik ağacın yapraklarına kıyasla bireysel olarak özelliklerinde çok zayıf olduklarını not ediyorum.

Eğittiğim genetik ağacın yapraklarında (binlerce yaprak) - ölçümleri iyileştirebilirsiniz.

 
Alexey Vyazmikin :

Sorunun ne olduğunu anlarsanız, bir çözüm arayabilirsiniz. Açıkçası, bu tür ağaçların dezavantajları vardır.

Ama ne yazık ki değişiklik yapmak için CatBoost kodunu anlamayacağımı kabul ediyorum.

Bununla birlikte, modeli etkilemek mümkündür, belki yapraklardaki nadir örneklerin sıfırlanması olumlu bir etki verecektir, ancak yaprak katsayılarının daha sonra yeniden tartılması arzu edilir - bu daha zordur, ancak küresel olarak çözülebilir.

Fazla uydurma bir etki olacağına katılıyorum, ancak farklı bir doğaya sahip - soru, bu etkilerden hangisinin daha doğru bir şekilde tanımlanıp değerlendirilebileceği ve hangisinin daha kolay ele alınabileceğidir.

Aslında bu yöntemlerin büyük çoğunluğu modellerde tahmin edicilerin kullanımından bahsetmekte, kendileri hakkında herhangi bir değerlendirme yapmamaktadır. Modelden bağımsız tahmin edici tahminlere ihtiyaç var - üzerinde çalışıyorum, mütevazı olumlu sonuçlar var.

Tabii ki, hazır çözümleri python veya R'de bükmek istiyorum, ancak yeni sözdiziminde ustalaşacağım konusunda şüpheler var.

özelliklerin belirli bir modelin davranışı üzerindeki etkisini değerlendirir

 
Alexey Vyazmikin :

Sorunun ne olduğunu anlarsanız, bir çözüm arayabilirsiniz. Açıkçası, bu tür ağaçların dezavantajları vardır.

Ama ne yazık ki değişiklik yapmak için CatBoost kodunu anlamayacağımı kabul ediyorum.

Bununla birlikte, modeli etkilemek mümkündür, belki yapraklardaki nadir örneklerin sıfırlanması olumlu bir etki verecektir, ancak yaprak katsayılarının daha sonra yeniden tartılması arzu edilir - bu daha zordur, ancak küresel olarak çözülebilir.

Fazla uydurma bir etki olacağına katılıyorum, ancak farklı bir doğaya sahip - soru, bu etkilerden hangisinin daha doğru bir şekilde tanımlanıp değerlendirilebileceği ve hangisinin daha kolay ele alınabileceğidir.

Aslında bu yöntemlerin büyük çoğunluğu modellerde tahmin edicilerin kullanımından bahsetmekte, kendileri hakkında herhangi bir değerlendirme yapmamaktadır. Modelden bağımsız tahmin edici tahminlere ihtiyaç var - üzerinde çalışıyorum, mütevazı olumlu sonuçlar var.

Tabii ki, hazır çözümleri python veya R'de bükmek istiyorum, ancak yeni sözdiziminde ustalaşacağım konusunda şüpheler var.

1 eklemenin (veya 1 çıkarmanın) en iyisi olduğu sonucuna vardık. İşte araştırmam. Muhtemelen zaten görmüşsünüzdür.

Сравнение разных методов оценки важности предикторов.
Сравнение разных методов оценки важности предикторов.
  • www.mql5.com
Провел сравнение разных методов оценки важности предикторов. Тесты проводил на данных титаника (36 фичей и 891 строки) при помощи случайного леса из 100 деревьев. Распечатка с результатами ниже. За
 
Maksim Dmitrievski :

özelliklerin belirli bir modelin davranışı üzerindeki etkisini değerlendirir

Bundan bahsediyorum ve değerlendirmenin ortaya çıkan modelden geçtiğini söylüyorum.

 
elibrarius :

1 eklemenin (veya 1 çıkarmanın) en iyisi olduğu sonucuna vardık. İşte araştırmam. Muhtemelen zaten görmüşsünüzdür.

Daha önce görmedim - baktım - genel olarak gerçek etkinin çıkarılmasıyla elde edilebileceğine katılıyorum. CatBoost, bir tahmin ediciyi kaldırmak için bir yönteme ve onsuz bir modeli yeniden ağırlıklandırmaya benzer bir yönteme sahiptir, ancak ben bunu çözemedim. Şimdiye kadar, kendimi tahmin edicileri eklemek ve hariç tutmakla sınırladım, ancak bir değil, gruplar.

 
Alexey Vyazmikin :

Bundan bahsediyorum ve değerlendirmenin ortaya çıkan modelden geçtiğini söylüyorum.

ve bu iyi

yeni verilerde hangi işaretlerin bozulduğunu görebilirsiniz

 

xs ... belki deneyim yüzünden, ya da belki de yumruk attığım için ...)

ama bana öyle geliyor ki sen bundan muzdaripsin ..)