Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1301

 
Alexey Vyazmikin :

Modelin değerlendirilmesi, bilinmeyen bir örneğe uygulandığında performansını etkiler mi?

peki, o zaman ne yapıyorsun? bir sürü farklı model oluşturun ve hangisinin en iyi sonucu verdiğini kontrol edin?

o zaman "yapraklar" nerede, en iyi yaprakların seçimi vb.?

Sadece periyodik olarak yazdıklarınızı anlamak için girmeye çalışıyorum

veya orada her satır bir sayfaya karşılık gelir
 
Maksim Dmitrievski :

peki, o zaman ne yapıyorsun? bir sürü farklı model oluşturun ve hangisinin en iyi sonucu verdiğini kontrol edin?

o zaman "yapraklar" nerede, en iyi yaprakların seçimi vb.?

Sadece periyodik olarak yazdıklarınızı anlamak için girmeye çalışıyorum

Görünüşe göre konuşma, modelin otomatik seçimi ile ilgiliydi, ilginç modellerin iyi bilinen bir kriter ve formül aracılığıyla iki şekilde seçilebileceğini açıkladım (şimdi yaptığım gibi - her örnek için son 3 sütun doldurulur) ve her örnek için böyle bir tablo oluşturulur, eğer 3 sütun - filtreler eşleşirse, o zaman model seçilir) veya makine öğrenimini kullanabilirsiniz, bağımsız bir örnek üzerinde çalışmadaki modelden ne istediğinizi anladığınızda, ancak yapmazsınız. Bunu nasıl başaracağımı bilmiyorum. Böylece, ikinci yöntem için, modelin farklı metrik göstergeleri tahmin ediciler haline gelir ve model, ML kullanarak benzer verilerden uygun modelleri zaten seçen bunlar üzerinde eğitilir. O yıl eğitimle benzer bir deneyim yaşamıştım, olumlu sonuçlar verdi, değerlendirmenin doğruluğu açısından iyi ama bütünlük çok iyi değil, sonra örneklemde yeterli çeşitlilik olmadığına karar verdim ve işi erteledim. daha iyi zamanlara kadar. Şimdi birçok farklı örnek üretiliyor ve bu çalışmaya geri dönebilirsiniz. Ana fikir, mevcut havuzdan en iyiyi seçmek değil, MO veya sabit bir gösterge olsun, mutlak kriterlere göre en iyisini seçmektir.

Yapraklar zaten seçili modellerle çalışıyor.

Her satır ayrı bir modeldir.
 
Alexey Vyazmikin :

Görünüşe göre konuşma, modelin otomatik seçimi ile ilgiliydi, ilginç modellerin iyi bilinen bir kriter ve formül aracılığıyla iki şekilde seçilebileceğini açıkladım (şimdi yaptığım gibi - her örnek için son 3 sütun doldurulur) ve her örnek için böyle bir tablo oluşturulur, eğer 3 sütun - filtreler eşleşirse, o zaman model seçilir) veya makine öğrenimini kullanabilirsiniz, bağımsız bir örnek üzerinde çalışmadaki modelden ne istediğinizi anladığınızda, ancak yapmazsınız. Bunu nasıl başaracağımı bilmiyorum. Böylece, ikinci yöntem için, modelin farklı metrik göstergeleri tahmin ediciler haline gelir ve model, ML kullanarak benzer verilerden uygun modelleri zaten seçen bunlar üzerinde eğitilir. O yıl eğitimle benzer bir deneyim yaşamıştım, olumlu sonuçlar verdi, değerlendirmenin doğruluğu açısından iyi ama bütünlük çok iyi değil, sonra örneklemde yeterli çeşitlilik olmadığına karar verdim ve işi erteledim. daha iyi zamanlara kadar. Şimdi birçok farklı örnek üretiliyor ve bu çalışmaya geri dönebilirsiniz. Ana fikir, mevcut havuzdan en iyiyi seçmek değil, MO veya sabit bir gösterge olsun, mutlak kriterlere göre en iyisini seçmektir.

Yapraklar zaten seçili modellerle çalışıyor.

yani, daha sonra n-modelleri alırsınız (dosyada olduğu gibi), NN için tahmin ediciler olarak metriklerini kullanırsınız ve sonra çıktı nedir?

Deneyimden herhangi bir geri bildirim var mı? bu tür göstergelerle yazın, model çalışacak, böyle olmayacak

ve sonra yeni modelleri bu saçmalıkla mı filtreleyeceksin? NS'nin MO modellerini seçmesi gibi

 
Maksim Dmitrievski :

yani, daha sonra n-modelleri alırsınız (dosyada olduğu gibi), NN için tahmin ediciler olarak metriklerini kullanırsınız ve sonra çıktı nedir?

Deneyimden herhangi bir geri bildirim var mı? bu tür göstergelerle yazın, model çalışacak, böyle olmayacak

ve sonra yeni modelleri bu saçmalıkla mı filtreleyeceksin? NS'nin MO modellerini seçmesi gibi

Deney yaptığımda, test örneği için benzer metrikleri aldım ve sonucu hedef olarak sınav (eğitimden bağımsız) örneğine koydum. Hedef, kâr, düşüş (alış ve satış işlemleri için ayrı ayrı) ve modelin göstergelerinden başka bir şeydi, tam olarak hatırlamıyorum. Şimdi, test örneğinin verilerine, eğitim örneğinden kesinlikle daha fazla metrik gösterge eklemeniz gerekiyor (o zaman bunun Katbust için önemli ölçüde farklı bir sonucu olabileceğini bilmiyordum) ve hedefle deneme yapmanız gerekiyor. daha fazla.

Ortaya çıkan model, modellere sahip diğer örneklerden alınan sonuçlarla beslendi, ana sonuç, kârsız modellerin iyi bir şekilde filtrelenmesiydi.
 
Alexey Vyazmikin :

Deney yaptığımda, test örneği için benzer metrikleri aldım ve sonucu hedef olarak sınav (eğitimden bağımsız) örneğine koydum. Hedef, kâr, düşüş (alış ve satış işlemleri için ayrı ayrı) ve modelin göstergelerinden başka bir şeydi, tam olarak hatırlamıyorum. Şimdi, test örneğinin verilerine, eğitim örneğinden kesinlikle daha fazla metrik gösterge eklemeniz gerekiyor (o zaman bunun Katbust için önemli ölçüde farklı bir sonucu olabileceğini bilmiyordum) ve hedefle deneme yapmanız gerekiyor. daha fazla.

çok garip süslü bir çözüm, böyle bir şey görmedim ve bu konuda bir şey söylemekte zorlanıyorum

ama işe yararsa iyi
 
Maksim Dmitrievski :

çok garip süslü bir çözüm, böyle bir şey görmedim ve bu konuda bir şey söylemekte zorlanıyorum

ama işe yararsa iyi

Buradaki fikir, modelin yapısına, test ve eğitim örnekleri üzerindeki davranışına göre, gerçek işte belirli davranış beklentilerini ortaya koyabileceğinizdir.

Bu yön çok ilginç, ancak zaman ve kaynak gerektiriyor. Öte yandan, burada toplu olarak gelişmek, tahmincileri açıkça değiştirmek mümkündür.

Modelden gelecekteki çalışmaları hakkında hiçbir şey söylenemezse, tüm ML zaman kaybıdır - bir şans meselesi ...

 
Alexey Vyazmikin :

Buradaki fikir, modelin yapısına, test ve eğitim örnekleri üzerindeki davranışına göre, gerçek işte belirli davranış beklentilerini ortaya koyabileceğinizdir.

Bu yön çok ilginç, ancak zaman ve kaynak gerektiriyor. Öte yandan, burada toplu olarak gelişmek, tahmincileri açıkça değiştirmek mümkündür.

Modelden gelecekteki çalışmaları hakkında hiçbir şey söylenemezse, tüm ML zaman kaybıdır - bir şans meselesi ...

Zamanla, sonuçların yayılması artar, bu dikkate alınmalıdır. Model yeni işlemlerde hemen bozulursa, ancak o zaman uygun olur, aksi takdirde onu sıkıştırmayı deneyebilirsiniz. İyileştirmenin en kolay yolu, düzenlileştirmedir (kaza basmasında kademeli adım) veya basitçe yeniden eğitmemek.

insanların nasıl ticaret yaptıklarına bakın - her türlü martingale saçmalığı. MO zaten bir tür avantaj sağlıyor

Şimdi Bayes modellerinin karmaşık değerlendirmeleri hakkında yazmıyorum, çünkü bununla nasıl çalışılacağını tam olarak anlamadım, hala çalışılacak ve kesilecek çok şey var.
 
Maksim Dmitrievski :

Zamanla, sonuçların yayılması artar, bu dikkate alınmalıdır. Model yeni işlemlerde hemen bozulursa, ancak o zaman uygun olur, aksi takdirde sıkıştırmayı deneyebilirsiniz.

geri kalanı için, insanların nasıl ticaret yaptıklarına bakın - her türlü martingale saçmalığı. MO zaten bir tür avantaj sağlıyor

Dün Catboost'un yapraklarda (ikili ağaçlar) gürültü ürettiğini gösterdim, bunlar kaldırılabilir ve model iyileştirildi. Bu yönde biraz daha deney yaptım, filtrelemeyi artırdım ve belirli bir eşikten sonra paradoksal bir şey olduğunu buldum - iyileştirmeler bağımsız bir örnekte duruyor, ancak test ve eğitim örneklerinde devam ediyor. Onlar. gerçekte, modelin düşük ağırlıklı bağlantılara, aslında bağlantılara göre çalışmaya devam ettiği (eğitimden bağımsız bir örnek üzerinde) ortaya çıkıyor ve burada soru, ağırlıkların doğru bir şekilde dağıtılmadığı veya modelin yeniden eğitilir ve yanlışlıkla beyaz gürültü üzerinde çalışır (iyi, tamamen gürültü değil, ikili ağaçların daha az önemli göstergelerinde). Bu bağlantıların nereden geldiğine de bakıp kısa bir inceleme örneğinde önemlerini tespit edebileceğinizi düşünüyorum.

 
Alexey Vyazmikin :

Dün Catboost'un yapraklarda (ikili ağaçlar) gürültü ürettiğini gösterdim, bunlar kaldırılabilir ve model iyileştirildi. Bu yönde biraz daha deney yaptım, filtrelemeyi artırdım ve belirli bir eşikten sonra paradoksal bir şey olduğunu buldum - iyileştirmeler bağımsız bir örnekte duruyor, ancak test ve eğitim örneklerinde devam ediyor. Onlar. gerçekte, modelin düşük ağırlıklı bağlantılar, aslında bağlantı parçaları üzerinde çalışmaya devam ettiği ortaya çıkıyor ve burada soru, ağırlıkların doğru bir şekilde dağıtılmadığı veya modelin yeniden eğitildiği ve yanlışlıkla beyaz gürültü üzerinde çalıştığı (iyi , oldukça gürültü değil, daha az önemli göstergelerde ikili ağaçlar). Bu bağlantıların nereden geldiğine de bakıp kısa bir inceleme örneğinde önemlerini tespit edebileceğinizi düşünüyorum.

hangi yönde kazma - her yerde bazı aldatıcı "desenler" olacak, herhangi bir fenomende bulunabilirler

En önemlisi, çok sayıda "tahmin ediciden" memnunum. Alıntılarda bile nereden gelebilir? %90 çöp

 
Maksim Dmitrievski :

Hiçbir fikrim yok, ağaçlara ve yapraklara tırmanmıyorum ve yapmayacağım .. her şey modelin kendi seviyesinde yapılabilir.

hangi yönde kazma - her yerde bazı aldatıcı "desenler" olacak, herhangi bir fenomende bulunabilirler

bu yüzden sadece bilinen şekillerde çalışın

Ve ben sadece manuel ayardan ilham alıyorum - pasif büyüye olan inancımı kaybettim.

Yaprak ağırlıkları için tam algoritmayı bilmiyorum, ancak bunun sadece bağlantıların kendilerine değil, yani bulunan bağlantıların sırasına bağlı olduğunu düşünüyorum. güçlendirmede yeni bir ağaç bir hatayı düzeltirse, ağırlık hata düzeltmesinin deltasına verilirken yeni bağlantı düzeltmenin kendisinden daha değerli olabilir. İdeal olarak, bağlantıları ve ağırlıklarını iki kez kontrol etmeniz, karara dahil olan ikili ağaç sayısını kontrol etmeniz gerekir, eğer toplam olasılık değeri 0,5 olan bir düzine ağaç varsa, o zaman belki bu zayıf bir bağlantıdır ... Öte yandan, ağacın boyutunu da hesaba katmanız gerekiyor (şu anda sadece yapraklardaki kısa kuralları tespit etmek için 4 derinliğini kullanıyorum). Bu böyle, kulaktaki düşünceler, cevaba ihtiyaç duymadan ...