Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2254

 
Maksim Dmitrievski :

Çok düşünmedim, sadece seçime dayalı bir tahmin

hmm size köpeğin daha önce görmediği özellikleri verecektir. Ama gördüklerime benzer. Ters dönüşümle, bu muhtemelen bir şekilde etkileyebilir. Gürültü ekle.

Bu bir varsayımdır.

İşte burada kafam karıştı...

PCA herhangi bir şekilde doğrusaldır, hiçbir şeyi bozmaz, tüm bileşenlere sahipseniz, ayrıştırdığınız şeyi kayıp olmadan geri koyabilirsiniz.

 
mytarmailS :

İşte burada kafam karıştı...

PCA herhangi bir şekilde doğrusaldır, hiçbir şeyi bozmaz, tüm bileşenlere sahipseniz, ayrıştırdığınız şeyi kayıp olmadan geri koyabilirsiniz.

Demek ki başka yerlerde tuzaklar var. PCA'lı resimlerle iyi çalışır, tırnak işaretleri ile daha hızlı olmasına rağmen onunla daha kötüdür

Eh, bu anlaşılabilir .. sayılarla resimler kolayca tahmin edilebilir ve piyasa durağan değildir. Üzerinde, PCA'nız karar vermez, volatilite değiştiğinde veya başka bir şey olduğunda bileşenler alakalı olmaktan çıkar.

dijital filtreler gibi

 
Maksim Dmitrievski :

Üzerinde, PCA'nız karar vermez, volatilite değiştiğinde bileşenler alakalı olmaktan çıkar.

ne demek istediğini anlamadım ama..

RSA'nın tüm bileşenlerini yeni veriler üzerine toplarsanız, kene için aynı fiyat adımı alırsınız, yani... alaka düzeyi ile ne demek istiyorsunuz?

 
mytarmailS :

ne demek istediğini anlamadım ama..

RSA'nın tüm bileşenlerini yeni veriler üzerine toplarsanız, kene için aynı fiyat adımı alırsınız, yani... alaka düzeyi ile ne demek istiyorsunuz?

kısacası köpekten sonra bahsedelim ben uyumak istiyorum)

kodlayıcılar deneysel olarak yuvarlanmaz

 
Maksim Dmitrievski :

kısacası köpekten sonra bahsedelim ben uyumak istiyorum)

kodlayıcılar deneysel olarak yuvarlanmaz

Tamam

 
mytarmailS :

birinci ol

2019'da Bayes yöntemiyle ilgili bir kurs izliyorum, orada ilginç fikirler var ama formüller anlamayı engelliyor. Birinin Bayes mantığıyla modern yaklaşımları denediğini düşündüm. Öğretim görevlisi genel olarak, ML'de olasılığı tahmin etmek için Bayesian yöntemleri olmayan tüm ML'nin sadece uygun olduğunu savunuyor.


Montajdan bahsetmişken, CatBoost modellerinin, numunenin temsili olmaması ve modelin oluşturulma şekli nedeniyle eğitim dışı numunelerdeki sonuçlarını kötüleştirdiği sonucuna giderek daha fazla meyilliyim. Gerçek şu ki, klasik modellerde ağaçlar simetriktir ve budama yoktur, bu da çok az verinin tek bir yaprağa girdiği ancak aynı zamanda yaprağın çok fazla ağırlık aldığı bir duruma yol açabilir. hatalı bir bölme, daha sonra eğitim dışı örneklerde , hatalı sayfada çok sayıda örnek varsa, bu, sonuçların önemli ölçüde bozulmasına yol açacaktır. Ve böyle binlerce yaprak olabilir. Örnek temsili olsaydı, sayfadaki ağırlık yeterli olacağından ve veri dağılımının (entropi) doğasına karşılık geleceğinden sorun olmazdı. Az sayıda örnekle yaprakların ağırlıklarını sıfırlayarak şant yapmaya çalışılmalıdır.

Buradaki fikir, modelin şu anda olduğu gibi "eğer bu doğruysa, o zaman yanlış" gibi bir yargıya değil, yalnızca bir fikri olduğu verilere tepki vermesidir.
 
Alexey Vyazmikin :

2019'da Bayes yöntemiyle ilgili bir kurs izliyorum, orada ilginç fikirler var ama formüller anlamayı engelliyor. Birinin Bayes mantığıyla modern yaklaşımları denediğini düşündüm. Öğretim görevlisi genel olarak, ML'de olasılığı tahmin etmek için Bayesian yöntemleri olmayan tüm ML'nin sadece uygun olduğunu savunuyor.


Montajdan bahsetmişken, CatBoost modellerinin, numunenin temsili olmaması ve modelin oluşturulma şekli nedeniyle eğitim dışı numunelerdeki sonuçlarını kötüleştirdiği sonucuna giderek daha fazla meyilliyim. Gerçek şu ki, klasik modellerde ağaçlar simetriktir ve budama yoktur, bu da çok az verinin tek bir yaprağa girdiği ancak aynı zamanda yaprağın çok fazla ağırlık aldığı bir duruma yol açabilir. hatalı bir bölme, daha sonra eğitim dışı örneklerde , hatalı sayfada çok sayıda örnek varsa, bu, sonuçların önemli ölçüde bozulmasına yol açacaktır. Ve böyle binlerce yaprak olabilir. Örnek temsili olsaydı, sayfadaki ağırlık yeterli olacağından ve veri dağılımının (entropi) doğasına karşılık geleceğinden sorun olmazdı. Az sayıda örnekle yaprakların ağırlıklarını sıfırlayarak şant yapmaya çalışılmalıdır.

Buradaki fikir, modelin şu anda olduğu gibi "eğer bu doğruysa, o zaman yanlış" gibi bir yargıya değil, yalnızca bir fikri olduğu verilere tepki vermesidir.

Duyarlılık önemli bir koşuldur.

Bir kesme, bölündüğünde, bir yaprakta az sayıda örnek bulunan yapraklar üretir mi? Önerilen derinlik orada 6, 2^6=64 yani. ortalama olarak, tüm numunedeki satırların 1/64'ü sayfaya düşecektir. En az 10.000 eğitim hattınız varsa, kağıt başına ortalama olarak yaklaşık 156 örnek olacaktır. Bence bu benim görüşüme göre oldukça temsili.

Ağaçlar simetrik yapılırsa belki bir miktar bozulma olabilir. Yaprakları ne kadar küçük gördünüz ve eğitim için kaç sıra gönderildi?

 
elibrarius :

Duyarlılık önemli bir koşuldur.

Bir kesme, bölündüğünde, bir yaprakta az sayıda örnek bulunan yapraklar üretir mi? Önerilen derinlik orada 6, 2^6=64 yani. ortalama olarak, tüm numunedeki satırların 1/64'ü sayfaya düşecektir. En az 10.000 eğitim hattınız varsa, kağıt başına ortalama olarak yaklaşık 156 örnek olacaktır. Bence bu benim görüşüme göre oldukça temsili.

Ağaçlar simetrik yapılırsa belki bir miktar bozulma olabilir. Yaprakları ne kadar küçük gördünüz ve eğitim için kaç satır gönderildi?

Şimdi kesin rakamlara sahip değilim - bu sadece bir tahmin. Eski kodlarıma dönmem gerekiyor, öyle görünüyor ki, bu tür istatistikleri alma fırsatım oldu - unuttum. Ortalamanın korkutucu görünmediğini söylemekte haklısınız, ancak bu, bir sayfada pek çok örnek olmayacağı anlamına gelmez.

Eğitim örneğindeki ve test örneğindeki aşırı olasılığın marjlarının genellikle önemli ölçüde farklı olduğunu görüyoruz - Sebebin az sayıda örnek içeren yapraklarda olduğunu varsayıyorum, bu tür yapraklar test örneğinde nadiren bulunur.

 

Eski modellerden biri olan ağaç yapraklarının aktivasyonu ile ilgili istatistiklerin değerlendirilmesinin böyle bir görselleştirmesi var.

Y ile - sayfanın numarası ve x ile - seçim satırı. Renk, modulo sac ağırlık oranını gösterir.

Burada bile nadir yaprak aktivasyonlarının olduğu görülebilir, bu varsayımın doğrulandığı anlamına gelir - bu bir sınav örneğidir


 
Alexey Vyazmikin :

Eski modellerden biri olan ağaç yapraklarının aktivasyonu ile ilgili istatistiklerin değerlendirilmesinin böyle bir görselleştirmesi var.

Y ile - sayfanın numarası ve x ile - seçim satırı. Renk, modulo sac ağırlık oranını gösterir.

Burada bile nadir yaprak aktivasyonlarının olduğu görülebilir, bu varsayımın doğrulandığı anlamına gelir - bu bir sınav örneğidir


Sınavda nadir görülen bir aktivasyon, daha ziyade pazarın değiştiği ve trende sık sık olanların artık olmadığı anlamına gelir. Ve trende birkaç yaprak aktivasyonunun olması gerekli değildir.