Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1203

 
Alexey Vyazmikin :

Teşekkür ederim. Tahmin edicinin örnekte sahip olduğu aynı değerlerle rastgele yapmak gerekiyor, doğru anlamış mıyım?

Genel olarak yaklaşım açık, teşekkürler, nasıl uygulanacağını ve test edileceğini düşünmemiz gerekiyor.

Ne yazık ki, üstesinden gelemiyorum, bu yüzden ara sıra dudaklarından bir tekrarı dinleyeceğim.

hayır, rastgele genellikle solcu, yani tahmin değerlerini tamamen temizleyin ve orada beyaz gürültüyü itin

ardından bir sonraki kontrole geçtiğinizde orijinal değerleri geri itin

Kabaca söylemek gerekirse, her bir tahmincinin yerine beyaz gürültüyü tek tek değiştirin. Yani, muhtemelen daha net.

Önemli bir koşul: göstergeler bağıntılı olmamalı, aksi takdirde hatalarla çöp olacak.Bunu yapmak için önce PCA aracılığıyla dönüştürdüm, ancak bir korelasyon matrisi yapabilir ve tüm güçlü korelasyonları kaldırabilirsiniz. Başka bir mekanizma var ama zor
 
Maksim Dmitrievski :

hayır, rastgele genellikle solcu, yani tahmin değerlerini tamamen temizleyin ve orada beyaz gürültüyü itin

ardından bir sonraki kontrole geçtiğinizde orijinal değerleri geri itin

Eğer sadece gürültü ise, o zaman bölmeyi tamamen kıracağız, örneğin, "100'den fazla" kuralına sahip bir bölme var ve 0'dan 99'a rastgele tıklıyoruz, o zaman daha fazla bölme artık aktif olmayacak ve muhtemelen Sayfa kurallarından birini bırakarak daha fazla bölmenin nasıl çalışacağını görmek önemli ...

 
Maksim Dmitrievski :


Önemli bir koşul: göstergeler bağıntılı olmamalı, aksi takdirde hatalarla çöp olacak.Bunu yapmak için önce PCA aracılığıyla dönüştürdüm, ancak bir korelasyon matrisi yapabilir ve tüm güçlü korelasyonları kaldırabilirsiniz. Başka bir mekanizma var ama zor

Hangi korelasyon kabul edilebilir? Ne de olsa, iyi tahminciler hedefle bağlantılı olmalıdır ve bu nedenle birbirleriyle bir dereceye kadar korelasyon göstereceklerdir ...

 
Alexey Vyazmikin :

Eğer sadece gürültü ise, o zaman bölmeyi tamamen kıracağız, örneğin, "100'den fazla" kuralına sahip bir bölme var ve 0'dan 99'a rastgele tıklıyoruz, o zaman daha fazla bölme artık aktif olmayacak ve muhtemelen Sayfa kurallarından birini bırakarak daha fazla bölmenin nasıl çalışacağını görmek önemli ...

hatanın çok düşeceği ve her şeyin bir demet olacağı anlamına gelir , önemi düşüktür. Ağaçların nasıl ayrıldığını bildiğiniz modellerin içine tırmanmayın, her biri farklı sayıda özelliğe sahip. Hastane için her zaman ortalama görünüyor

 
Alexey Vyazmikin :

Hangi korelasyon kabul edilebilir? Ne de olsa, iyi tahminciler hedefle bağlantılı olmalıdır ve bu nedenle birbirleriyle bir dereceye kadar korelasyon göstereceklerdir ...

bu, bir öngörücü ile doğrusal regresyon için sapkınlıktır, doğrusal olmayan modellerde, özellikle bir sınıflandırma ise, hedefle ilişkilendirmek için hiçbir şey gerekli değildir.

Hangisinin kabul edilebilir olduğunu bilmiyorum, zor .. veya deneysel olarak. Bu konuda PCA ile daha kolay tabii ki
 
Maksim Dmitrievski :

hatanın çok düşeceği ve her şeyin bir demet olacağı anlamına gelir, önemi düşüktür. Ağaçların nasıl ayrıldığını bildiğiniz modellerin içine tırmanmayın, her biri farklı sayıda özelliğe sahip. Hastanede her zaman ortalama görünür

O zaman değeri sıfırlayabilir veya başka herhangi biriyle değiştirebilirsiniz - aynı rastgele, ama bana öyle geliyor ki bu mantıklı değil ... genel olarak, eğer bunu uygulayabilirsem, o zaman iki seçeneği deneyeceğim.

Maksim Dmitrievski :

bu doğrusal regresyon için sapkınlıktır, doğrusal olmayan modellerde hiçbir şey hedefle ilişkilendirilmemelidir

Peki, hedefle bir korelasyon varsa, tahmin edicinin kötü olduğu argümanı ne olabilir?

 
Alexey Vyazmikin :

O zaman değeri sıfırlayabilir veya başka herhangi biriyle değiştirebilirsiniz - aynı rastgele, ama bana öyle geliyor ki bu mantıklı değil ... genel olarak, eğer bunu uygulayabilirsem, o zaman iki seçeneği deneyeceğim.

Peki, hedefle bir korelasyon varsa, tahmin edicinin kötü olduğu argümanı ne olabilir?

istediğiniz gibi yapın, ana ilke özellikleri yeniden düzenleme ilkesidir, bana öyle geliyor ki bunlar önemsiz şeyler, büyük olasılıkla

bu bir değil, ama birçoğu olduğunda ve ithalatlar aşağı yukarı aynı olduğunda, çünkü aralarındaki ilişki güçlüdür. Yeniden düzenleme sırasında güçlü bir özelliğin kaldırılmasının, model hatasının düşmeyeceği ortaya çıktı, çünkü aynı içe aktarma ile benzer özellikler olacak ve hiçbir güçlü özellik tanınmayacaktır. Bu nedenle, ya tüm ilişkili özellikleri bir kerede (uygulanması daha zor olan) rastgele seçmeniz ya da başlangıçta hiçbir şeyin güçlü bir şekilde ilişkili olmamasına dikkat etmeniz gerekir.

 
Maksim Dmitrievski :

istediğiniz gibi yapın, ana ilke özellikleri yeniden düzenleme ilkesidir, bana öyle geliyor ki bunlar önemsiz şeyler, büyük olasılıkla

bu bir değil, ama birçoğunun olduğu ve ithalatın yaklaşık olarak aynı olduğu zaman hakkında, çünkü korelasyon güçlüdür. Yeniden düzenleme sırasında güçlü bir özelliğin kaldırılmasının, model hatasının düşmeyeceği ortaya çıktı, çünkü aynı içe aktarmayla benzer özellikler olacak ve tek bir güçlü özellik tanınmayacak

Aynı zamanda, simetrik ağaçların oluşturulabileceği şekilde tahmin ediciler kazanması gereken modeldir - sonuçta, yeniden eğitim olmadan, bana göründüğü gibi bu olası değildir, çünkü bir model oluştururken bu hiçbir anlam ifade etmez.

Peki ne tür bir korelasyon kabul edilebilir?
 
Alexey Vyazmikin :

Aynı zamanda, simetrik ağaçların oluşturulabileceği şekilde tahmin ediciler kazanması gereken modeldir - sonuçta, yeniden eğitim olmadan, bana göründüğü gibi bu olası değildir, çünkü bir model oluştururken bu hiçbir anlam ifade etmez.

ormanda bu harika çalışıyor, bir catbust durumunda, okumanız gerekiyor, nasıl çalıştığını hatırlamıyorum. Belki de modelin yapısı nedeniyle ithalatının kendisi iyi uygulandı.

Neyin kabul edilebilir olduğunu bilmiyorum, biraz eşik koyun ve görün. + - modelde çok az değişiklik olacak. Güçlendirmenin RF çalışma şekli olmamasına rağmen, belki başlangıçta orada net bir ithalat vardır.

veya özelliklerin prensipte heterojen olduğundan ve birbiriyle ilişkili olmadığından eminseniz, genellikle bu adımı deneyin.

bunların hepsi önemli şeyler, özellikle çok fazla özellik varsa ve modeli gürültülü yapmamak için cüruf atmanız gerekiyorsa, ancak korelasyonun her %'si için sallanacağınız kadar değil, sanırım. -0.5 aralığında; 0,5 tamam

Daha sonra kendim yapacağım, bir göz atacağım

 
Maksim Dmitrievski :

ormanda bu harika çalışıyor, bir catbust durumunda, okumanız gerekiyor, nasıl çalıştığını hatırlamıyorum. Belki de modelin yapısı nedeniyle ithalatının kendisi iyi uygulandı.

Neyin kabul edilebilir olduğunu bilmiyorum, biraz eşik koyun ve görün. + - modelde çok az değişiklik olacak. Güçlendirmenin RF çalışma şekli olmamasına rağmen, belki başlangıçta orada net bir ithalat vardır.

veya özelliklerin prensipte heterojen olduğundan ve birbiriyle ilişkili olmadığından eminseniz, genellikle bu adımı deneyin.

bunların hepsi önemli şeyler, özellikle çok fazla özellik varsa ve modeli gürültülü yapmamak için cüruf atmanız gerekiyorsa, ancak korelasyonun her %'si için sallanacağınız kadar değil, sanırım. -0.5 aralığında; 0,5 tamam

Daha sonra kendim yapacağım, bir göz atacağım

Tabii, denemek zorundasın. Hedefle kesinlikle böyle bir korelasyon yok, ancak tüm eller matrise ulaşmıyor - sadece korelasyon için yapraklara ve muhtemelen catbust modellerine bakmak istiyorum - Modellerin eşleştirilmesinin mümkün olduğundan eminim - basit bir numaralandırma gösterdi bu, ancak her şeyin daha makul bir şekilde yapılması gerekiyor ve ortaya çıkan korelasyon, modelleri eşleştirirken yineleme sayısını azaltacaktır.