Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1911

 
Maksim Dmitrievski :
Hareket halindeyken bestelersiniz) 100 değil 24 sütun. Dosyayı kendiniz istediniz. Hata yok (açıklandı). 300 küsur satır çünkü sana bir yıl verdim, böylece 'jeneratörün' saymayı başaramadı))) Ama devam et. Bitiremedim ama umut verici bir başlangıç. Daha sonra tam bir inceleme yayınlayacağım. Görünüşe göre video formatında cevap vermem gerekecek
Evet, Maxim, üzgünüm, senin eğitim dosyan değildi, ama sanırım mesajın anlamı açık. 24 sütun 2000 vektörü tekrarsız açıklayamaz. Sadece fiziksel olarak imkansız...
 
Michael Marchukajtes :

Kirli dosyam 24 lig aldığım 7700 sütundan oluşuyor, bu yüzden devam etmeyin, daha çok buraya bakın. İşte dosyan

Ve işte benim

Fark ne???? yılmayacağım. Temel bileşenleri analiz ederken, her sütun kendi koordinat sistemi olduğunda, farklı sütunlardan alınan noktalar onlar için ortak bir koordinat sistemi üzerinde işaretlenebildiğinde, bunların gruplandırılabilmesi önemlidir. Yorumlama basittir. Daha fazla dikey ve yatay vektör, daha iyi. Bu aptalca tek tip noktaya sahipsin.

Biraz anladım, aslında vektörler arasındaki açılar bir korelasyon gösteriyor (90g = 0 korelasyon). Gecikme artışları veriyorum, orada korelasyon olmayacak, beyaz gürültü gibi.

50 eğitim örneği (50 satır) ile idare etmeniz şaşırtıcı, ızgaranın ne kadar iyi olması gerektiği. Verileri tanımlayabilen gereksiz işlevleri (ideal olarak bir taneye kadar) atmak için birçok örneğe ihtiyaç vardır.

 
Michael Marchukajtes :
Evet, Maxim, üzgünüm, senin eğitim dosyan değildi, ama sanırım mesajın anlamı açık. 24 sütun 2000 vektörü tekrarsız açıklayamaz. Sadece fiziksel olarak imkansız...


bir iz içinde. bir kez dans ettiğimde

 
Maksim Dmitrievski :

bir iz içinde. bir kez dans ettiğimde

vtreet bilgisayar kullanmaz, bununla hiç ilgili değil. Ne yaptıklarını anlamadım.

eksik değerleri önceden işlerler. vs. + yeni özellikler oluşturuyorlar ama onu bir özellik tümevarımı olarak konumlandırmıyorlar, özelliklerin önemini de göz önünde bulunduruyorlar ama onu bir özellik seçimi olarak konumlamıyorlar, bu yüzden ne olduğunu ve nasıl çalıştığını bilmiyorum.



"RSA doğrusaldır ve onu çöp kutusuna atabileceğiniz gerçeği" ile ilgili

Burada, + - %98 doğrulukla yeni verilerdeki RSA ayrıştırmasından fiyatı toplayabileceğime bahse girerim

Kanıtlayabilirim, yani burada yanılıyorsunuz, hatta lineer olması harika bir şey, yoksa toplamazdım.

 
Maksim Dmitrievski :


bir iz içinde. bir kez dans ettiğimde

Genel olarak, sütunların girdi olduğu (değişkenleri açıklayan), satırların öğrenme vektörleri veya örnekler olduğu terminolojiye katılıyorum. Bazı öğrenme algoritmaları için, sütunlardan daha az satır olduğunda bunun kritik olması oldukça olasıdır, ANCAK sütunlardan daha fazla satır olduğunda, modeli yeniden eğitim alanına çeken benzer örneklere sahip olursunuz. 24 açıklayıcı değişken (sütun) ile 350 örnek (satır) anlatmak ve tekrardan kaçınmak mümkün değildir.

Genel olarak PCA'yı hiçbir şekilde kullanmıyorum, sadece başka bir kullanıcı için bir örnekti. Bununla, ortaya çıkan kümenin ne kadar bölünebileceğini değerlendirebilirsiniz.


not Pod..eb sayılan bir şarkı ile. Aferin!

 
Yani teorik olarak, sütun ve satır sayısı aynı olduğunda eğitim için en havalı matris karedir .... Hmm ... Bu arada, bu bana eğitim için çok sayıda örnek almayı düşündürdü, burada, ön işlemeden sonra aynı sayıda sütun kalır .... Bu bir fikir ... öyleyse .... %100 kare matriste tekrar yoktur ....
 
Michael Marchukajtes :

Genel olarak, sütunların girdi olduğu (değişkenleri açıklayan), satırların öğrenme vektörleri veya örnekler olduğu terminolojiye katılıyorum. Bazı öğrenme algoritmaları için, sütunlardan daha az satır olduğunda bunun kritik olması oldukça olasıdır, ANCAK sütunlardan daha fazla satır olduğunda, modeli yeniden eğitim alanına çeken benzer örneklere sahip olursunuz . 24 açıklayıcı değişken (sütun) ile 350 örnek (satır) anlatmak ve tekrardan kaçınmak mümkün değildir.

Genel olarak PCA'yı hiçbir şekilde kullanmıyorum, sadece başka bir kullanıcı için bir örnekti. Bununla, ortaya çıkan kümenin ne kadar bölünebileceğini değerlendirebilirsiniz.


not Pod..eb sayılan bir şarkı ile. Aferin!

sadece sınıf etiketlerinin sayısı çok farklıysa (sınıflar dengeli değil)

Seninle hiçbir şey için acı çekmedim .. en ünlü sihirbaz ve büyücü)))

 
Michael Marchukajtes :

Modeli yeniden eğitim alanına çeken yakınlarda bulunan benzer örneklere sahipsiniz.

bu "aynı örnekler" sadece istatistiksel olarak anlamlı yapılar oluşturur - istatistik nedir? bu, bir şeyin tekrarlandığı zamandır ve bundan bazı sonuçlar çıkarabilirsiniz.

Michael Marchukajtes :

24 açıklayıcı değişken (sütun) ile 350 örnek (satır) anlatmak ve tekrardan kaçınmak mümkün değildir.

tekrarlarda neyi beğenmedin

 
mytarmailS :

bu "aynı örnekler" sadece istatistiksel olarak anlamlı yapılar oluşturur - istatistik nedir? bu, bir şeyin tekrarlandığı zamandır ve bundan bazı sonuçlar çıkarabilirsiniz.

tekrarların neresini beğenmedin

Üç tür yalan vardır: yalanlar, lanet olası yalanlar ve istatistikler . — Mark Twain

Tekrarlar ezberlemeye yol açar, ancak ağı genelleştirmemiz gerekiyor. Yani, benzersiz bir vektör göndermemiz gerekiyor, böylece yalancının yanında yeni bir vektör göründüğünde, ağın yeterince tepki vermesi. Kümede bir grup yakın vektör varsa, ağ onları basitçe ezberler....

Başka bir deyişle, algoritma bu iki yakın vektöre makul olmayan büyük bir ağırlık atayacaktır....

 
Maksim Dmitrievski :

sadece sınıf etiketlerinin sayısı çok farklıysa (sınıflar dengeli değil)

Seninle hiçbir şey için acı çekmedim .. en ünlü sihirbaz ve büyücü)))

Başlangıçta, iki sınıftan bahsediyorum ve daha fazlası değil. Üç veya daha fazla sınıf varsa, sütunlardan daha fazla satırın olduğu benzersiz vektörlerden oluşan bir tablo oluşturmaya izin verilir, ancak bunların benzersizliği yalnızca hedef tarafından belirlenir.