Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2739

 
mytarmailS #:
Alexei, bu normal bir arama görevi, tıpkı senin istediğin gibi, sorun nedir?

Yani komut dosyası bunu yapıyor mu yapmıyor mu?

Sadece burada kaç kişinin konuşmanın akışını kolayca kaybettiğini merak ediyorum.

 

Çok sayıda öngörücü içeren bir örnek gönderebilirim, kim en iyilerini seçebilirse - aferin - bir yarışma yapalım.

En iyiler, seçilen tahmin ediciler üzerinde modeli eğittikten sonra bağımsız bir örneklem üzerinde belirlenecektir.

Katılmak isteyen var mı, yoksa hepsi kulaktan kulağa bu kadar yetenekli mi?

 

Çok genel bir konu. Sık sık bileşenlerine ayrılıyor. Birden fazla konuya bölünmek için çok gecikti. Örneğin: 1. MO: veri ön işleme. 2. MO model seçimi. 3. MO.Model eğitimi ve optimizasyonu. 4. MO.Modellerin uygulanması. 5. MO. IO Otomasyonu.

Bölüm çok büyük ve yaklaşıktır, ancak dalın ne hakkında olduğu açık olacaktır. Ve böylece her şey ve hiçbir şey hakkında.

Ve tabii kitekrarlanabilir kod örnekleri vermek gerekiyor, aksi takdirde konuşmaların pratik bir faydası yok.

Herkese iyi şanslar

 
Aleksey Vyazmikin #:

Peki senaryo bunu yapıyor mu, yapmıyor mu?

Buradaki pek çok insanın konuşmanın akışını bu kadar kolay kaybetmesine şaşırıyorum.

Alexey, sürgülü pencere ile işaretlerin önemine nasıl bakılacağına dair bir örnek istemiştin.

Ben de senin için bir senaryo yazdım.

O zaman farklı ölçeklerde arama yapmak istiyorsun ya da ne istersen, neden geçmişten gelen bir betik gelecekte isteklerini yerine getirebilsin ki?

Burada bu kadar çok insanın konuşmanın akışını kolayca kaybetmesine şaşırıyorum. Bu sizsiniz.

 
Vladimir Perervenko #:

Çok genel bir konu. Sık sık bileşenlerine ayrılıyor. Birden fazla konuya bölünmek için çok gecikti. Örneğin: 1. MO: veri ön işleme. 2. MO model seçimi. 3. MO.Model eğitimi ve optimizasyonu. 4. MO.Modellerin uygulanması. 5. MO. MOE'lerin otomasyonu.

Bölüm çok büyük ve yaklaşıktır, ancak şubenin ne hakkında olduğu açık olacaktır. Ve böylece her şey ve hiçbir şey hakkında.

Ve tabii ki tekrarlanabilir kod örnekleri vermek gerekir, aksi takdirde konuşmaların pratik bir faydası olmaz.

Herkese iyi şanslar

Daha ziyade, çözdüğümüz görevlere göre bölünmeliyiz, ancak bu çok bireysel...

Örneğin, bir ön işleme başlığında iki kişi ortak bir zemin bulamayacaktır; eğer biri tüm örneklem üzerinde ZZ'yi tahmin ederken diğeri bazı ihtiyaçlar için tüm verilerden 10-20 küme seçmek için MO kullanıyorsa.... Vb...

Aynı bok orada olacak, ancak konulara daha fazla bulaşmış olacak
 
Valeriy Yastremskiy #:

SSF pek yeni bir şey söylemedi, elbette tahmin ediciler ve sonuçlar arasında korelasyon bulma hedefi bariz bir hedef. Yakaladığım tek yeni şey, tüm eğitim için yaklaşık 200 önemli özellik bulduğu, ancak belirli veriler için bunların yalnızca yüzde 5'ini kullandığı oldu.

Bunu, sadece en son veriler için daha önemli tahmin ediciler seçmek amacıyla bir serinin durumunu/özelliklerini hızlı bir şekilde belirlemenin bazı yolları olduğu anlamına geldiğini anlıyorum. Elbette uygun seçim için hacim veya uzunluk sorunu ortaya çıkıyor. Ancak görünüşe göre, tüm büyük eğitimde bulunan ve seçilen yalnızca 200 tahminci ile bile çalışıyor.

Benbunu şöyle görüyorum. Bir serinin bazı endekslerde kararlı olan özellikleri vardır, ancak bu endeksler ve sayıları farklı bölümlerde farklıdır. MO, serinin yeterli kararlılık süresine sahip bazı farklı durumlarını bulur, bunlar farklı modeller ve buna bağlı olarak model ayarları - tahmin ediciler tarafından tanımlanabilir. Tahmin edicilerin toplam sayısı, farklı modeller için ayarların toplam sayısıdır ve buna göre, bir model tanımlanarak, bunun için daha önce bulunan ayarlar hızlı bir şekilde bulunabilir.


Bir zamanlar bu başlıkta bir tablo yayınlamıştım, ancak şimdi elimde değil, bu yüzden fikrimi kelimelerle açıklayacağım.

Tahmin edici-öğretmen korelasyonu kavramına güveniyorum. "Bağlantı", hemen hemen her MOE modeline uyan tahmin edicilerin korelasyonu veya "önemi" DEĞİLDİR. İkincisi, bir tahmin edicinin bir algoritmada ne sıklıkla kullanıldığını yansıtır, bu nedenle Satürn'ün halkalarına veya kahve telvesine büyük bir "önem" değeri verilebilir. Örneğin, bilgi teorisine dayalı olarak tahmin edici ve öğretmen arasındaki "bağlantıyı" hesaplamanıza olanak tanıyan paketler vardır.

Burada yayınladığım tablo hakkında bir şeyler söylemek istiyorum.

Tablo, her bir yordayıcı ile öğretmen arasındaki "bağlantının" sayısal bir tahminini içeriyordu. Pencere hareket ettikçe yüzlerce "bağlantı" değeri elde edildi. Belirli bir öngörücü için bu değerler değişiyordu. Her bir "bağlantı" için ortalama ve sd değerlerini hesapladım:

- Çok küçük bir "bağlantı" değerine sahip tahmin edicileri izole etmek - gürültü;

- Çok değişken bir "bağlantı" değerine sahip olan tahmin edicileri izole etmek. Yeterince büyük bir "bağlantı" değerine ve %10'dan az sd değerine sahip tahmin ediciler bulmak mümkün oldu.


Bir kez daha, MO'ya dayalı bir TC oluşturmanın sorunu, pencere hareket ettiğinde büyük bir "bağlantı" değerine ve küçük bir sd değerine sahip tahmin ediciler bulmaktır. Bence bu tür tahmin ediciler gelecekte tahmin hatasının istikrarını sağlayacaktır.


Yukarıdakileri ilk kez söylemiyorum. Ne yazık ki tartışma sürekli olarak gürültü ve narsisizme gidiyor.

 
mytarmailS #:

Alexei, kayan bir pencere ile özellik önemine nasıl bakılacağına dair bir örnek istediniz.

Senin için bir senaryo yazdım.

O zaman farklı ölçeklerde arama yapmak istiyorsunuz ya da ne istiyorsanız, neden geçmişten gelen bir senaryo gelecekte sizin isteklerinizi yerine getirebilsin ki?

Bu yüzden burada bu kadar çok insanın konuşmanın akışını kolayca kaybetmesine şaşırıyorum. Bu sizsiniz.

Nasıl yani, bir betik yapmanızı istedim - evet, alıntı yapıyorum " Örneklemim için hesaplamalar için R'de bir betik yapabilir misiniz - deney uğruna çalıştıracağım. Deney, optimum örneklem büyüklüğünü ortaya çıkarmalıdır. ", ancak bu zaten yapılmış olan bir şeye yanıttır.

Daha önce "... Dinamik olarak nasıl izlemeyi, nasıl gerçekleştirmeyi öneriyorsunuz? " - burada dinamiklerde tahmin edici tahmininin uygulanmasını soruyordum, yani bir pencere ile düzenli tahmin ve bunun her yeni örnekte mi yoksa her n örnekten sonra mı bir pencere olduğu açık değil. Eğer yaptığınız şey buysa, bunu anlamıyorum.

Gönderdiğiniz kod harika, ancak tam olarak ne yaptığını veya özünde neyi kanıtladığını anlamak benim için zor, bu yüzden ek sorular sormaya başladım. Grafikli iki resim ne anlama geliyor?

 
СанСаныч Фоменко #:

Bir keresinde bu başlıkta bir tablo yayınlamıştım, ancak şu anda elimde değil, bu yüzden düşüncelerimi kelimelerle açıklayacağım.

Ben tahminci-öğretmen korelasyonu kavramına güveniyorum. "Bağlantı", hemen hemen her MOE modeline uydurulan tahmin edicilerin korelasyonu veya "önemi" DEĞİLDİR. İkincisi, bir tahmin edicinin bir algoritmada ne sıklıkla kullanıldığını yansıtır, bu nedenle Satürn'ün halkalarına veya kahve telvesine büyük bir "önem" değeri verilebilir. Örneğin bilgi teorisine dayalı olarak tahmin edici ve öğretmen arasındaki "bağlantıyı" hesaplamaya izin veren paketler vardır.

Burada yayınladığım tablo hakkında biraz bilgi vereyim.

Tablo, her bir öngörücü ile öğretmen arasındaki "bağlantının" sayısal bir tahminini içeriyordu. Pencere hareket ettikçe yüzlerce "bağlantı" değeri elde edilmiştir. Belirli bir yordayıcı için bu değerler değişiyordu. Her bir "bağlantı" için ortalama ve sd değerlerini hesapladım:

- Çok küçük "bağlantıya" sahip tahmin edicileri izole edin - gürültü;

- Çok değişken bir "bağlantı" değerine sahip tahmin edicileri izole edin. Yeterince büyük bir "bağlantı" değerine ve %10'dan az sd değerine sahip tahmin ediciler bulmak mümkün olmuştur.


Bir kez daha, MO'ya dayalı bir TC oluşturmanın sorunu, pencere hareket ettiğinde büyük bir "bağlantı" değerine ve küçük bir sd değerine sahip tahmin ediciler bulmaktır. Bana göre, bu tür tahmin ediciler gelecekte tahmin hatasının istikrarını sağlayacaktır.


Yukarıdakileri ilk kez söylemiyorum. Ne yazık ki tartışma sürekli olarak gürültü ve narsisizme kayıyor.

Yani özünde benimle aynı yaklaşıma sahipsiniz, merak ediyorum! Sadece, belki de "bağlantıyı" farklı arıyoruz. Ben windows olarak 10 örnek grafik alıyorum ve bunlar üzerinde "bağlantı" arıyorum, siz nasıl yapıyorsunuz?

Bağlantı bulmak için kullandığınız algoritma nedir, açıklayabilir misiniz?

 
СанСаныч Фоменко #:


Yukarıdakileri ilk kez söylemiyorum. Ne yazık ki tartışma sürekli olarak gürültüye ve narsisizme sürükleniyor.

evet, asıl discus arka planda en dartagnan dartagnan sunumuna gidiyor (moderated word) :-)

hepsi herhangi bir sonuç eksikliğinden. Yöntemi geliştirip değiştirebilirsiniz ama sonuç 50/50 taş gibi.

 
Aleksey Vyazmikin #:

Yani özünde benimle aynı yaklaşıma sahipsiniz, merak ediyorum! Sadece belki de "bağlantı "yı farklı arıyoruz. Pencereler olarak ben 10 örnek parsel alıyorum ve bunlarda "bağlantı" arıyorum, siz nasıl yapıyorsunuz?

Bir bağlantı bulmak için kullandığınız algoritma nedir, açıklayabilir misiniz?

Kendi algoritmamı kullanıyorum - çok sayıda R kütüphanesinden çok daha hızlı çalışıyor. Örneğin,

library("entropy")

Sadece grafikleri kullanabilirsiniz:



Her şey bu başlıkta yayınlanmıştır. Her şey Vladimir Perervenko'nun makalelerinde sistematik olarak açıklanmış ve kod düzeyinde incelenmiştir