Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 109

 
Sohbeti destekleyeceğim ve fikir hafta sonu geldi. Gerçekten de, ağ ne kadar sık "Bilmiyorum" derse, onu aşırı eğitmeye o kadar yakın olur. OOS'un en başında, neredeyse tüm sinyaller açık bir şekilde yorumlanır, ancak zamanla Ağ giderek daha fazla "Bilmiyorum" demeye başlar, bu da yorumlanması zor yeni verilerin geldiğini gösterir. Belirli bir "Bilmiyorum" seviyesine ulaşıldığında, ağ aşırı eğitilir. Çok kullanışlı bir ürün....
 
FOS'ta modelin kademeli olarak azalması ve bu bilgilerin ticaretteki kullanışlılığı hakkındaki tüm konuşmalar , tahmin edicilerin ön seçiminden bahsetmeden inandırıcı görünmüyor.
 
San Sanych Fomenko :
FOS'ta modelin kademeli olarak azalması ve bu bilgilerin ticarette kullanışlılığı hakkındaki tüm konuşmalar, ön tahmin edicilerin seçiminden bahsetmeden inandırıcı görünmüyor.
Peki, ne seçim. Maksimum genelleme seviyesine sahip bir model seçiyoruz, eğitim aralığında nasıl çalıştığına bakıyoruz. Euvity eşit olarak büyümeli ... Ve işte iyi şanslar. O olmadan hiçbir yerde...
 
Andrey Dik :

Ato.

Model FOS'a yanlış sinyaller veriyorsa, bu bir piyasa değişikliği gerçeği değil, yanlış eğitimin bir göstergesidir.

Buna katılıyorum. Ve iki şebekenin sinyallerini nasıl analiz ediyorsunuz? Pek net değil mi? Ne ölçüde ayrılıyor veya uyum içinde gidiyorlar?
 
Alexey Burnakov :
Buna katılıyorum. Ve iki şebekenin sinyallerini nasıl analiz ediyorsunuz? Pek net değil mi? Ne ölçüde ayrılıyor veya uyum içinde gidiyorlar?

Sinyalleri aşağıdaki şemaya göre generale getiriyorum:

SATIŞ AL Çevirisi

-1 0 satmak

0 0 çit

0 1 satın al

-1 1 çit

İyi eğitilmiş bir modelde, sinyaller nadiren birbiriyle çelişir. Eğitim sitesinde onlardan eşit sayıda sinyal gerekli değildir ve kural olarak farklıdır ve bu anlaşılabilir, çünkü piyasada uzun süreli küresel eğilimler olabilir. Ancak bir şebekeden gelen sinyal sayısının diğerinden 2 katını geçmemesi için bir kısıtlama yapıyorum. Neden 2 kez - Cevap veremiyorum, ampirik oran, birileri farklı şekilde anlayabilir. Diyelim ki trend yukarıdan aşağıya değişiyor, satış sinyallerinin sayısı artıyor ve aynı zamanda al sinyalleri yalan söylemeye başlıyor, bir çelişki ortaya çıkıyor ve işlem sayısı düşüyor - yeni öğrenmeye ihtiyacın bir işareti.

 
Andrey Dik :

Sinyalleri aşağıdaki şemaya göre generale getiriyorum:

SATIN AL Çevirisi

-1 0 satmak

0 0 çit

0 1 satın al

-1 1 çit

İyi eğitilmiş bir modelde, sinyaller nadiren birbiriyle çelişir. Eğitim sitesinde eşit sayıda sinyale sahip olmaları gerekmez ve kural olarak farklıdırlar ve bu anlaşılabilir, çünkü piyasada uzun süreli küresel eğilimler olabilir. Ancak bir şebekeden gelen sinyal sayısının diğerinden 2 katını geçmemesi için bir kısıtlama yapıyorum. Neden 2 kez - cevap veremiyorum, ampirik oran, birileri farklı anlayabilir. Diyelim ki trend yukarıdan aşağıya değişiyor, satış sinyallerinin sayısı artıyor ve aynı zamanda al sinyalleri yalan söylemeye başlıyor, bir çelişki ortaya çıkıyor ve işlem sayısı düşüyor - yeni öğrenmeye ihtiyacın bir işareti.

Teşekkür ederim. Bu çalışan bir fikir olabilir.
 
birleştirici :

Evet, ancak nöronun konfigürasyonunda değil.

Andrey, görünüşe göre, o kadar güçlü girdilere işaret ediyor ki, üzerlerindeki herhangi bir varsayılan model, iyi ve fazla eğitimli olmayan bir sonuç verecektir.

Veya başka bir şey. Ama daha ayrıntılı bir cevap almak istiyorum.

 

jPrediction 9.00 Yayınlandı

Kullanım kılavuzundan alıntı:

« jPrediction'ın diğer makine öğrenimi yazılımlarından farkı

jPrediction arasındaki temel fark, herhangi bir kullanıcı ayarının olmamasıdır, bu da hem ayarlar hem de algoritma seçimi sürecinde ve seçim sürecinde insanlar tarafından yapılan hatalar şeklinde insan faktöründen kurtulmanızı sağlar. sinir ağlarının mimarisi. jPrediction'daki tüm makine öğrenimi süreci tamamen otomatiktir ve kullanıcılardan herhangi bir özel bilgi veya müdahale gerektirmez.

Otomatik modda jPrediction tarafından gerçekleştirilen işlevler

  1. Matematiksel bir sınıflandırma modeli oluşturmak için birçok örnek içeren bir dosyayı okumak ve ayrıştırmak;
  2. Makine öğrenimi öncesi veri normalizasyonu;
  3. Örnekteki tüm örneklerin kümesini iki alt kümeye bölmek: eğitim ve test;
  4. Eğitim alt kümesinden dengeleme örnekleri;
  5. Sinir ağlarının mimarisinin oluşumu;
  6. Çeşitli tahmin ediciler (faktörler) kombinasyonları ile bir eğitim alt kümesi üzerinde bir model seti eğitimi;
  7. Sinir ağlarının mimarisinin azaltılması - gereksiz unsurların kaldırılması;
  8. Örneklerin bir test alt kümesinde bir dizi modeli test etme ve genelleme yeteneklerini hesaplama;
  9. Maksimum genelleme yeteneği kriterine göre en iyi modelin seçimi.

Her biri diğer herhangi bir tahmin edici kombinasyonundan farklı olan model setinden yalnızca maksimum genelleme yeteneğine sahip olanı seçildiğinden, en önemli tahmin edicilerin azaltılması (seçimi) otomatik olarak gerçekleşir .

8. versiyondan itibaren jPrediction'ın eğitim setindeki maksimum tahminci sayısı konusunda herhangi bir kısıtlaması olmadığı söylenmelidir. 8'e kadar, eğitim örneğindeki öngörücü sayısı on ile sınırlıydı.

Sürüm 8'den önce jPrediction tek modeldi. Onlar. bir numune alınmış ve üzerinde sadece tek bir model eğitilmiş ve test edilmiştir.

Sürüm 8'den itibaren jPrediction çok modelli hale geldi, yani. numunenin farklı kısımlarında birçok farklı modeli eğitir ve test eder, her kısım farklı tahmin edici kombinasyonları içerir. Bu modellerden biri, numunenin test kısmında maksimum genelleme yeteneği verecektir.

Sorun şuydu ki, farklı tahmin edici kombinasyonları alırsak, o zaman tam bir kombinasyon sayımı ile, sözde birleşimsel (kombinatorik teriminden) "patlama", yani. Her ek tahmin edici ile, onsuz modellerin iki katı kadar modelin eğitilmesi ve test edilmesi gerekir. Numunedeki tahmin edicilerin sayısı onlarca hatta yüzlerce olarak ölçüldüğünde, makul bir sürede tüm model kombinasyonlarının eğitiminin ve test edilmesinin tamamlanmasını beklemek sorunlu hale gelir.

jPrediction'daki kombinatoryal "patlama" sorunu, tüm olası kombinasyonların numaralandırılmasıyla değil, sıralı aramayla çözüldü. Yöntemin özü şudur:

Tüm olası N ve daha az tahmin edici kombinasyonlarından geçerek maksimum genelleme yeteneğine sahip N tahmin edici içeren bir kombinasyon bulduğumuzu varsayalım. Buna N+1 tahmincileri eklememiz gerekiyor. Bunu yapmak için, kombinasyona dahil olmayan örneklemden tahmin edicileri zaten bulunan kombinasyona birer birer ekliyoruz ve onlar için genelleme yeteneğini ölçüyoruz. Böyle bir numaralandırma sürecinde, genelleme yeteneği N tahmin edicinin en iyi kombinasyonunu aşan N + 1 tahmin edicileri ile bir kombinasyon bulmuşsak, aynı şekilde N + 2 tahmin edicileri ile bir kombinasyon seçmek mümkün olacaktır. Ve eğer bulamadılarsa, daha fazla aramanın bir anlamı olmadığı ve kombinasyon arama algoritmasının en iyi N tahminci kombinasyonunda durduğu açıktır. Sonuç olarak, model için tahmin edicilerin bir kombinasyonunu aramaya yönelik algoritma, tüm olası kombinasyonların eksiksiz bir sayımına kıyasla çok daha erken durur. Aramanın bu sayıyı artırma yönünde az sayıda tahminci ile başlaması nedeniyle bilgi işlem kaynaklarında ek tasarruflar oluşur. Ve eğitim için ne kadar az tahminciye ihtiyaç duyulursa, modeller oluşturmak için o kadar az zaman ve bilgi işlem gücü gerekecektir.

İşte bazı turtalar.

İlgilenenler için ekteki ZIP arşivi, jPrediction 9 kullanıcıları için Rusça olarak PDF formatında talimatlar içerir:

Dosyalar:
 
Güzel! Hepsini sürükleyen tek kişi sen misin? "Azaltma" terimi açık değildir. Tekniği ele alırsak, bu bir şeyde çoklu bir azalmadır. Ve bir seçeneğin var.
 
Yuri Reshetov :

jPrediction 9.00 Yayınlandı


Bir önemsememek dışında her şey yolunda: Diğer modellerle karşılaştırma yok.

Hizmetlerimi karşılaştırmalı olarak sunuyorum

1. Tahminciler ve bir hedef değişken içeren bir girdi excel dosyası hazırlarsınız

2. Hesaplamaları yapın

3. Giriş dosyasını bana gönder

4. Randomforest, ada, SVM kullanarak hesaplamalar yaparım

Karşılaştırmak.