Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2550
Alım-satım fırsatlarını kaçırıyorsunuz:
- Ücretsiz alım-satım uygulamaları
- İşlem kopyalama için 8.000'den fazla sinyal
- Finansal piyasaları keşfetmek için ekonomik haberler
Kayıt
Giriş yap
Gizlilik ve Veri Koruma Politikasını ve MQL5.com Kullanım Şartlarını kabul edersiniz
Hesabınız yoksa, lütfen kaydolun
Genel olarak konuşursak, eğitimden sonra (trende) bir model değil, metaparametreler tarafından belirlenen bir dizi model vardır. Örneğin, kement regresyonunda farklı derecelerde enterpolasyon polinomu veya farklı düzenlileştirme katsayıları vb. Daha sonra metaparametre için en iyi değer belirlenir (test için kontrol edilerek setten en iyi model alınır). Buna karşılık, testte bir meta parametrenin optimizasyonu, optimizasyon için hangi sınavın kullanılabileceği bazı parametreler (meta-meta-parametreler) tarafından da belirlenebilir. Örneğin, ilk örneğin hangi oranlarda tren ve teste bölüneceği.
Ancak, büyük olasılıkla, fikrinizi anlamadım)
En uygun meta-parametreler bir test bölümü için değil, çapraz doğrulama veya ileriye doğru yürüme yoluyla toplanan birbirine yapıştırılmış birkaç bölüm için seçilir. Geçenlerde tartışıldı .
Kabul ediyorum. Aslında, çapraz doğrulamanın da zor bir şekilde düzenlenebileceği ve başka bir örnek için optimize edilebilen (ve alınamayan) bazı kendi parametreleri (meta-meta-parametreler) tarafından ayarlanabileceği fikrini ifade etmek istedim. tavandan).
Kabul ediyorum. Aslında, çapraz doğrulamanın da zor bir şekilde düzenlenebileceği ve bir örnek daha için optimize edilebilecek (ve tavandan alınmıştır).
Doğru anlaşıldı - tren örneğinin sınav örneğine daha çok benzemesi için herhangi bir işlem yapmak.
Soru, o zaman en iyi nasıl yapılacağıdır.
Sıklıkla kullanılan seçeneklerden biri, tahmin edicilerin numaralandırılmasıdır - ancak büyük bir kümede bunlardan çok fazla vardır. Örneğin, iki örnekte hedefin sonucunun benzerliği ve kararlılığı için dizileri (bir dizi tahmin edici) karşılaştırmak mümkün müdür? Daha sonra eğitim örneğinden anormal (örneğin, nadir veya sınav örneğinde bulunmayan) satırları atabiliriz ve bu nedenle teorik olarak çok daha iyi öğreniriz.
Doğru anlaşıldı - tren örneğinin sınav örneğine daha çok benzemesi için herhangi bir işlem yapmak.
Soru, o zaman en iyi nasıl yapılacağıdır.
Sıklıkla kullanılan seçeneklerden biri, tahmin edicilerin numaralandırılmasıdır - ancak büyük bir kümede bunlardan çok fazla vardır. Örneğin, iki örnekte hedefin sonucunun benzerliği ve kararlılığı için dizileri (bir dizi tahmin edici) karşılaştırmak mümkün müdür? Daha sonra eğitim örneğinden anormal (örneğin, nadir veya sınav örneğinde bulunmayan) satırları atabiliriz ve bu nedenle teorik olarak çok daha iyi öğreniriz.
Vladimir'in bununla ilgili bir makalesi vardı, paketin adını hatırlamıyorum, ancak örnekten tahmin edilemez satırlar attı.
İlginç, bakmak zorunda kalacak. Ama ben tahmin edilemeyeni değil, eğitim dışında örnekte bulunmayanı atmak istiyorum. Tabii ki onları bir şekilde işaretlemek ve sadece onları atmak değil - tanımlamak bile ilginç.
İlginç, bakmak zorunda kalacak. Ama ben tahmin edilemeyeni değil, eğitim dışında örnekte bulunmayanı atmak istiyorum. Tabii ki onları bir şekilde işaretlemek ve sadece onları atmak değil - tanımlamak bile ilginç.
Belki de, iki tür olabilen gözlemlerdeki aykırı değerleri kaldırmaktan bahsediyoruz - yanıtın büyüklüğüne ve tahmin edicilerin büyüklüğüne göre (her ikisi de tek bir gözlemde birleştirilebilir). Aslında emisyonlara birincisi denir ve ikincisi genellikle bir şekilde farklı olarak adlandırılır. Bu bilim, lineer regresyon için iyi kurulmuştur. Muhtemelen, her bir gözlemin sınava göre bir anlamda aykırı olup olmadığını testten kontrol etmek mümkündür.
İlginç, bakmak zorunda kalacak. Ama ben tahmin edilemeyeni değil, eğitim dışında örnekte bulunmayanı atmak istiyorum. Tabii ki onları bir şekilde işaretlemek ve sadece onları atmak değil - tanımlamak bile ilginç.
Vladimir'in bununla ilgili bir makalesi vardı, paketin adını hatırlamıyorum, ancak örnekten tahmin edilemez satırlar attı.
paket Gürültü FiltreleriR. Makaleye göz atın.
En uygun meta-parametreler, bir test bölümü için değil, çapraz doğrulama veya ileriye doğru yürüme yoluyla toplanan birkaç yapıştırılmış olanlar için seçilmelidir. Geçenlerde tartışıldı .
CV sonuçlarını kullanmanın en iyi yolu nedir? bulunan en iyi model parametrelerini alın ve ardından tüm veri kümesi üzerinde eğitin veya yalnızca iyi veri kümelerini seçmek için kullanın
örneğin, çıktı böyle bir tablodur
paket Gürültü FiltreleriR. Makaleye göz atın.
Gürültü tahmincileriyle her şey az çok netse, o zaman gürültü örnekleriyle o kadar da değil. Bunları nasıl tanımlayacağım hakkında daha fazla bilgi edinmek istiyorum (teori anlamında, kullanılan paketlerin/fonksiyonların adlarını değil, elbette R'nin her zaman makalelere bağlantıları olmasına rağmen). Her zaman piyasada olma arzusu bir hata olarak kabul edildiğinden, sınıflandırma yapılırken “ticaret yapmayın” sınıfının olması gerektiği açıktır. Ancak bu sınıfın az çok resmi bir biçimde nasıl doğru bir şekilde tanımlanacağı çok açık değildir.