Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 91

 
ForeCA: Forecastable Component Analysis
  • 2012.05.22
  • Georg
  • www.gmge.org
Forecastable component analysis (ForeCA) is a novel dimension reduction (DR) technique to find optimally forecastable signals from multivariate time series (published at JMLR). ForeCA works similar to PCA or ICA, but instead of finding high-variance or statistically independent components, it finds forecastable linear combinations. ForeCA is...
 
Sihirbaz_ :
Ve isteyen herkes. z1 arşivi, tren ve test olmak üzere iki dosya içerir. Hedef için trende bir model oluşturun, teste uygulayın, sonuçları % olarak düzenleyin (başarılı bir şekilde tahmin edildi)
durumlar) her iki numune için de (tren = %xx, test = %xx). Yöntemleri ve modelleri seslendirmeye gerek yok, sadece sayılar. Herhangi bir veri manipülasyonuna izin verilir
ve çıkarma yöntemleri.

1. Tüm tahmin edicileriniz tahmine dayalı değildir - istisnasız hepsi gürültüdür

2. Üç model oluşturulmuştur: rf, ada, SVM. Sonuçlar burada

rf

aramak:

randomForest(formül = TFC_Target ~.,

veri = crs$veri kümesi[crs$örnek, c(crs$giriş, crs$hedef)],

ntree = 500, mtry = 3, önem = DOĞRU, değiştir = YANLIŞ, na.action = randomForest::na.roughfix)


Rastgele orman türü: sınıflandırma

Ağaç sayısı: 500

hayır. her bölmede denenen değişken sayısı: 3


OOB hata oranı tahmini: %49.71

Karışıklık matrisi:

[0, 0] (0, 1] sınıf hatası

[0, 0] 197 163 0.4527778

(0, 1] 185 155 0.5441176

ada

aramak:

ada(TFC_Target ~ ., veri = crs$dataset[crs$tren, c(crs$input,

crs$target)], kontrol = rpart::rpart.control(maxdepth = 30,

cp = 0.01, minsplit = 20, xval = 10), iter = 50)


Kayıp: üstel Yöntem: ayrık Yineleme: 50


Veriler için Nihai Karışıklık Matrisi:

son tahmin

gerçek değer (0,1] [0,0]

(0.1] 303 37

[0.0] 29,331


Tren Hatası: 0.094


Çanta Dışı Hatası: 0.157 yineleme= 50

DVM

SVM modelinin özeti (ksvm kullanılarak oluşturulmuştur):


"ksvm" sınıfının Vektör Makinesi nesnesini destekleyin


SV tipi: C-svc (sınıflandırma)

parametre : maliyet C = 1


Gauss Radyal Tabanlı çekirdek işlevi.

Hiperparametre : sigma = 0.12775132444179


Destek Vektör Sayısı : 662


Amaç Fonksiyon Değeri : -584.3646

Eğitim hatası: 0.358571

Olasılık modeli dahildir.


Geçen süre: 0.17 sn

Bir test setinde (senin değil, çıngırak anlamında)

Ada Boost modeli için test.csv [validate] (sayılar) için hata matrisi:


tahmin edilen

Gerçek(0.1] [0.0]

[0.0] 33 40

(0.1] 35 42


Test.csv [validate] üzerindeki Ada Boost modeli için hata matrisi (oranlar):


tahmin edilen

Gerçek(0.1] [0.0] Hata

[0.0] 0,22 0,27 0,55

(0,1] 0,23 0,28 0,45


Genel hata: %50, Ortalama sınıf hatası: %50


Çıngırak zaman damgası: 2016-08-08 15:48:15 kullanıcı

================================================= ====================

test.csv [validate] üzerindeki Rastgele Orman modeli için hata matrisi (sayılar):


tahmin edilen

Gerçek[0,0](0,1]

[0.0] 44 29

(0.1] 44 33


test.csv [validate] üzerindeki Rastgele Orman modeli için hata matrisi (oranlar):


tahmin edilen

Gerçek[0,0](0,1] Hata

[0.0] 0.29 0.19 0.40

(0,1] 0,29 0,22 0,57


Genel hata: %49, Ortalama sınıf hatası: %48


Çıngırak zaman damgası: 2016-08-08 15:48:15 kullanıcı

================================================= ====================

test.csv [validate] üzerindeki SVM modeli için hata matrisi (sayılar):


tahmin edilen

Gerçek[0,0](0,1]

[0.0] 41 32

(0.1] 45 32


test.csv [validate] üzerindeki SVM modeli için hata matrisi (oranlar):


tahmin edilen

Gerçek[0,0](0,1] Hata

[0.0] 0.27 0.21 0.44

(0,1] 0,30 0,21 0,58


Genel hata: %51, Ortalama sınıf hatası: %51


Çıngırak zaman damgası: 2016-08-08 15:48:15 kullanıcı

Rastgele ormanlar için ROC analizi

Yukarıdakileri onaylar.

Çözüm.

Tahminleriniz umutsuz.

 
Alexey Burnakov : Yani, yüzünüz maviye dönene kadar trende en iyi modeli eğitiyoruz. Belki iki veya üç model. Sonra test için tek seferlik testleri.
Evet, koşullarda belirtilen tam olarak budur (trende bir model oluşturun, testte uygulayın).
 
mytarmailS :

BP'yi seçebilen, tahmin edilebilen ve doğru anladıysam yapamayan bir paket

Açıklamaya bakılırsa okudum, bu çok iyi bir paket (ForeCA, R deposunda bile var, github'dan bir şey indirmenize gerek yok). Ana özellik, verilerin "öngörülebilirliğini" derecelendirmektir.
Ve buna ek olarak, ki bu da önemlidir - verilerin boyutsallığını azaltmak için kullanılabilir. Yani, mevcut tahmin edicilerden, bu paket şaşırtıcı derecede iyi tahmin edilebilirlik ile iki yeni tane yapacak. Aynı zamanda, çöpleri vb. Temel bileşenler yöntemine biraz benzer, yalnızca bileşenler yerine kendine ait bir şey verecektir.

Çok basitse - bu pakete bir dizi tahmin edici içeren bir tablo veriyoruz (fiyatlar, göstergeler, deltalar, her türlü çöp vb.). ForeCA, orijinal tablonun yerine yeni bir tablo yayınlayacaktır. Bu yeni tabloyu, tahmine dayalı modeli (gbm, rf, nnet, vb.) eğitmek için kullanıyoruz.
Biraz daha karmaşıksa, bu, nükleer veri dönüşümü için başka bir paket , değişim için bir önyargı ile.

Her şey kulağa harika geliyor, düpedüz kâse, hatta çok fazla, yine de kontrol etmeniz gerekiyor.

 

Son derece meraklı.

Paket kurulu, belgeler mevcut.

Belki biri deneyip sonucu yazar?

 
Dr.Tüccar :

Açıklamaya bakılırsa okudum, bu çok iyi bir paket (ForeCA, R deposunda bile var, github'dan bir şey indirmenize gerek yok). Ana özellik, verilerin "öngörülebilirliğini" derecelendirmektir.
Ve buna ek olarak, ki bu da önemlidir - verilerin boyutsallığını azaltmak için kullanılabilir. Yani, mevcut tahmin edicilerden, bu paket şaşırtıcı derecede iyi tahmin edilebilirlik ile iki yeni tane yapacak. Aynı zamanda, çöpleri vb. Temel bileşenler yöntemine biraz benzer, yalnızca bileşenler yerine kendine ait bir şey verecektir.

Çok basitse - bu pakete bir dizi tahmin edici içeren bir tablo veriyoruz (fiyatlar, göstergeler, deltalar, her türlü çöp vb.). ForeCA, orijinal tablonun yerine yeni bir tablo yayınlayacaktır. Bu yeni tabloyu tahmine dayalı modeli (gbm, rf, nnet, vb.) eğitmek için kullanıyoruz.
Biraz daha karmaşıksa, bu, değişim için bir önyargı ile nükleer veri dönüşümü için başka bir pakettir.

Her şey kulağa harika geliyor, düpedüz kâse, hatta çok fazla, yine de kontrol etmeniz gerekiyor.

Ön seçim gerektirmez mi?

Çocuklar, alın!

 
San Sanych Fomenko :

Çözüm.

Tahminleriniz umutsuz.

Tamam))) ama şartları dikkatlice okuyun -
"her iki örnek için sonuçları % (başarıyla tahmin edilen durumlar) olarak düzenleyin (tren = %xx, test = %xx). Yöntem ve modellerin dile getirilmesine gerek yok, sadece rakamlara gerek yok"
Daha fazla sonuç bekliyoruz. Mihail Marchukajtes'in ne gibi sonuçlar çıkarabileceğini merak ediyorum.
 
Sihirbaz_ :
Tamam))) ama şartları dikkatlice okuyun -
"her iki örnek için sonuçları % (başarıyla tahmin edilen durumlar) olarak düzenleyin (tren = %xx, test = %xx). Yöntemlerin ve modellerin dile getirilmesine gerek yok, sadece sayılar"
Daha fazla sonuç bekliyoruz. Mihail Marchukajtes'in ne gibi sonuçlar çıkarabileceğini merak ediyorum.

teste gerek yok!

Model eğitilemez! Boş alanı test edemezsiniz.

 
Deneyeceğim ..... Az önce gördüm ....
 
Dr.Tüccar :

Okudum, açıklamaya bakılırsa, bu çok iyi bir paket (ForeCA, ..............

Bu “öngörülebilirliğin” nasıl hesaplandığını anlamıyorum ve hedef dikkate alınmazsa bunun bir anlamı var mı?