Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 137

 
mytarmailS :


sorun nedir? bana yardım et lütfen


Bu nasıl çalışır:

test_vec <- numeric() # тут будем хранить показатели теста 


for(i in 151:ln){

print(i)

idx <- (i-150):i

#проводим линейную регрессию для определения правильного соотношения

x <- data[idx, ]

model <- lm(ri ~ si + 0, x)

#вычисляем разницу цен (спред)

spread <- x$ri - coef(model)[[1]] * x$si

#проводим тест Дики-Фуллера на стационарность

test <- adf.test(as.vector(spread), k = 0)

test_vec[i-150] <- test$p.value

}


plot(test_vec, type = 's')

 
Alexey Burnakov :

İlk olarak, R^2 0.55, "metafişe" bazı küçük fonksiyonel dönüşümler uygulanarak gerçekten elde edilebilir. Başka bir şey, işlevin görünüşünde oldukça karmaşık olduğu ortaya çıkıyor.

Ayrıca şunu deneyin:

satırOrtalamalar(df[, 1:10])

...

10 yeni sütun eklendi, bu nnet için hiçbir şeyi değiştirmedi, sonuçlar ve öğrenme eğrileri yaklaşık olarak aynı kaldı, model aynı tahmin edicileri seçiyor.

Ama ağaç birdenbire çok daha iyi bir sonuç verdi. Orman da daha iyi, ancak bir ağacın kendisi önde (sözde r^2=0.39), işte yeni verilerle ilgili çıngırak grafikleri.

Ağaç, eğitim verilerinden değerlerini hatırlayarak sadece rowMeans[,1:50] seçti. Yani rowMeans[,1:50] ile hedef arasında çok yakın fakat doğrusal olmayan bir ilişki vardır.

Bununla birlikte, yalnızca bu 10 yeni tahmin ediciyi bırakırsanız, nnet r^2=0.22'yi öğrenecektir, bu da daha iyidir.

 
Dr.Tüccar :

10 yeni sütun eklendi, bu nnet için hiçbir şeyi değiştirmedi, sonuçlar ve öğrenme eğrileri yaklaşık olarak aynı kaldı, model aynı tahmin edicileri seçiyor.

Ama ağaç birdenbire çok daha iyi bir sonuç verdi. Orman da daha iyi, ancak bir ağacın kendisi önde (sözde r^2=0.39), işte yeni verilerle ilgili çıngırak grafikleri.

Ağaç, eğitim verilerinden değerlerini hatırlayarak sadece rowMeans[,1:50] seçti. Yani rowMeans[,1:50] ile hedef arasında çok yakın fakat doğrusal olmayan bir ilişki vardır.

Bununla birlikte, yalnızca bu 10 yeni tahmin ediciyi bırakırsanız, nnet r^2=0.22'yi öğrenecektir, bu da daha iyidir.



Tam olarak tahmin edildi. ortalama (1:50). İyi sonuçlar. Şimdi fonksiyon yaklaşımını biraz iyileştirmeye çalışacağım. Zor değilse, simüle edilmiş çıktıya karşı bulunan özelliğin bir dağılım grafiğini gönderin. NS veya rastgele orman için. Benimkini daha sonra yayınlayacağım. Doğrusal olmama durumu olmalıdır.

 

Alexey Burnakov :

Doğrusal olmama durumu olmalıdır

Grafiğe bakılırsa, hafif bir bağlantı var. Ama nöron nedir, ağaç nedir, sadece belirli bir genel eğilimi vurgularlar. Evet ve tek başına bu tahmin edici üzerinde modeli eğitmek açıkça mümkün olmayacak, ağaçtan daha fazlasını elde etmek imkansız.

 
Dr.Tüccar :

Grafiğe bakılırsa, biraz bağlantı var. Ama nöron nedir, ağaç nedir, sadece belirli bir genel eğilimi vurgularlar. Evet ve tek başına bu tahmin edici üzerinde modeli eğitmek kesinlikle mümkün olmayacak, ağaçtan daha fazlasını elde etmek imkansız.

Teşekkürler.

Evet katılıyorum.

Grafiklerim:

rmse minimizasyonu

gerçek bağımlılık:

modeli:

gerçek ve modeli:

Orijinal fikir temiz:

Gürültüyü hesaba katarak, gerçekte nasıl ortaya çıktığını zaten gördünüz.


Mümkün olan maksimum simülasyon kalitesi:

 
Alexey Burnakov :

Bu nasıl çalışır:

Teşekkürler, bunu anlamazdım.
 
Dr.Tüccar :

Grafiğe bakılırsa, biraz bağlantı var. Ama nöron nedir, ağaç nedir, sadece belirli bir genel eğilimi vurgularlar. Evet ve tek başına bu tahmin edici üzerinde modeli eğitmek açıkça mümkün olmayacak, ağaçtan daha fazlasını elde etmek imkansız.

Görevi özetlemek ve ne anladığımızı yazmak gerekiyor.

Hepsi, gerçek hayatta bağımlılığın türü hakkında hiçbir şey bilmememiz şartıyla.

ben şöyle anladım:

1) Fiyat getirileri gibi bir takım basit özelliklerden bağımlılık çıkarmak zordur ve birçok yöntem iyi çalışmaz. Ancak genel prensiplere göre evrişim yoluyla yaklaşık bir çözüm elde etmek mümkündür.

2) Önceden çok sayıda özellik oluşturursanız, olağan yöntemlerin işe yaraması için önemli bir şans vardır.

3) ham özellikler üzerinde en iyi kalite metriği, evrişimli NN'den sonra, olağan NN'de, diğer yöntemler yaklaşık olarak aynı sonuçla gelir.

4) potansiyel olarak oluşturulan özellikler kümesinde, orman, NS iyi çalışır.

5) özellikleri toplamak için bir kişi yerine paketin kendisini bırakmanın daha mı tercih edilir olduğu sorusu hala açık. Doğru evrişimsel mimariyi ararken, iş muhtemelen önceden bir dizi özellik oluşturmaktan daha az değildir.

Ne eklersiniz, Dr?

 

Sorunu yeni yayınladığınızda özellikler oluşturmaya çalıştım, algoritma bütün gece farklı matematiksel kombinasyonlardan geçti, vtreat tahmini yoluyla en iyi yeni tahmin edicileri seçti. Olumlu bir sonuç yoktu, model yeni tahmin edicilerden gerçekten bir şey öğrenemedi. Yani, ya yanlışlıkla buraya gelirsiniz ve gerekli tahmin edicileri ve onlarla matematiksel işlemleri tahmin edersiniz ya da etmezsiniz. Seçenekler oluşturmak ve sıralamak için günlerinizi harcayabilirsiniz ve yine de hiçbir anlam ifade etmeyecektir. Orijinal öngörücülerdeki evrişimli , sıra araçlarına sahip normal ağdan daha iyi bir sonuç aldığından, muhtemelen evrişimli ağda durmak daha iyidir.

 
Dr.Tüccar :

Sorunu yeni yayınladığınızda özellikler oluşturmaya çalıştım, algoritma bütün gece farklı matematiksel kombinasyonlardan geçti, vtreat tahmini yoluyla en iyi yeni tahmin edicileri seçti. Olumlu bir sonuç yoktu, model yeni tahmin edicilerden gerçekten bir şey öğrenemedi. Yani, ya yanlışlıkla buraya gelirsiniz ve gerekli tahmin edicileri ve onlarla matematiksel işlemleri tahmin edersiniz ya da etmezsiniz. Seçenekler oluşturmak ve sıralamak için günlerinizi harcayabilirsiniz ve yine de hiçbir anlam ifade etmeyecektir. Orijinal öngörücülerdeki evrişimli ağ, sıra araçlarına sahip normal ağdan daha iyi bir sonuç aldığından, muhtemelen evrişimli ağda durmak daha iyidir.

Teşekkürler Dr!

Evet, bu da geçerli bir argüman. Sadece alışkanlığım dışında, kayan artan bir pencere ile toplamları, ayrıca kayan bir gecikme ve diğer her şeyin geçmişe kaymasıyla farklılıkları gösteriyorum.

Görüyorsunuz, hemen hemen her şeyi modellemek için (neredeyse!) Bir fikrim var, formun öngörücülerini almak yeterli:

cari_fiyat - fiyat(gecikme1)

cari_fiyat - fiyat(gecikme2)

...

current_price - fiyat(lag_n)

Bu, hareketli toplamlar olarak ele alınabilir (kolaylıkla ortalamalara indirgenir) ve herhangi bir eğilim konfigürasyonu yeniden üretilebilir: farklı yerlerde bükülmeler, hız, ivme.

Evrişimsel ağ hakkında konuşursak, pratik bir şey çözmek için verdiğim kodu denemeyi öneriyorum. Ve ağın ağırlıklarının ve çekirdeklerinin analizine odaklanmak. Çekirdek, evrişimin bir görünümünü gösterecektir. Ağırlıklar, önem ve doğrusal olmama durumunu gösterebilir.

Şahsen, zaten bazı tolere edilebilir sonuçlar olmasına rağmen, ana deneyime hala ara veriyorum. Sadece yorgun... Evrişimsel bir ağ ile bir hisse senedi enstrümanını tahmin etmeye karar verdim. Oldukça düşük genel giderler (Forex'teki spread'den daha düşük bir büyüklük sırası) var ve işe yarayacak bir fantezi var. O zaman sana daha fazlasını anlatacağım.

CNN Hızlı Kursu: http://cs231n.github.io/convolutional-networks/

 

Bu videolu dersler eskiden YouTube'da da vardı, sonra oradan kaldırıldı, ancak arşiv.org'da kaldı - https://archive.org/details/cs231n-CNNs

İngilizce, ancak çok bilgilendirici ve yararlı. Çoğunlukla evrişimsel ağlar tarafından görüntü tanıma hakkında, ancak genel olarak nöronlar hakkında birçok yararlı bilgi var.