Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 655

 
Dr. tüccar :

Ben de çok düşünüyorum.

Regresyon modeli, çubuk başına fiyatta bir artış öngörüyorsa ve ön ve arka testlerde R2 puanı sıfırın üzerindeyse, bu zaten iyi bir başlangıçtır. Sorun, sonucun istikrarlı olmasına rağmen küçük olması, yayılmanın üstesinden gelinememesidir.

Analitik olarak sorun, R2'nin modeli büyük hatalar için daha fazla cezalandırması ve küçük hataları ve yanlış ticaret yönergelerini görmezden gelmesidir. Kazançların dağılımına bakıldığında, fiyat hareketlerinin çoğu sadece birkaç pip. Ve model, bu tür en ufak hareketlerin doğru yönünü tahmin etmek yerine, daha yüksek bir R2 alacağı dağılımın uzun kuyruklarını tahmin etmeyi öğrenir. Sonuç olarak, model bir şekilde büyük hareketleri tahmin ediyor, ancak küçük olanlarda sürekli olarak yön hataları yapıyor ve yayılmaya göre birleşiyor.

Sonuç - forex için standart regresyon tahminleri kötü. Kendinize ait bir tür uygunluk fonksiyonu icat etmeniz gerekir, böylece işlemlerin yönleri dikkate alınır ve yayılma, doğruluk ve hatta fonksiyon düzgün olmalıdır. O zaman, %50'nin biraz üzerinde bir doğrulukla bile, şimdiden kâr etme şansı olacaktır.
Doğruluk, Keskin oran, kurtarma faktörü ve ticaret tablosunu analiz eden diğer fonksiyonlar çok ayrıktır, standart bir backprop'a sahip bir nöron yerel minimumdan çıkamaz ve gerçekten öğrenemez.

Alternatif bir sonuç, nöronun zayıf sinyallerini tamamen görmezden gelmektir. Sadece güçlülerle ticaret yapın. Buradaki sorun, her zaman arka testte mükemmel sonuçlar gösterecek bir eşik seçebilmenizdir, ancak bununla birlikte ön testte kötü sonuçlar olacaktır. Burada da bir şeyler düşünmeniz gerekiyor.

Yine de, makine öğrenimi regresyon modellerini kullanma fikri son derece şüpheli görünüyor. Ve bu özellikle artışları tahmin etmek için geçerlidir. Ve bu iki kez özellikle anlam açısından bazı katmanları ve algılayıcıları olan bir kara kutu olan NN'ler için geçerlidir. Bu kelimelerin ekonomik veya istatistiksel anlamı nedir?

Sonuçta, GARCH modellerinin artışlar için kullanılması boşuna değil. ve şu anda en yaygın olanlarıdır. Durağan olmayan bir diziyi oldukça anlamlı ekonomik ve istatistiksel anlamlara sahip bileşenlere ayırarak durağan olmayanlığı yenmenin temel fikri çok çekici.


GARCH'da model aşağıdaki adımlardan oluşur:

  • orijinal seri, bitişik çubukların oranının logaritması (aykırı değerlerin etkisini azaltır) tarafından bozulur.
  • DEĞİL durağanlığından tamamen kurtulmak genellikle imkansız olduğundan,
  • kalan trendi modelleyin (ARIMA)
  • ARCH nüanslarını simüle edin
  • artışların dağılımını modelleyin.

Hepsi anlamlı ve anlamlı çalışmalar.

Buna harici regresör ekleme olasılığını eklersek, oldukça zengin bir araç elde ederiz, ne yazık ki son derece çeşitli ve dolayısıyla zaman alıcıdır.

 
ARIMA+GARCH Trading Strategy on the S&P500 Stock Market Index Using R | QuantStart
ARIMA+GARCH Trading Strategy on the S&P500 Stock Market Index Using R | QuantStart
  • www.quantstart.com
In this article I want to show you how to apply all of the knowledge gained in the previous time series analysis posts to a trading strategy on the S&P500 US stock market index. We will see that by combining the ARIMA and GARCH models we can significantly outperform a "Buy-and-Hold" approach over the long term. Strategy Overview The idea of the...
 
San Sanych Fomenko :

  • orijinal seri, bitişik çubukların oranının logaritması ( aykırı değerlerin etkisini azaltarak ) alınarak detrende edilir.

Hangi temelde?

 
San Sanych Fomenko :

Yine de, makine öğrenimi regresyon modellerini kullanma fikri son derece şüpheli görünüyor. Ve bu özellikle artışları tahmin etmek için geçerlidir. Ve bu iki kez özellikle anlam açısından bazı katmanları ve algılayıcıları olan bir kara kutu olan NN'ler için geçerlidir. Bu kelimelerin ekonomik veya istatistiksel anlamı nedir?

Sonuçta, GARCH modellerinin artışlar için kullanılması boşuna değil. ve şu anda en yaygın olanlarıdır. Durağan DEĞİL bir seriyi oldukça anlamlı ekonomik ve istatistiksel anlama sahip bileşenlere ayrıştırarak DEĞİL durağanlığını yenmenin temel fikri çok çekicidir.

Yanılıyorsun SanSanych. NS, bu bulanık mantığa eşdeğer bir türdür. Öğretilebilir. Şahsen, gizemli bir şey görmüyorum. Diğer analojileri kullanabilirsiniz

Peki, durağan olmama. Herhangi bir süreç, parçalara ayrılırsa durağan olmayacak ve değilse, rastgele olmayacaktır.

Bu arada, farklı uzun periyotlarda (3 aydan fazla) dağılımların türüne göre aralarında önemli bir fark görmedim.

Ekonomik anlamda - eh, bilmiyorum. Piyasanın gözlemci için rastgele olduğunu varsayıyorum. Rastgele olup olmaması gerçekten önemli değil. Buradaki anahtar kelime gözlemci içindir.

 

Sen ilginç bir insansın! Görünüşe göre her şeyi biliyorsun!

 
Maksim Dmitrievski :

Hangi temelde?

Bir günlüğüm var, fark nedir?

 
San Sanych Fomenko :

Bir günlüğüm var, fark nedir?

çünkü bu durumda logaritma aykırı değerlerden kurtulmaz: n-gecikmeli artışların hesaplanması aykırı değerleri ortadan kaldırır

logaritma grafiği basitçe 0 civarında ortalar

ve logaritma alarak aykırı değerlerden kurtulmak için logaritmik bir ölçek tanıtmak gerekir.

sadece artışlar

günlük artışları (doğal)


 
Maksim Dmitrievski :

çünkü bu durumda logaritma aykırı değerlerden kurtulmaz: n-gecikmeli artışların hesaplanması aykırı değerleri ortadan kaldırır

logaritma grafiği basitçe 0 civarında ortalar

ve logaritma alarak aykırı değerlerden kurtulmak için logaritmik bir ölçek tanıtmak gerekir.

sadece artışlar

artışların logaritması (doğal)


Emisyonlar hassas bir şeydir. Çok büyük emisyonları daha kabul edilebilir bir maksimum ile değiştirmek daha iyidir.

Emisyonlardan tamamen kurtulmak mümkün değildir. Ancak dağılım üzerindeki etkilerini küçümsemek sadece mümkün ve gerekli değildir ve bu bir logaritma alınarak yapılır.

> summary(diff(eur))
     Index                       diff(eur)         
 Min.   : 2016 - 01 - 04 00 : 00 : 00    Min.   :- 0.0230100   
 1 st Qu.: 2016 - 04 - 14 19 : 00 : 00    1 st Qu.:- 0.0005300   
 Median : 2016 - 07 - 27 12 : 00 : 00    Median : 0.0000100   
 Mean   : 2016 - 07 - 27 12 : 01 : 14    Mean   :- 0.0000036   
 3 rd Qu.: 2016 - 11 - 08 06 : 00 : 00    3 rd Qu.: 0.0005200   
 Max.   : 2017 - 02 - 17 23 : 00 : 00    Max.   : 0.0143400   


> summary((diff(eur, log=T)))
     Index                     (diff(eur, log = T))
 Min.   :2016-01-04 00:00:00   Min.   :-0.0206443  
 1st Qu.:2016-04-14 19:00:00   1st Qu.:-0.0004810  
 Median :2016-07-27 12:00:00   Median : 0.0000090  
 Mean   :2016-07-27 12:01:14   Mean   :-0.0000034  
 3rd Qu.:2016-11-08 06:00:00   3rd Qu.: 0.0004755  
 Max.   :2017-02-17 23:00:00   Max.   : 0.0127862  
                               NA's   :1


Ve komşu 10 ve 2 alıntılarıyla belirli bir varsayımsal durumu alırsak, o zaman

10/2 = 5

log(10/2) = 0.69

 
Maksim Dmitrievski :

çünkü bu durumda logaritma aykırı değerlerden kurtulmaz: n-gecikmeli artışların hesaplanması aykırı değerleri ortadan kaldırır



n-lag, TF'deki bir artıştır ve TF ne kadar fazlaysa, artış da o kadar büyük olur.

50'lik gecikmeniz H8'dir, yalnızca TF=8 saatinizin normal programın aksine her dakika başlaması anlamında daha doğrudur.

 
San Sanych Fomenko :

Emisyonlar hassas bir şeydir. Çok büyük emisyonları daha kabul edilebilir bir maksimum ile değiştirmek daha iyidir.

Emisyonlardan tamamen kurtulmak mümkün değildir. Ancak dağılım üzerindeki etkilerini küçümsemek sadece mümkün ve gerekli değildir ve bu bir logaritma alınarak yapılır.



Ve komşu 10 ve 2 alıntılarıyla belirli bir varsayımsal durumu alırsak, o zaman

10/2 = 5

log(10/2) = 0.69

peki, tamam, ilk artışın değerini elde etmek için e tabanını yükseltmeniz gereken gücü buldunuz

ama emisyonlardan kurtulmadın

Yukarıda 2 resim paylaştım.