Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1613

 
Alexey Mavrin :

Evet, hangi argümanlar, bunu yaparsanız, ya bir şey anlamıyorsunuz ya da ben.

Sürprizimin özü şudur - burada onlardan bahsettiğimiz eğitilebilir bir model, ilk veriler üzerinde eğitilmelidir.

Kaynak verilerde ilişkili veriler varsa, bunlar ilişkisiz verilere indirgenmelidir.

İşte bir örnek - modele bir renk tonunu 3 basamak - RGB ile sınıflandırmayı öğretiyoruz. Üç sayı, bu saf ilk veridir !!! Yaklaşımınızla, bunun gibi tahminciler yapmanız gerekir:

1- R 2-G 3-B - 4 Daha fazla kırmızı 5 - Daha fazla yeşil 6- Yeşilden daha fazla kırmızı ve mavi bir arada .... 100500 Yeşil, mavi kadar kırmızı olsaydı olacağı kadar kırmızı değil. ))

Modelin kendisi öğrenmemeli mi?, ilk verilere sahip ve bunun için var!


Ve tam tersini yaparsınız - birbiriyle tamamen ilişkili orijinal verileri üretirsiniz.

Belki yanılıyorum, ama bana öyle geliyor ki, yalnızca işaretleri temel parçalara bölerek (örneğin, günlük kuralları) saf bir model elde edebilirsiniz. Aynı örneğe mumlarla geri dönelim.

45 seçeneğimiz var, ya saf ve tek desen ise

open[- 1 ]<low

işte bu kadar!, bu 45 seçenekte başka bir şey yok. Bir arama yaptım, bir kural seçtim (bir özellik) ve onu kullandım.

"İlk satırı" almayı teklif ediyorsunuz çünkü sizin durumunuzda anladığım kadarıyla "ağın kendisi bulacak":

open[ 1 : 2 ] ; high[ 1 : 2 ] ; low[ 1 : 2 ] ; close[ 1 : 2 ]

Yani kuru kalıntıda,

Bir özelliğim var, tek kural, tek değer, gürültüsüz şeklinde saf bir desen

Toplam 8 değer + gürültü olmak üzere iki değerden oluşan 4 satırınız (OHLC) var

Soru: Kimin daha fazla ve ilişkili bir örneği var?

 
mytarmailS :


Ve tam tersini yaparsınız - birbiriyle tamamen ilişkili orijinal verileri üretirsiniz.

Belki yanılıyorum , ama bana öyle geliyor ki, yalnızca işaretleri temel parçalara (örneğin, günlük kuralları) bölerek saf bir kalıp çıkarabilirsiniz. Aynı örneğe mumlarla geri dönelim.

45 seçeneğimiz var, ya saf ve tek desen ise

işte bu kadar!, bu 45 seçenekte başka bir şey yok. Bir arama yaptım, bir kural seçtim (bir özellik) ve onu kullandım .

"İlk satırı" almayı teklif ediyorsunuz çünkü sizin durumunuzda anladığım kadarıyla "ağın kendisi bulacak":

Yani kuru kalıntıda,

Bir özelliğim var, tek kural, tek değer, gürültüsüz şeklinde saf bir kalıp

Toplam 8 değer + gürültü olmak üzere iki değerden oluşan 4 satırınız (OHLC) var

Soru: Kimin daha fazla ve ilişkili bir örneği var?

1. Büyük olasılıkla yanılıyorsunuz

2.3. Bu olmaz. çünkü seri durağan değildir. Modeli sadece bir diziye ayarladınız, sözde "saf bir düzenlilik ayırt ettiyseniz", MO'nun bununla ne ilgisi olduğu bile belli değil. Böyle saf bir düzenlilik olsaydı, MO icat bile olmazdı, diğer temel yöntemlerle bulunur.

4. Dediğiniz gibi, bir özelliği seçtiyseniz - %100 fazla eğitim aldınız = uygun, %100 kör, hiçbir şey görmüyor ve bu nedenle %100 "aptal" model, kör olduğum için üzgünüm)

Z.s. Kitleler için çok yaşa MO! )))

 
Alexey Mavrin :

1. Büyük olasılıkla yanılıyorsunuz

Tamam, muhtemelen haklısın, ama sanırım tüm bu açıklamanın tek bir kuralla sadece bir örnek olduğunu anlıyorsunuz, daha görsel bir düşünce ifadesi için, tabiri caizse, elbette, bir kurallar topluluğu yapmanız gerekiyor ... Ve hangisinin daha iyi olduğu oldukça ilginç, 100 zor (istatistiksel olarak) kural topluluğu veya 3000 daha zayıf (olasılıksal) kural topluluğu. Bence sorunu baştan çözerseniz, ilk verilerden öğrenirler, o zaman aynı durağan olmama nedeniyle ikinci seçenek daha iyidir, ancak örneğin, sabit özelliklere sahip belirli bir piyasa modeli oluşturursanız, o zaman ilk seçenek muhtemelen daha iyidir, gerçek olmasa da... Genel olarak, yapmayacağımı iddia etmek daha fazla, beni ikna ettin, ikna ettin...

 
Alexey Vyazmikin :

Sonuçlarım pek iç açıcı değil. Yaprakları terbiyeli bir şekilde topladım, ama sonra soru ortaya çıkıyor - birbirleriyle en iyi nasıl çalışacakları. Gerçek şu ki, genellikle birbirleriyle %20 - %50 veya daha fazla örtüşüyorlar ve buna göre aynı sinyali verdikleri ortaya çıkıyor ki bu çok iyi değil. Buradaki fikir, onları gruplandırmak ve her grup için bir etkinleştirme eşiği yapmaktır - bence bunu yapmanın en iyi yolu budur.

Yaprak seçimi konusu tam olarak çözülmedi, her 5 yılda bir iyi sonuç veren yapraklar seçilse bile, yüzde 20 - 40'ın çalışmayı bırakmasını bekleyebiliriz ki bu daha da üzücü çünkü imkansız çünkü onları kapatmaya değip değmeyeceğini anlayın - özellikle çeyrekler için bir test yaptım, sonraki çeyreklerde son çeyrekte kârsız yaprakların zararı (birçok) kapsadığı ortaya çıktı.

Sayfa seçim yönteminin kendisi umut verici görünüyor, ancak süreç son derece yavaş.

Sormak için biraz nekropost - neden başlangıçta yapraklarının bir portföyü için optimallik koşuluna dayalı bir ağaç inşa edemiyorsunuz ( Markowitz teorisinde olduğu gibi)? Belki bir yerlerde tartışılmıştır ama ben göremedim.

 
Aleksey Nikolaev :

Sormak için biraz nekropost - başlangıçta yapraklarının bir portföyü için optimallik koşuluna dayalı bir ağaç inşa etmek neden imkansız (Markowitz teorisine benzer)? Belki bir yerlerde tartışılmıştır ama ben göremedim.

ML modelleri oluşturmak için mevcut algoritmaların, gürültülü zaman serilerinin nüanslarını hesaba katmadıkları için ticaret için uygun olmadığını defalarca yazdım. Bu, örneğin, tüm örneklemde doğru sınıflandırma olasılığının toplam baskın dağılımını veren bölünme için bir öngörücü değer kullanıldığında kendini gösterir, ancak bu dağılım yalnızca bir kısımda gruplandırılmış nadir bir fenomenden kaynaklanabilir. örnek. Seçilen yaprakları aktivasyon sıklığı için inceledim ve bu benim için belirgin oldu.

Bu nedenle, evet - başlangıçta ihtiyacınız olanı oluşturabilirsiniz, ancak bunun için öğrenme algoritmasını değiştirmeniz (burada programlama konusunda yeterli yetkinliğe sahip değilim) veya yaptığım farklı yöntemleri kullanarak rastgele değerlendirmeniz gerekir. " Portföy optimalite koşulları " ile ne kastedildiğini anlamamış olsam da.

Başka bir seçenek daha var - tüm örneğe göre hedef sınıflandırma olasılığındaki değişimi iyileştiren tahmin değeri aralıklarını seçmek ve bunlara dayalı ayrı tahminciler yapmak - şu anda bu fikri uyguluyorum, ancak yapmıyorum. sonucun ne olacağını henüz bilmiyorum.

Bu arada, ağaç modellerinin oluşturulmasında sonraki kullanım için tahmin ediciyi aralıklara bölme ızgarasının burada tartışıldığını hatırlamıyorum, ancak bana öyle geliyor ki bu konunun tartışılması gereken önemli yönleri var ve modelin yapısını doğrudan etkiliyor. ve dolayısıyla nihai sonuç.

 
Alexey Vyazmikin :

ML modelleri oluşturmak için mevcut algoritmaların ticaret için uygun olmadığını defalarca yazdım.

Muhtemelen MO için standart bilgi sunumu türlerinin ticaret için uygun olmadığını söylemek istediniz... MO hiçbir şey için suçlanamaz)

Alexey Vyazmikin :


Bu arada, ağaç modellerinin oluşturulmasında daha sonra kullanılmak üzere tahmin ediciyi aralıklara bölme ızgarasının burada tartışılacağını hatırlamıyorum.

Bölme ağı ne anlama geliyor?

 
Alexey Vyazmikin :

" Portföy optimalite koşulları " ile ne kastedildiğini anlamamış olsam da.

Sabit (tartışılabilir) bir risk seviyesinde (volatilite veya düşüş) bir portföyün getirisini maksimize etmek.

Görünüşe göre evet, algoritmaların değiştirilmesi gerekecek. Farklı yaprakların hakkaniyetleri arasında çok fazla korelasyon hesaplamak gerekecek ve bu zaman açısından çok pahalı olabilir.

Bu konunun daha önce forumda tartışılmış olabileceğini düşündüm.

 
Alexey Vyazmikin :

Bu arada, ağaç modellerinin oluşturulmasında sonraki kullanım için tahmin ediciyi aralıklara bölme ızgarasının burada tartışıldığını hatırlamıyorum, ancak bana öyle geliyor ki bu konunun tartışılması gereken önemli yönleri var ve modelin yapısını doğrudan etkiliyor. ve dolayısıyla nihai sonuç.

Ağaç tam olarak bunu yapar, her tahmin ediciden farklı aralıklar alır ve hangisinin daha iyi olduğunu kontrol eder.

İlk yarıyı ikiye bölün, en iyi yarıyı tekrar yarıya, en iyi çeyreği tekrar ikiye bölün, vb. ve böylece her tahmin edici ile. Düğüm, tüm tahmin ediciler arasında tüm bu parçaların en iyi bölünmesi haline gelir.
manuel olarak mı yapıyorsun Algoritma bunu mükemmel ve hızlı bir şekilde yapar.

Alexey Vyazmikin :

ancak bu dağılım yalnızca örneğin bir bölümünde gruplanan nadir bir fenomenden kaynaklanabilir. Seçilen yaprakları aktivasyon sıklığı için inceledim ve bu benim için belirgin oldu.

Bu nadir fenomenin tespit edilebileceği öngörücüleri aramak gerekir. Tahminciler varsa, en basit standart MO modelleri her şeyi bulacaktır.

 
mytarmailS :

Muhtemelen MO için standart bilgi sunumu türlerinin ticaret için uygun olmadığını söylemek istediniz... MO hiçbir şey için suçlanamaz)

Söylemek istediklerimi söyledim - ortak model oluşturma yöntemleri öğretilirken dikkate alınmayan birçok nüans var. Bu yöntemlerin rafine edilmesi, çalışmanın sonuçlarının seçilmesi ve ek tahmin edicilerin hazırlanmasıyla sorun çözülebilir, başka seçenekler olabilir, ancak şu ana kadar onları bilmiyorum.


mytarmailS :

ağ ne demek?

Bu, tahmin yeteneği için bir dizi tahmin değerini test eden ve tahmin kabiliyetini daha iyi vurgulayacak şekilde aralığın bölümlerini ayırmaya çalışan bir algoritmadır. Diyelim ki 3 hedefli bir örnek var, örnek bu şekilde %1 - 24, % 2 - 50, % 3 - 26 olarak dağıtılıyor ve bir dizi değere sahip belirli bir tahmin edici var, bu nedenle ızgaranın amacı Hedef 1'in %24 değil, daha fazlasının "tahmin edileceği" ve bu bölümün bölüneceği tahmin edici değerlerin alanlarını bulmak için. Bu tür ızgaraları oluşturmak için farklı algoritma türleri vardır.


Aleksey Nikolaev :

Sabit (tartışılabilir) bir risk seviyesinde (volatilite veya düşüş) bir portföyün getirisini maksimize etmek.

Görünüşe göre evet, algoritmaların değiştirilmesi gerekecek. Farklı yaprakların hakkaniyetleri arasında çok fazla korelasyon hesaplamak gerekecek ve bu zaman açısından çok pahalı olabilir.

Bu konunun daha önce forumda tartışılmış olabileceğini düşündüm.

Şimdi aktivasyonların korelasyonu dikkate alınır, koşullu olarak ilişkili sayfalar bir gruba girer ve bu şekilde bir portföy oluşturulur. Ancak portföyün tek bir temel stratejisi var ve sürdürülebilirlik için çok şey yapılması gerekiyor. Aynı tahmin ediciler kullanılıyorsa, stratejiler zaman içinde aktivasyonda örtüşmemelidir. Genel olarak, bu gerçekten mümkün.


elibrarius :

Ağaç tam olarak bunu yapar, her tahmin ediciden farklı aralıklar alır ve hangisinin daha iyi olduğunu kontrol eder.

İlk yarıyı ikiye bölün, en iyi yarıyı tekrar yarıya, en iyi çeyreği tekrar ikiye bölün, vb. ve böylece her tahmin edici ile. Düğüm, tüm tahmin ediciler arasında tüm bu parçaların en iyi bölünmesi haline gelir.
manuel olarak mı yapıyorsun Algoritma bunu mükemmel ve hızlı bir şekilde yapar.

Bu nadir fenomenin tespit edilebileceği öngörücüleri aramak gerekir. Tahminciler varsa, en basit standart MO modelleri her şeyi bulacaktır.

Mükemmel olmak ne anlama geliyor? Bunu manuel olarak yapmıyorum, ancak şimdi gördüğüm şekilde yapacak bir komut dosyası yazıyorum.

Benim durumumda, her bir tahmin değeri seçeneğinin ayrı değerlendirilmesi ideal olacaktır. Ve, bir hedefi artıran bir tahmin edicinin aktivasyon aralıklarını, bildiğim ızgaraların yapmadığı, aralıkları sırayla bölerek, birleştirme sıralamadaki tahmin ediciyi spar'a yükseltecek (bir düğüm oluşturmak) gibi bir tahmin edicide birleştirmek istiyorum. ) başka bir tahmin edici ile. Teoride iken.

Aşağıdaki şekil tipik bir zaman tahmin edicisini göstermektedir - kelimenin tam anlamıyla saatleri kaydederken, tahmin edici aktivasyonlarını her bir hedef numunenin tamamından %10'dan az sapma olacak şekilde filtreledim. 18 ve 19 saatlerinin hedef Eksi için uygun olduğu ve 15. saatin uygun olmadığı ortaya çıktı, çıktıda 1 örnek değerine sahip yeni bir tahminci alacağım - tahmin edici değerleri 18 ve 19 , -1 - değeri birleştiriyor 15 ve 0 - diğer tüm değerler.

Hangi bölme ızgarası, aşağıdaki şekilde olduğu gibi, 1 ve 4 değerleri gibi ara değerler hariç, tek bir bölmede bir boşlukla aralıkları toplayabilir?


 
Alexey Vyazmikin :

Şimdi aktivasyonların korelasyonu dikkate alınır, koşullu olarak ilişkili sayfalar bir gruba girer ve bu şekilde bir portföy oluşturulur. Ancak portföyün tek bir temel stratejisi var ve sürdürülebilirlik için çok şey yapılması gerekiyor. Aynı tahmin ediciler kullanılıyorsa, stratejiler zaman içinde aktivasyonda örtüşmemelidir. Genel olarak, bu gerçekten mümkün.

Örneğin, tüm stratejiler yalnızca ALIŞ yapıyorsa, muhtemelen her şey zaman içindeki kesişimlerini en aza indirmeye (her zaman pozitif olan korelasyonları en aza indirmeye) indirgenecektir. AL ve SATIŞlara izin verilirse, stratejilerin kötü kısımlarını dengelemek için zaman geçişleri faydalı olabilir (negatif korelasyonlar genellikle bir portföy için iyidir).

Muhtemelen, korelasyon basitçe stratejilerin zamanı ve kesişme zamanları aracılığıyla belirlenebilir.