Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1614

 
Aleksey Nikolaev :

Örneğin, tüm stratejiler yalnızca ALIŞ yapıyorsa, muhtemelen her şey zaman içindeki kesişimlerini en aza indirmeye (her zaman pozitif olan korelasyonları en aza indirmeye) indirgenecektir. AL ve SATIŞlara izin verilirse, stratejilerin kötü kısımlarını dengelemek için zaman geçişleri faydalı olabilir (negatif korelasyonlar genellikle bir portföy için iyidir).

Muhtemelen, korelasyon basitçe stratejilerin zamanı ve kesişme zamanları aracılığıyla belirlenebilir.

Genel olarak, çok yönlü sinyallerin karşılıklı telafisi konusunda hemfikirim, ancak bunun için benim durumumda farklı stratejiler kullanmanız gerekiyor ve her birini işaretlemek farklı bir şarkı ama bunu da kullanmayı planlıyorum.

Ancak benzer stratejiler bulmak için, bunları bir gruptan seçmek veya riski (lot) paylaşmak için sadece piyasaya giriş ve çıkış zamanını değil, aynı zamanda giriş yönünü de hesaba katmak gerekecektir. Burada, bunu en iyi nasıl yapacağınız hakkında daha fazla düşünmeniz gerekir.

 
Alexey Vyazmikin :

Mükemmel olmak ne anlama geliyor? Bunu manuel olarak yapmıyorum, ancak şimdi gördüğüm şekilde yapacak bir komut dosyası yazıyorum.

Benim durumumda, her bir tahmin değeri seçeneğinin ayrı değerlendirilmesi ideal olacaktır. Ve, bir hedefi artıran bir tahmin edicinin aktivasyon aralıklarını, bildiğim ızgaraların yapmadığını, aralıkları sırayla bölerek, birleştirme sıralamadaki tahmin ediciyi spar'a yükseltecek (bir düğüm oluşturmak) gibi bir tahmin edicide birleştirmek istiyorum. ) başka bir tahmin edici ile. Teoride iken.


Hangi bölme ızgarası, aşağıdaki şekilde olduğu gibi, 1 ve 4 değerleri gibi ara değerler hariç, tek bir bölmede bir boşlukla aralıkları toplayabilir?


İdeal - ayırma değerlendirme işlevine tam olarak uygun olarak ideal anlamında. Binlerce seçeneği değerlendirecek ve en iyisini hatırlayacak ve düğüm olacak.

En kolay yol, her biri için karşılık gelen saatin tahmin edicilerini besleyerek 24 standart orman/artırma eğitmektir.

 
elibrarius :

İdeal - ayırma değerlendirme işlevine tam olarak uygun olarak ideal anlamında. Binlerce seçeneği değerlendirecek ve en iyisini hatırlayacak ve düğüm olacak.

Algoritmaya göre ve hangi algoritmanın doğru olduğu açıktır? Yalnızca CatBoost'ta ağ oluşturma için 3 algoritma vardır.

elibrarius :

En kolay yol, her biri için karşılık gelen saatin tahmin edicilerini besleyerek 24 standart orman/artırma eğitmektir.

Bu, örneği 24 kez koşullu olarak azaltacaktır (ve benim örneğim zaten çok küçüktür) ve sonra, ağaç oluşturma açgözlülüğü ilkesini gözlemleyerek (ağaç bölme deneylerimden ortaya çıktığı gibi, her zaman doğru değildir), biz Yalnızca, istatistiksel olarak en iyi olasılığa sahip oldukları belirli bir saatte olan ağaç dallanması için öngörücüleri seçecektir, ancak bence, diğer sözleşmelerden bağımsız olarak, işaretler bulmak ve bunları bir ağaca koymak gerekir, tüm örnek üzerinde bir avantaj sağladı, o zaman günün belirli bir saatinde bir ayarlama elde etmeyeceksiniz (koşullu olarak daha doğru bir açıklama aktivasyon için bir olay), ancak bağımsız olasılıkların bir sayfada toplanması.

 
Alexey Vyazmikin :

Bu, tahmin yeteneği için bir dizi tahmin değerini test eden ve tahmin kabiliyetini daha iyi vurgulayacak şekilde aralığın bölümlerini ayırmaya çalışan bir algoritmadır. Diyelim ki 3 hedefli bir örnek var, örnek bu şekilde %1 - 24, % 2 - 50, % 3 - 26 olarak dağıtılıyor ve bir dizi değere sahip belirli bir tahmin edici var, bu nedenle ızgaranın amacı Hedef 1'in %24 değil, daha fazlasının "tahmin edileceği" ve bu bölümün bölüneceği tahmin edici değerlerin alanlarını bulmak için. Bu tür ızgaraları oluşturmak için farklı algoritma türleri vardır.

İlginç bir fikir ama böyle yapmak daha kolay olmaz mıydı?..

madde 1) Püre için bir çeşit algoritmamız var. eğitim MO

s.2) tren ve teste bölünmüş bir örnek var

s.3) bir ilkeye göre kümelenmiş bir fiyat var (zaman, grafik deseni, hepsi bir arada, başka bir şey .. ...) (bu bir piyasa koşulu veya sadece bir küme olarak algılanabilir)

not. çok sayıda küme olmalı veya çok iyi. çok güzelsin


eylem algoritması:

1) MO'yu trende eğitiyoruz

2) bilimsel modelin zemini testi tahmin eder

3) testte, modelin hatasız tahmin ettiği noktaları seçin, onlara ХТ (iyi nokta) diyelim

4) her XT, yukarıdaki 3. maddeden bir kümeye karşılık gelir.

Pekala, hepsi bu, artık modelin pazarın hangi kümelerinde (durumlarında) iyi işlem yaptığını biliyoruz.


Ama önerdiğim şeyin öncelikle ele alınması gereken kavramsal kusurları olduğu konusundaki yaklaşımınız. Daha ziyade sorun bir yaklaşım bile değil, bilgi sunumu şeklindedir.

 
mytarmailS :


s.3) bir ilkeye göre kümelenmiş bir fiyat var (zaman, grafik deseni, hepsi bir arada, başka bir şey .. ...) (bu bir piyasa koşulu veya sadece bir küme olarak algılanabilir)

not. çok sayıda küme olmalı veya çok iyi. çok güzelsin

Burada anlamıyorum, hedef işaret noktalarının çıplak fiyatını almayı ve bunları kümelemeyi mi yoksa ne öneriyorsunuz?


mytarmailS :


3) testte, modelin hatasız tahmin ettiği noktaları seçin, onlara ХТ (iyi nokta) diyelim

4) her XT, yukarıdaki 3. maddeden bir kümeye karşılık gelir.

Pekala, hepsi bu, artık modelin pazarın hangi kümelerinde (durumlarında) iyi işlem yaptığını biliyoruz.

Fikir ilginç, ancak ilkesi önerdiğim şeyle hiç bağlantılı değil veya tam olarak anlamıyorum. Modelin belirli bir küme yüzdesini etkinleştirdiğini öğrendik ve bundan sonra ne yapmalıyız? Anladığım kadarıyla, o zaman hangi yaprağa (bir ağaçtan bahsediyorsak) kaç kümenin aktifleştiğine bakmanız gerekiyor ve eğer bir yaprak bir kümeyi çok daha sık aktive ediyorsa, o zaman bu sadece onu belirlemeyi öğrendiğini söyleyecektir. . Burada, sayfaların çoğunun, görünüşe göre rastgeleliği gösterecek olan farklı kümelerde eşit şekilde doğru bir şekilde etkinleştirileceği ortaya çıkabilir. Ve yine, kümeleme algoritmasına güvenmeniz gerekir - sonucun benzersiz kümeler olduğundan ve pek çok benzer küme olmadığından emin olun ...

 
Alexey Vyazmikin :

Algoritmaya göre ve hangi algoritmanın doğru olduğu açıktır? Yalnızca CatBoost'ta ağ oluşturma için 3 algoritma vardır.

Bu, örneği 24 kez koşullu olarak azaltacaktır (ve benim örneğim zaten çok küçüktür) ve sonra, ağaç oluşturma açgözlülüğü ilkesini gözlemleyerek (ağaç bölme deneylerimden ortaya çıktığı gibi, her zaman doğru değildir), biz Yalnızca, istatistiksel olarak en iyi olasılığa sahip oldukları belirli bir saatte olan ağaç dallanması için öngörücüleri seçecektir, ancak bence, diğer sözleşmelerden bağımsız olarak, işaretler bulmak ve bunları bir ağaca koymak gerekir, tüm örnek üzerinde bir avantaj sağladı, o zaman günün belirli bir saatinde bir ayarlama elde etmeyeceksiniz (koşullu olarak daha doğru bir açıklama aktivasyon için bir olay), ancak bağımsız olasılıkların bir sayfada toplanması.

Numuneyi nerede kestiğinizin ne önemi var? Dışarıda, 24 orman yaparak mı, yoksa örneğin ilk 24 düğümü saatlere bölerek mi içeride? Bu 24 düğümden, örneğin 1/24'ü kalan her şubeye gidecektir.

 
Bu arada, güçlendirme konusunda sevmediğim şey, önerilen ağaç derinliğinin 7-10 olmasıdır.
Onlar. 100 tahmincimiz varsa ve oradaki bölme de her bir tahmincinin ortasından başlar. O zaman yüksek bir olasılıkla ortada bölünmüş 7 farklı tahmincimiz olacak. Belki 1 veya 2, neredeyse daha küçük, çeyreğe kadar paylaşacak.
Yoksa algoritma, algoritmaları yarım bölmede değil, daha küçük parçalarda güçlendirmede mi çalışıyor? Kimse biliyor mu?
Ve bir ağacın derinliğini kim kullanır?
 
elibrarius :

Numuneyi nerede kestiğinizin ne önemi var? Dışarıda, 24 iskele yaparak mı yoksa içeride, örneğin ilk 24 düğümü saatlere bölerek mi? Bu 24 düğümden, örneğin 1/24'ü kalan her şubeye gidecektir.

Azaltma ile ilgili değil, ancak tahmin edicinin bölünme dışındaki örnek üzerindeki davranışının istatistikleri ile ilgili - bu, tahmin edici değerinin seçiminin rastgeleliğini azaltmalıdır.

Bu arada, AlgLib her bölmede veya bir kez bir ızgara yapar ve ardından bu ızgarayı kullanır mı? Anladığım kadarıyla, CatBoost geliştiricileri, ızgaranın onlarla bir kez yapıldığını iddia ediyor.

 
Alexey Vyazmikin :

Burada anlamıyorum, hedef işaret noktalarının çıplak fiyatını almayı ve bunları kümelemeyi mi yoksa ne öneriyorsunuz?

Hedefiniz, herhangi bir .. Biraz pürüzlü bir şekilde açıkladım ....

kümeler yalnızca bir amaç için gereklidir:


Böylece XT'yi yenilerini test ederken bulduk ve iyi olarak kabul ettik..

Şimdi, yeni verilerde, modeli ona uygulamak için bu TX'i bulmamız gerekiyor, çünkü model sadece XT'de iyi çalışıyor, ama onu yeni verilerde nasıl tanıyacağız? küme numarasına göre bir seçenek olarak

 
Alexey Vyazmikin :

Genel olarak, çok yönlü sinyallerin karşılıklı telafisi konusunda hemfikirim, ancak bunun için benim durumumda farklı stratejiler kullanmanız gerekiyor ve her birini işaretlemek farklı bir şarkı ama bunu da kullanmayı planlıyorum.

Ancak benzer stratejiler bulmak için, bunları bir gruptan seçmek veya riski (lot) paylaşmak için sadece piyasaya giriş ve çıkış zamanını değil, aynı zamanda giriş yönünü de hesaba katmak gerekecektir. Burada, bunu en iyi nasıl yapacağınız hakkında daha fazla düşünmeniz gerekir.

Fikri mantıklı bir sonuca getireceğim. Bir varlık üzerinde bir dizi sistemimiz olduğunu varsayalım. Her sistem piyasadayken sabit hacimde bir konuma sahiptir, ancak yön değişebilir. Stratejilerin karlılığı ve oynaklığı bilinmektedir. Stratejiler arasındaki korelasyonu (t1-t2)/sqrt(T1*T2) formülü ile tanımlayalım, burada T1 ve T2 piyasada kalma süreleri, t1 ve t2 bu stratejilerin geçerli olduğu sürelerin süresidir. piyasada aynı anda ve sırasıyla eşit ve zıt yönde yönlendirilir. Bu, fiyatın SB'ye yakın olduğu varsayımı altında türetilen basitleştirilmiş bir formüldür. Artık en uygun portföyü bulmak için Markowitz teorisini uygulamak için tüm verilere sahibiz.

Açıkçası, bu şekilde anlamlı portföyler elde edemeyiz (en azından sadece bir varlığın kullanılması nedeniyle). Bazı değişiklikler gerekiyor.

1) Optimizasyon algoritmasını değiştirin (parametrelerdeki kısıtlamalar, cezalar). Stratejiler arasındaki korelasyon tanımını geliştirin.

2) Oluşturma stratejileri sırasında portföyü optimize edin. Yani, üzerlerinde portföy optimalliği koşuluna dayalı stratejiler aramak. Bunun pratik bir şekilde nasıl resmileştirilebileceği tam olarak açık değil, ancak yaklaşım genel olarak daha mantıklı görünüyor. Halihazırda yazdığınız gibi, algoritmaların yeniden yazılması vb. gerekli olacaktır. Oyunun muma değdiği gerçeği değil