Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1533

 
Maksim Dmitrievski :

yukarıda yazdım. Parçaların bir yarısında ana model, diğer yarısında ikinci düzeltici

5-10 kat yeterli, belki daha fazla

Yukarıda yazılanlar anlaşılır.

Ben sadece "5-10 kat" ne anlama geldiğini anlamıyorum.

 
Alexey Vyazmikin :

Yukarıda yazılanlar anlaşılır.

Ben sadece "5-10 kat" ne anlama geldiğini anlamıyorum.

veri kümesini eşit bölümlere ayırın, diyelim ki 5 parça

1,3,4'ü birleştirin ve ana modeli üzerlerinde eğitin

2.5 birleştir. 1. modeli üzerlerinde çalıştırın, sonuçları alın.

2. modeli bu 2.5 üzerinde 1., doğru kaybeden işlemlerin sonuçları üzerinde eğitin.

her iki modeli de tüm veri kümesinde ve yeni verilerde çalıştırın ve sonucu görün

 
Alexey Vyazmikin :

Tam olarak ne sayılacak?

Portföyde her zamanki gibi - ağırlıklar (varlıklar, sistemler). Sizin durumunuzda, örneğin 0 - bir yaprak sinyalinde sanal ticaret, 1 - gerçek ticaret olabilir ve -1 - sinyal geri dönüşü ekleyebilirsiniz. Her portföy 0, 1 veya -1 yaprak uzunluğu vektörüne karşılık gelir. Optimizasyon, örneğin, düşüş ve portföy hacmi için cezalar içeren kâr üzerinden her geçen ay için gerçekleştirilir.

 
Maksim Dmitrievski :

veri kümesini eşit bölümlere ayırın, diyelim ki 5 parça

1,3,4'ü birleştirin ve ana modeli üzerlerinde eğitin

2.5 birleştir. 1. modeli üzerlerinde çalıştırın, sonuçları alın.

2. modeli bu 2.5 üzerinde 1., doğru kaybeden işlemlerin sonuçları üzerinde eğitin.

her iki modeli de tüm veri kümesinde ve yeni verilerde çalıştırın ve sonucu görün

Ve, şey, şimdi açık, sadece örneğin bir çeşit karışık olduğu ve birincisi için eğitimin olmadığı ikinci modeli eğittiği anlamına geliyordu, öğretimin nasıl bitirileceği. Bunun nasıl uygulanabileceğini düşünmemiz gerekiyor, ancak muhtemelen bu projede 2019'da ikinci modeli eğitmekten başka bir yol yok, ancak o zaman eğitim dışında sonuçları kontrol edecek hiçbir yer kalmayacak.

 
Aleksey Nikolaev :

Portföyde her zamanki gibi - ağırlıklar (varlıklar, sistemler). Sizin durumunuzda, örneğin 0 - bir yaprak sinyalinde sanal ticaret, 1 - gerçek ticaret olabilir ve -1 - sinyal geri dönüşü ekleyebilirsiniz. Her portföy 0, 1 veya -1 yaprak uzunluğu vektörüne karşılık gelir. Optimizasyon, örneğin, düşüş ve portföy hacmi için cezalar içeren kâr üzerinden her geçen ay için gerçekleştirilir.

Burada soru, katsayıları yeniden yuvarlama sıklığıdır, nadiren ise, o zaman trendin gerisindeyiz ve sık sık ise, uyum korkunç olacaktır, çünkü stratejinin kendisi düşüşlere izin verir ve liste asla bir sinyal vermeyebilir. bu yaklaşımı karmaşıklaştıran çeyrek.

 
Maksim Dmitrievski :

Test cihazı tamir edilmiş gibi görünüyor, hiçbir yere bakmıyor, sonuçlar:

EURUSD treni+geçerli, 10k bar


EURUSD testi 50k bar

Aynı model EURUSD'de eğitildi, ancak GBPUSD'de test edildi, 50k bar

USDCHF'de aynı model

Bu mantıklı görünüyor. Bir yükseliş eğilimi var, tabiri caizse)

Belki bir şeyi hesaba katmadım, ama hareket halindeyken alglib ormanından açıkça daha iyi (iyileştirmek için çok daha fazlasını eklememe rağmen)

Hızlı koşuyor, çok fazla sinyal var, portföy yapmayı deneyebilirsiniz. Ve numunenin zaman aralığı nedir?

 
Alexey Vyazmikin :

Hızlı koşuyor, çok fazla sinyal var, portföy yapmayı deneyebilirsiniz. Ve numunenin zaman aralığı nedir?

yaklaşık 15 dakikada bir buçuk yıl

Pekala, bu bir sonda, eksiklikleri ve yapacağım diğer her şeyi kaldırmak gerekiyor

 
Maksim Dmitrievski :

yaklaşık 15 dakikada bir buçuk yıl

Pekala, bu bir sonda, eksiklikleri ve yapacağım diğer her şeyi kaldırmak gerekiyor

Görünüşe göre birçok anlaşma var, yayılma her şeyi nasıl tüketirse tüketsin... her durumda, potansiyel var - iyi şanslar!

 

Bölme sırasında modellerin metrik göstergelerindeki değişikliklerin dinamiklerine biraz bakmaya karar verdim, 1, 20 ve 48 adım attı (en son işlendi), böyle bir özet tablo çıktı.

Eğitimin gerçekleştirildiği örneklemden alınan göstergeler.

Sonuçlar bana ilginç geliyor, her şeyden önce, sadece %52 - %53 arası Doğruluk veren ağaçlarla çalıştığımıza dikkat etmeye değer, ki bu da bir bütün olarak model için çok küçük görünüyor. tüm model bizi pek ilgilendirmiyor, çünkü ticaret için girişi atlamaktan doğru yöne girmek daha önemlidir, bu da öncelikle sınıflandırmanın doğruluğuyla ilgilenmemiz gerektiği anlamına gelir ve burada görülebilir ki "-1" ve "1" sınıflarının belirli bir anda doğruluğu, orijinal versiyondan% 4 ve% 3 daha fazla bir değere ulaştı ve "0" sınıfı, doğruluğu sadece% 1-2 oranında kaybetti, ancak aynı zamanda, "-1" ve "1" sınıflarının tamlığı azalır, ancak bununla birlikte "0" sınıfının tamlığı büyür.

Bu aşamada, kök tahmin edicilerin yaklaşık %10'u örnekten çıkarıldı - her adımda bir tane, ancak model dağılmadı ve hatta bizim için önemli olan bireysel göstergeler bile daha iyi hale geldi.

Tabii ki, dinamikler hakkında daha fazla bilgi, 48 bölünmenin tümü işlenerek elde edilebilir, belki göstergelerde boşluklar vardır veya tam tersi, tüm göstergeler seçilen vektörde hareket eder. Ama bence asıl mesele, ticaretin, prensibi tüm yapıyı tanımlamaya çalışmak değil, yapının bir kısmını diğer parçalardan daha iyi anlamak olan bir model yaratma yöntemine ihtiyaç duymasıdır ve şimdi iyi bir model, benim bildiğim tüm yöntemlerde, model entropi veya mantık ile tahmin edilir, yani. eğitim için, tüm model değerlendirilir - isterseniz sıfır ve bir hakkında bilgi, biz sadece bir hakkında daha fazla bilgiye ihtiyacımız var.

Pekala, daha önce gösterdiğim gibi, yapraklara göre ağaç ve yapraklara göre seçme yöntemim, alışılmış modele kıyasla eğitim örneğindeki sınıflandırma doğruluğunu %20 - %25 artırıyor.

Soru, süreci nasıl hızlandırabilirim, şimdi ağaçlar oluşturan R betiğinin çalışmasını yeniden düşünebileceğim ve tekniği geliştirmeyi ve hızlandırmayı düşünebileceğim ilgili insanları arıyorum.

 
Alexey Vyazmikin :

Bölme sırasında modellerin metrik göstergelerindeki değişikliklerin dinamiklerine biraz bakmaya karar verdim, 1, 20 ve 48 adım attı (en son işlendi), böyle bir özet tablo çıktı.

Eğitimin gerçekleştirildiği örneklemden alınan göstergeler.

Sonuçlar bana ilginç geliyor, her şeyden önce, sadece %52 - %53 arası Doğruluk veren ağaçlarla çalıştığımıza dikkat etmeye değer, ki bu da bir bütün olarak model için çok küçük görünüyor. tüm model bizi pek ilgilendirmiyor, çünkü ticaret için girişi atlamaktan doğru yöne girmek daha önemlidir, bu da öncelikle sınıflandırmanın doğruluğuyla ilgilenmemiz gerektiği anlamına gelir ve burada görülebilir ki "-1" ve "1" sınıflarının belirli bir anda doğruluğu, orijinal versiyondan% 4 ve% 3 daha fazla bir değere ulaştı ve "0" sınıfı, doğruluğu sadece% 1-2 oranında kaybetti, ancak aynı zamanda, "-1" ve "1" sınıflarının tamlığı azalır, ancak bununla birlikte "0" sınıfının tamlığı büyür.

Bu aşamada, kök tahmin edicilerin yaklaşık %10'u örnekten çıkarıldı - her adımda bir tane, ancak model dağılmadı ve hatta bizim için önemli olan bireysel göstergeler bile daha iyi hale geldi.

Tabii ki, dinamikler hakkında daha fazla bilgi, 48 bölünmenin tümü işlenerek elde edilebilir, belki göstergelerde boşluklar vardır veya tam tersi, tüm göstergeler seçilen vektörde hareket eder. Ama bence asıl mesele, ticaretin, prensibi tüm yapıyı tanımlamaya çalışmak değil, yapının bir kısmını diğer parçalardan daha iyi anlamak olan bir model yaratma yöntemine ihtiyaç duymasıdır ve şimdi iyi bir model, benim bildiğim tüm yöntemlerde, model entropi veya mantık ile tahmin edilir, yani. eğitim için, tüm model değerlendirilir - isterseniz sıfır ve bir hakkında bilgi, biz sadece bir hakkında daha fazla bilgiye ihtiyacımız var.

Pekala, daha önce gösterdiğim gibi, yapraklara göre ağaç ve yapraklara göre seçme yöntemim, alışılmış modele kıyasla eğitim örneğindeki sınıflandırma doğruluğunu %20 - %25 artırıyor.

Soru, süreci nasıl hızlandırabilirim, şimdi ağaçlar oluşturan R betiğinin çalışmasını yeniden düşünebileceğim ve tekniği geliştirmeyi ve hızlandırmayı düşünebileceğim ilgili insanları arıyorum.

yani logloss ~ 1'iniz var, yani model genellikle olanlardan havada

Ayrı bir giriş için ayrı bir logoloss mu bulmak istiyorsunuz? doğru anlaşıldı mı? Onlar. kol-in levha değerleri ile hedef arasındaki bilgiler?

"hiçbir şey yapma" sınıfı, yukarıda yazdığım diğerlerine göre açıkça dengesiz, 3 sınıflı modelden dolayı böyle bir sorun olabilir. Rakamların geri kalanı hayal kırıklığı yaratıyor.