Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3012

 
Maxim Dmitrievsky #:

söylediklerinizi hala kimse anlamıyor, bence )

Occam'ın usturası prensibiyle her şeyi sözsüz ve basit bir şekilde açıklığa kavuşturuyor.

Hayır, sadece konuya geldiğimde ve ağaçlardan kuralları ayıklamak ve onları değerlendirmek hakkında konuşmaya başladığımda bu fikre güldünüz.

Şimdi bir sonraki adımı attım - tahmin edicinin kuantum segmentlerinin değerlendirilmesi yoluyla potansiyel olarak yüksek kaliteli kuralların oluşturulması için koşulların yaratılması ve yine tamamen yanlış anlaşılma ile karşı karşıyayım.

 
СанСаныч Фоменко #:

Birkaç kez yazdım.

Burada duyulmak için aynı şeyi yüzlerce kez söylemek zorundasınız.

 
Aleksey Vyazmikin #:

Hayır, sadece konuya gelip kuralları ağaçlardan ayıklamak ve değerlendirmek hakkında konuşmaya başladığımda bu fikre güldünüz.

Şimdi bir sonraki adımı attım - tahmin edicinin kuantum bölümlerinin tahmin edilmesi yoluyla potansiyel olarak yüksek kaliteli kuralların oluşturulması için koşulların yaratılması ve yine tamamen yanlış anlaşılmayla karşılaştım.

Yani sadece ağaçtan kural çıkarmak sizi mutlu etmiyor mu? Teorik olarak, bu da bir şans meselesidir, ancak bir numaralı (kurallar) pahasına bir şeyler bulabilir.

Bu, bir optimize edicide strateji parametrelerini aramakla hemen hemen aynıdır, ancak daha zarif bir şekilde.
 
Maxim Dmitrievsky #:

Yani sadece kuralları ağaçtan çıkarmak sizi mutlu etmedi mi?

Yöntemin, kuralların sonraki reenkarnasyonları ile daha uzun ömürlü olmaları konusunda kesinlik olmaması dışında oldukça iyi olduğu ortaya çıktı. Uzun aralıklarla seçilen kuralların %50'sinden fazlası olumlu performans sonuçları gösterdi.

Genetik bir ağaç kullandım - örnek çok sayıda tahminci içeriyorsa bu çok yavaştır.

Bu yüzden eğitim için ağaca beslenen bilgi miktarını azaltmanın yollarını aramaya karar verdim. Potansiyel olarak yararlı verileri vurgulamanın yollarını aramaya başladım.

Bir başka sorun da yaprakların/kuralların aktivasyon noktaları açısından çok benzer olmasıydı. Ve yaprak tabanı büyüdükçe, benzersizliği bulmak zorlaştı.

Sonuç olarak, tasarım ilginç, geliştirilecek bir şeyler var, ancak benim durumumda son derece yavaştı. Genel olarak, deneyler için uygun değil, ancak TC inşaat cihazının tüm konsepti hazırsa, uygulama için ilginç.

Ve tabii ki - R'yi bilmiyorum, yerel uzmanlara sordum ve kimse görevlerimi çözmeme yardımcı olamadı.

Şimdi örnekleme ve kök tahmin edicinin zorunlu seçimini (listeye göre) ve zaten kullanılmış olanın engellenmesini ekleyeceğim.

 
Aleksey Vyazmikin #:

Yöntemin, kuralların sonraki reenkarnasyonları ile daha uzun ömürleri hakkında kesinlik olmadığı gerçeği dışında oldukça iyi olduğu ortaya çıktı. Uzun aralıklarla seçilen kuralların %50'sinden fazlası olumlu performans sonuçları göstermiştir.

Genetik bir ağaç kullandım - örnek çok sayıda tahmin edici içeriyorsa bu çok yavaştır.

Bu yüzden eğitim için ağaca beslenen bilgi miktarını azaltmanın yollarını aramaya karar verdim. Potansiyel olarak faydalı verileri seçmenin yollarını aramaya başladım.

Bir başka sorun da yaprakların/kuralların aktivasyon noktaları açısından çok benzer olması. Ve yaprak tabanı büyüdükçe, benzersizliği bulmak zorlaştı.

Sonuç olarak, tasarım ilginç, geliştirilecek bir şeyler var, ancak benim durumumda son derece yavaştı. Genel olarak, deneyler için uygun değil, ancak TC yapım cihazının tüm konsepti hazırsa, uygulama için ilginç.

Ve tabii ki - R'yi bilmiyorum, yerel guruları sordum ve kimse sorunlarımı çözmeme yardımcı olamadı.

Şimdi örnekleme ve kök tahmin edicinin zorunlu seçimini (listeye göre) ve halihazırda kullanılmış olanın engellenmesini eklerdim.

Catbust'ın bununla ne ilgisi var? Neden ona ihtiyacınız var, ondan da kurallar çıkarıyor musunuz?

neden basit bir ağaç alıp, karmaşık kurallara daha az ağırlık vererek (kural karmaşıklığı için ceza) kökten tepelere doğru kurallarla gitmeyelim?

her kuralı yeni veriler üzerinde bir test cihazında çalıştırın, önceden büyük hata verenleri atın.

ZY, bu yaklaşımı sezgisel olarak hala sevmiyorum, nedenini henüz bulamadım
 
Aleksey Vyazmikin #:

Ve tabii ki R'yi tanımıyorum,

Bunu bir yıldan fazladır duyuyorum.

R 'yi bir haftada öğrenebilirsin.

 
Maxim Dmitrievsky #:

Catbust'ın bununla ne ilgisi var? Neden buna ihtiyacınız var, kuralları da bundan mı çıkarıyorsunuz?

CatBoost, fikirlerin yönünün ilk etapta doğru olup olmadığını kontrol etmek için harika bir hızdır.

İlk ağaçtan kurallar çıkarabilirim, ancak elbette ortalama olarak çok daha zayıf çıkıyorlar (iyi olanlar var, ancak çok nadiren), bu yüzden şimdilik bu fikri bıraktım. Şimdi ağaç oluşturmanın alternatif bir yolu var, belki kurallar orada daha güçlüdür, ancak python olmadan böyle bir modelle MQL5'te çalışma imkanı yoktur.

Ve genel olarak, oluşturulması yavaş olan, ancak yaprakları seçmek için kullanılan kontrollerle aynı olan bir modelin nasıl oluşturulacağına dair kendi fikirlerim var. Belki bir gün bunun kod olarak uygulanmasını sağlayabilirim.

 
Maxim Dmitrievsky #:

neden basit bir ağaç alıp, karmaşık kurallara daha az ağırlık vererek (kural karmaşıklığı için ceza) kurallara göre kökten tepelere doğru gitmiyorsunuz?

her kuralı bir test cihazında yeni veriler üzerinde çalıştırın, önceden büyük hata verenleri atın.

ZY, bu yaklaşımı sezgisel olarak hala sevmiyorum, nedenini henüz bulamadım

Aradaki fark esasen sadece veri miktarı ve modeli uygularken CPU yüküdür.

Ayrıca, yaprakları gruplandırarak ve ağırlıkları dağıtarak bir araya getirmek daha kolaydır (ben buna herbaryum dedim :) ).

Kuralları oluşturmak için birçok ağaç kullanılır, bu da sinyallerin çakıştığı anlamına gelir, bu sadece bir ağaçta geçerli değildir.

 
mytarmailS #:

Bunu bir yılı aşkın süredir duyuyorum.

R bir haftada öğrenilebilir

Görünüşe göre herkes bu kadar yetenekli değil.

Ve kod basit değil - yeniden yapmaya çalıştım, ancak internette sorunu çözmek için yeterli bilgi yoktu.

R'nin bir diğer dezavantajı da hesaplamaları bilgisayarlar arasında paralelleştirmek için basit bir çözüm olmaması.

 
Aleksey Vyazmikin #:

Aradaki fark esasen sadece modeli uygularken kullanılan veri miktarı ve CPU yüküdür.

Ayrıca, yaprakları bir araya getirmek, gruplar halinde toplamak ve ağırlıkları dağıtmak daha kolaydır (ben buna herbaryum dedim :) ).

Kuralları oluşturmak için birçok ağaç kullanılır, bu da sinyallerin çakıştığı anlamına gelir, bu durum tek bir ağaçta söz konusu değildir.

Bu fikri neden sevmediğimi anladım, çünkü ilişkilendirme (kurallar, örneğin) = nedensellik :)