Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3370

 
Bogard_11 #:

Model, yani model, sadece bir tanedir. Herhangi bir hareketi ABC'ye basitleştirdiğiniz anda, modelin tüm matris oranlarını bulabilirsiniz. Makine öğrenimi olmasa bile tüm bunlar elle kolayca hesaplanabilir. Ranok, okuldaki cebir ve geometri derslerinden daha karmaşık değildir.

Örneğin, çok sayıda modeli olan ahşap modellerde bir desen bir ağaçtır. Her ahşap model, örneğin CatBoost yüzden fazla ağaç bulur, desenleri okur. RandomForest için istatistiklerim var: 50 ağaca kadar sınıflandırma hatası düşüyor ve 150 ağacın üzerinde sınıflandırma hatası sabit, yani işlediğim zaman serisinde desen sayısı 150'yi geçmiyor.

 
СанСаныч Фоменко #:

Örneğin, çok sayıda modeli olan ahşap modellerde bir desen bir ağaçtır. Her ahşap model, örneğin CatBoost yüzden fazla ağaç bulur, desenleri okur. RandomForest için istatistiklerim var: 50 ağaca kadar sınıflandırma hatası düşüyor ve 150 ağacın üzerinde sınıflandırma hatası sabit, yani işlediğim zaman serisinde desen sayısı 150'yi geçmiyor.

Bu 150 örüntüyü tek bir ortak örüntüye dönüştürmek için geriye çok az şey kalmıştır. Eğer A varsa ve B varsa, o zaman C belirli bir zamanda filanca ördekte gelecektir, değilse, zaman ve nokta farklı olacaktır. C'nin gelişiminin sadece üç farklı varyantı vardır. Her şeye ZAMAN karar verir! Ve bu önce elle kolayca çözülebilir ve sonra isterseniz bir robota koyabilirsiniz.

Not: - sadece A 'nın büyüklüğü B 'nin geri çekilmesi için belirli seviyeler vermekle kalmaz (çoğu zaman geri tepme 1-3 puanı geçmez). Benzer şekilde, B, C'nin fiyat seviyeleri hakkında önceden sinyal verir. Her yerde çok fazla matematik var.

Örnek olarak, manuel bir Uzman Danışman, ilgilendiğimiz hareketten seviyeleri otomatik olarak hesaplar. Yani, istenen dalgayı çekiyoruz ve gelecek zaten işaretlenmiş durumda.

Dosyalar:
 
СанСаныч Фоменко #:

Örneğin, çok sayıda modeli olan ahşap modellerde bir desen bir ağaçtır. Her ahşap model, örneğin CatBoost yüzden fazla ağaç bulur, desenleri okur. RandomForest için istatistiklerim var: 50 ağaca kadar sınıflandırma hatası düşüyor ve 150 ağacın üzerinde sınıflandırma hatası sabit, yani işlediğim zaman serisinde desen sayısı 150'yi geçmiyor.

Bunun yerine, yanıtı bir işlem açmak için eşiğinizi aşan her yaprağa giden yol bir modeldir.
Örneğin:
1. bölünme: 40 bar delta ile akım = 0,
2. bölünme: 30 bar = 100,
3. bölünme: 20 bar = 50,
4. bölünme: 10 bar 100,
5. bölünme: 1 bar = 0.
Bir çukur ile 2 tepe noktası. Bir model mi? Evet. 1 yaprağa giden yol bunu açıklar.

Ağacınızda işlem yaptığınız eşiği aşan 20 yaprak varsa, ağacınızda kullandığınız 20 desen vardır. Daha az başarılı yapraklar da desenleri tanımlar, ancak bunlar rastgele/kayıptır.
Diğer 100 ağaç, farklı bölünme değerlerine sahip diğer çipleri/çubukları kullanabilir.
Orman, tüm ağaçların cevaplarının ortalamasını alacak (toplayacak ve ağaç sayısına bölecek), durum hakkında ortalama bir görüş elde edeceğiz.
Boost, basitçe bir ağırlıklandırma / netleştirme katsayısı ile ekleyecektir.

 
Bogard_11 #:

Bu 150 örüntüyü tek bir ortak örüntü haline getirmek için geriye çok az şey kalmıştır. Eğer A varsa ve B varsa, o zaman C belirli bir zamanda filanca ördeğin içinde gelecektir, eğer gelmeyecekse, zaman ve nokta farklı olacaktır. C'nin gelişiminin sadece üç farklı varyantı vardır. Her şey ZAMAN tarafından belirlenir! Ve bu önce elle kolayca çözülebilir ve sonra isterseniz bir robota koyabilirsiniz.

Not: Sadece A 'nın büyüklüğü B 'nin geri çekilmesi için belirli seviyeler vermekle kalmaz (çoğu zaman geri tepme 1-3 puanı geçmez). Aynı şekilde, B de C'nin fiyat seviyeleri hakkında önceden sinyal verir.

Örnek olarak, manuel bir Uzman Danışman, ilgilendiğimiz hareketten seviyeleri otomatik olarak hesaplar. Yani, istenen dalgayı çekiyoruz ve gelecek zaten işaretlenmiş durumda.

Hiçbir şeyi resmileştirmenize gerek yok - her şey sizin için yapılıyor.

 
Forester #:

Bunun yerine, cevabı bir işlem açmak için eşiğinizi aşan her sayfaya giden yol bir modeldir.
Örneğin:
1. bölünme: 40 bar delta ile akım = 0,
2. bölünme: 30 bar = 100,
3. bölünme: 20 bar = 50,
4. bölünme: 10 bar 100,
5. bölünme: 1 bar = 0.
Bir çukur ile 2 tepe noktası. Bir model mi? Evet. 1 yaprağa giden yol bunu açıklar.

Ağacınızda işlem yaptığınız eşiği aşan 20 yaprak varsa, ağacınızda kullandığınız 20 desen vardır. Daha az başarılı yapraklar da desenleri tanımlar, ancak bunlar rastgele/kayıptır.
Diğer 100 ağaç, farklı bölme değerlerine sahip diğer çipleri/çubukları kullanabilir.
Orman, tüm ağaçların cevaplarının ortalamasını alacak (toplayacak ve ağaç sayısına bölecek), durum hakkında ortalama bir görüş elde edeceğiz.
Boost, basitçe bir ağırlıklandırma / netleştirme katsayısı ile ekleyecektir.

Ağaç ağaçtır ve hatırladığım kadarıyla bunların çıktısını bile alabilirsiniz.

Öte yandan yapraklar karanlık bir meseledir. Yaprak seviyesinde algoritma, tasarımcının kalemleriyle birlikte sınıflandırma hatası ve yanlılık arasında bir denge arar. Ağaçları, girdi kümesini tam olarak tanımlayacak kadar derin ayarlamak mümkündür - aşırı eğitim veya aşırı uyum. Ve sorun, girdi setini bilmediğimiz bir gelecekte minimum hata ile sınıflandırma elde etmektir. Yapraklar elbette sonludur, ancak tam olarak "sonlu" değil, yaklaşık olmaları gerekir. Bu nedenle, bir örüntü bir ağaçtır.

 
СанСаныч Фоменко #:

Ağaç ağaçtır ve hatırladığım kadarıyla bunların çıktısı bile alınabiliyor.

Ancak yapraklarla ilgili konu karanlıktır. Yaprak seviyesinde algoritma, tasarımcının kalemleriyle birlikte sınıflandırma hatası ve yanlılık arasında bir denge arar. Ağaçları, girdi kümesini tam olarak tanımlayacak kadar derin ayarlamak mümkündür - aşırı eğitim veya aşırı uyum. Ve sorun, girdi setini bilmediğimiz bir gelecekte minimum hata ile sınıflandırma elde etmektir. Yapraklar elbette sonludur, ancak tam olarak "sonlu" değil, yaklaşık olmaları gerekir. Bu nedenle, bir örüntü bir ağaçtır.

Ben buna katılmıyorum. Derinliği 5 olan bir yaprak örneği verdim (yaprak 5 bölme ile elde edilir ve bu bir örüntüdür). Bir yaprağı 200 bölünme ile elde ederseniz, size yeni veriler üzerinde düşük performans gösterecek aşırı eğitilmiş bir örüntü verecektir. Ancak bir örüntü olmaktan çıkmayacaktır. Ağaç bir örüntü kümesidir.

 
Forester #:

Buna katılmıyorum. Ben 5 derinlikli bir tabaka örneği verdim (tabaka 5 bölme ile elde edilir ve bu bir kalıptır). Eğer 200 bölme ile bir sayfa elde ederseniz, bu size yeni veriler üzerinde düşük performans gösterecek yeniden eğitilmiş bir örüntü verecektir. Ancak bir örüntü olmaktan çıkmayacaktır. Ağaç bir örüntü kümesidir.

Sobadan başlayalım.

İki ağaç çeşidini ele alıyorum: torbalama ve boolean (rf, ada) türleri.

Bu oldukça geniş algoritmalardan her ikisi de girdi verilerini komşu satırlara atıfta bulunmadan OLASI olarak değerlendirir. bu nedenle eğitim seti rastgele satırlar seçilerek oluşturulur.

Tek bir satır içinde, hedef değişken (öğretmen) tarafından belirtilen sınıfı en yüksek olasılıkla tahmin edecek bir tahmin edici değer seçimi yapılır.

Girdi tahmin edicileri kümesinden belirli sayıda tahmin edicinin ve bunların tek bir satırdaki değerlerinin kombinasyonu oldukça örüntü olarak adlandırılır.

 
СанСаныч Фоменко #:

Tek bir satır içerisinde, hedef değişken (öğretmen) tarafından belirtilen sınıfı en yüksek olasılıkla tahmin edecek tahminci değerleri seçilir.

Girdi tahmin edicileri kümesinden belirli sayıda tahmin edicinin ve bunların değerlerinin tek bir satırda birleşimi bir örüntü olarak adlandırılabilir.

Soba borusunu yanlış anlıyorsunuz. Görünüşe göre ağaç yapım koduna hiç bakmamışsınız.... Orada bir satır içinde hiçbir işlem yoktur!!!, sadece kümelerle (tam veya toplu).

Kısaca:
Eğitime geçirilen rastgele/tam bir satır kümesi, her tahminci/sütun için tek tek sıralanır. Üzerindeki farklı bölünmeler kontrol edilir (orta/yüzde/rastgele), her biri için istatistikler sayılır ve önerdiğiniz gibi bir/her satır için değil, tüm satır kümesi için en iyi bölünme seçilir.
En iyi bölünmeye göre, dizeler kümesi 2 kümeye bölünür, ardından her küme tekrar sıralanır ve durdurma kuralına ulaşılana kadar (derinliğe, satır başına örnek sayısına vb. göre) parçaların her biri için en iyi bölünme seçilir.

Editörde daha fazla ayrıntı görebilirsiniz, dosyanız var:
\MQL5\Include\Math\Alglib\dataanalysis.mqh
ClassifierSplit() işlevi ve çağrıldığı işlev.
Bunu birkaç saat içinde anlayacaksınız ve tahmin edicileri tek bir satırla aramak hakkında konuşmak zorunda kalmayacaksınız.
 
СанСаныч Фоменко #:

Hiçbir şeyi resmileştirmenize gerek yok - her şey sizin için yapıldı.

Peki robotunuzun gelecekteki artı veya eksi birkaç üç saatlik aralıktaki doğruluğu nedir? Yapay zekanızın gelecekte hesaplayacağı pivot noktasından bahsediyorum. Aynı pound-dolar üzerinde gün içi artı eksi 5-10 piplik bir hata ve m5 üzerinde + 1-2 barlık bir hata ile.

Ve yapay zekanız, modelin (modelin) fiyata göre değil, zamana göre hareket ettiğini zamanında fark edebilecek mi? Bu, birinci değil, ikinci veya üçüncü hesaplama noktasının tetikleneceği anlamına gelir. :)

Yazılımcılar çocuklar gibidir, eğer birisi bir bilgisayarın yeteneklerinden şüphe ederse (bir makine her şeyi bulacakmış gibi), hemen dudaklarını büker ve alınırlar. ;) Ve kimse neden %100 çalışan bir algoritma bulamadığınızı asla göremeyeceğinizi anlayamaz. Ve hepsi küçük bir algılanamaz ayrıntı olduğu için, gelecekte modelin oranlarının belirli bir miktarda değişeceğine dair bir sinyal veren şey budur. Ama siz Henius'lar ve kod tanrılarısınız, bir şey seçmek (her şeyi elle aramak, bir kağıda veya hesap makinesine saymak) onurlu bir şey değildir. Girdiye saçma sapan bir şey kodlamak, çıktıda saçma sapan bir şey elde etmek ve sonra hepsini optimize etmeye çalışmak daha kolaydır.

Net bir mantıksal matematiksel sistem 100 yıldan daha uzun bir süre önce tanımlanmıştır (hala saat gibi çalışmaktadır). Hem cebir hem de geometri açısından. Ama kendi lizapedilerinin mucitleri hala bolluk içinde....

 
Bogard_11 #:

Net bir mantıksal matematiksel sistem 100 yıldan fazla bir süre önce tanımlanmıştır (hala saat gibi çalışmaktadır). Hem cebir hem de geometri açısından. Ama hala kendi lizapedlerinin mucitleri var.....

Öyleyse bize ticaretinizi gösterin...
Neden bu kadar laf kalabalığı?

Ve TS'nizin saat gibi işleyen yüz yıllık bir teoriye göre nasıl çalıştığını görelim.
Hadi ama.