Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2792

 
Maxim Dmitrievsky #:
Aynı şeyi bir yıldan fazla bir süre önce kümeleme ile yaptım, daha sonra resimlerdeki gibi ortalama seviyeleri belirledim ve bunlardan sipariş verdim. Yukarı, aşağı, ortalama geri dönüş olmak üzere 3 kümeye ayrılmıştır. Eğitimde harika çalışıyor.
İşin komik yanı, hangi özel aracı kullanırsanız kullanın, rastgele bir şeyden iyi bir şey elde edemezsiniz

Evet. Görünüşe göre fiyatlardan bir şey alamıyorsun. Başka bir şey yok. Borsada hacimler de var.
Görünüşe göre, FA bir şeyler verebilecek tek şey. Ve muhtemelen bunu manuel olarak yapmak daha iyidir. Ama orada bile yanılıyor olabilirsiniz, sahte haberler aktif olarak çalışıyor.

 
Maxim Dmitrievsky #:

Niteliklerin bilgilendiriciliğini onları geriye doğru kaydırarak kontrol ettim. Yani, niteliklerin geçmişinin son değerlerini değil, geçmişe doğru bir girinti ile alıyoruz. Ben 50 girinti aldım. (sıfırdan -50 çubuğa kadar)

Sağ sütunda çubuklar halinde girinti, sol sütunda karşılıklı bilgi. Girinti, çipler ve etiketler arasındaki karşılıklı bilginin artan sırasına göredir.

Son fiyatların her zaman öncekilerden daha iyi olmadığı, -11 barda sıfır bara göre bir miktar artış olduğu ortaya çıktı:

gösterge niteliğinde

"Karşılıklı bilgi" derken neyi kastediyorsunuz? Kurgunun işaret üzerindeki etkisi ilginç mi? Karşılıklı etki ilginç mi? "Karşılıklı bilgi" nasıl hesaplanır?

 
СанСаныч Фоменко #:

"Karşılıklı bilgi" ile ne demek istiyorsunuz? Fişin etiket üzerindeki etkisi ilginç mi? Karşılıklı etki ilginç mi? "Karşılıklı bilgi" nasıl hesaplanır?

Sorularınla beni şaşkına çeviriyorsun.

 
Maxim Dmitrievsky #:

Niteliklerin bilgilendiriciliğini onları geriye doğru kaydırarak kontrol ettim. Yani, niteliklerin geçmişinin son değerlerini değil, geçmişe doğru bir girinti ile alıyoruz. Ben 50 girinti aldım. (sıfırdan -50 çubuğa kadar)

Sağ sütunda çubuklar halinde girinti, sol sütunda karşılıklı bilgi. Girinti, çipler ve etiketler arasındaki karşılıklı bilginin artan sırasına göredir.

Son fiyatların her zaman öncekilerden daha iyi olmadığı, -11 barda sıfır bara göre bir miktar artış olduğu ortaya çıktı:

gösterge niteliğinde

H1 düzeltmeleri?

0   0.001554  23
1   0.001612  22
2   0.001708  15
3   0.001783  24
Günlük döngülere benziyor. 22-24 saat en bilgilendirici saatler. Yani bugün de dünle aynı olacak.
 
Maxim Dmitrievsky #:

Sorularınla beni şaşırtıyorsun.

Neden şaşırdınız?

Benim için bir özelliğin, çipin, tahmin edicinin bir etiketle olan etkisi, bağlantısı, tahmin gücü şu örnekle açıklanabilir.

İki değer alan bir "kişi" etiketi olsun: erkek ve kadın.

Pantolon ve etek olmak üzere iki değer alan bir "giyim" etiketi olsun ve farklı pantolon ve etek değerlerinin sayısı yüzlerce veya binlerce olsun.

Erkeklerin sadece pantolon, kadınların ise sadece etek giydiğini varsayalım. O zaman böyle bir fiş etiketi hatasız belirler, yani tahmin hatası = %0'dır. Fişin etiketi %100 etkilediğini, sınırladığını ve tahmin ettiğini düşünebiliriz. Bu koşullar gelecekte de devam ederse, hata değişmeyecek ve =-%0 olacaktır.

Modern toplumda durum böyle değildir ve büyüklüğü bilinmeyen ve fişin doldurulmasına bağlı olarak değişebilen bir tahmin hatası olacaktır.

Yazılım paketleri şeklinde uygulanan ve örneğimiz için kadınların bir kısmının pantolona ve erkeklerin eteğe olan sevgisi için çipin işaretle %100 bağlantısından bazı farklılıklar gösterecek çok sayıda yaklaşım vardır.


Grafikler bunu çok iyi göstermektedir.

Yararsız bir özellik örneği:


Oldukça umut verici bir fiş örneği. Kesişme bir tahmin hatasıdır. Önceki grafikte bir çip diğeriyle tamamen örtüşüyordu - tahmin hatası %50'dir.


Bu, ilk grafikteki ya da ikinci grafikteki çipler arasındaki farkın ölçüsü müdür? Tahminlerdeki fark 2,5 kattır. Ancak rakamlar görecelidir. Tüm özellikler önemsiz mi, bazıları ya da hepsi harika mı?

 
Google'da araştırın, wikipedia'dan alıntı yapmak istemiyorum. Bağlantının ölçüsü, korelasyonda olduğu gibi geometrik ve Mi'de olduğu gibi bilgisel olabilir.

Neden bir başkasının tembelliğiyle savaşmak zorunda olduğumu anlamıyorum, ki bunu daha önce kendiniz de kabul etmiştiniz).

Bir tane iyi yaklaşım verin, çok sayıda pakete ihtiyacınız yok. İsim yeterli olacaktır.
 
Maxim Dmitrievsky geometrik ve Mi'de olduğu gibi bilgisel olabilir.

Neden bir başkasının tembelliğiyle savaşmam gerektiğini anlamıyorum, ki bunu kendime de itiraf ederdim)

Peki, tamam. Öyle olsun.

 
СанСаныч Фоменко #:

Evet, peki, tamam. Öyle olsun.

Herhangi bir sonuç vermediğiniz ve birçok iyi pakete atıfta bulunduğunuz gibi, tam olarak ne demek istediğinizi tahmin etmemi de sağlıyorsunuz. Eğer spesifik bir şeyden bahsediliyorsa, spesifik sonuçlarla birlikte spesifik olarak yazın.

Genişletilmiş dağıtımlar hakkında sıradan bir örnek, bana bunları nasıl verimli bir şekilde elde edeceğimi gösterin.
Bilgi ilişkisi sizin tarafınızdan adlandırıldı. Temelinde entropi ve karşılıklı bilgi var. Bunu 500 kez yazmanıza gerek var mı? Entropi bir seri için tanımlanır, karşılıklı bilgi 2 seri için.
 

Özellikleri modelle ilgili olmayan bazı yöntem ve paketlerle değil, modelin kendisiyle değerlendirmek daha iyidir.
2 yıl önce https://www.mql5.com/ru/blogs/post/737458'un önemini değerlendirmek için yöntemleri karşılaştırdım.

Modelin kendisi örnek olarak alındı. Bunlardan birini kaldırarak N kez (özellik sayısına göre) eğittim.
Bir özellik çıkarıldıktan sonra sonuç ne kadar kötüleşirse, o kadar önemliydi. Çıkarılması sonucu iyileştiren çipler de vardı, yani açıkça gürültü.

Bir özelliğin önemini belirlemenin hiçbir çeşidi örnek önemine benzemiyordu. Korkarım ki karşılıklı bilgi ve diğer paketler de tutarsız olabilir.

Сравнение разных методов оценки важности предикторов.
Сравнение разных методов оценки важности предикторов.
  • www.mql5.com
Провел сравнение разных методов оценки важности предикторов. Тесты проводил на данных титаника (36 фичей и 891 строки) при помощи случайного леса из 100 деревьев. Распечатка с результатами ниже. За
 
elibrarius #:

Özellikleri modelle ilgili olmayan bazı yöntem ve paketlerle değil, modelin kendisiyle değerlendirmek daha iyidir.
2 yıl önce önem değerlendirme yöntemlerini karşılaştırdım https://www.mql5.com/ru/blogs/post/737458

Modelin kendisi bir örnek olarak alındı. Bunlardan birini kaldırarak N kez (özellik sayısına göre) eğittim.
Bir özellik çıkarıldıktan sonra sonuç ne kadar kötüleşirse, o kadar önemliydi. Çıkarılması sonucu iyileştiren çipler de vardı, yani açıkça gürültü.

Bir özelliğin önemini belirlemenin hiçbir çeşidi örnek önemine benzemiyordu. Korkarım ki karşılıklı bilgi ve diğer paketler de tutarsız olabilir.

İlk yaklaşımda kesinlikle haklısınız - bir modeli performans ölçütlerine göre değerlendirmeyi kastediyorsanız, nihai bir puana sahip olmalısınız.

Ancak, her şeyden ağır basan bir nüans var.

Bir modeli performansı üzerinden değerlendirmek geçmiş veriler üzerinden bir değerlendirmedir. Peki model gelecekte nasıl davranacak?

Özelliklerin kendilerini değerlendiriyorsak, bir pencere çalıştırabilir ve her bir özelliğin puanının değerindeki değişime ilişkin istatistikler elde edebiliriz. Ve bana göre, önem puanlarında küçük bir dalgalanma olan, tercihen %10'dan daha az olan özellikleri kullanmak tercih edilir. Benim kurgu setim 500 çubukta %10 ila %120 arasında sd dalgalanmalarına sahip (hafızadan). Bu, puanın %10'luk kanal içinde dalgalandığı anlamına gelir, yani gördüğümüz rakam budur. Ancak %120 için, gördüğümüz önem puanı değeri kurgudur.