Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 645

 
San Sanych Fomenko :

Serinin durağan olmadığı çıplak gözle açıkça görüldüğünden, ilk alıntı için yf'yi test etmenin bir anlamı yoktur.

Ve ilginç (benim için değil - her zaman kullanırım) log(p/p-1) zaman serileri için grafiklerdir.

Orada ne var? Ve tabii ki y ekseni boyunca bir ölçeğe ihtiyacınız var.

Yer kazanmak için iki grafiği tek bir çerçeveye sığdırmak için ölçeği kullanmadım, ancak Y koordinatları başlangıçta farklıydı.

Sonuç geçen seferden tamamen farklı, işte en ilginç grafikler, geri kalanı burada 10 resim heykel yapmamak için arşivde. Ancak entropi grafiğiyle tamamen ilgisiz olduğu ortaya çıktı.

Komut dosyası saldırısında, R-Studio'da, tüm arsa grafiklerinin geçmişini ileri geri kaydırabilirsiniz.

ayy, yine kodda bir yazım hatası, .txt dosyasını yeniden ekledim

Dosyalar:
 
San Sanych Fomenko :


Ana bileşenleri tartıştı ve algoritmanın denetimsiz olmasının dezavantajını gördünüz.

Burada öğretmenle:

spls paketi

Teşekkürler, vinçteki açıklamaya göre tahmin bile edemezdim (Sparse Kısmi En Küçük Kareler (SPLS) Regresyon ve Sınıflandırma)

 
Dr. tüccar :

Yer kazanmak için iki grafiği tek bir çerçeveye sığdırmak için ölçeği kullanmadım, ancak Y koordinatları başlangıçta farklıydı.

Sonuç geçen seferden tamamen farklı, işte en ilginç grafikler, geri kalanı burada 10 resim heykel yapmamak için arşivde. Ancak entropi grafiğiyle tamamen ilgisiz olduğu ortaya çıktı.

Komut dosyası saldırısında, R-Studio'da, tüm arsa grafiklerinin geçmişini ileri geri kaydırabilirsiniz.

ayy, yine kodda bir yazım hatası, .txt dosyasını yeniden ekledim

Harika resimler!

Kemer testinden arima modellerinin çalıştığı alanlar olduğu yargısına varılabilir. Ama sorun hep aynı: Hepimiz tarih konusunda çok zekiyiz ve Arima'yı ancak onu geçtikten sonra kullanabileceğimizi öğreniyoruz! Ve böylece tüm teorilerimizde: geçmişe bakıldığında güçlü.

 
Dr. tüccar :

Bunun peşinde - https://www.mql5.com/ru/forum/86386/page643#comment_6472393


Tahmini bırakma işlevi random.forest.importance() bazı testlerde oldukça iyi sonuçlar verdi. Onun görüşüne göre, genel olarak, tüm tahmin edicilerin en azından biraz önemli olması sakıncalıdır, ancak örneğin, ortalama önemi hesaplarsak ve yalnızca ortalamanın üzerinde önemli olan tahmin edicileri alırsak, çok iyi bir sonuç elde ederiz. sonuç.

ne önemi var Gini veya Permütasyon (MDA)

not başka yöntemler de var, mb da karşılaştırmayı deneyin http://blog.datadive.net/selecting-good-features-part-iv-stability-selection-rfe-and-everything-side-by-side/

Selecting good features – Part IV: stability selection, RFE and everything side by side
  • 2014.12.20
  • blog.datadive.net
In this post, I’ll look at two other methods: stability selection and recursive feature elimination (RFE), which can both considered wrapper methods. They both build on top of other (model based) selection methods such as regression or SVM, building models on different subsets of data and extracting the ranking from the aggregates. As a wrap-up...
 
Dr. tüccar :

Tahmin edicileri filtrelemek için başka bir ilginç paket buldum. Adı FSelector. Entropi kullanımı da dahil olmak üzere, tahmin edicileri ayıklamak için bir düzine yöntem sunar.

Tahmin ediciler ve hedef içeren dosya buradan alınmıştır - https://www.mql5.com/ru/forum/86386/page6#comment_2534058


Sonunda, her bir yöntemle tahmin edicinin tahminini grafikte gösterdim -

Mavi iyidir, kırmızı kötüdür (düzgün için, sonuçlar [-1:1] olarak ölçeklenmiştir, doğru bir değerlendirme için, işlevlerin kendilerini çağırma sonuçlarına bakın cfs(targetFormula, trainTable), chi.squared(targetFormula, trainTable ), vb.)
X3, X4, X5, X19, X20'nin hemen hemen tüm yöntemlerle iyi değerlendirildiği görülebilir, başlangıç için bunları alabilir, daha sonra eklemeyi / çıkarmayı deneyebilirsiniz.

Ancak çıngıraktaki modeller Rat_DF2'deki bu 5 tahminci ile testi geçemedi, yine mucize gerçekleşmedi. Onlar. Kalan öngörücülerle bile, model parametrelerini seçmeniz, çapraz doğrulama yapmanız, öngörücüleri kendiniz eklemeniz/kaldırmanız gerekir.

FSelector WEKA'dan gelir, yani Java kullanır. Hafıza yiyor ölçülmez. FSelectorRcpp kullanmak daha iyidir.

İyi şanlar

 

İşte aynı anda entropy(price) ve archTest(log(p/p-1)). Gözle ilişkili görünmüyorlar, herhangi bir sinyal görmüyorum. Göstergeler için gözü olan herkes bir şey fark edebilir.


 
Maksim Dmitrievski :

ne önemi var Gini veya Permütasyon (MDA)

Seçilebilecek 2 tip vardır -
1=doğrulukta ortalama azalma (muhtemelen bu mda'dır, ilk harflerde yakınsar)
2=düğüm safsızlığında ortalama azalma

 
Dr. tüccar :

Seçilebilecek 2 tip vardır -
1=doğrulukta ortalama azalma (muhtemelen bu mda'dır, ilk harflerde yakınsar)
2=düğüm safsızlığında ortalama azalma

evet, o, teşekkürler, ikinci mdi

 
Dr. tüccar :

İşte aynı anda entropy(price) ve archTest(log(p/p-1)). Gözle ilişkili görünmüyorlar, herhangi bir sinyal görmüyorum. Göstergeler için gözü olan herkes bir şey fark edebilir.


Evet, olağan oynaklık göstergesi elde edildi)

ve kemer testinin ne gösterdiği net değil

 

Tahmin edicilerin önemini değerlendirmede şüphesiz ilgi görüyorum.

En çeşitli sistem CORElearn paketindedir (bir zamanlar Vladimir Perervenko bana şiddetle tavsiye etti)

Değerlendirme için çeşitli işlevleri vardır.

İlk adım fonksiyondur:

ordEval(formula, data, file= NULL , rndFile= NULL ,
variant=c( "allNear" , "attrDist1" , "classDist1" ), ...)

ordEval вычисляет результирующие вероятностные факторы, соответствующие эффекту увеличение/уменьшение значимости атрибута для класса.
Алгоритм оценивает строго зависимые упорядоченные атрибуты, в которых значения отдельных атрибутов зависят от других атрибутов в разной манере.

İkinci aşamada, fonksiyon

attrEval(formula, data, estimator, costMatrix = NULL , ...)

estimator       Имя метода оценки. Ниже 37 имен.

[ 1 ]     "ReliefFequalK"        "  ReliefFexpRank" "ReliefFbestK"    "Relief"
[ 5 ]     "InfGain"              "GainRatio"          "MDL"              "Gini"
[ 9 ]     "MyopicReliefF"        "Accuracy"          "ReliefFmerit"    "ReliefFdistance"
[ 13 ]     "ReliefFsqrDistance"      "DKM"            "ReliefFexpC"    "ReliefFavgC"
[ 17 ]     "ReliefFpe"            "ReliefFpa"          "ReliefFsmp"      "GainRatioCost"
[ 21 ]     "DKMcost"              "ReliefKukar"        "MDLsmp"          "ImpurityEuclid"
[ 25 ]     "ImpurityHellinger"      "UniformDKM"      "UniformGini"    "UniformInf"
[ 29 ]     "UniformAccuracy"        "EqualDKM"        "EqualGini"      "EqualInf"
[ 33 ]     "EqualHellinger"          "DistHellinger" "DistAUC"        "DistAngle"
[ 37 ]     "DistEuclid"                      


Дополнительный параметр costMatrix может включить неоднородную матрицу стоимости для классификаций, чувствительных к стоимости мер 
(ReliefFexpC, ReliefFavgC, ReliefFpe, ReliefFpa, ReliefFsmp, GainRatioCost, DKMcost, ReliefKukar и MDLsmp). 



Görüldüğü gibi deniz, tahmin edicilerin önemini belirleme alanında alıştırmalarla dolu.