Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 37

 
Yuri Reshetov :



R'ye entegre etmek daha iyi olabilir mi?

ve insanlar daha fazla çalışabilecek ve R ile mt5 köprüleri gibi görünüyor

 
Dr.Tüccar :

Bunu hiç denemedim, ancak teknik olarak hedef değişkeni pca modeline dahil ederek bir öngörücü olarak düşünmek mümkün. Daha sonra, yeni verilerde değeri bilinmeyecek, sırasıyla pca bu eksik değerleri doldurabilir.

Bileşenin kafalarını tahmin etmeye çalıştım, ilginç bir şey alamadım ..

ayrıca bu "Rssa" için çok iyi ve iyi belgelenmiş bir paket olduğunu deneyebilirsiniz.

 
Dr.Tüccar :

Hayır, her şey yolunda. Ana bileşenlerin her biri için kullanılan tahmin ediciler bilindiğinden, ana bileşenlerde kullanılmayan tahmin edicileri güvenle filtreleyebiliriz.

Ne demek kullanılmadı? PCA doğrusal bir dönüşümdür. Çıkarılabilir boyutlar, diğerlerinin doğrusal bir kombinasyonu ile elde edilebilen boyutlardır. Bu, herhangi bir tahmin edicinin, temel bileşenlerin doğrusal bir kombinasyonu ile elde edilebileceği anlamına gelir. %95'lik bir aralık alırsanız, ölçek nedeniyle aptalca iyi bir tahminciyi kaybetme şansınız yüksektir, %100'den küçük bir aralık yalnızca kayıplı veri sıkıştırmasında kullanılır, aksi takdirde yalnızca sıfır olan bileşenler her zaman kesilir.

 
mytarmailS :
Kahretsin, bu "NA"-shki'nin tarihe atılmasının tesadüf olmadığından şüphelendim, ancak kılavuzu okudum, açıkça bir sinir ağı olan PCA diyor, ancak bu kişinin siteden nasıl olduğu hala net değil bu güzel resmi sınıflara iyi bir şekilde ayırarak aldım

Orada resimlerin farklı bir özü var... Yazının kendisi sınıflandırma ile ilgili değil, kümeleme ile ilgili. Veriler var, bir şekilde gruplara ayrılmaları gerekiyor. Yani, kaç grubun ortaya çıkacağı bile bilinmiyor - iki, üç, on ... Yazar, PCA'dan ilk iki bileşenin grafiğini kullanıyor, burada önemi bir gruptaki noktaların her birine ne kadar yakın olduğu diğer. Renkler zaten karşılaştırmalı bir analizdir ve hesaplanmayan, ancak tablodan alınan, zaten bilinen hedef değişkenlerden atanır. Nokta grupları da renklere göre doğru bir şekilde dağıtılmışsa, her şey yolunda demektir, yöntem çalışıyor gibi görünüyor, başka veriler üzerinde deneyebilirsiniz. Ancak makalede gerçekten sıfır tahmin var, sadece bilinen sınıflandırma ile kümeleme ve karşılaştırma var.

Son yazımdaki linkteki makaleyi kullanarak buna benzer bir grafik çizebilirsiniz. Sonuç olarak, şöyle bir grafik elde edeceksiniz: http://i0.wp.com/www.win-vector.com/dfiles/YAwarePCA_files/figure-html/scaledplotest-1.png Burada güzel kümeleme işe yaramadı. , diğer ilk veriler. Ancak kaynak veri olarak iris tablosunu kullanırsanız, verdiğiniz makaledeki grafiklere benzer bir şey elde edersiniz.

 
birleştirici :
PCA'nın başlangıçta orijinal serinin boyutsallığını azaltması amaçlandı. Hepsi bu. Tahmin edicilerin seçimi için kullanmak, hayali bir saçmalıktır.
SUBJECTLY linkini verdiğim yazının içeriğini çürütebilir misiniz? Şu anda Dr.Trader : bu materyali kullanmak için bir girişimde bulundu. Çok spesifik kullanın. Sonuç olumsuz. Belki de ayrıntılı olarak konuşun?
Principal Components Regression, Pt. 3: Picking the Number of Components | R-bloggers
Principal Components Regression, Pt. 3: Picking the Number of Components | R-bloggers
  • Nina Zumel
  • www.r-bloggers.com
In our previous note we demonstrated Y-Aware PCA and other y-aware approaches to dimensionality reduction in a predictive modeling context, specifically Principal Components Regression (PCR). For our examples, we selected the appropriate number of principal components by eye. In this note, we will look at ways to select the appropriate number...
 
mytarmailS :

R'ye entegre etmek daha iyi olabilir mi?

ve insanlar daha fazla çalışabilecek ve R ile mt5 köprüleri gibi görünüyor

Dr.Trader'ın libVMR'nin eski sürümünü R'ye taşımaya çalışırken zaten bozulduğuna ve büyük bir nükleer makine için yeterli belleğe ve küçük bir makine için tam performansa (döngü sayısı) sahip olmadığına bakılırsa 100 kat azaldı), o zaman aynı yere basmak isteyenlerin en fazla tırmık bulunması olası değil mi?


Bu nedenle, şimdilik bu tür görevleri R'ye taşıma konusunda kekelememek daha iyidir - bu dırdır çekmez.

 
Yuri Reshetov :

Dr.Trader'ın libVMR'nin eski sürümünü R'ye taşımaya çalışırken zaten bozulduğuna ve büyük bir nükleer makine için yeterli belleğe ve küçük bir makine için tam performansa (döngü sayısı) sahip olmadığına bakılırsa 100 kat azaldı), o zaman aynı yere basmak isteyenlerin en fazla tırmık bulunması olası değil mi?


Bu nedenle, şimdilik bu tür görevleri R'ye taşıma konusunda kekelememek daha iyidir - bu dırdır çekmez.

"R" için bir paket oluşturmak istedim.

%70'lik bir yerde "R", "yabancı" dillerde (C ++, C, fortran, java ...) yazılmış paketlerden oluşuyor, bu yüzden işlem hızı düşmemeli veya bir şey anlamadım

aynı ünlü "h2o" paketi tamamen Java ile yazılmıştır

 
mytarmailS :

"R" için bir paket oluşturmak istedim.

%70'lik bir yerde "R", "yabancı" dillerde (C ++, C, fortran, java ...) yazılmış paketlerden oluşuyor, bu yüzden işlem hızı düşmemeli veya bir şey anlamadım

aynı ünlü "h2o" paketi tamamen Java ile yazılmıştır

Bilmiyordum. Java'da paket oluşturmaya ilişkin talimatları aramaya çalışacağım.
 
Yuri Reshetov :


Daha spesifik olarak rapor dosyasında:

/**
* Numune dışı modelleme kalitesi:
*
* TruePositives: 182
* TrueNegatives: 181
* YanlışPozitifler: 1
* YanlışNegatifler: 1
* İstatistikli numunelerdeki toplam kalıp sayısı: 365
* Numune dışı toplam hata: 2
* Genelleme yeteneğinin duyarlılığı: %99.4535519125683
* Genelleme yeteneğinin özgüllüğü: %99.45054945054946
* Genelleme yeteneği: %98.90410136311776
* Reshetov'un Göstergesi: 8.852456238401455
*/

Üzgünüm, inanmıyorum, çok ciddi . Deneyi tekrar eder misin lütfen? Başka bir arşiv ekledim, farklı bir döneme ait veriler var. Model eğitimi, train.csv üzerinde, test_notarget.csv üzerinde test edilmelidir. test_notarget.csv dosyası için öngörülen sonuçlarla ilgileniyorum. Dürüst olmak gerekirse, test dosyası hedef değişkeni içermiyor. Ancak içeride test.csv testinin sonuçlarını içeren başka bir şifre korumalı arşiv var, daha sonra tahmin edilen sonuçlar karşılığında karşılaştırma için bir şifre vereceğim.

Dosyalar:
forex_test.zip  2699 kb
 
birleştirici :

Ne demek kullanılmadı? PCA doğrusal bir dönüşümdür. Çıkarılabilir boyutlar, diğerlerinin doğrusal bir kombinasyonu ile elde edilebilen boyutlardır. Bu, herhangi bir tahmin edicinin, temel bileşenlerin doğrusal bir kombinasyonu ile elde edilebileceği anlamına gelir. %95'lik bir aralık alırsanız, ölçek nedeniyle aptalca iyi bir tahminciyi kaybetme şansınız yüksektir, %100'den küçük bir aralık yalnızca kayıplı veri sıkıştırmasında kullanılır, aksi takdirde yalnızca sıfır olan bileşenler her zaman kesilir.

Kesin değildim, ama doğru anladınız. Sonuç olarak, %95 doğruluk için yeterli bileşenleri almak ve diğer her şeyi atmak. Örnek: Diyelim ki 10000 öngörücü var, bu, %100 garantili bir doğruluk için 10000 bileşenin oluşturulabileceği anlamına geliyor. Ardından 9900 bileşeni atarak 100'ü bırakabilirsiniz, ancak doğruluk %100'den %95'e yalnızca %5 düşer. Geriye kalan 100 bileşeni analiz etmek ve içinde kullanılmayan tahmin edicileri kaldırmak kalıyor. Burada %5'lik kayıplar korkunç değildir, çünkü hedef değişkeni tahmin etmek ve orijinal verileri kayıpsız yeniden oluşturmamak önemlidir.