Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 883

 
Maksim Dmitrievski :

sıradan orman ve rastgele ormanlar ve ağaçların ormanları aynı şeydir :) Orman, Ağaçlardan bir topluluktur

işaretler küçüldü, ya da ne oldu? seyrek işaretler, nadiren değişen ve / veya kategorik birler ve sıfır türleri olarak anlaşılır (peki, bu zaten yüksek bir anlayış düzeyidir)

Hayır, daraltılırlar, yani bir değişkenin birçok değeri vardır, ancak kombinasyon sayısı aynı kalır. Satın almalar için geçmişe benzer, ancak farklı bir görünümde bir dosya eklendi.

Dosyalar:
 
Sihirbaz_ :

Binarizasyon birçok yararlı bilgiyi öldürdü.

Bilginin nasıl sunulduğu ne fark eder, bundan değişmez... ???

 
Maksim Dmitrievski :

Şahsen, SanSanych hakkında hiçbir şeyim yok, o çok yetkin ve ölçülü bir insan, orada bilinmeyen bir şey yapıyor, muhtemelen R'ye ihtiyacı var.

Python benim için daha sezgisel, tam olsun diye üzerinde ne yapacağımı çözemesem de vay be ama sessizce çalışmaya devam ediyorum belki işine yarar :D

R, Python'a göre birçok avantajı olan harika bir ortamdır. Temel olarak, R bir modelleme ortamıdır. Python ile karşılaştırıldığında, R'deki sonuçlar şöyle olabilir: daha hızlı ve daha kolay alındı.

Python'un modüllerle birlikte kendi avantajları olduğu açıktır.

Bu arada, RF ile ilgili olarak, burada, NS'de olduğu gibi, tahmin edicilerin numaralandırılması-seçimi olmadan yapılabileceği ve doğrudan normalleştirilmiş VR'yi bu şekilde kullanabileceği görülüyor.

 
San Sanych Fomenko :

Normal orman mı yoksa rastgele orman mı yoksa her ikisi mi?

Çıngırakta, ağaç ve ada adlı her iki orman modelini de çalıştırın. Günlük sekmesini açın ve R kodunu, kullanılan paketlere referansları göreceksiniz ve bunların farklılıklarını anlayabilirsiniz.

Ağaçlar ve ormanlar arasındaki farkı anlıyorum (ya da sanırım öyle) ormanlar en iyi verilerde daha fazla belirsizlik olduğunda kullanılır, yani. ormanlar, rastgele (kısalma nedeniyle bağımsız) ağaçlarda meydana gelen oylama yoluyla karar verdiğinden daha az istikrarlı bir model, yoksa yanılıyor muyum? Ama “adad” seçeneğini göremiyorum, ekranda da yok, orada “Orman” var - öyle değil mi?

San Sanych Fomenko :

Rattle ve R'yi koydum (peki, her şey buggy ...),

Neyin buggy olduğunu anlamadım, son zamanlarda çok sayıda model sürdüm - her şey yolunda

Paketleri indirirken bazı anlaşılmaz şeyler vardı - indirmeye başladığını yazıyor, ancak indirmiyor, sonra kuruyor ve ihtiyaç duyduğu kütüphanelere sahip olmadığını yazıyor, sonra bir dosyadan veri okurken donuyor ... iş süreci görünmüyor - sonuna kadar ne kadar bekleneceği belli değil. Bu tür buglardan bahsediyorum. Görevi dağıtıcıdan kaldırdığımda ...

San Sanych Fomenko :


Bitirmemiş olduğunuz çıngırağın resmi. En azından, bitişik değerlendirme sekmesine gitmeniz ve sonuçları orada görmeniz gerekir.

Ancak en önemli şey, kaynak dosyayı farklı adlarla iki parçaya bölmektir (büyük olasılıkla bunun R'de yapılması gerekecektir).

İlk dosyada , TÜM altı model oluşturun ve değerlendirme testlerini görün, doğrulayın. Ardından ikinci dosyanın adını R Dataset alanına girin. Ve yine ondan not alıyorsun. Tüm puanlar eşleşmelidir!

Bu tahminler sizin için uyuşmuyorsa ve modellerin performansı ikinci dosyada temelde daha kötüyse, bu, modellerinizin gereğinden fazla takıldığı ve fazla uydurmanın gürültünün (hedef değişkenle ilgili olmayan) tahmin edicilerinden kaynaklandığı anlamına gelir. .


Bu gerçek an: ya belirli bir hedef değişkenle ilgili bir dizi tahminciniz var ya da yok. Ve bu üzücü durumun hiçbir modeli düzeltemez. Sonra bir çift "hedef öngörücü" seçiminde aptalca çalışma başlar, modeller hiç ilginç değildir, eğer bir çift bulursanız, modeller sadece R'de tohumlardır, günde bir düzine toplarsınız ve onlardan topluluklar yapacaksın.

Peki R ile nasıl dosya keserim, özel bir algoritma kullanmam gerekir mi? Sonunda ne olduğunu görmek ilginç.

 
San Sanych Fomenko :


2. RE EA'yı kullanırken sorun yok: her şey çalışıyor ve çok kararlı.

Ve MT5 için çalışıyor mu? Kod örneklerini nerede görebilirim? Kolaylık sağlamak için gösterge gibi bir şeyle ilgileniyorum, gösterge aracılığıyla bilgi göndermenin daha iyi olduğunu düşünüyorum, çünkü optimize edicide bir danışmana bağlandığında bunları karşılaştırmak kolay olacak ve ayrıca ormanın ne olduğu görsel olarak görünecek. herhangi bir zamanda piyasadaki durumu düşünür.

 
Yuri Asaulenko :

R, Python'a göre birçok avantajı olan harika bir ortamdır. Temel olarak, R bir modelleme ortamıdır. Python ile karşılaştırıldığında, R'deki sonuçlar şöyle olabilir: daha hızlı ve daha kolay alındı.

Python'un modüllerle birlikte kendi avantajları olduğu açıktır.

Bu arada, RF ile ilgili olarak, burada, NS'de olduğu gibi, tahmin edicilerin numaralandırılması-seçimi olmadan yapılabileceği ve doğrudan normalleştirilmiş VR'yi bu şekilde kullanabileceği görülüyor.

belki normalleşmedi bile

 
Maksim Dmitrievski :

belki normalleşmedi bile

Çalışmayacak. VR segmentinin belirli bir seviyeye, örneğin sıfıra net bir şekilde bağlanması olmalıdır.

 
Alexey Vyazmikin :


Ağaçlar ve ormanlar arasındaki farkı anlıyorum (ya da sanırım öyle) ormanlar en iyi verilerde daha fazla belirsizlik olduğunda kullanılır, yani. ormanlar, rastgele (kısalma nedeniyle bağımsız) ağaçlarda meydana gelen oylama yoluyla karar verdiğinden daha az istikrarlı bir model, yoksa yanılıyor muyum?

Bilmiyorum, sonuçlara göre karar veririm.

Ama “adad” seçeneğini göremiyorum, ekranda da yok, orada “Orman” var - öyle değil mi?

Sırayla:


ağaç

'rpart' paketi 'rpart' işlevini sağlar .


Artırmak

# Aşırı Güçlendirme

# `xgboost' paketi aşırı gradyan artırma algoritmasını uygular.


DVM

# Destek vektör makinesi.

# 'kernlab' paketi 'ksvm' işlevini sağlar.


Doğrusal

# Regresyon modeli

# Bir Regresyon modeli oluşturun.


sinir ağı

#Sinir ağı

# nnet paketini kullanarak bir sinir ağı modeli oluşturun.

kitaplık(nnet, sessizce=DOĞRU)


Bu arada, bu işi sizin için yaptım - tüm bunları Günlük'te kendiniz görebilirsiniz. Farklı bir çıngırak sürümünüz varsa, liste farklı olabilir.


Peki R ile nasıl dosya keserim, özel bir algoritma kullanmam gerekir mi? Sonunda ne olduğunu görmek ilginç.

Dizine göre, örneğin: [1:2000,], [2001:4000,]. İkinci dosyanın doğal zaman sırasını ihlal etmemesi önemlidir.

 
Alexey Vyazmikin :

Ve MT5 için çalışıyor mu? Kod örneklerini nerede görebilirim? Kolaylık sağlamak için gösterge gibi bir şeyle ilgileniyorum, gösterge aracılığıyla bilgi göndermenin daha iyi olduğunu düşünüyorum, çünkü optimize edicide bir danışmana bağlandığında bunları karşılaştırmak kolay olacak ve ayrıca ormanın ne olduğu görsel olarak görünecek. herhangi bir zamanda piyasadaki durumu düşünür.

Kütüphane siparişime göre değiştirildi - MT5'ten bir test cihazına ihtiyacım vardı. Bakmak için çok tembelim, belki temizledim diye düşündüm.

Vladimir Perervenko'nun makalelerine bakın

Ağlarla ilgileniyorsanız, o zaman bu alanda en son gözetleme var, R, danışmanlar, sitede bir kişi var
 
Alexey Vyazmikin :

Hayır, daraltılırlar, yani bir değişkenin birçok değeri vardır, ancak kombinasyon sayısı aynı kalır. Satın almalar için geçmişe benzer, ancak farklı bir görünümde bir dosya eklendi.

iyi, bu şekilde ve bu şekilde ve herkes için, kalbinizin istediği gibi deneyin :) asıl şey, teoriyi okumayı unutmamak, böylece açık bir saçmalık yapmamak ve bir tür paket kullanmak zor değil , birçoğu var ve hatta çevrimiçi - gerekli hiçbir şeyi yükleyemezsiniz. Şimdi veri biliminde bir patlama var, "o" her yerde

arşivleri analiz edecek zaman yokken, sürekli bir şeylere eziyet ediyorum