Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 838

 
Michael Marchukajtes :

Genel olarak, tahmin edicilerin seçimi için bu özel paketi kullanıyorum. Dezavantajların, özellikle de hedefle ilgili olarak birkaç tahmin edicinin etkileşiminin olmamasının olduğu açıktır. Ancak genel olarak, şimdiye kadar optimizasyonum için yeterli ... yani, veri ön işleme için başka paketler varsa, onları memnuniyetle değerlendiririm ...

Tecrübelerime dayanarak, tahmin edicilerin öneminin çeşitli yönleriyle konuya en eksiksiz ve profesyonel yaklaşım olarak RandomUniformForest paketini önerebilirim. Örnekler burada görülebilir

İyi şanlar

Not: Bu arada, modeli yeni veriler üzerinde yeniden eğitmenize izin veren birkaç kişiden biri. Bu çok zaman kazandırır.

 
Dr. tüccar :

Her hafta yeni tur. Bir hafta içinde modeli eğitmeniz ve onlara tahmin göndermeniz gerekiyor. Ancak modelinizin ileriye dönük tahminini ancak üç hafta sonra bileceksiniz, bu 3 hafta için tahminleriniz gerçek tahminlerle karşılaştırılacak.

bence kendilerini en az %90 bırakıyorlar

"En az %90 tuttuklarını düşünüyorum" ne anlama geliyor? Gönderdikleri bu tahminleri takas ettiklerini düşünüyor musunuz? Genel olarak, tahmini hesaplamak için işaretleri önceden nasıl bilebilirsiniz? Enterpolasyon ya da ne? Belgelerinde bunun madencilikte olduğu gibi sadece bir "iş kanıtı" olduğu ve kazananın da rastgele seçildiği, muhtemelen sonuçların yarısı neredeyse aynı olduğu, ardından rastgele bir filtre atıldığı yazıyor. ek olarak, evet, bu kumarhane utanç verici, ancak veri kümesi büyük olasılıkla saf sentetikler, küçük bir sinyal katkılı gürültü, hiç pazar yok. Hedge fonları ve benzeri şeylerle ilgili tüm bu saçmalıklar. tamamen paraları için popülerlik kazanmak için.

 
Maksim Dmitrievski :

Peki Mikhail, öfkenden uzaklaştın mı, yakında aracını mantıklı ve fanatizmden uzak değerlendirmeye başlayacak mısın? :)

Hiç öfkem olmadı. Sadece son zamanlardan beri hiçbir şekilde değişmeyen soğuk bir hesaplama. Hala işe yarayan yaklaşımın teorisinden bahsetmiyorum bile. Bir an için..

 
govich :

Spesifik olarak, kendileri için ne kadar bıraktıklarına dair - resmi olarak yazılmamıştır. Her türlü finans dergisi 2016'da 1.5 milyon kar hakkında yazdı ve bunun ne kadarını katılımcılara ödediklerini karşılaştırırsanız, biraz ortaya çıkıyor.

> Gönderdikleri bu tahminleri takas ettiklerini düşünüyor musunuz?
Evet, tüm strateji bu. Örneğin, bir dizi özellik oluşturacağım, bir eğitim tablosu oluşturacağım, buraya foruma göndereceğim, 10 kişi tahminlerini verecek, onlarla ticaret yapacağım - her şey basit.
Uzun bir süre kendi kriptoları yoktu, Bitcoin ile ödeme yaptılar. Bir yıl boyunca her hafta birkaç bin dolar bitcoin alıp ödediler. Sonra bitcoin'lerle uğraşmamak için kriptolarını serbest bıraktılar.

> Genel olarak, tahmini hesaplamak için işaretleri önceden nasıl bilebilirsiniz? Enterpolasyon ya da ne?
Enterpolasyon, en yakın komşulara göre tahmin, kümeleme, birçok seçenek var, belirli bir cevap vermeyecekler, sadece tahmin edebilirsiniz.

 
Vladimir Perervenko :

Tecrübelerime dayanarak, tahmin edicilerin öneminin çeşitli yönleriyle konuya en kapsamlı ve profesyonel yaklaşım olarak RandomUniformForest paketini önerebilirim. Örnekler burada görülebilir

İyi şanlar

Not: Bu arada, modeli yeni veriler üzerinde yeniden eğitmenize izin veren birkaç kişiden biri. Bu çok zaman kazandırır.

denedim. Sonuç alınamadı...

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300,threads = 2, nodesize = 2)

5 dakika sonra veriyor.
OOB.votes hatası - Y : benzer olmayan çok boyutlu matrisler

Sağlanan matrislerin yapısı:

>str(x1)
sayı [1:20000, 1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
sayı [1:20000, 1] 0 0 0 0 0 0 1 1 1 1 ...
>str(x2)
sayı [1:10000, 1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
sayı [1:10000, 1] 0 0 1 1 0 0 0 0 0 0 ...

Açık değil - neye ihtiyaç duyduğunun benzerliği.
xtest = x2, ytest = y2 olmadan denendi - aynı sonuç.
Bir sonraki pakete geçiyorum.

 
elibrarius :

denedim. Sonuç alınamadı...

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300,threads = 2, nodesize = 2)

5 dakika sonra veriyor.
OOB.votes hatası - Y : benzer olmayan çok boyutlu matrisler

Sağlanan matrislerin yapısı:

>str(x1)
sayı [1:20000, 1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
sayı [1:20000, 1] 0 0 0 0 0 0 1 1 1 1 ...
>str(x2)
sayı [1:10000, 1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
sayı [1:10000, 1] 0 0 1 1 0 0 0 0 0 0 ...

Açık değil - neye ihtiyaç duyduğunun benzerliği.
xtest = x2, ytest = y2 olmadan denendi - aynı sonuç.
Bir sonraki pakete geçiyorum.

Neden işe yaramadığı belli değil, her şey benim için çalışıyor.

Caret'te iyi sonuçlar aldım. Tahmin edicileri seçmenin üç işlevi vardır, bunların verimliliği farklıdır, ancak bilgi işlem kaynaklarını farklı şekillerde de tüketirler.


Son derece ilginç bir paket daha var: CORElearn. Bu pakette tahmin edicileri seçmek için iki fonksiyon var, bunları çiftler halinde kullandım, tahmin edicilerimde çok iyi sonuç veriyorlar. Sadece bir gözlemi (sırayı) değil, aynı zamanda en yakın satırları da değerlendiren Rölyef grubu, aralarında özel bir yer olan kesinlikle harika bir seçim değerlendirme yöntemleri seti ile özellikle merak uyandırıyor.


İyi şanlar.


not.

Tahmin edicilerin seçiminin en azından aşağıdaki adımlardan oluşması gerektiğini unutmayın:

  • ilkeye göre seçim: hedefle ilgili öngörücüler. Sihirbaz burada bu aşamanın teorisine bir bağlantı verdi. İki yöntem ayırt edilebilir: istatistik ve entropi. Her ikisinin de kodu vardı burada
  • gelecek modelle ilgili OLMAYAN listelenen paketlere göre seçim
  • modelin sonuçları üzerinde yaptığımız seçim. Lineer modellerde çok etkilidir. Örneğin, glm ile yalnızca önemli tahmin edicileri seçiyoruz ve ardından yalnızca onları ağa dahil ediyoruz. Sonuç sizi şaşırtabilir.


Tahminciler, seçimden önce merkezleme gibi ön işleme gerektirebilir. Vladimir Perervenko'nun makalesinde iyi tanımlanmış

 
elibrarius :

denedim. Sonuç alınamadı...

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300,threads = 2, nodesize = 2)

5 dakika sonra veriyor.
OOB.votes hatası - Y : benzer olmayan çok boyutlu matrisler

Sağlanan matrislerin yapısı:

>str(x1)
sayı [1:20000, 1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
sayı [1:20000, 1] 0 0 0 0 0 0 1 1 1 1 ...
>str(x2)
sayı [1:10000, 1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
sayı [1:10000, 1] 0 0 1 1 0 0 0 0 0 0 ...

Açık değil - neye ihtiyaç duyduğunun benzerliği.
xtest = x2, ytest = y2 olmadan denendi - aynı sonuç.
Bir sonraki pakete geçiyorum.

orjinallerini atabilirmisin

Hedefiniz bir faktör olmadığı için bunun bir gerileme olmadığını belirtmek gerekir. Seçenek Ekle

ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 3, ntree = 300,threads = 2, nodesize = 2, regresyon = YANLIŞ)

veya

ruf <- randomUniformForest( X = x1, Y = y1 %>% as.faktör, xtest = x2, ytest = y2 %>% as.faktör, mtry = 3,

ntree = 300, iş parçacığı = 2, düğüm boyutu = 2)

İyi şanlar

 
San Sanych Fomenko :

Son derece ilginç bir paket daha var: CORElearn. Bu pakette tahmin edicileri seçmek için iki fonksiyon var, bunları çiftler halinde kullandım, tahmin edicilerimde çok iyi sonuç veriyorlar. Sadece bir gözlemi (sırayı) değil, aynı zamanda en yakın satırları da değerlendiren Rölyef grubu, aralarında özel bir yer olan kesinlikle harika bir seçim değerlendirme yöntemleri seti ile özellikle merak uyandırıyor.


Kabul ediyorum. Prensip olarak, bu muhtemelen RF için en ciddi pakettir. Geliştiriciye dikkat etmeniz gerekiyor Yazar: Marko Robnik-Sikonja .

İyi şanlar

 
Vladimir Perervenko :

orjinallerini atabilirmisin

Hedefiniz bir faktör olmadığı için bunun bir gerileme olmadığını belirtmek gerekir. Seçenek Ekle

ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 3, ntree = 300,threads = 2, nodesize = 2, regresyon = YANLIŞ)

veya

ruf <- randomUniformForest( X = x1, Y = y1 %>% as.faktör, xtest = x2, ytest = y2 %>% as.faktör, mtry = 3,

ntree = 300, iş parçacığı = 2, düğüm boyutu = 2)

İyi şanlar

Bu yardımcı oldu. Teşekkür ederim!
 
Dr. tüccar :

Spesifik olarak, kendilerine ne kadar bıraktıklarına dair resmi olarak yazılı değil. Her türlü finans dergisi 2016'da 1.5 milyon kar hakkında yazdı ve bunun ne kadarını katılımcılara ödediklerini karşılaştırırsanız, biraz ortaya çıkıyor.

> Gönderdikleri bu tahminleri takas ettiklerini düşünüyor musunuz?
Evet, tüm strateji bu. Örneğin, bir dizi özellik oluşturacağım, bir eğitim tablosu oluşturacağım, buraya foruma göndereceğim, 10 kişi tahminlerini verecek, onlarla ticaret yapacağım - her şey basit.
Uzun bir süre kendi kriptoları yoktu, Bitcoin ile ödeme yaptılar. Bir yıl boyunca her hafta birkaç bin dolar bitcoin alıp ödediler. Sonra bitcoin'lerle uğraşmamak için kriptolarını serbest bıraktılar.

> Genel olarak, tahmini hesaplamak için işaretleri önceden nasıl bilebilirsiniz? Enterpolasyon ya da ne?
Enterpolasyon, en yakın komşulara göre tahmin, kümeleme, birçok seçenek var, belirli bir cevap vermeyecekler, sadece tahmin edebilirsiniz.

1.5 milyon dolar bir kuruş, kantorun tamamı için, kripto paralarını borsaya yerleştirdikleri anda, bazı katılımcıların (en üstte olan) her birinin milyonlarca dolar olmasa da yüzlerce dolar çekildiğini duydum. , topun hızla bitmesine ve NMR'nin çökmesine ve madeni paraların daha az büyüklükte siparişler vermeye başlamasına rağmen, bir kez birinciliği ve jeton başına 200$ = 800.000k$'da 4000 NMR'yi almak mümkündü, ancak muhtemelen birileri hoş bir şekilde şanslıydı.

IMHO, bence başlangıçta bir şekilde gönderdikleri tahminleri takas etmeye çalışmış olabilirler, o zaman az çok tahmin edilebilir yerler vardı, muhtemelen az önce ödedikleri paranın %90'ı, ilk yüzün çoğu büyük olasılıkla onlarındı. beyler para kimin umrunda olmasın diye. Ama şimdi çok fazla rastgeleliğe sahip saf bir iş kanıtı kumarhanesi, en azından söylenti bu.


Not: Paralarından önce, haftada 6 bin dolar ödüyorlardı (ama kime?), yani yılda 288 bin dolar, sadece aynı "dürüst" çıkıyor ~ 1.5 milyon kârdan nicellere kadar %20))) Ama bu sayıların üretilebileceği açık.