Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 584

 
Maksim Dmitrievski :

, Rusya Federasyonu'ndaki tahmin edicilerin öneminin nasıl belirlendiğini bile bilmiyordunuz, açıklama yapmadan tavlama vb.

Bankların özellikle Forex'te kullanım için nerede olduğunu kim söyledi? neden GBM değil de Ada? cevaplarınızda çok fazla bulanık soyutlama var. Gerçekte, daha fazla aşırı antrenmanla artış %5'ten fazla olmayacaktır.

Tartışmanın olduğu düzeyde

ALGLIB seviyesini belirliyorum - toplu çiftliğin seviyesi, Novgorod yakınlarındaki köyler. Bu seviyenin size uygun olduğunu defalarca yazdınız. Bunun görevleriniz için yeterli olması oldukça olasıdır, ancak neden rahatsız olasınız?


tavlama hakkında bazı saçmalıkları kayma ve

Gerçekten öylesin..

Tahmin edicilerin seçimi hakkındaysa, R'den hemen hemen her şeyi denedim ve bu tavlama en etkili olanı.


neden GBM değil de Ada? cevaplarınızda çok fazla bulanık soyutlama var. Gerçekte, daha fazla aşırı antrenmanla artış %5'ten fazla olmayacaktır.

Çünkü denedim ve sadece onları değil. Protokoller hala bende.

Evet, en iyi ada? Evet, ormana göre %5, en fazla %7. Ve bundan daha iyi bir şey bilmiyorum.

"Büyük aşırı uyum" nedir? Neden bahsediyorsun? Fazla takma hakkında, modellerinizin aşırı eğitilmediğini göstereceğiniz tek bir gönderi hatırlamıyorum!

Sadece fazla takmanın modele bağlı OLMADIĞINI, ancak şunlara bağlı olduğunu tekrarlayabilirim:

  • tahmin ediciler seti
  • modelleri iyileştirme yeteneği

 
San Sanych Fomenko :

Tartışmanın olduğu düzeyde

ALGLIB seviyesini belirliyorum - toplu çiftliğin seviyesi, Novgorod yakınlarındaki köyler. Bu seviyenin size uygun olduğunu defalarca yazdınız. Bunun görevleriniz için yeterli olması oldukça olasıdır, ancak neden rahatsız olasınız?


tavlama hakkında bazı saçmalıkları kayma ve

Gerçekten öylesin..

Tahmin edicilerin seçimi hakkındaysa, R'den hemen hemen her şeyi denedim ve bu tavlama en etkili olanı.


neden GBM değil de Ada? cevaplarınızda çok fazla bulanık soyutlama var. Gerçekte, daha fazla aşırı antrenmanla artış %5'ten fazla olmayacaktır.

Çünkü denedim ve sadece onları değil. Protokoller hala bende.

Evet, en iyi ada? Evet, ormana göre %5, en fazla %7. Ve bundan daha iyi bir şey bilmiyorum.

"Büyük aşırı uyum" nedir? Neden bahsediyorsun? Overfitting hakkında, modellerinizin aşırı eğitilmediğini göstereceğiniz tek bir gönderi hatırlamıyorum!

Sadece fazla takmanın modele bağlı OLMADIĞINI, ancak şunlara bağlı olduğunu tekrarlayabilirim:

  • tahmin ediciler seti
  • modelleri iyileştirme yeteneği


Peki, torbalama ve artırma arasındaki fark nedir? torbalamada, başlangıçta daha az uyum ve daha fazla şans unsuru vardır ve artırmada, ikincinin kalıntılarına göre ayarlanır, sonra 3.'ye vb. Ve sonuç tam bir fazlalıktır. Onlar. RF, en başından beri oldukça "kaba" hale getirilebilir, ancak yine de bunu iki kez kontrol etmek gerekli olacak, henüz zamanım olmadı

Tüm modellerim yeniden eğitildi :) Henüz bunların altında kalıcı bir desen bulamadım

Alglib'de neredeyse her şey var - evrişim, PCA, kümeleme, sinir ağları topluluğu, orman .. yani. klasiklere göre her şey var başka ne lazım

iyi bir açık kaynak kitaplığı olarak kabul edilir ve yazar bunun sinir ağları vb. için geçerli olmadığını yazar. büyük saygı duymakla birlikte, bunları olağan cassification/regresyon araçlarına atıfta bulunur ve diğer yöntemlerden ayırt etmez. Bu gerçekçi yaklaşımı seviyorum.

Tavlama ve benzerlerine gelince, bu da net değil - tüm modeller için bir tür evrensel yöntem mi yoksa ne? her model, bu belirli şeyin en iyi şekilde eğitilebileceği bir değerlendirme yöntemine sahip olmalıdır.

 
Maksim Dmitrievski :

Peki, torbalama ve artırma arasındaki fark nedir? torbalamada, başlangıçta daha az uyum ve daha fazla şans unsuru vardır ve artırmada, biri saniyenin kalıntılarına, ardından 3.'ye göre ayarlanır ve bu böyle devam eder. Ve sonuç tam bir fazlalıktır. Onlar. RF, en başından beri zaten oldukça "kaba" hale getirilebilir, ancak yine de bunu iki kez kontrol etmek gerekli olacak, henüz zamanım olmadı

Tüm modellerim yeniden eğitildi :) Altlarında henüz kalıcı bir desen bulamadım

Alglib'de neredeyse her şey var - evrişim, PCA, kümeleme, sinir ağları topluluğu, orman .. yani. klasiklere göre her şey var başka ne lazım

iyi bir açık kaynak kitaplığı olarak kabul edilir ve yazar bunun sinir ağları vb. için geçerli olmadığını yazar. büyük saygı duymakla birlikte, bunları olağan cassification/regresyon araçlarına atıfta bulunur ve diğer yöntemlerden ayırt etmez. Bu gerçekçi yaklaşımı seviyorum.

Tavlama ve benzerlerine gelince, bu da net değil - tüm modeller için bir tür evrensel yöntem mi yoksa ne? her model, bu belirli şeyin en iyi şekilde eğitilebileceği bir değerlendirme yöntemine sahip olmalıdır.

Birkaç kez, benim açımdan temel olan bazı şeyleri size açıklamaya çalıştım. Başarısızca.


Sadece tavsiyede bulunabilirim: şapkaya birkaç ay harcarsanız, farklı bir düşünme biçimine, niteliksel olarak farklı bir bakış açısına sahip olursunuz.

 
Maksim Dmitrievski :

Tavlama ve benzerlerine gelince, bu da net değil - tüm modeller için bir tür evrensel yöntem mi yoksa ne? her model, bu belirli şeyin en iyi şekilde eğitilebileceği bir değerlendirme yöntemine sahip olmalıdır.

Tavlama, Afrika'da da tavlama yapılıyor ve amaçlar/hedefler aşağı yukarı aynı. Modelin yerel minimumları değil, küresel olanları bulmasına izin verir.

ADA'yı bilmiyorum ama Ulusal Meclis için tavlama iyi sonuçlar veriyor. Normal olanı sevmedim çünkü. tavlama parametreleri önceden ayarlanmalıdır, bu nedenle, önceki eğitimin sonuçlarına göre parametreler değiştirilerek manuel olarak tavlanmalıdır.

Tehdit Bu arada, az çok karmaşık bir NS'yi tavlama olmadan gerçekten öğretemezsiniz.

 
Maksim Dmitrievski :

evet ama o kadar mükemmel ki bu aşamada uzatmayayım :) + yılda %20 den fazla kazanmanın imkansız olduğunu yazmış :)

Maxim, sigarayı bırak artık. Bağlamdan çıkar, diğer insanların sözlerini başkalarına atfet, vb.
+ Bazı yorumlar kaldırıldı. Ayrıca, çıngırak Fa (Fomenko)) kelimesinin yazarlığına atıfta bulunmamalısınız.

 
Sihirbaz_ :

Maxim, sigarayı bırak artık. Bağlamdan çıkar, diğer insanların sözlerini başkalarına atfet, vb.
+ Bazı yorumlar kaldırıldı. Ayrıca, çıngırak Fa (Fomenko)) kelimesinin yazarlığına atıfta bulunmamalısınız.


evet öyleyim, basitim :) akılda ne var dilde

ve sonra bir şey ortaya çıkıyor .. iş süreci kişisel değil

çıngırak hakkında, evet, yanılmışım) SanSanych bir şekilde .. saçmalık ya da onun gibi bir şey yazıyor gibiydi

 

Tembellikten ve daha fazla çalışma için herhangi bir fikrin yokluğundan, elbette kendim için yeni bir şey çalışmaya karar verdim - belki de zaten çok iyi. eski.) RF'yi tanıyarak başladım, RF sayesinde Python'a (Python) geldim. SciLab yazılımımla her iki yönde de (dedikleri gibi) uyumludur. Şimdi Python için paketlere genel bir bakışa geldim.

Toplamda 120.000'den fazla paket var.70 kadarı Makine Öğrenimi için, 70 kadarı derin olanlar dahil sinir ağları için.Çok daha fazlası olabilir - Rubricators aradım ve paketlerin bir kısmı başka bölümlerde olabilir.

Bu, diğer şirketler tarafından doğrudan dağıtılan paketleri içermez. Bu tür birçok paket var. bizi ilgilendiren konular da var - kendim gördüm, dahil. Savunma Bakanlığı, Rusya Federasyonu Ulusal Meclisi ve ADA'ya göre.

Diğer firmalar arasında makine öğrenimi, ağaçlar, NS ve ADA ile ilgili bir şeyler vardı.

Pek çok paket C/C++'da yapılmıştır, bu nedenle performans konusunda endişelenmenize gerek yoktur - Python yalnızca bir arabirimdir (komut dosyası dili). Tıpkı R gibi.

Genel olarak, ilginç bir zaman geçiriyorum.)

 
Maksim Dmitrievski :

neden GBM değil de Ada? cevaplarınızda çok fazla bulanık soyutlama var. Gerçekte, daha fazla aşırı antrenmanla artış %5'ten fazla olmayacaktır.

sınıflandırma yaparken, modeli "doğruluk" - doğru cevapların yüzdesi - kullanarak değerlendirmek çok yaygındır. Bence bu, ticaret modellerini değerlendirmek için en zayıf ve en uygunsuz tahminlerden biridir ve bundan kaçınılmalıdır. Ben burada konuyla ilgili bir sürü başka denemeyi önerdim - kappa, f-score, logloss.

Ada'da R (belki sadece R'de değil), eğitim sırasında sınıflandırma modelinin "doğruluktan" çok daha iyi olan, biraz farklı bir yerleşik değerlendirmesini kullanır.

 
Yuri Asaulenko :

Tembellikten ve daha fazla çalışma için herhangi bir fikrin yokluğundan, elbette kendim için yeni bir şey çalışmaya karar verdim - belki de zaten çok iyi. eski.) RF'yi tanıyarak başladım, RF sayesinde Python'a (Python) geldim. SciLab yazılımımla her iki yönde de (dedikleri gibi) uyumludur. Şimdi paketlere genel bakış geliyor.

Toplamda 120.000'den fazla paket var.70 kadarı Makine Öğrenimi için, 70 kadarı derin olanlar dahil sinir ağları için.Çok daha fazlası olabilir - Rubricators aradım ve paketlerin bir kısmı başka bölümlerde olabilir.

Bu, diğer şirketler tarafından doğrudan dağıtılan paketleri içermez. Bu tür birçok paket var. bizi ilgilendiren konular da var - kendim gördüm, dahil. Savunma Bakanlığı, Rusya Federasyonu Ulusal Meclisi ve ADA'ya göre.

Diğer firmalar arasında makine öğrenimi, ağaçlar, NS ve ADA ile ilgili bir şeyler vardı.

Pek çok paket C/C++'da yapılmıştır, bu nedenle performans konusunda endişelenmenize gerek yoktur - Python yalnızca bir arabirimdir (komut dosyası dili). Tıpkı R gibi.

Genel olarak, ilginç bir zaman geçiriyorum.)

şu şeye bir göz atın https://cloud.google.com/datalab/

İşin kötü yanı, AutoML hala orada gelişiyor - hizmet, belirli görevler için modeli kendi başına seçecek

Cloud Datalab - Interactive Data Insights Tool  |  Google Cloud Platform
Cloud Datalab - Interactive Data Insights Tool  |  Google Cloud Platform
  • cloud.google.com
Integrated Cloud Datalab simplifies data processing with Cloud BigQuery, Cloud Machine Learning Engine, Cloud Storage, and Stackdriver Monitoring. Authentication, cloud computation and source control are taken care of out-of-the-box. Multi-Language Support Cloud Datalab currently supports Python, SQL, and JavaScript (for BigQuery...
 
Dr. tüccar :

sınıflandırma yaparken, modeli "doğruluk" - doğru cevapların yüzdesi - kullanarak değerlendirmek çok yaygındır. Bence bu, ticaret modellerini değerlendirmek için en zayıf ve en uygunsuz tahminlerden biridir ve bundan kaçınılmalıdır. Ben burada konuyla ilgili bir sürü başka denemeyi önerdim - kappa, f-score, logloss.

Ada'da R (belki sadece R'de değil), eğitim sırasında sınıflandırma modelinin "doğruluktan" çok daha iyi olan, biraz farklı bir yerleşik değerlendirmesini kullanır.


alım satım yapanların bu şekilde değerlendirilmesi genellikle zordur, çünkü hem işlemin süresi vardır hem de zarar durdurma seviyeleri bir şekilde diğer her şeye eklenmeli ve ayrıca periyodik olarak kendini yeniden eğitmesini sağlamalıdır .. genel olarak, koruma :)