Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 210
Alım-satım fırsatlarını kaçırıyorsunuz:
- Ücretsiz alım-satım uygulamaları
- İşlem kopyalama için 8.000'den fazla sinyal
- Finansal piyasaları keşfetmek için ekonomik haberler
Kayıt
Giriş yap
Gizlilik ve Veri Koruma Politikasını ve MQL5.com Kullanım Şartlarını kabul edersiniz
Hesabınız yoksa, lütfen kaydolun
Alexey Burnakov :
Soruma R'de cevap almaya başladım.
Aynı kişiyle yazışmaların devamı...
No. The value of a density at any particular point is irrelevant.
Duncan Murdoch
Davalı hakkında: http://www.stats.uwo.ca/faculty/murdoch/other.shtml
Özellikle:
R çekirdek geliştirme grubunun bir üyesiyim; R projesiyle ilgili ayrıntılar için www.r-project.org adresine bakın . R'nin Windows sürümünü koruyorum ve R için DLL yazan kişiler için ipuçları içeren bir web sayfam var .
M-evet, sen daha iyi biliyorsun
Evet, daha görünür ve daha dürüst.
Ayrıca, forumda dışarıdan bir katılımcı olarak taslak çizme fırsatım da yok.
Matlab, Wolfram ve Mathematics "Kim olduğunu bilmiyorum" demekten utanmadılar bile.
Matematik (Tungsten) paketini içerecek istatistiksel paketlerin derecelendirmelerine bir bağlantı verin. Matlab öyleydi ama Bose'da dinlenmişti. Sitenizdeki blogumda alıntı yaptım ve forumda birçok kez yayınladım
Şu konularda sessizsiniz:
Matlab, diğer paketler gibi hiçbir yerde dinlenmedi. Evet, ücretli, ancak yüksek kaliteli. Evet, popülerlik düşecek, ancak doğruluk ve kalite hiçbir yere gitmeyecek.
Wolfram Alpha hakkında bilgi edinin ve web sitesini keşfedin - bu, analitik için çok az kişinin yapabileceği temel bir yatırımdır. Ve Wolfram Alpha'nın doğruluğu, hesaplamaların kalitesine çılgınca dikkatlerini kanıtlayan 30 karakterdir.
Ne yazık ki, sorunuzu tam olarak formüle etmediniz ve bitmemiş ve kısa kibar bir yanıt aldınız "önemli değil".
Sorunun kendisinde formüle ederek "böyle kararlaştırıldı / konvansiyonel" cevabını almak istediniz. Ancak Duncan ilk seferinde "doğru olan" yanıtından kaçtı ve ikinci kez tekrarladı.
R'de doğruluk onayı almadınız ve sonucun diğer paketlerde neden farklı olduğuna dair bir cevap almadınız. "Diğer paketlerde cevap neden farklı" sorusunun ayrıştırılması daha önemlidir ve konuyu ortaya çıkarabilir.
Konumumuz:
выражение для dgamma
(x)= 1/(s^a Gamma(a)) x^(a-1) e^-(x/s)
for x ≥ 0 , a > 0 and s > 0в точке 0 является неопределенным.
R, bu noktayı hesaplamaya dahil edebileceğinize inanır, ancak yine de dgamma(0,0.5,1) durumunda olduğu gibi sonsuzluğa eşit olsalar bile sınır değerleri alır.
Ancak olasılıklar sıfır noktasında sonsuzluk dikkate alınarak hesaplanırsa, dgamanın tüm integralleri resmen sonsuz hale gelir ve bu mantığa göre x'in tüm değerleri için pgamma sonsuza eşit olmalıdır.
Ancak bu, tüm değerlerin sonlu olduğu pgammanın sonuçlarıyla çelişir. Doğrudurlar, sanki x=0 noktasında yoğunluğun = 0 olduğu kabul edilir.@SanSanych Fomenko için - MQL4/MQL5, TIOBE dünya programlama dilleri sıralamasında 41. sıraya yükseldi: http://www.tiobe.com/tiobe-index/
R 19. sırada, Mathlab 15. sırada.
Bu, "otorite değil" ve "dünya lideri değil" hakkındaki ifadelerinizi ortadan kaldırmak içindir.
Tartışmaları kaybetmemek için, burada R'yi test etme sürecinde bulunan merkezi olmayan t dağılımının niceliklerinin hesaplanmasında bir hata var.
Örneğin:
Lenth [6] tarafından önerilen AS 243 algoritması, merkezi olmayan bir Öğrencinin R dilinde T dağılımının olasılığını hesaplamak için kullanılır. Bu yöntemin avantajı, tamamlanmamış beta fonksiyonlarına sahip sonsuz bir serinin terimlerinin hızlı özyinelemeli hesaplanmasıdır. Ancak [7]'de, serinin terimlerini toplarken doğruluğu tahmin etmedeki hata nedeniyle, bu algoritmanın özellikle merkezi olmayan büyük değerler için hatalara yol açtığı gösterilmiştir ([7]'deki Tablo 2) parametre deltası. Makalenin yazarları [7], merkezi olmayan bir T dağılımı olasılığının özyinelemeli hesaplanması için ayarlanmış bir algoritma önerdiler.
MQL5 istatistik kitaplığımızda, doğru sonuçlar veren makale [7]'den olasılıkları hesaplamak için doğru algoritmayı kullanıyoruz.
Ayrıca, R'de Gama, KiKare ve Merkezi Olmayan KiKare dağılımları için yoğunlukları x=0'da tanımlamanın yolu sonsuz ifadelere yol açar:
Böylece, R'deki x=0 noktasının yoğunluk ifadesinin alanına dahil olduğu ve çözümün sınır değerler olduğu ortaya çıkıyor.
Bu durumda x=0 noktasındaki limit değer sonsuzdur. Bu yaklaşımla 0'dan x>0'a integrasyon sonucunda x=0 noktasındaki diverjans nedeniyle olasılıklar sonsuz olmalıdır.
Ancak, olasılıkları hesaplamanın sonucu (örneğin, x=0.1 için) son ifadelerdir:
x=0 noktasında yoğunluğun sonsuz olduğu varsayılsa da R'deki olasılık hesabının sonuçları sonsuz değildir, Wolfram Alpha ( Gamma , ChiSquare , NoncentralChiSquare ) değerleri ile örtüşmektedir.
Wolfram Alpha (Mathematica) ve Matlab'da x=0'da sonsuza giden fonksiyonların integrali alınmasıyla ilgili sorunları önlemek için, x=0'daki yoğunluk tanım gereği 0'dır:
Pirinç. 3. Wolfram Alpha'da Gama dağılımının olasılık yoğunluğunun belirlenmesi
Pirinç. 4. Wolfram Alpha'da ChiSquare dağılımının olasılık yoğunluğunun belirlenmesi
Pirinç. 5. Wolfram Alpha'da Merkezi Olmayan KiKare Dağılımının Olasılık Yoğunluğunun Belirlenmesi
Bu yaklaşımı doğru buluyoruz. Olasılık yoğunluğunu belirlemede belirsizlikleri önler ve olasılık yoğunluğunu entegre ederken ortaya çıkabilecek sonsuz değerlerle sorunu çözer.
Bu nedenle, x=0 noktasında, bu dağılımların yoğunlukları tanım gereği sıfır olarak kabul edilir ve R'deki gibi sonsuz değil.
Hesaplamaların doğruluğundan emin olmak ve üçüncü taraf geliştiricilerin kitaplığın kalitesini kontrol etmelerini sağlamak için dağıtıma birkaç birim test komut dosyası ekledik.
Edebiyat
@SanSanych Fomenko için - MQL4/MQL5, TIOBE dünya programlama dilleri sıralamasında 41. sıraya yükseldi : http://www.tiobe.com/tiobe-index/
R 19. sırada , Mathlab 15. sırada.
Bu, "otorite değil" ve "dünya lideri değil" hakkındaki ifadelerinizi ortadan kaldırmak içindir.
İstatistikleri tartışıyorum. Ve istatistik paketleri için puanlarım.
Üstelik. Algoritmik dillerle ilgili bu istatistiklerde, alıntınızda R, MQL4/5'in üzerinde yer alıyor. Ancak benim için bu, örneğin MCL'den R'ye geçmek için bir neden DEĞİLDİR . R'nin algoritmik yeteneklerini hiç tartışmıyorum.
Benim için, R'nin ana gücü paketleridir, tüm bu sistemin desteğidir, onları geliştiren kişilerin otoritesidir, R üzerinde büyük bir mekân, sonuçta R'ye bağlı çok sayıda yayın.
Ayrıca 15 yılını akademik kurullarda geçirmiş bir kişi olarak. "Analog R" yazıyorlarsa, bu istisnasız bir analogdur. Ve başka türlü olmaz. Aksi takdirde, bu bir R analogu DEĞİLDİR, çok daha doğru olabilir, ancak bir analog değil
İstatistikleri tartışıyorum. Ve istatistik paketleri için puanlarım.
Üstelik. Algoritmik dillerle ilgili bu istatistiklerde, alıntınızda R, MQL4/5'in üzerinde yer alıyor. Ancak benim için bu, örneğin MCL'den R'ye geçmek için bir neden DEĞİLDİR . R'nin algoritmik yeteneklerini hiç tartışmıyorum .
Ve R'de belirli bir hatayı tartışıyoruz.
Bu nedenle, matematikten ve incelenen belirli vakadan haberdar olmadığınız için derecelendirmelerinizle uğraşmayın.
San Sanych Fomenko :
...
Benim için, R'nin ana gücü paketleridir, tüm bu sistemin desteğidir, onları geliştiren kişilerin otoritesidir, R üzerinde büyük bir mekân, sonuçta R'ye bağlı çok sayıda yayın.
...
Bir çeşit çürüme bu R, kare tekerlekli bir bisiklet. Bazı paketleri hakkında, temelin kendisi, yani. R eğrisinde YaP ve bir "piç dosyası" ile ciddi bir iyileştirme mi gerekiyor? Bunca yıldır R'deki temel fonksiyonların doğruluğunu kontrol etme zahmetine bile girmeyenler için ne gibi bir otorite olabilir ki? R'nin zayıf noktasında hangi "güç" olabilir - onun üzerinden yapılan hesaplamaların yanlışlığı?
MetaQuotes'un bazı kullanıcıların gözlerini gerçekler ve açık kaynak testleri üzerinde bu R'nin gerçekte neyi temsil ettiğine açması iyi oldu, böylece herkes iki kez kontrol edebilir ve kendi başına emin olabilir ve asılsız değil. Elbette herkes açılmadı çünkü. Yıkıcı tarikat R'den bireysel dini fanatikler, sunulan testlere atıfta bulunmak ve bunları kendi başlarına yeniden kontrol etmek ve fanatik bir kar fırtınası sürmek yerine, çarpık dil ve paketlerindeki hesaplamaların "yanılmazlığına" körü körüne inanmaya devam edecekler. "genel olarak kabul edilen standart" olarak R'nin eğriliği.
Sonuç daha doğru olacağından ve bunu eğri ve eğik R üzerinden yapmaya çalışacağından, ticaret stratejileri oluşturmak için MQL işlevini kullanmanın daha iyi olduğu artık oldukça açıktır.
Yapıcı bir yaklaşım, testler ve kaynakları ile " çıplak kral - R " yi ortaya çıkarmak için MetaQuotes geliştiricilerine özellikle teşekkür edilmelidir!
0 genişliğiyle ilgilenmiyoruz, böyle bir integralin nasıl davrandığını anlamamız gerekiyor, yani. cdf(x). Ne tür bir işlev elde edilir? pgamma(x) ile eşleşecek mi?
> dgamma_05_1 <- function(x)dgamma(x, 0.5 , 1 ) #всего 1 параметр, чтоб удобней работать
> pgamma_05_1 <- function(x)pgamma(x, 0.5 , 1 ) #всего 1 параметр, чтоб удобней работать
> pgamma_05_1_integralform <- function(x)integrate(dgamma_05_1, 0 , x)$value #вычисление pgamma путём интегрирования dgamma>
> pgamma_05_1( 0.00001 )
[ 1 ] 0.003568236
> pgamma_05_1_integralform( 0.00001 )
[ 1 ] 0.003568236
> pgamma_05_1( 0.00001 ) - pgamma_05_1_integralform( 0.00001 )
[ 1 ] - 6.938894 e- 18
>
> pgamma_05_1( 0.0001 )
[ 1 ] 0.01128342
> pgamma_05_1_integralform( 0.0001 )
[ 1 ] 0.01128342
> pgamma_05_1( 0.0001 ) - pgamma_05_1_integralform( 0.0001 )
[ 1 ] 3.295975 e- 17
>
> pgamma_05_1( 0.001 )
[ 1 ] 0.03567059
> pgamma_05_1_integralform( 0.001 )
[ 1 ] 0.03567059
> pgamma_05_1( 0.001 ) - pgamma_05_1_integralform( 0.001 )
[ 1 ] 1.595946 e- 16
>
> pgamma_05_1( 0.01 )
[ 1 ] 0.1124629
> pgamma_05_1_integralform( 0.01 )
[ 1 ] 0.1124629
> pgamma_05_1( 0.01 ) - pgamma_05_1_integralform( 0.01 )
[ 1 ] 1.096345 e- 15
>
> pgamma_05_1( 0.1 )
[ 1 ] 0.3452792
> pgamma_05_1_integralform( 0.1 )
[ 1 ] 0.3452792
> pgamma_05_1( 0.1 ) - pgamma_05_1_integralform( 0.1 )
[ 1 ] 1.126876 e- 13
>
> pgamma_05_1( 1 )
[ 1 ] 0.8427008
> pgamma_05_1_integralform( 1 )
[ 1 ] 0.8427008
> pgamma_05_1( 1 ) - pgamma_05_1_integralform( 1 )
[ 1 ] 3.460265 e- 11
pgamma() standart yolla bulunur ve integral(dgamma()) ile neredeyse çakışır, hatanın x=1'de sadece 3.460265e-11'e ulaştığı görülebilir. Ancak böyle bir hata oldukça olasıdır, buradaki entegrasyon, herhangi bir ön analiz ve basitleştirme olmadan küçük adımlarla toplamdan geçer. pgamma() işlevinin kendisi C++ ile yazılmıştır ve entegre() ile entegre etmekten daha doğru olmalıdır. Bu nedenle, tam olarak pgamma(x,0.5,1) kullanmaya ve integral(dgamma(x,0.5,1),0,x) kullanmaya değer.
Bazı paketleri hakkında ne söyleyebiliriz, çok temel, yani. R eğrisinde YaP ve bir "piç dosyası" ile ciddi bir iyileştirme mi gerekiyor?
Yap R - çarpık ve yavaş.
Tartışmayı hem temel pakette hem de ek paketlerde bulunan tamamen klasik istatistiklere ayırırsak, burada bir sorun olmadığını düşünüyorum. Milyonlarca istatistiksel test yaparsanız, diğer dillerin (MQL dahil) performansı bir artı olacaktır.
R'nin genel olarak nasıl programlandığı hakkında konuşursak, o zaman sana söyleyeceğim Yuri, insanlar yine hızlı veri işleme için paketleri kullanıyorlar (dplyr, data.table ve grafikler için ggplot2). R'nin kendisi yine eski, büyük veriler için tasarlanmamış bir betik dilidir.
Ancak tüm bunlara rağmen, sizin tarafınızdaki kir akışı hala haksız yere yüksek. Burada istatistikleri tartıştık ve kod yeniden düzenleme ve diğer teknik şeyleri bile tartışmadık. Konuşma matematiksel kavramlar hakkındaydı.