Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2745

 
JeeyCi #:


ve regresyon katsayıları için istatistiksel testler ne içindir? veya ortalama ve varyans eşitliği hakkındaki hipotezleri test etmek için mi? (PCA hala 1. PC'nin kabul edilebilir varyans payını açıkladığını gösteriyorsa [artık varyans çok küçüktür] - o zaman kabul edin ve regresyon katsayılarının anlamlılığını doğrulamak için kontrol edin)...).

İdeal olarak -- %100 olasılığa sahip olmak için korelasyon ilişkilerinden ziyade fonksiyonel ilişkileri kullanmamız gerektiği açıktır -- ancak stokastik bir süreç üzerinde çalışıyorsak sonuçlar sadece olasılıksal olacaktır ve sadece çok sayıda test verisi üzerinde ve sadece piyasada yeni bir Sürücü ortaya çıkana kadar doğrulanabilir olacaktır.... [bu arada, burada sadece sağlam analiz değil, olgusal/mantıksal farkındalık da çok önemlidir].

Geçmiş verilere dayandığımız sürece geçmişe uyum her zaman vardır..... ancak varyansı her zaman F-istatistikleri ile karşılaştırabiliriz -- eğer varyans azalması kalan açıklanamayan varyanstan çok daha büyükse, o zaman yeni bir regresyon tanımlanır. (dr SLOPE ile)... ve sadece gelecekteki bir ana kadar ve sadece büyük sayılar üzerinde çalışır... ya da aktörün durumunu değiştirir (DL kullanılıyorsa)... ama sürücü beklemekten daha iyisini bilir... ancak sürücüyü bilmek, onaylamak için mevcut örnek toplanana kadar beklemekten daha iyidir.

Özellik Mühendisliği mantıklı yaparsanız, doğru fark ettiniz - "teorik olarak" mantıklı (herhangi bir stat işleminin altında dünyevi fiziksel-mantıksal yasalar ve insan bilgisi vardır, modeller havadan düşmez) -- [ancak birinin cehaleti olabilir] -- o zaman modelleme sürecinde FS ne modelleyiciyi ne de geliştiriciyi çok fazla rahatsız etmeyecektir.... ve tarih olmadan hiçbir yere gidemezsiniz, neyin ne zaman itici güç olduğunu ve neyin olmadığını bilmek için - yüksek matematikte çok fazla zekaya ihtiyacınız yoktur, sadece para ve emtia piyasası, özel ve devlet sektörlerinin yasalarını anlamanız gerekir, aksi takdirde uygulamalı yüksek matematik aygıtını sadece "sonradan" dünyayı değiştiren haberlerin bir kez duyulduğunu öğrenmek için kullanacağız.... Sadece, piyasa tepkisi de dahil olmak üzere, piyasa tepkisi genellikle gecikmeli olur.

p.s..

kelimelerin ve harflerin bilinmediği, bilinmeyen bir konuyu harflere takılmamak için okumayın - FS'niz için bir VM makinesi arayın.... o zaman sonuçlarınızın istatistiksel geçerliliğini de kanıtlarsanız, sadece % isabet oranını değil (bu arada her zaman tarafsız değil)), o zaman konuşmalar farklı olacaktır.... Ama şimdilik, evet, herkesin kendi terminolojisi var....

Her şey insanların kooperatif kurmak istemesiyle başladı)) sıralamaya başladı, herkesin diğerlerinin yaptığı her şeyi reddettiği ortaya çıktı. Ayrıca yeni tanımlar icat ettiler. Sonunda kimse bir şey anlamadı. Genelde Sanych'in yaklaşımını severim, bu yüzden ayrıntı istedim. Tanımlamalarda da, korelasyon olmasa bile bir ilişki ve bağlantı olması bir sorun.

Belli ki bilgi birikimine değer veriyor ve ayrıntıları açıklamıyor.
 
Maxim Dmitrievsky #:
Her şey insanların kooperatif istemesiyle başladı)) araştırmaya başladı, herkesin diğerlerinin yaptığı her şeyi inkar ettiğini öğrendi. Ayrıca yeni tanımlar uyduruyorlar. Sonunda kimse bir şey anlamadı. Genelde Sanych'in yaklaşımını severim, bu yüzden ayrıntıları sordum. Ve tanımlamalarla da, korelasyon değilse, ilişki ve bağlantı nedir.

Belli ki bilgi birikimine değer veriyor ve ayrıntıları açıklamıyor.

Benim görüşüme göre iki tür korelasyon vardır.

Bunlardan ilki nedenseldir ve bazı hesaplamalarla değil, araştırma nesnesi hakkında belirli bir konu alanındaki bilgilerden elde edilen a priori bilgilerle belirlenir.

İkinci tür, nesnenin davranışını gözlemleyerek elde edilen bazı verilerden a posteriori olarak hesaplanabilen olasılıksal bağımlılıktır. İkinci tür korelasyon, deterministik bağımlılık (uç bir durum olarak) ve kopulalar ve diğer yöntemlerle tanımlananlar da dahil olmak üzere benzerlerini içerir. Bu türün incelenmesinin temeli, tahmin ediciler ve hedef için ortak bir dağılım olduğu varsayımıdır.

 
Aleksey Nikolayev #:

Bana göre iki tür iletişim vardır.

Bunlardan ilki nedenseldir ve bazı hesaplamalardan ziyade, söz konusu konu alanındaki bilgiden elde edilen araştırma nesnesi hakkındaki a priori bilgilerle belirlenir.

İkinci tür, nesnenin davranışını gözlemleyerek elde edilen bazı verilerden a posteriori olarak hesaplanabilen olasılıksal bağımlılıktır. İkinci tür korelasyon, deterministik bağımlılık (uç bir durum olarak) ve kopulalar ve diğer yöntemlerle tanımlananlar da dahil olmak üzere benzerlerini içerir. Bu türün incelenmesinin temeli, tahmin ediciler ve hedef için ortak bir dağılım olduğu varsayımıdır.

Doğru. A priori varsayımların eksikliği nedeniyle ikinci tür kullanılır. Sanych'in bunu nasıl gördüğünü merak ediyorum. Örneğin, hedefler nasıl oluşturulursa oluşturulsun, herhangi bir özelliğe basitçe uydurulabilir ve bunun tersi de geçerlidir.

Benim yaklaşımım bu tür manipülasyonlar için tamamen özelleştirilmiştir, belki bir şeyler geliştirilebilir.
 
mytarmailS #:

Hedefi dikkate alan bir PCA vardır, hedefi karakterize eden bileşenleri vurgulayacaktır,

Bunu asla yapmaz. Hedefle olan ilişkiyi hesaba katmaz. - Sadece özellik uzayında maksimum varyansı açıklayan ortogonal bir projeksiyon oluşturacaktır..... (Rotasyonun manuel olarak mı yapılması gerektiğinden emin değilim [sanırım Statistika paketinde bununla ilgili bir şey vardı - bir düğme] veya otomatik olarak çözüp çözmeyeceğinden emin değilim - diğer kütüphaneler zaten yerleşik rotasyona sahip olabilir).


mytarmailS #:

ancak üzücü olan şey hedefin öznel bir değişken olması ve iz biter bitmez "dalgalanacak" olmasıdır.... ve bunun bir öğretmenle normal öğrenmeden farkı nedir?

Evet, ne yazık ki bu yöntemin amacına ilişkin kendi yorumlarınız ve onu kullanma yollarınız ve amaçlarınız var.... Bu görüşlerle size nasıl yardımcı olabilirim bilmiyorum... - bu yüzden bana daha fazla sormanıza da gerek yok.
 
JeeyCi #:
1) bunu asla yapmayacaktır - hedefe olan bağlantıları hesaba katmaz!!!! - sadece özellik uzayında maksimum varyansı açıklayan bir projeksiyon oluşturacaktır.... (Rotasyonun manuel olarak mı yapılması gerektiğinden emin değilim [sanırım Statistika paketinde bununla ilgili bir şey vardı - bir düğme] veya otomatik olarak çözüp çözmeyeceğinden emin değilim - diğer kütüphanelerde zaten yerleşik rotasyon olabilir).


2) evet, üzücü - bu yöntemin amacına ilişkin kendi yorumlarınız ve onu kullanma yollarınız ve amaçlarınız var... Bu konuda bu tür görüşlerin size nasıl yardımcı olabileceğini bilmiyorum..... - bu yüzden bana daha fazla sormanıza da gerek yok.

1) Hedefi dikkate alan rsa' lar olduğunu söylüyorum.

2) Ben bir şey sormadım, iddia ettim.

 

mytarmailS #:

1)Hedeflemeyi dikkate alan rsa 'lar olduğunu söylüyorum.

2) Bir şey sormuyordum, iddia ediyordum.

bunlar zaten PC'leri hedefe yapay olarak bağlayan algoritmalardır - farklı algoritmalar (yazılım bazen farklı kütüphanelerde farklı şekilde uygulanır)... PLS de kullanabilirsiniz... hedefi özelliklere nasıl bağladığınız sizi ilgilendirir, PCA = "öğretmenle" (öğretmen ayrı olarak bağlanır - aslında - istediğiniz şekilde) - yine konudan uzaklaşıyoruz ve "zevk ve renk..." (kütüphaneler) konusuna giriyoruz. (kütüphaneler).

Kütüphanenizin rotasyon yapıp yapmadığını bildiğinizden veya bunu kendiniz kodlamanız gerekip gerekmediğinden bile emin değilim... bu nedenle doğrulanmamış ve eksik/yanlış ifadeler burada kimseyi ilgilendirmez, özellikle de olguların/nesnelerin anlamlarını ve özünü değiştirdiklerinde, ardından kelimeleri anlamadığınızı haykırdığınızda... Görünüşe göre kendi kelimelerinizi bile doğru anlamıyorsunuz

 
JeeyCi #:

Kütüphanenizin rotasyon yapıp yapmadığını bilip bilmediğinizden veya bunu kendiniz kodlamanız gerekip gerekmediğinden bile emin değilim....

kendi̇ni̇zi̇ yargilamayin

(Sadece rotasyonun manuel olarak mı yapılması gerektiğinden emin değilim [sanırım Statistika paketinde bununla ilgili bir şey vardı - bir düğme] veya otomatik olarak çözüp çözmeyeceğinden emin değilim - diğerinde.

JeeyCi #:

bu yüzden doğrulanmamış ve eksik/yanlış ifadeler burada kimseyi ilgilendirmiyor

Ve emin değilseniz, o zaman kontrol edilen hiçbir şeyi iddia etmeye hakkınız yoktur . ne değil, kim ilgileniyor, kim değil.... tabii ki kafanız düzenliyse


ps Ve matriste rotasyon olup olmadığını anlamak varsa kontrol etmek kolaydır, ancak görünüşe göre bununla ilgili bir sorun var.....

 

Bu yüzden kendinizi insanların üzerine atmadan önce kontrol edin,

- eğer 1. seferden anlamadiysaniz, lütfen uçlari aramak yeri̇ne gurulu/yanliş tonlarinizi kodunuza ve sonuçlariniza dökün

 
Bunun LDA'dan farkı nedir? Alıntılarda, yeni veriler üzerinde çalışmayan sıkı bir uyum elde edersiniz. Ancak üzerinde eğitilen modelin hatasını neredeyse sıfıra indirir. Sanych'in yaklaşımında da benzer bir durum ortaya çıkabilir. Prensip aynıdır - sinekleri cutlet'lere uydurmak

Ancak kayan bir pencere, üzerinde istatistikler toplanırsa biraz keyif verecektir. Bunu henüz hayal edemiyorum.
 

Gönderilerde bir çeşit artış!


Bir kez daha.

Tahmin edicileri Tahmin yeteneğine göre sıralıyorum.

Çok sayıda paketteki algoritmalar çok yavaş olduğu için kendi algoritmamı kullanıyorum - benimki daha az doğru ama çok hızlı.

Tahmin yeteneği korelasyon DEĞİLDİR ve modellerin ürettiği tahmincilerin seçiminin sonucu DEĞİLDİR.

Tahmin yeteneği bilgi korelasyonudur ve DEĞİLDİR:

1. Korelasyon bir durağan serinin diğerine "benzerliğidir" ve her zaman bir değeri vardır ve "ilişki yok" değeri yoktur. Korelasyonun her zaman bir değeri vardır, bu nedenle bir öğretmen ile kahve telvesi arasındaki ilişkiyi bulmak için korelasyonu kolayca kullanabilirsiniz.

2. Fiş seçimi, model oluştururken fiş kullanma sıklığıdır. Öğretmenle ilgisi olmayan tahmin edicileri alırsak, yine de bir fiş sıralaması elde ederiz.

Benim "tahmin gücü" anlayışımın bir benzeri, örneğin her bir ağırlık merkezi sınıfı için Mahalanobis örnekleme mesafelerini tanımlayan caret::classDist()'tir. Ya da woeBinning. R'de birçok yaklaşım ve birçok paket vardır. Bilgi teorisine dayalı daha fazlası var.