Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2537

 
Alexey Vyazmikin # :

Ve hedef rastgele belirlenmezse?

Ancak? Girdilerden birini çıktıya kopyala? İyi öğrenmek. Hatta denedim gibi görünüyor.

Alexey Vyazmikin # :

Burada bir deney yaptım - genellikle 3 parçaya bölünmüş bir örneğim var, bu yüzden onu aldım, tek bir örnekte birleştirdim ve 100 ağaçlık bir model eğittim, sonra hangi tahmin edicilerin kullanılmadığına baktım ve onları engelledim. Ardından, her zamanki gibi, modeli ikinci örnekte yeniden eğitim duruşuyla eğittim ve tahmin edicileri hariç tutmadan eğittiğimde üçüncü örnekteki sonuçları seçenekle karşılaştırdım. Sonuçların seçilen yordayıcılarda daha iyi olduğu ortaya çıktı ve burada bu etkinin sonuçlarıyla bir kaybım var. "Farklı yordayıcıların seçimi, aralıktaki örneklerdeki farklılıklardan kaynaklanmaktadır, öğrenme üzerinde tüm örnek için, uzun bir süre içinde önemini kaybetmeyen tahmin edicileri otomatik olarak seçiyoruz .".

Evet, gelecekte bir etkisi olacak olanı seçtiniz. Hatta geçmişte çok az etkisi olabilirdi, ancak gelecekteki iyi etkisi nedeniyle, tüm örnek için ortalama sonuca göre seçildi.

Alexey Vyazmikin # :

Ancak bu, örneklem ne kadar büyükse, modelin uzun vadede daha istikrarlı olduğu anlamına mı geliyor? Bu şekilde eğitim için tahmin edicileri seçmek mümkün mü, yani. Bu yeniden eğitime katkıda bulunmuyor mu?

Dedikleri gibi, pazar değişiyor. Yeni oyuncular gelir, yeni robotlar yaratır ve eskileri kapatır vb. Çok büyük bir örneklemde, modelin tüm bu değişiklikler için ortalama bir sonuca, muhtemelen sıfıra geleceğini düşünüyorum. Maksimum verim için antrenman derinliğini seçmek ve düzenli olarak yeniden antrenman yapmak gerektiğini düşünüyorum. Aynı süreyi kendim deniyorum (örneğin, 2 yıllık bir test, cumartesi günleri yeniden eğitim alıyorum, veri boyutunu birkaç günden bir veya iki yıla kadar denedim).
Teorik olarak, her yeniden eğitim için eğitim için örnek boyutunu bir şekilde otomatik olarak belirlemek daha iyi olacaktır. Ama nasıl olduğunu henüz bilmiyorum.

Alexey Vyazmikin # :
Genel olarak, CatBoost'un yaratıcılarından, modelin hiper parametrelerini bulmanız ve ardından modeli işte uygulamak için mevcut tüm örnekten aptalca öğrenmeniz gerektiğine dair bir öneri duydum.

Kötünün yaratıcıları tavsiye etmeyecek) Yürüyüş-İleri (VF) üzerinde hiperparametreler seçiyorum, çünkü veri dizisi kalacak ve burada eski verilerin etkisinin bozulmasına göre eğitim için geçmişin derinliğini seçmek mümkün olacaktır. Veriler zamanla değişmezse Çapraz Doğrulama (CV) üzerinde de mümkündür, ancak bu piyasalarla ilgili değildir.
Seçimden sonra, elbette, şu ana kadar öğrenmeniz ve HF veya WF'de ileri bölümde sahip olduğunuz süre için modeli kullanmanız gerekir.
Test sitesiyle aynı sitede eğitim alarak modeli ve hiperparametreleri bu 1 teste uydurursunuz. HF veya WF üzerinde 10-50 kez eğitim almış olarak, tarihin büyük bir bölümü için en iyi hiperparametreleri bulacaksınız.
Belki daha iyi, ya da belki de haftada bir hiperparametre seçemeyecek kadar tembelim)) Peki, aslında daha iyi olan şey - uygulama gösterecektir.

 
elibrarius # :
Teorik olarak, her yeniden eğitim için eğitim için örnek boyutunu bir şekilde otomatik olarak belirlemek daha iyi olacaktır. Ama henüz nasıl bilmiyorum

ORTALAMA BELİRLEMEK İÇİN

eğer gen boyutu. kepçe bilinmiyor - yeniden örnekleme boyutunu hesapla

n=(t^2*sigma^2)/delta_y^2

- rastgele bir numune için (tabakalı ve seri numuneler için formül biraz daha karmaşık hale gelir)

onlar. gereken güven olasılığına P ve buna karşılık gelen güven katsayısına (güvenilirlik derecesi) t=2 ver-ty %95 için karar vermeniz gerekir ... ortalamanın izin verilen maksimum marjinal hatası (endüstri uzmanı, bir tüccar) bölene ... ve bir tür bilinmeyen, ancak önceki gözlemlerden bilinebilecek varyans (sigma) ...

genel olarak, bunun hakkında yazdım ve yüzen bir pencereden [prensipte şöyle "örnek boyutu" diyebilirsiniz] ve düz eğilimi ve "nerede olduğumuz" olasılığını belirlemek için t-istatistiklerinden bahsettiğimde şüphelerimi yazdım. - RS'yi reddetmek veya RS'yi emmek için ...

Tabii ki, özelliğinizin normlara sahip olması şartıyla. dağılım, olduğu gibi, sonucu etkileyen ana faktördür (belki de dy / dx-> min değerini zaten belirlemişsinizdir) ... çok faktörlü bir modelden bahsetmiyoruz (muhtemelen, bu durumda, siz hesaplanandan maksimum değeri alabilir ... IMHO)

BİR İŞARET PAYLARININ BELİRLENMESİ İÇİN

aynı şekilde, ancak hata göstergeleri ve ortalamanın varyansı yerine, payın marjinal hatasını (delta_w) ve alternatif özelliğin varyansını w(1-w) kullanın.

frekans(w) yaklaşık olarak bilinmiyorsa, hesaplama maks. paylaşım dağılım değeri, 0.5(1-0.5)=0.25

cboe by opts, en yakın 2 K_opt'un son kullanma tarihinden dakikalar önce asimetri değerlendirmesine dahil edilir (alternatif işaretler olarak)...

ya da aşk. diğer tat ve renk belirtileri (seçenek yoksa)

not: buradaki gibi

pps, olduğu gibi, mantıksal olarak ve bilinmeyen bir genle bir model oluştururken örnek yeterliliği hesaplamasının nasıl uygulanacağı. bütünlük, referansa sahip olma meselesidir. veri ve mantık ... ama 2 yıl - bana da norm gibi görünüyor. popülasyon geni için aralık ... IMHO

Определение объема выборки
Определение объема выборки
  • 2013.08.16
  • baguzin.ru
Ранее мы рассмотрели методы построения доверительного интервала для математического ожидания генеральной совокупности. В каждом из рассмотренных случаев мы заранее фиксировали объем выборки, не учитывая ширину доверительного интервала. В реальных задачах определить объем выборки довольно сложно. Это зависит от наличия финансовых ресурсов...
 
JeeyCi # :

ORTALAMA BELİRLEMEK İÇİN

eğer gen boyutu. kepçe bilinmiyor - rastgele bir örnek için yeniden örnekleme hacmini hesaplayın (tabakalı ve seri örnekler için formül biraz daha karmaşık hale gelir)

n=(t^2*sigma^2)/delta_y^2

onlar. gereken güven olasılığına P ve buna karşılık gelen güven katsayısına (güvenilirlik derecesi) t=2 ver-ty %95 için karar vermeniz gerekir ... ortalamanın izin verilen maksimum marjinal hatası (endüstri uzmanı, bir tüccar) bölene ... ve bir tür bilinmeyen, ancak önceki gözlemlerden bilinebilecek varyans (sigma) ...

genel olarak, bunun hakkında yazdım ve yüzen bir pencereden [prensipte şöyle "örnek boyutu" diyebilirsiniz] ve düz eğilimi ve "nerede olduğumuz" olasılığını belirlemek için t-istatistiklerinden bahsettiğimde şüphelerimi yazdım. - RS'yi reddetmek veya RS'yi emmek için ...

Tabii ki, özelliğinizin normları olması şartıyla. dağılım, olduğu gibi, sonucu etkileyen ana faktördür (belki de dy / dx-> min değerini zaten belirlemişsinizdir) ... çok faktörlü bir modelden bahsetmiyoruz (muhtemelen, bu durumda, siz hesaplanandan maksimum değeri alabilir ... IMHO)

BİR İŞARET PAYLARININ BELİRLENMESİ İÇİN

aynı şekilde, ancak hata göstergeleri ve ortalamanın varyansı yerine, payın marjinal hatasını (delta_w) ve alternatif özelliğin varyansını w(1-w) kullanın.

cboe by opts, en yakın 2 K_opt'un son kullanma tarihinden dakikalar önce asimetri değerlendirmesine dahil edilir (alternatif işaretler olarak)...

ya da aşk. diğer tat ve renk belirtileri (seçenek yoksa)

not: buradaki gibi

pps, olduğu gibi, mantıksal olarak ve bilinmeyen bir genle bir model oluştururken örnek yeterliliği hesaplamasının nasıl uygulanacağı. bütünlük, referansa sahip olma meselesidir. veri ve mantık ... ama 2 yıl - bana da norm gibi görünüyor. popülasyon geni için aralık ... IMHO

İÇİN Ortalama tanımlar:
(Yüksek+Düşük)/2
 
Vladimir Baskakov
İÇİN Ortalama tanımlar:
(Yüksek+Düşük)/2

Üzülmek istemedim ama "orta", (yüksek + düşük) / 2, kesinlikle söylemek gerekirse, buna hiç diyemezsiniz, bunun için daha akademik isimler var. Olayların zamanlaması bilinmiyor, düzensiz ve düzensiz.

 
Maksim Kuznetsov # :

Üzülmek istemedim ama "orta", (yüksek + düşük) / 2, kesinlikle söylemek gerekirse, buna hiç diyemezsiniz, bunun için daha akademik isimler var. Olayların zamanlaması bilinmiyor, düzensiz ve düzensiz.

Bence, bu ortalamanın en ortalaması
 
Maksim Kuznetsov # :

Olayların zamanlaması bilinmiyor, düzensiz ve düzensiz.

gerçekten de alışkanlıktan, "işaretleri" düşünürken " olayları" gözden kaçırıyorum... - Sürekli unutuyorum... Sözü hatırlattığın için teşekkürler! .. - Bayes'in teoremi işte burada devreye giriyor. mantıken yani sanırım

 
Belki saçma ama ben yakın dışında bir şey kullanmayı sevmiyorum. Yakından bir dizi gözlemim olduğunda (üzgünüm), gözlemler arasında sabit bir zaman aralığı olduğunu her zaman bilirim (her zaman aynıdır, sabittir ve benim için bilinir). Ve onlarla düşük / yüksek ve farklı hesaplamalar kullanıldığında, gözlemler arasında ..... rastgele bir zaman dilimi olduğu ortaya çıkıyor? ki bu her zaman bir gözlemden diğerine farklıdır.
 
LenaTrap # :
Belki saçma ama ben yakın dışında bir şey kullanmayı sevmiyorum. Yakından bir dizi gözlemim olduğunda (üzgünüm), gözlemler arasında sabit bir zaman aralığı olduğunu her zaman bilirim (her zaman aynıdır, sabittir ve benim için bilinir). Ve onlarla düşük / yüksek ve farklı hesaplamalar kullanıldığında, gözlemler arasında ..... rastgele bir zaman dilimi olduğu ortaya çıkıyor? ki bu her zaman bir gözlemden diğerine farklıdır.

rastgelelik ve her zaman farklı hakkında , elbette, bu mahanut ... aslında tüm bu halabuda'yı incelemenin tüm amacı - zaman ve fiyatta yüksek / düşük az çok doğru bir şekilde belirlemek :-)

 
LenaTrap # :
Belki saçma ama ben yakın dışında bir şey kullanmayı sevmiyorum. Yakından bir dizi gözlemim olduğunda (üzgünüm), gözlemler arasında sabit bir zaman aralığı olduğunu her zaman bilirim (her zaman aynıdır, sabittir ve benim için bilinir). Ve onlarla düşük / yüksek ve farklı hesaplamalar kullanıldığında, gözlemler arasında ..... rastgele bir zaman dilimi olduğu ortaya çıkıyor? ki bu her zaman bir gözlemden diğerine farklıdır.

Kesin olarak matematiksel olarak yaklaşırsak, Open'ı kullanmalıyız, çünkü yalnızca onun için kenenin varış anı Markovian'dır - açık bir şekilde bir açılış olarak tanımlanır (mükemmel saatler ve kaçırılan alıntılar olmadığı varsayılarak). Onay işaretinin varış anında kapanış, açık bir şekilde zaman dilimi segmentinin bitiminden önce kapanış olarak tanımlanamaz.

Ancak daha sık kapanışla çalışmak gelenekseldir. Muhtemelen, günlük alıntılarla çalıştıkları zamanlardan kalmadır.

 
Alexey Nikolaev # :

Kesinlikle matematiksel olarak yaklaşıyorsanız, Open kullanmanız gerekir, çünkü sadece onun için kene varış anı Markovian'dır - benzersiz bir şekilde bir açılış olarak tanımlanır

teknik olarak, kapanış geçerli zamana sahip tek fiyattır, yani. Bir çubuğu diğerine değiştirme anında, fiyat tam olarak kapanmaya eşittir.

açık, yeni çubuğun ilk tikinin fiyatıdır. bu ilk tik, bar değişiminden 10 dakika sonraysa, o an için açık olacaktır.