Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1487

 
Alexey Vyazmikin :

Bu nedenle, tahmin edicileri ve değerlerini sıralarken bir tahmin vermeniz ve çok kalabalık olan değerlere (aralıklara) sahip tahmin edicileri almamanız, ancak örnek boyunca dağılmış olanları tercih etmeniz gerekir.

Eh, geriye dönük testte her şey her zaman çok iyi görünüyor)
Sanırım forvet formasına ihtiyacın var? Orman eğitim sırasında ileri hakkında hiçbir şey bilmiyor\
 
elibrarius :
Eh, geriye dönük testte her şey her zaman çok iyi görünüyor)
Sanırım forvet formasına ihtiyacın var? Orman eğitim sırasında ileri hakkında hiçbir şey bilmiyor\

Değerlendirme, eğitime katılan iki numune üzerinde yapılmalıdır.

 
Alexey Vyazmikin :

Değerlendirme, eğitime katılan iki numune üzerinde yapılmalıdır.

ikinci - doğrulama?
 

Ardından doğrulama sitesinde bir ayarlama yapılacaktır. Doğrulama daha fazla eğitim ise daha iyi olabilir. Ivan Butko'nun NS'sinde, küçük bir sitede eğitim ve bir sitede doğrulama birkaç kat daha büyüktür. Burada, tüm verilerin %15-25'ini doğrulayan seçenekler genellikle dikkate alındı ve videosunda yaklaşık %80'i

 
elibrarius :
ikinci - doğrulama?

Evet, varsa.

Genel olarak, buradaki örnek ne kadar büyük olursa o kadar iyi olduğunu düşünüyorum - bu sadece öğrenme değil, öngörücülerin istikrarı ile ilgili bir sorudur.

Belki de hazırlık aşamasındaki verileri işlemek, nadir olmayan ancak örneklemde çok kalabalık olan tahmin edici değer aralıklarını basitçe gruplamak mümkündür.

Bunları koşullu olarak -1 ile değiştirin ve en az 2-3 derinliğe kadar ilk bölmeleri yapmayı yasaklayın.

 
elibrarius :

Ardından doğrulama sitesinde bir ayarlama yapılacaktır. Doğrulama daha fazla eğitim ise daha iyi olabilir. Ivan Butko'nun NS'sinde, küçük bir sitede eğitim ve sitede doğrulama birkaç kat daha büyüktür. Burada, tüm verilerin %15-25'ini doğrulayan seçenekler genellikle dikkate alındı ve videosunda yaklaşık %80'i

Gerçekte doğrulama konusunda eğitim almadığımız ve ondan piyasa yapısı hakkında ek bilgi aldığımız için özel bir ayarlama olmayacak.

 
Alexey Vyazmikin :

Evet, varsa.

Genel olarak, buradaki örnek ne kadar büyük olursa o kadar iyi olduğunu düşünüyorum - bu sadece eğitim değil, tahmin edicilerin istikrarı ile ilgili bir sorudur.

Belki de hazırlık aşamasındaki verileri işlemek, nadir olmayan ancak örneklemde çok kalabalık olan tahmin edici değer aralıklarını basitçe gruplamak mümkündür.

Bunları şartlı olarak -1 ile değiştirin ve en az 2-3 derinliğe kadar ilk bölmeleri yapmayı yasaklayın.

Çok zor... standart ağaç oluşturma algoritması basit ve hızlıdır.
Alexey Vyazmikin :

Gerçekte doğrulama konusunda eğitim almadığımız ve ondan piyasa yapısı hakkında ek bilgi aldığımız için özel bir ayarlama olmayacak.

Değerlendirme doğrulamaya dayanıyorsa, bunun için bir ayarlama olacaktır.Kabul edilebilir tek seçenek, doğrulamanın orantılı veya öğrenmeden daha fazla olmasıdır.
Ve sadece doğrulamayı eğitim alanına dahil etmemiz gerektiği sonucuna varıyoruz.
 
Kâse :

Evet, hayır, bu "Parzen penceresi" ne tür bir svm, nükleer yumuşatma, ancak neredeyse mükemmel olması anlamında "yarı optimal" (Mitchell bir yerde vardı), ancak yalnızca çok yavaş, her yineleme tüm yeni bir noktaya veri kümesi ve çekirdek ile evrişim

Durağan olmamaya neyin etki edeceğinden emin değilim .. ve yavaşsa Monte Carling bile zor

IMHO asıl sorun ölçekleme \ veri dönüşümü, döngü seçimidir. desenler tekrarlanırsa (yapay VR'de) doğrusal olmayan regresyon veya SVM bile iyi sonuçlar verir

onlar. çok uzak modellerin seçimi ile ilgili sorunlar
 
Maksim Dmitrievski :

asıl sorun, verileri ölçeklendirmek/dönüştürmek, döngüleri vurgulamak

Evet kesinlikle.

 
elibrarius :
Çok zor... standart ağaç oluşturma algoritması basit ve hızlıdır.
Ve sadece doğrulamayı eğitim alanına dahil etmemiz gerektiği sonucuna varıyoruz.

Standart algoritmalar, durağan fenomenler, kapalı sistemler ile çalışmak üzere tasarlanmıştır, bu nedenle herhangi bir bilgi orada önceden yararlı kabul edilir ve rastgelelik açısından değil, sadece görev için kullanma olasılığı (hedefe göre sınıflandırma) açısından değerlendirilir. , çok fazla gürültümüz var ve bununla başa çıkmanın mantıklı bir yolunu önerdim.

Ve evet, bir herbaryum toplarken, geçici alanlarda verimlilik de dahil olmak üzere yaprakları değerlendirme kriterlerini bırakarak doğrulamayı bu şekilde bıraktım. Şimdi, tüm ağaç türlerinden 50 binden fazla sayfam var, bunların yalnızca 200'ü sinyal olarak seçildi ve sonucu önemli ölçüde iyileştiren filtreler (çoğu dönemde) - 600 (sinyal sayfası başına 3).

Yapabileceğimiz tek şeyin en başarılı veri uydurma için bir algoritma geliştirmek olduğu gerçeğinden hareket etmeliyiz, çünkü geleceği bilmiyoruz ve mevcut tahmin değerlerine dayanarak bile birçok varyasyonu var. Ve eğer şanslıysanız, bir süre daha var olmaya devam edecek bir örüntü tespit edebileceksiniz, bu yüzden böyle bir örüntüyü belirli kriterlerle aramak önemlidir ve mantık, en azından bir örüntü olması gerektiğini önerir. tüm örnek boyunca meydana gelen desen. Bu nedenle, görev, bu tür birçok desen oluşturan ve onlardan ağaçlar oluşturan bir algoritma oluşturmaktır.

Korunabilecek basit bir yeniden eğitim örneği, üzerinde uzun bir dairenin kurulduğu belirli bir fiyat aralığına sahip bir sitenin bir örneğindeki tanımlamadır - eğitim sırasında, şimdi iki fiyat aralığı (veya ticaret yapmamız gereken üst zaman dilimleri), ancak gelecekte aynı alanda dairenin kurulması olası değildir. Ve aynı özelliklerin temasıyla önerdiğim yaklaşımla, grev seviyelerinin olay üretmek için önemli bulunma olasılığı daha yüksektir.