Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2649

 
Aleksey Vyazmikin #:

Anlamış olmanız güzel - hemen fark etmemiştim, açıklama için teşekkürler.

Ancak daha sonra, ilk aşamadaki algoritmanın kutulara daha iyi ayrılacak tahminci çiftlerini bulması ve ardından bunlara "soyma" uygulaması gerektiği ortaya çıktı.

Hayır, herhangi bir sayıda tahminci için çalışır. Her adımda hangi tahmin edicinin ve hangi dilimin (sol veya sağ) kesilmesinin en uygun olduğu seçilir. Geleneksel karar ağaçları da aynı şeyi yapar - her adımda hem tahmin edici hem de kesme noktası iki yeni kutu üretmek için en uygun olacak şekilde seçilir. PRIM ile tek fark, her adımda sınırlı derecede küçük bir dilimin kesilmesidir, bu da kademeli bir süreçle sonuçlanır, dolayısıyla adındaki hasta kelimesi de buradan gelir.

Şahsen, standart yaklaşımın her kutunun iki değil üç yeni kutuya bölündüğü bir başka modifikasyonunu ilginç buluyorum. Bir ara bu konuda bazı düşüncelerimi paylaşacağım.

 
Aleksey Nikolayev #:

Bu konudaki düşüncelerimi bir ara açıklayacağım.

Belki de farkına varmak ve test etmek daha iyidir
 
Aleksey Nikolayev #:

Hayır, herhangi bir sayıda tahminci için çalışır. Her adımda, hangi tahmin edicinin ve hangi dilimin (sol veya sağ) kesileceğinin en uygun olduğu seçilir. Geleneksel karar ağaçları da aynı şeyi yapar - her adımda hem tahmin edici hem de kesim noktası iki yeni kutu üretmek için en uygun olacak şekilde seçilir. PRIM'in tek farkı, her adımda sınırlı sayıda küçük bir dilimin kesilerek kademeli bir sürece yol açmasıdır, dolayısıyla adındaki hasta kelimesi de buradan gelmektedir.

Şahsen, her kutunun iki değil üç yeni kutuya bölündüğü standart yaklaşımın bir başka modifikasyonunu ilginç buluyorum. Bir ara bu konuda bazı düşüncelerimi paylaşacağım.

https://xgboost.readthedocs.io/en/stable/tutorials/feature_interaction_constraint.html
 
Aleksey Nikolayev #:

Hayır, herhangi bir sayıda tahminci için çalışır. Her adımda, hangi tahmin edicinin ve hangi dilimin (sol veya sağ) kesileceğinin en uygun olduğu seçilir. Geleneksel karar ağaçları da aynı şeyi yapar - her adımda hem tahmin edici hem de kesme noktası iki yeni kutu üretmek için en uygun olacak şekilde seçilir.

Bu yüzden aksini iddia etmedim - işe yarıyor - bu sadece bir uygulama meselesi - keyfi olarak iyi sınırlara sahip iki tahminci alırsanız, kutu çıkmayacaktır - mesele bu! Bu yüzden çift yönlü aramanın bir kerede gerçekleştiğini varsaydım.

Aleksey Nikolayev #:

PRIM'in tek farkı, her adımda sınırlı küçük bir parçanın kesilmesi ve bunun da kademeli bir sürece yol açmasıdır; adındaki hasta kelimesi de buradan gelmektedir.

Kesilmiş - ne anlama geliyor - ağacın köküne yakın koşullu olarak bölündükten sonra küçük bir kalıntı?

Aleksey Nikolayev #:

Şahsen, her kutunun ikiye değil de üçe bölündüğü standart yaklaşımın bir başka modifikasyonunu ilginç buluyorum. Bir ara bu konuda bazı düşüncelerimi paylaşacağım.

Neden 5 değil? :) Her şeyi denemeye varım!

 
mytarmailS #:
Belki bir farkındalık ve bir test daha iyi olurdu

Bunun gerçekleşeceğini sanmıyorum. Şu ana kadar sadece başıboş bir varsayım var.

Bir yerden önemli kuralın A<x1<B olduğunu kesin olarak bildiğimizi varsayalım, ancak şimdilik a<A ve B<b olan bir a<x1<b kuralı var. İyi bir kural en az iki adımda elde edilecektir, örneğin 1) a<x1<B ve 2) A<x1<B. Pratikte bu, farklı bir tahminci üzerindeki bir bölümleme adımının yanlışlıkla bu iki adım arasına sıkışacağı ve bu önemli kuralın sonuçta görünmeyeceği anlamına gelebilir. Bu nedenle, her adımdaki bölümleme parçalarının sayısı sabit olmayabilir, ancak en uygunluk değerlendirmelerinden belirlenebilir. O zaman özel durumlarda (neredeyse savaş zamanında sinüs için olduğu gibi) sayıları beşe eşit olabilir) Ağaç elbette ikili olmaktan çıkar.

 
Aleksey Vyazmikin #:

Kesilmiş - bu ne anlama geliyor - ağacın köküne yakın bir yerde geleneksel olarak bölündükten sonra küçük bir kalıntı mı?

Muhtemelen güzel bir ağaç inşa etme fikri yoktur - sadece "iyi bir parça" kesmek isterler) Tüm alanı boşluksuz döşemek zorunda olan bir kiremitçi gibi davranmak yerine, ticarete uygun parçaları kesmek gerektiği fikrine yakınım) Bu, eski "her zaman piyasada olmaya çalışmayın" sözüyle oldukça uyumludur. Tahmin edicilerin "iyi parçalara" düşmediği durumlar basitçe göz ardı edilir, bu nedenle ağaçlar pek işe yaramaz hale gelir.

Evet, ağacı terk etmek olası kutu kesişimleriyle uğraşmaya yol açar, ancak işe yarayacaksa, ağaçlar acınacak durumda değildir)

 
Maxim Dmitrievsky #:
h ttps:// xgboost.readthedocs.io/en/stable/tutorials/feature_interaction_constraint.html

Benim küçük deneylerimden daha ciddi bir şey gibi görünüyor)Önceden bilinen tahminciler arasındaki bağımlılık yapısını hesaba katmakla ilgili.

 
Aleksey Nikolayev #:

İşe yarayacağını sanmıyorum. Şimdilik, sadece abuk sabuk bir tahmin.

Önemli kuralın A<x1<B olduğunu bir yerden kesin olarak bildiğimizi varsayalım, ancak şimdilik a<A ve B<b olan bir a<x1<b kuralı var. İyi bir kural en az iki adımda elde edilecektir, örneğin 1) a<x1<B ve 2) A<x1<B. Pratikte bu, farklı bir tahminci üzerindeki bir bölümleme adımının yanlışlıkla bu iki adım arasına sıkışacağı ve bu önemli kuralın sonuçta görünmeyeceği anlamına gelebilir. Bu nedenle, her adımdaki bölümleme parçalarının sayısı sabit olmayabilir, ancak en uygunluk değerlendirmelerinden belirlenebilir. O zaman özel durumlarda (neredeyse savaş zamanında sinüs için olduğu gibi) sayıları beşe eşit olabilir) Ağaç elbette ikili olmaktan çıkar.

Sembolik regresyon kullanın, diğer algoritmaların sunduğunu değil, tam olarak ne istediğinizi tasarlayın.

Rku'yu biliyorsunuz, bir paket var, örnekler var, her şey daha önce ve bizim için yapıldı.

 
Aleksey Nikolayev #:

Benim küçük deneylerimden daha ciddi bir şey gibi görünüyor)Önceden bilinen tahminciler arasındaki bağımlılık yapısını hesaba katmakla ilgili.

Eğer sadece 1 ve 2 etkileşime girebiliyorsa. Ya da 3,4,5. O zaman ilk bölünmeden sonra, örneğin 3'te, sonraki tüm bölünmeler sadece 3,4,5 kümesinden olacaktır.
Bunun basitçe 1,2 ve 3,4,5 kümelerinden 2 ağaç oluşturduğunu varsayıyorum. Eğer 10 küme varsa, o zaman 10 ağaç vardır. Vb.
 
Gerçi bu da havalanma. Sonra bir setteki ilk ağaç. Diğer sette 2. rafine ağaç ve böyle devam eder.