Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2848

 
Aleksey Nikolayev #:

Sütun yüksekliklerinden oluşan bir örnek için bir histogram (alışılagelmiş anlamda) oluşturmaya çalışın. Ayrıca bir hayatta kalma fonksiyonu oluşturmayı da deneyebilirsiniz.

Ben inşa ettim, peki siz nasıl kullanmayı düşünüyorsunuz?

Hayatta kalma fonksiyonuna gelince, nasıl kullanılacağını anlamıyorum.

Dosyalar:
 
Aleksey Vyazmikin #:

Yani onu siz inşa ettiniz ve nasıl kullanmayı düşünüyorsunuz?

Hayatta kalma fonksiyonuna gelince, nasıl kullanılacağını anlamıyorum.

Örneğin, ilk şekilde 8-9 civarında gözle görülür bir düşüş var, bu da çitinize ve ağaçlarınıza karşılık geliyor. Hayatta kalma fonksiyonu grafiğinde düşüşün eğimini daha kesin olarak görebilirsiniz - orada yatay bir kesitle tanımlanır.

 
Aleksey Nikolayev #:

Örneğin, ilk şekilde çit ve ağaçlarınıza karşılık gelen 8-9 civarında gözle görülür bir düşüş var. Düşüş segmentini hayatta kalma fonksiyonu grafiğinde daha net görebilirsiniz - orada yatay bir kesitle tanımlanır.

Histogramın iki bölüme ayrılabileceği açıktır, ancak bu bir otomasyon ve sürecin birleştirilmesi meselesidir. Eğer yayılma mutlak anlamda büyük değilse, histogram bunu göstermeyecektir.

 
Aleksey Vyazmikin #:

Histogramın iki bölüme ayrılabileceği açıktır, ancak burada soru sürecin otomasyonu ve birleştirilmesiyle ilgilidir. Eğer yayılma mutlak anlamda büyük değilse, histogram bunu göstermeyecektir.

Bu yüzden hayatta kalma fonksiyonu hakkında yazdım (bir de tehlike fonksiyonu var). Yeni şeyler öğrenmek için tembel olmayın ve her şeyi kendi başınıza icat etmeye çalışmayın - birileri zaten sorunlarınızı çözdü.

 
Aleksey Nikolayev #:

Yeni şeyler öğrenmek için tembel olmayın ve kendi başınıza bir şeyler uydurmaya çalışmayın - yaşadığınız tüm sorunlar zaten bir başkası tarafından çözülmüştür.

++++

 
Aleksey Nikolayev #:

Bu yüzden hayatta kalma fonksiyonu hakkında yazdım (bir de tehlike fonksiyonu var). Yeni şeyler öğrenmek için tembel olmayın ve her şeyi kendi başınıza icat etmeye çalışmayın - birileri zaten sorunlarınızı çözdü.

Spesifik olalım - ne yapmayı öneriyorsunuz - nasıl ve neden kullanılacağına dair üretken bir anlayış olmadan eterik bedenlere atıfta bulunmak zaman kaybıdır.

Hayatta kalma fonksiyonunu oluşturma algoritmasının anlaşılmasına yardımcı olmaya hazırım - kodu yazacağım ve daha fazla düşüneceğiz. Ve tembelliğim hakkındaki varsayımlarınız, görevlerimde uygulamak üzere işlediğim bilgi miktarı göz önüne alındığında, basitçe aşağılayıcıdır.

 
Aleksey Vyazmikin #:

Spesifik olalım - ne yapmayı öneriyorsunuz - eterik bedenlerin nasıl ve neden kullanılacağına dair verimli bir anlayış olmadan onlara atıfta bulunmak zaman kaybıdır.

Hayatta kalma fonksiyonunu oluşturma algoritmasını anlamamda bana yardımcı olmaya hazırsanız, kodu yazacağım ve daha fazla düşüneceğiz. Ve tembelliğim hakkındaki varsayımlarınız, görevlerimde uygulamak için işlediğim bilgi miktarı göz önüne alındığında, sadece hakarettir.

Kabaca konuşmak gerekirse, ağaç kesmek için tembel değilsinizdir, ancak bir baltayı bilemek için tembelsinizdir.

Risk fonksiyonu, R'nin en basit varyantı

#  x - выборка, y - функция риска
x <- sort(x)
nx <- length(x)
y <- log(nx/(nx:1))
plot(x, y, type = "l")

Eğrinin yatay çizgiye yakın bölümleri histogramdaki düşüşlere karşılık gelir ve burada bu bölümler daha doğru bir şekilde belirlenebilir, çünkü bölümleme ile bağlantı yoktur (histogramlarda olduğu gibi). Bunu örneğin zikzak dizlerin yüksekliklerinin dağılımını incelerken kullanıyorum.

 
Aleksey Nikolayev #:

Risk fonksiyonu, R'nin en basit varyantı

nx:1 ile ne demek istiyorsunuz? Logaritmaya baktıktan sonra y vektöründe birden fazla sayı elde etmiyor musunuz? R'nin sözdizimini bilmiyorum.

Aleksey Nikolayev #:

Eğrinin yatay çizgiye yakın bölümleri histogramdaki diplere karşılık gelir ve burada bu bölümler daha kesin bir şekilde tanımlanabilir, çünkü bölümleme ile bağlantı yoktur (histogramlarda olduğu gibi). Örneğin, zikzak dizlerin yüksekliklerinin dağılımını incelerken kullanıyorum.

"Yakın" - yakınlık derecesi nasıl birleştirilir? Sonunda manuel tahmin değil, bir algoritma istiyorum.

Şimdiye kadar, örneklemdeki bu tür aykırı değerlerin yüzdesini gösterecek basit bir tahminci yapıyoruz. Daha sonra bu aykırı değerlerin örneklemdeki dağılımını tahmin etme seçeneğini düşünebiliriz.

 
Aleksey Vyazmikin #:

Ne demek nx:1? Logaritmaya baktıktan sonra y vektöründe birden fazla sayı elde etmiyor musunuz? R'nin sözdizimini bilmiyorum.

nx 'den 1'e kadar değerler içeren nx uzunluğunda bir vektördür. R öğrenin, baltalarınızı keskinleştirin.

Aleksey Vyazmikin #:

"Yakın" - yakınlık derecesi nasıl birleştirilir? Sonunda manuel tahmin değil, bir algoritmaya ihtiyacım var.

Görevinize bağlı olarak, nasıl yapacağınıza karar vermek size kalmış. Benim varyantımın sizin için işe yaraması pek olası değil - SB için hesaplanan risk fonksiyonunun teorik formundan bir sapma kullanıyorum.

 
Aleksey Nikolayev #:

nx ile 1 arasında değerler içeren nx uzunluğunda bir vektördür. R öğrenin, baltalarınızı keskinleştirin.

nx aynı elemanın sayısıdır. Eğer 1'den büyükse nasıl 1'e kadar olabilir?

Makale genel olarak, yöntemin kendisini uygulamadan önce dağılımı bilmeniz gerektiğini vurgulamaktadır.