Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 555

 
Maksim Dmitrievski :

bu yüzden bu hayatta neye inanacağımı biliyorum. .her şeyin yeniden kontrol edilmesi gerekiyor


Kriterlerde kurtuluş)))

Çeşitli dönüşümler ve kesimler. Üst - ilk veriler.

tren = hafif kare ile r.fetch. test = OOS. zaman = yaklaşık zaman. saniye içinde


 
Veri kümelerindeki aykırı değerlerle ilgili olarak, bu yöntem piyasada kullanışlı olabilir.
 

Burada bazen bu forumdan şaşırıyorum. Sessizlik ve pürüzsüzlük ve genel şaşkınlık. Ve birden Vladimir veya Vizard gibi bazı insanlar veya en şüpheli podotr ortaya çıkar ve ustalık sınıfları göstermeye başlar. Onlar kim? İstisnasız herkesten pasaportlarını ve eğitim diplomalarını ibraz etmelerini rica ediyorum! :))))

 
San Sanych Fomenko :

Yalnızca hedef değişkenle İLİŞKİLİ olan tahmin edicileri kullanın. Bu durumda, "doğrusal" veya "doğrusal olmayan" önemli değil, çok kesin olarak formüle edilmiş "ilgili" ile ilgili değiller.

peki, bu ve metindeki diğer her şey açıktır, ancak başlangıçta doğrusal olmayan modelde özelliğin hedefle korelasyonu nerede?

ve regresyon durumunda neden gerekli olduğunu yazdım, ancak sınıflandırmada değil, çünkü hedef yok, ancak sınıflar .. hakkında yazdıklarımı daha derinden okuyun :)

 
Maksim Dmitrievski :

peki, bu ve metindeki diğer her şey açıktır, ancak başlangıçta doğrusal olmayan modelde özelliğin hedefle korelasyonu nerede?

ve regresyon durumunda neden gerekli olduğunu yazdım, ancak sınıflandırmada değil, çünkü hedef yok, ancak sınıflar .. hakkında yazdıklarımı daha derinden okuyun :)


Daha derin okumama gerek yok - seni çok iyi anlıyorum ama sen beni hiç anlamıyorsun.

Fazla takma (fazla takma) hakkında yazıyorum - bu, tüm sınıflandırma modellerinin ana düşmanıdır. Aşırı eğitilmiş modellerin davranışı gelecekte tanımlı DEĞİLDİR.

Bu mutlak kötülükle savaşmak için iki araç görüyorum:

1. Girdi tahmin edici setinden gürültüden kurtulmak

2. Doğru test

Bütün bunları kendi hesaplarıma dayanarak yazıyorum, sizi temin ederim ki bir yıl içinde ürettiğim çok büyük bir cilt.

Kimseyi herhangi bir şeye ikna etmek gibi bir amacım olmadığı için, araştırıp okunabilir bir psot oluşturmak için çok tembelim.


not.

Gürültü tahmincilerinin zararsızlığı ve hatta kullanışlılığı konusunda ısrar etmeye devam ediyorsunuz - ilk değilsiniz, bu kadar çok insan var, astrologlar denir.

 
San Sanych Fomenko :

Gürültü tahmincilerinin zararsızlığı ve hatta kullanışlılığı konusunda ısrar etmeye devam ediyorsunuz - ilk değilsiniz, bu kadar çok insan var, astrologlar denir.


bunu nereye yazdım

 
Maksim Dmitrievski :

bunu nereye yazdım

Gönderinizi tekrar okuyun

ну это и все далее по тексту понятно, но причем здесь корреляция признака с целевой в изначально нелинейной модели

а я написал зачем она (корреляция) нужна в случае регрессионной, а в классификации нет, потому что там вообще не целевая а классы



Tahmin ettiğim ortaya çıktı ve bence tutarsızlıklarımız aşağıdakilere dayanıyor:

Korelasyona karşısınız ve tahmin edici ile hedef değişken arasındaki korelasyon hakkında hiç yazmadım.

"konuştu" denir.

Her zaman yazdım: tahmin edici hedef değişkenle ilgili olmalıdır. " İlişki " kelimesinin anlamında asla korelasyon, lineer, lineer olmayan regresyon demek istemedim. Ayrıca, sınıflandırma algoritmalarının bana verdiği öngörücülerin "önemi" için tüm algoritmalar da bana uymuyor.


Örneğime bakın: hedef: erkek/kadın sınıflarıyla cinsiyet ve tahmin edici: etek/pantolon değerine sahip giysiler.

 
San Sanych Fomenko :

Gönderinizi tekrar okuyun



Tahmin ettiğim ortaya çıktı ve bence tutarsızlıklarımız aşağıdakilere dayanıyor:

Korelasyona karşısınız ve tahmin edici ile hedef değişken arasındaki korelasyon hakkında hiç yazmadım.

"konuştu" denir.

Her zaman yazdım: tahmin edici hedef değişkenle ilgili olmalıdır. " İlişki " kelimesinin anlamında asla korelasyon, lineer, lineer olmayan regresyon demek istemedim. Ayrıca, sınıflandırma algoritmalarının bana verdiği öngörücülerin "önemi" için tüm algoritmalar da bana uymuyor.


Örneğime bakın: hedef: erkek/kadın sınıflarıyla cinsiyet ve tahmin edici: etek/pantolon değerine sahip giysiler.


evet, sadece bazen hedef ile işaretlerin tam olarak ilişkili olması gerektiğini yazıyorlar, yani. doğrusal bir ilişki olmalı

iyi, regresyon modelleri için en az 1 özelliğin hedefle doğrusal olarak ilişkili olmasının makul olabileceğini yazdım.

"İlişki" konusunda kesinlikle katılıyorum :)

 
Sihirbaz_ :

Kriterlerde kurtuluş)))

Çeşitli dönüşümler ve kesimler. Üst - ilk veriler.

tren = hafif kare ile r.fetch. test = OOS. zaman = yaklaşık zaman. saniye içinde



ileriye dönük iyi bir sonuç bile her zaman daha sonra kardan karta geri çekilmenin habercisi değildir :)

ama genel olarak, çapraz doğrulama yukarıda zaten belirtilmişti, benim için aynı

 
Overfitting - A(x, w) modelinin kararsızlığına yol açan çoklu bağlantının bir sonucu olarak büyük ağırlıklar (~10^18) olduğunda oluşur.


Aşırı uyum şu şekilde giderilir: model eğitiminin erken durdurulması, ağırlıkların büyümesinin sınırlandırılması (L1 (Kement) ve L2'nin düzenlenmesi), ağdaki bağlantıların sınırlandırılması (Bırakma), ceza işlevlerinin (ElacticNet, Lasso) kullanılması da mümkündür.

Ayrıca, L1 düzenlemesi, ağırlık katsayılarını geçersiz kıldığı için özellik seçimine yol açar.

"Gürültü" özelliklerinden kurtulmak - bu özellik seçimidir. Bunun için yöntemler var. Bu, model için her zaman faydalı değildir, bu nedenle bazen L2 düzenlemesi kullanılır (çoklu doğrusallık sorununu çözmeye yardımcı olur).


SanSanych Fomenko , İşaretler ve hedefler arasındaki ilişki hakkındaki açıklamanız biraz özgüvenli. Çünkü henüz kanıtlanmamış olanı nasıl tartışabilirsiniz; MO modeli bunun için üretildi. İnşa edilen ve çalışan model, "şu şöyle" doğrulukla bir ilişki olduğu gerçeğine dair bir miktar tahminde bulunur.

Ve pantolon ve etekli örnek, araştırmacının incelenen alan hakkındaki bilgisinin kıtlığını yansıtıyor, çünkü böyle bir modelde ikamet yeri, mevsim, ikamet edilen bölgenin enlem ve boylamı vb. .


Bir model oluşturmadan önce, incelenen alanı anlamalısınız, çünkü şeytan, deha gibi ayrıntılarda yatar.


not. Tartışma iyidir. Bakış açılarını cilalamaya yardımcı olur, tez için nasıl iyi argümanlar sunacağını öğretir ve ortak bir gerçeğe yol açarlar.