Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 364

 
Vladimir Perervenko :

Buraya bak.

Tahmin edicilerin önemini değerlendirirken, bunun yalnızca bilgi kriterleriyle belirlenmeyen karmaşık bir değer olduğunu hatırlamak önemlidir. ve


Benim düşünceme göre, hem ana algoritmaya yerleştirilmiş araçlarla hem de bağımsız araçlarla belirlenen öngörücülerin önemi, sorunu çözmez, çünkü bu önem aslında tahmin edicinin sınıflandırmada kullanılma sıklığıdır. Satürn'ün halkaları, kahve telvesi tahmin edicilerin sayısına dahil edilirse, algoritma bu tahmin edicileri de kullanacaktır.


Bu konuya ve tahmincilerin hedef değişkenle "ilişkilendirmesi" gereken diğer konulara birçok kez gönderildi.

Yine bir örnek vereceğim.

Hedef değişken erkek/kadın

Tahmini: giyim.

Katı ahlaki değerlere sahip ülkeler için, tahmin edici pantolon ve eteklerden oluşuyorsa, her biri hedef değişkeni benzersiz bir şekilde belirleyen, birbiriyle örtüşmeyen iki alt gruba ayrılır; sınıflandırma hatası sıfırdır.

Tahmin ediciye unisex veya İskoç tarzı kıyafetleri dahil etmeye başlarsak, sınıflandırma hatasını belirleyecek bir kesişme meydana gelir. Temel olarak, bu hatadan kurtulamazsınız.


Bunlar sadece benim düşüncelerim değil, bu başlıkta benzer düşüncelere sahip yayınların linklerini verdim.

 
San Sanych Fomenko :


Benim düşünceme göre, hem ana algoritmaya yerleştirilmiş araçlarla hem de bağımsız araçlarla belirlenen öngörücülerin önemi, sorunu çözmez, çünkü bu önem aslında tahmin edicinin sınıflandırmada kullanılma sıklığıdır. Satürn'ün halkaları, kahve telvesi tahmin edicilerin sayısına dahil edilirse, algoritma bu tahmin edicileri de kullanacaktır.


Bu konuya ve tahmincilerin hedef değişkenle "ilişkilendirmesi" gereken diğer konulara birçok kez gönderildi.

Yine bir örnek vereceğim.

Hedef değişken erkek/kadın

Tahmini: giyim.

Katı ahlaki değerlere sahip ülkeler için, tahmin edici pantolon ve eteklerden oluşuyorsa, her biri hedef değişkeni benzersiz bir şekilde belirleyen, birbiriyle örtüşmeyen iki alt gruba ayrılır; sınıflandırma hatası sıfırdır.

Tahmin ediciye unisex veya İskoç tarzı kıyafetleri dahil etmeye başlarsak, sınıflandırma hatasını belirleyecek bir kesişme meydana gelir. Temel olarak, bu hatadan kurtulamazsınız.


Bunlar sadece benim düşüncelerim değil, bu başlıkta benzer düşüncelere sahip yayınların linklerini verdim.

Gerçek birdir, ona ulaşmanın milyonlarca yolu vardır.

Herkesin kendi yoluna hakkı vardır. Ana şey, bir çıkmaza yol açmamasıdır.

İyi şanlar

 
Maksim Dmitrievski :


Ancak, her zaman mükemmel çalışmayacak, ancak zaman zaman verecek iyi bir kendi kendini optimize eden aparat yapmanın mümkün olduğuna inanıyorum.

Ama bu açıkça standart göstergelerde değil ve çıktıda zikzak olacak :) Hatta sadece bir örnek olarak bence biraz çocukça bir oyun gibi geliyor kulağa.

Ben de öyle umuyorum, ancak bunun bir düzine popüler kütüphane sınıflandırıcı parametresini yapılandırarak yapılabileceğine dair yaklaşık 3 yıl önce yediğim yanılsamadan çok uzaktayım. Özellikle işten sonra akşamları (((

ZZ - kötü hedef, kesinlikle katılıyorum.

 
Vladimir Perervenko :

Tahmin edicilerin önemini değerlendirirken, hatırlamak önemlidir...

... tahmin edicilerin önemi, ilk katmandaki ağırlıklarına göre belirlenebilir

elibrarius :

bu fonksiyondaki önemi hesaplamak için algoritma

Bunu iki aşamada yapıyorum, önce örneğin doğrusal olarak ilişkili PCA özellikleriyle ilgileniyorum ve sonra örneğin bir orman veya XGB gibi zengin bir doğrusal olmayan model oluşturuyorum, özelliklerin üzerinden geçiyorum (sıkıştırılmış PCA) ve olmayanları patlatıyorum. hangi hız en az azalır
 

Open R yüklendi, tüm paketleri kurdu, VS 2017, R projesi oluştururken hala kilitleniyor

Python için projeler normalde oluşturulur

Yıkılmış R Studio ve R 3.4, yalnızca Open R bırakarak ve işe yaradı) Görünüşe göre çatışıyorlar

peki, R Studio'da bir anlamı yok, aynı şey oluyor


 
Eğitimden önce girdi değişkenleri ile hedef değişkenler arasında bir korelasyon oluşturmak mantıklı mı? Ve hesaplamaları hızlandırmak ve öğrenme derecesini artırmak için en ilişkisiz olanları kaldırın?
 
elibrarius :
Eğitimden önce girdi değişkenleri ile hedef değişkenler arasında bir korelasyon oluşturmak mantıklı mı? Ve hesaplamaları hızlandırmak ve öğrenme derecesini artırmak için en ilişkisiz olanları kaldırın?
Aslında, ilişkili girdileri kaldırmanız gerekiyor :) Girdileriniz hedefle ilişkiliyse, o zaman bu kâsedir ve Hc gerekli değildir)))
 
Bir şekilde internette ilginç bir programa rastladım. Popüler bir karakteri veya kişiyi zihinsel olarak düşünürsünüz ve bilgisayar size özel sorular sorarak düşüncenizi yüksek bir olasılıkla tahmin edebileceksiniz. Bir sinir ağı bu şekilde çalışmalıdır. Doğru anket. İşin sırrı burada yatıyor.
 
elibrarius :
Eğitimden önce girdi değişkenleri ile hedef değişkenler arasında bir korelasyon oluşturmak mantıklı mı? Ve hesaplamaları hızlandırmak ve öğrenme derecesini artırmak için en ilişkisiz olanları kaldırın?

Değişkenlerin hedefle korelasyonunu kontrol etmek gerekli değildir (olmalıdır), ancak değişkenler arasında korelasyon olmadığını kontrol etmek gerekir - olmamalıdır (çoklu bağlantı).
 
Dmitry :

Değişkenlerin hedefle korelasyonunu kontrol etmek gerekli değildir (olmalıdır), ancak değişkenler arasında korelasyon olmadığını kontrol etmek gerekir - olmamalıdır (çoklu bağlantı).

İlişkili girdilerin kaldırılmasını zaten yaptım, sadece girdileri nasıl iyileştireceğimi düşünüyorum.

Bu nedenle, hedefle bir korelasyon olması gerektiği konusunda sizinle hemfikirim ve bu nedenle, örneğin Kcorr<0.5 veya 0.3 ile hedef girdilerle en ilişkisiz olanı da kaldırmak istiyorum. Bu, kaliteyi çok fazla düşürmeden öğrenme sürecini hızlandırmalıdır. Ancak tüm girdileri kaldırmanız gerekeceği varsayımı var)))

Kullanılan girdilerde (bu göstergelerden rastgele alınanlar), şimdiye kadar hedefle bir korelasyon bulamadım, öğrenme hatası = 0,44, yani. neredeyse bir madeni para. Bak denge düşüyor.