Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1921

 
mytarmailS :

Anlamadım, elde edilen proebrazovaniya kurallarında transfer etmek mi istiyorsunuz?

Elbette, yoksa daha sonra modeli nasıl uygulayacağım? :)

 
Alexey Vyazmikin :

Elbette, yoksa daha sonra modeli nasıl uygulayacağım? :)

)))))) peki, tüm algoritmaları µl olarak P ile yeniden yazın ve sonra kurallardaki tüm dönüşümleri µl olarak alacaksınız))

 
mytarmailS :

)))))) peki, tüm algoritmaları µl olarak P ile yeniden yazın ve sonra kurallardaki tüm dönüşümleri µl olarak alacaksınız))

Bu tür bir kümelemenin, kümelemeyi tekrarlamadan sonucu yeniden üretebilecek kurallar oluşturmadığını fark ettim. Ve kümeleme çok yavaş. Bu nedenle, kümeleme sonuçlarını bazı kriterlere göre ilgili sınıflara bölecek bir ağaç oluşturarak kurallar oluşturmanız gerekir.

Bir soru olduğu anlamına gelir - csv'de her sınıfa bir satırın aksesuarını nasıl kaydedebilirim?


Garip olmasına rağmen, neden zaten var olan verilerle kümelemeye devam edemiyor ve sınıflardan birinde yeni bir satır tanımlamıyorsunuz, yoksa bu mümkün mü?

 
Kafam karıştı - kümeleme haritasını kaydedip bir şekilde çalışmaya devam edebileceğinizi anlıyorum ama nasıl olduğunu anlamıyorum. Ama R hakkında bir kitap buldum.
Классификация, регрессия и другие алгоритмы Data Mining с использованием R
  • Шитиков В. К., Мастицкий С. Э.
  • ranalytics.github.io
Описана широкая совокупность методов построения статистических моделей классификации и регрессии для откликов, измеренных в альтернативной, категориальной и метрической шкалах. Подробно рассматриваются деревья решений, машины опорных векторов с различными разделяющими поверхностями, нелинейные формы дискриминантного анализа, искусственные...
 
İşte burada bulduğum şey

1. kmeans nesneleri ile nasıl başa çıkılacağı hemen belli değil. Yapılacak en basit şey, onu veri çerçevenize eklemektir:
 k = kmeans(data, centers = 7 )
 data = k$cluster
Artık data.frame'de bir sütun olarak küme numarasına sahipsiniz. Data.frame'i nasıl kaydederseniz kaydedin.

2. Anlam yardımına (kmeans) bakın, Merkezler size ortalamanın merkezinin nerede olduğunu söyleyecektir. Gelen veriler için hangi merkeze en yakın olduğunu hesaplayın. Misal:

data(mtcars)
mt.k <- kmeans(mtcars, centers = 4 )
mt.k$centers

Ve sonuçları belirli bir sütuna nasıl alacağımı anlamıyorum?

k означает сохранение результатов кластеризации для последующего использования
k означает сохранение результатов кластеризации для последующего использования
  • 2015.03.13
  • Soumajit 13 мар '15 в 14:55 2015-03-13 14:55
  • stackru.com
Я изучаю r среду программирования для выполнения кластерного анализа моих тестовых данных. Для тестирования я использую набор данных из одного столбца со следующей диаграммой рассеяния и гистограммой, построенной по отношению к индексу значений. Из данных я чувствую, что значения могут быть разделены на 7 кластеров. И когда я использую Функция...
 

Bu resimde daha önce olduğu gibi aynı tahmin ediciler var, ancak örneklem boyutu farklı ve en önemlisi yeni tahmin ediciler eklendi.

Ve işte nasıl yorumlanacağı - yeniden eğitme eğilimi?

 

kümeleme kullanarak herhangi bir eğriye zarif bir şekilde sığdırın. İletişim

neden böyle kaba bir algoritma neredeyse anında yeni veriler yağmaya başlıyor - asla bilemeyeceğim

Yeniden öğrenme ağacını suçluyorum. Boost kullanmak istiyorum ama hızlı bir şekilde mql'ye aktaramıyorum

 

Phah.. işte cevap

modeli bir süre için eğitirseniz ve ardından verilerdeki akuralara birbiri ardına bakarsanız (yine kümelenmiş), o zaman ağaç için şöyle olacaktır:

TRAIN DATA:   1.0    0.8541666666666666
NEW DATA:   0.1 8323586744639375 Fuuuuuuu

tren bir eğitim veri seti + doğrulamadır

yeni tarih genellikle yeni kümelerdeki yeni verilerdir. Ağaç doğrulama üzerinde iyi çalıştı, ancak yeni başarısız oldu.


Catboost'a aynı verilere bakıyoruz:

TRAIN DATA:  0.9304589707927677   0.8916666666666667
NEW DATA:   0.8528265107212476

ne oluyor be? böyle bir fark?

her şeyi adım adım kontrol edene kadar şakanın ne olduğunu hemen anlamayacaksın

Doğru, ağacı suçladım. Bu kadar basit bir şey yapabileceğini düşündüm, ama hayır.

parsim kesme...

 
Maksim Dmitrievski :

Phah.. işte cevap

modeli bir süre için eğitirseniz ve ardından verilerdeki akuralara birbiri ardına bakarsanız (yine kümelenmiş), o zaman ağaç için şöyle olacaktır:

tren bir eğitim veri seti + doğrulamadır

yeni tarih genellikle yeni kümelerdeki yeni verilerdir. Ağaç doğrulama üzerinde iyi çalıştı, ancak yeni başarısız oldu.


Catboost'a aynı verilere bakıyoruz:

ne oluyor be? böyle bir fark? parsim kesme...

her şeyi adım adım kontrol edene kadar komik olanı hemen durdurmayacaksın

doğru, ağacı suçladım
Şimdi slayt resimlerine geçelim. Bu arada, dağlarda durum nasıl? Neredeydi?
 
Ilnur Khasanov :
Şimdi slayt resimlerine geçelim. Bu arada, dağlarda durum nasıl? Neredeydi?

Altay .. ama sonuncuya gitmedim. an, fazla istenen)

Bu arada, artılarda mısın?