Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2807

 
Aleksey Vyazmikin #:

Değiştirdim ve iyi görünüyordu.

.

 
mytarmailS #:

.

Komut dosyanız örneğimde neredeyse 9 gigabayt RAM tüketiyor, ancak çalışıyor gibi görünüyor, dosyalar kaydediliyor. Örnek bir gigabayttan biraz daha fazla yer kaplarken, orada belleğin nerede tüketildiğini bile bilmiyorum.

 
mytarmailS #:

.

Ayrıca tablodaki başlıkların (sütun adları) tırnak içinde kaydedildiğini öğrendim - bunu nasıl kapatabilirim?

 

Bu kod ne işe yarar? Daha hızlı hale getirmek için, tüm sütunları aynı veri türüne dönüştürmeli (float 32, 16 - gerek yok, daha yavaş olacaktır) ve hızlı diziler aracılığıyla coRR hesaplamalısınız.

eğer kaRma'nın gerçek düzeltmesinden bahsediyorsak

 
Aleksey Vyazmikin #:

Komut dosyanız örneğimde neredeyse 9 gigabayt RAM tüketiyor, ancak çalışıyor gibi görünüyor, dosyalar kaydediliyor. Örnek bir gigabayttan biraz daha fazla yer kaplarken, belleğin nerede kullanıldığını bile bilmiyorum.

Ne olmuş yani?

R kötü muhtemelen)

Aleksey Vyazmikin #:

Ayrıca bir sorun buldum - tablodaki başlıklar (sütun adları) tırnak içinde kaydediliyor - bunu nasıl kapatabilirim?

Sorunu çözmek için ne yaptınız?

 
mytarmailS #:

Ne olmuş yani?

R kötü sanırım.)

Sorunu çözmek için ne yaptınız?

Kötü/iyi çok kritik bir yargıdır.

Paket kodunun bellek açısından verimli olmadığı, ancak hızlı olabileceği veya betiğin tüm tabloyu\seçimi birçok kez kopyaladığı açıktır.

Ve siz ne yaptınız - sorunu buldunuz ve yardım umuduyla bir profesyonele bildirdiniz.

 
Maxim Dmitrievsky #:

Bu kod ne işe yarar? Hız için, tüm sütunları aynı veri türüne dönüştürmeli (float 32, 16 - gerek yok, daha yavaş olacaktır) ve hızlı diziler kullanarak sütun sayısını hesaplamalısınız.

eğer kaRma'nın gerçek düzeltmesinden bahsediyorsak

Anladığım kadarıyla R'de farklı veri tipleri (int, float, vs.) diye bir kavram yok. Ve bellek boyutunu küçültecek ama hızı çok etkilemeyecek. Ekran kartlarında evet bir artış olacaktır.

 
Aleksey Vyazmikin #:

Anladığım kadarıyla R'de farklı veri tipleri (int, float, vb.) kavramı yok. Ve bellek boyutunu küçültecek ama hızı çok etkilemeyecek. Ekran kartlarında evet bir artış olacaktır.

her şey orada. Hızı feci şekilde etkileyecektir. Dataframe'ler en fazla ek yüke sahip en yavaş canavarlardır.

Bu ekran kartlarıyla ilgili değil, bu tür şeylerin ayık bir durumda veri kareleri aracılığıyla sayılmadığını anlamakla ilgili.

 
Aleksey Vyazmikin #:

İpucu: Aralarındaki korelasyonu görmek için 100.000 gözlemden oluşan vektörler kullanmak gerekli midir?

Yüksek korelasyonlu vektörler arıyorum, yani korelasyonu 0,9'dan büyük olan.
 
Rica ederim.