Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3083

 
Maxim Dmitrievsky #:

Önemsiz parametreleri fonksiyonlara dönüştürmek için, makalede olduğu gibi RF'nin veya herhangi bir temel algoritmanın çıktı değerlerini kullanabilirsiniz. Tamamen bilgisiz olanlar için: seçilen parametrelerin değerlerini fonksiyon değerleriyle değiştirin. Ardından doğrusal regresyon (veya başka bir algoritma), tritment etkisinin değerlendirildiği meta lerner olacaktır. Tüm bunların neden ve nasıl çalıştığı - matematiği öğrenin.

Bunu anlamak için kafanızla düşünmeye başlamanız yeterli. Ama Sanych yine saçmalamaya başlayacak, çünkü sadece düşünmeden bir şeyler söylemek istiyor. Sanych, anlayış eksikliğiniz o kadar büyük ki, RF parametrelerini bir tür kanıt olarak gösteriyorsunuz ki bu kesinlikle inanılmaz. Size 3 kez yazdım - RF'yi unutun. Son kez söylüyorum: konuyu çalışın, sonra atıp tutun. Aksi takdirde aynı cahil insanlar size körü körüne inanır.

Yazılarıma her şeyi bilen biri edasıyla yanıt vermeyin (ki bu can sıkıcıdır), çünkü hiçbir şey bilmiyorsunuz ve bu bir ptuschnik'in saçmalıkları gibi görünüyor.

Tüm kaynak referansları makalede verilmiştir. Kör kedi yavruları gibi her kelimede dürtülmeye ihtiyacınız var mı? Yoksa sonuçta yetişkin misiniz?

Ben makaleyi tartışıyordum, cebinizdeki rakamı değil, ki atıfta bulunduğunuz literatür listesine göre çok fazla olduğuna inanıyorum.

Gönderdiğiniz makaleyle ilgili tartışmaya devam etmek için böyle yakıcı bir arzunuz varsa, devam etmeye hazırım, ancak: yalnızca makale ve yalnızca benim argümanlarım ve sizin tarafınızdan yasaklayıcı kabalık içermeyen bir biçimde.


Makalede RF'den bahsediliyordu. Uydurma hatasının yanı sıra uydurmanın kendisini de hesaplayacak başka bir fonksiyon görmedim. Bu nedenle, lütfen makalenin metnini alıp bu fikri çürüten belirli bir alıntı sunacak kadar nazik olun.

 
Lilita Bogachkova #:

Makine öğrenimi uzmanlarına bir sorum var. Eğitim için bir karakterin verilerini, doğrulama için başka bir karakterin verilerini ve test için üçüncü bir karakterin verilerini kullanırsam, bu iyi bir uygulama mıdır?

Ayrıca, test verilerinden şu sonuçları alıyorum: yeşil hücreler çok iyi, sarı hücreler iyi, kırmızı hücreler ortalama.


Ayrıca modeli eğitmek için verileri değiştirmekle ilgili bir soru. Modelin ekstremumları bulmakta zorlandığını fark ettim, benim durumumda 60'ın üzerindeki ve 40'ın altındaki değerler.
Bu yüzden eğitim verilerinde 60'ın üzerindeki ve 40'ın altındaki değerleri buluyorum, bunları modele beslemeden önce eğitim verilerine yeniden ekliyorum, bu yüzden soru şu: ekstremumlar hakkında bilgi içeren eğitim verilerini artırarak modelin doğruluğunu artırabilir miyim?

Eğer enstrümanlar arasındaki farkı söyleyemiyorsanız, söyleyebilirsiniz. Ya da aradaki farkı çıkararak onları zorla bu duruma getirebilirsiniz.

İkinci soruda, hayır muhtemelen yapamazsınız. Diğer yerlerde daha yanlış olacaktır, çünkü gradyanı kendine doğru çekecektir. Ama hepsi bireyseldir.
 
Maxim Dmitrievsky #:
Enstrümanlar arasındaki farkı söyleyemiyorsanız, söyleyebilirsiniz. Ya da farkı çıkararak onları bu duruma zorlayabilirsiniz.

İkinci soruda, hayır, muhtemelen yapamazsınız. Diğer yerlerde daha yanlış olacaktır, çünkü eğimi kendine doğru çekecektir.

Şu anda öyle görünüyor.


Ancak, bu fikirden vazgeçmeden önce, farklı enstrümanları (sembolleri) bir araya getirerek ve ardından yalnızca uç değerleri içeren veriler oluşturarak modeli eğitmekten ne elde edeceğimi göreceğim.

 
Lilita Bogachkova #:

Bu noktada, gerçekten böyle görünüyor.


Ancak, bu fikirden vazgeçmeden önce, farklı enstrümanları (karakterleri) bir araya getirerek ve ardından yalnızca uç değerleri içeren veriler oluşturarak modeli eğitmekten ne elde edeceğimi göreceğim.

Bir dene bakalım. Bir ve birden fazla arasında herhangi bir fark görmedim.
 
Maxim Dmitrievsky #:
Enstrümanlar arasındaki farkı söyleyemiyorsanız, söyleyebilirsiniz. Ya da farkı çıkararak onları bu duruma zorlayın.

Günümüzde eğitim, doğrulama ve test için farklı sembollerle pratik yapmak, tahmin doğruluğunu artırmanıza olanak tanır. Bu uygulama için bir artı olarak, verilerin boyutunda bir sınırlama olmadığını, doğrulama veya eğitim için istediğiniz veya ihtiyaç duyduğunuz kadar verebileceğinizi söyleyebilirim.

Üçüncü bir sembolle test yaparken, modelin belirli bir sembole özgü dar piyasa olaylarına takılmak yerine evrensel kalıpları bulup bulamadığını hemen görebilirsiniz.

 
Lilita Bogachkova #:

Günümüzde eğitim, doğrulama ve test için farklı sembollerle yapılan uygulama, tahminin doğruluğunu artırmanıza olanak tanır. Bu uygulama için bir artı olarak, veri boyutunda bir sınırlama olmadığını, doğrulama veya eğitim için istediğiniz veya ihtiyaç duyduğunuz kadar verebileceğinizi söyleyebilirim.

Üçüncü sembolle test yaparken, modelin dar piyasa olayları tarafından yönlendirilmek yerine evrensel kalıplar bulup bulamadığını hemen görebilirsiniz.

Eğer verilerde büyük bir sapma yoksa. Farklı semboller farklı işaret dağılımlarına sahiptir ve model bunlar üzerinde sürüklenebilir veya tek bir pozisyonda kalabilir. Eğer işaretler en azından sembolden sembole özelliklerini değiştirmiyorsa, bu mümkündür.
 
Arka arkaya 4 kereden fazla tekrar eden değerler gibi arka arkaya birden çok kez tekrar eden değerleri kaldırarak eğitim verilerini düzeltme konusundaki görüşleri duymak istiyorum.
seq = remove_repeating_values(seq, 5)
Anladığım kadarıyla, bu tür eşit değerler düz piyasa durumunda birkaç onluğa ulaşma eğilimindedir. Bu da bence modelin eğitimini engelliyor.
 
Lilita Bogachkova #:
Arka arkaya 4 kereden fazla tekrar eden değerler gibi arka arkaya birden çok kez tekrar eden değerleri kaldırarak eğitim verilerini düzeltme konusundaki görüşleri duymak istiyorum.
Anladığım kadarıyla, bu tür eşit değerler düz piyasa durumunda birkaç onluğa ulaşma eğilimindedir. Bu da bence model eğitimini engelliyor.
Genellikle modeller değerleri arka arkaya değil rastgele çeker. Ve örneği karıştırmak iyi bir kararın işaretidir :) lstm atılabilir ve örnekler karıştırılabilir.
 
Maxim Dmitrievsky #:
Genellikle modeller değerleri rastgele sıralar, arka arkaya değil.

Evet,

X_train, X_val, y_train, y_val = train_test_split(inputs_unique, outputs_unique, test_size=test_size_value,
                                                    random_state=random_state_value)

ancak aynı değerlere sahip çok sayıda veri, verilerin genel kalitesini sorgulamama neden oluyor.
Örnek: seq = ([5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5]) = [5,5,5,5,5,5,5,5,5][5]; [5,5,5,5,5,5,5,5][5]; [5,5,5,5,5,5][5] ....
Modeli bu tür eğitim verileriyle beslemenin anlamını göremiyorum;

Bu yüzden hala benzersiz olmayan tüm verileri eliyorum.

inputs_unique, indices = np.unique(inputs, axis=0, return_index=True)
outputs_unique = outputs[indices]

Yanılıyor olabilirim, ancak modeli aşağıdaki eğitim verileriyle de beslemek bana yanlış geliyor:

[1,2,3,4,5] [5];

[1,2,3,4,5] [6];

[1,2,3,4,5] [7];

[1,2,3,4,5] [8];

...

 

Herkese merhaba. Bu sitedeki sinir ağları hakkında geniş bir makale serisinden alınan Uzman Danışmanları eğitmeye çalışıyorum. Eğitilebilir olmadıkları izlenimini edindim. Makalelerin altında yazara sorular sormaya çalıştım, ancak maalesef pratik olarak cevap vermiyor...(

Buna göre, forum üyelerine bir soru - lütfen bana bir sinir ağını ne kadar eğitmem gerektiğini söyleyin, böylece bazı (rastgele olmayan) sonuçlar vermeye başlar?

Makale 27'den sonuncusuna kadar tüm EA'ları denedim - sonuç aynı - rastgele. Yazar tarafından belirtildiği gibi 300 ila 1000 eğitim dönemi arasında gittim. Uzman Danışman sadece yinelemelerle ise, 100 000 ila 20 000 000 yineleme ve benzeri 2-3 yaklaşım yaptım, yine de rastgele.

Ne kadar eğitim verilmelidir? Yeterli bir eğitim örneğinin boyutu nedir (önceden oluşturulmuşsa)?

Not: Google'da sinir ağları hakkında basit bilgiler okuyun, genel olarak sinir ağlarına aşinadır. Hepsi yaklaşık 100-200 epoch yazıyor ve zaten bir sonuç olmalı (resimler, şekiller, sınıflandırmalar üzerinde).