Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2018

 
Maksim Dmitrievski :

Görünüşe göre bir makale istiyorlar.. Yaklaşımın özünü ana hatlarıyla belirtin. ne yapıyorsun hala anlamadım :D

Özelliklerin modelin kendisi tarafından zaman serisinden (varsa) otomatik olarak çıkarılması gerektiği görüşüne bağlıyım. Ve manuel olarak hiçbir şey yapmanız gerekmez. Yeterli artışlar. Soru mimari. Örneğin, NLP'de (sinirsel dil işleme) olduğu gibi, sinir ağının kendisi, kelime dizilerindeki içeriği belirler, yani. zaman serisi okumaları arasındaki bağlantı.

Genetik ağaç ve CatBoost gevşek bir şekilde ilişkilidir, CatBoost hakkında bir makale yazmayı planlıyorum. Tahmini göstergelerin istikrarında eksiklikler bulduğum için yazmayı erteledim ve tüm gücümü bunu düzeltmeye verdim, aynı zamanda yeni tahminciler yaptım. Hafta sonuna kadar hesaplama sürecini başlatmayı planlıyorum (aksi takdirde sunucular boştayken can sıkıcı oluyor) ve bir makale için zaman olacak - ilk bölümü ayın sonuna kadar yazmaya çalışacağım. Makale, CatBoost'ta bir model oluşturmak için mutfağım hakkında olacak.

Genetik ağaçlarda her şey daha karmaşıktır, burada henüz bir makale olmayacak, ancak yaklaşım, tarihte bir veri parçasını istikrarlı bir şekilde sınıflandıran ağaçlardan yaprakları seçmemizdir - aslında, yanıtların % 0,5 -% 3'ü tüm örnekte, böyle daha fazla yaprak var, çok daha iyi, şimdi alım satım için yaklaşık 1000 tane var, ayrıca seçilen yaprakları da filtreleyen yapraklar arıyorum, yani. Doğruluğunu artıran ek eğitim yapıyorum. Yapraklar benzerliklerine göre gruplandırılır (hala yapılması gereken işler vardır), daha sonra cevapları her grup içinde geçmişe göre ağırlıklandırılır ve bir grup yapraktan bir sinyalin üretildiği eşik belirlenir. Buradaki ek bir filtre, tüm yaprakların veya sadece grupların tepkilerine göre oluşturulmuş bir genetik ağaçtır. Bu yaklaşım, benim durumumda "0" hedefinin yaklaşık %65 olduğu 3 hedef olan, dengesiz bir örnekle sınıflandırmanın eksiksizliğini önemli ölçüde artırmanıza olanak tanır.

Yaprakları seçme kriterleri ve bunları birleştirme tekniği üzerinde çalışmak, iyileştirme için büyük bir potansiyele sahiptir, bu da modellerin daha kaliteli olabileceği anlamına gelir.

 
Alexey Vyazmikin :

Peki ya tahminciler?

Bu yüzden, kendiminkini düşünerek berbat ettim)

 
Maksim Dmitrievski :

Özelliklerin modelin kendisi tarafından zaman serisinden (varsa) otomatik olarak çıkarılması gerektiği görüşüne bağlıyım. Ve manuel olarak hiçbir şey yapmanız gerekmez. Yeterli artışlar. Soru mimari. Örneğin, NLP'de (sinirsel dil işleme) olduğu gibi, sinir ağının kendisi, kelime dizilerindeki içeriği belirler, yani. zaman serisi okumaları arasındaki bağlantı.

Mimari konusunda hemfikirim, tamamen farklı bir mimariye ihtiyacımız var, bir dizi ağa ihtiyacımız var:

1. Görüntüleri tanımlama

2. Görüntülerin uzamsal sıralamasının belirlenmesi

3. Uzaya yerleştirilen görüntülerde desen aramak

Şimdi beynimi, tahmin ediciler oluşturarak ağ 1 ve 2'yi çözmek için kullanıyorum ve CatBoost üçüncü görevle başa çıkıyor. Bu ağları bir araya getirmek zor olacak, belki her yönle ayrı ayrı çalışmayı ve sonra bu ağları birleştirmeyi deneyebilir misiniz?

 
Alexey Vyazmikin :

Şimdi beynimi, tahmin ediciler oluşturarak ağ 1 ve 2'yi çözmek için kullanıyorum ve CatBoost üçüncü görevle başa çıkıyor. Bu ağları bir araya getirmek zor olacak, belki her yönle ayrı ayrı çalışmayı ve sonra bu ağları birleştirmeyi deneyebilir misiniz?

Yeni ürünlere dikkat etmelisiniz, sürekli gelişiyorlar. Modern şebekelerin böyle bir görevi vardır, her şeyi aynı anda yapmak

tahmin edicileri manuel olarak aramak, kazma ile bir taş gibi, zaten geçen yüzyıldır. Ve herkesin gördüğü gibi, neredeyse çalışmıyor
 
Maksim Dmitrievski :

Yeni ürünlere dikkat etmelisiniz, sürekli gelişiyorlar. Modern şebekelerin böyle bir görevi vardır, her şeyi aynı anda yapmak

tahmin edicileri manuel olarak aramak, kazma ile bir taş gibi, zaten geçen yüzyıldır. Ve herkesin gördüğü gibi, neredeyse çalışmıyor

Bu, aynı anda olması gereken çok karmaşık bir mimaridir ve mimari ne kadar karmaşıksa, o kadar fazla bilgi işlem gücü gerekir.

Ancak kapasite ihtiyacı varsa (eski sunucular ve GPU'lar var), o zaman fikir için bunları sağlamaya hazırım;)

 
Alexey Vyazmikin :

Bu, aynı anda olması gereken çok karmaşık bir mimaridir ve mimari ne kadar karmaşıksa, o kadar fazla bilgi işlem gücü gerekir.

Ancak kapasite ihtiyacı varsa (eski sunucular ve GPU'lar var), o zaman fikir için bunları sağlamaya hazırım;)

karmaşık değil, sadece anlamalısın

güce hiç ihtiyaç yoktur. Birkaç saat süren bir dizüstü bilgisayarda LSTM var. dakikalar herhangi bir video kartı olmadan. Güç bir efsanedir.

 
Alexey Vyazmikin :

Bu, aynı anda olması gereken çok karmaşık bir mimaridir ve mimari ne kadar karmaşıksa, o kadar fazla bilgi işlem gücü gerekir.

Ancak kapasite ihtiyacı varsa (eski sunucular ve GPU'lar var), o zaman fikir için bunları sağlamaya hazırım;)

Fikirleri kişisel olarak dile getirmeye hazır mısınız?

 
Maksim Dmitrievski :

karmaşık değil, sadece anlamalısın

güce hiç ihtiyaç yoktur. Birkaç saat süren bir dizüstü bilgisayarda LSTM var. dakikalar herhangi bir video kartı olmadan. Güç bir efsanedir.

Karmaşık olmayan mimariler işe yaramaz, kendileri yukarıda söylediler. Basit olanlar için durağanlık gereklidir ... döngüler.

Vay canına, birkaç dakika harika ve ağ topolojisi nedir, kaç katman, nöron?

 
dr.mr.mom :

Fikirleri kişisel olarak dile getirmeye hazır mısınız?

Kişisel olarak mümkündür.

 
Alexey Vyazmikin :

Karmaşık olmayan mimariler işe yaramaz, kendileri yukarıda söylediler. Basit olanlar için durağanlık gereklidir ... döngüler.

Vay canına, birkaç dakika harika ve ağ topolojisi nedir, kaç katman, nöron?

kahretsin .. anlamak açısından zor değil, yapabilirsin

genellikle birkaç katman yeterlidir, Forex'te çok fazla derinlik gerekli değildir

sadece mimari olarak vr için daha gelişmiş ağlar var, aniden lstm. Oradan bir kar olabilir, henüz kontrol etmedim. Boost ve algılayıcılar gibi "klasik" olan her şey BP için hiç uygun değildir.