Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3190

 
Aleksey Nikolayev #:

Bunu bir şekilde kârla ilişkilendirin, en azından yaklaşık olarak ve gerçek kârı rastgele kârlardan oluşan bir örneklemle karşılaştırın. Hata olmadığının kontrolü, örneklemdeki ortalama kârın sıfıra eşit olmasıdır. Gerçek kârın örneğe göre pozitifliğinin anlamlılığını kontrol edin - üç sigma kuralı.

Kendi görevlerim çok yoğun olduğu için görevinizin ayrıntılarına girmeye hazır değilim.

İleri sınıflandırma için verilerin ön işlemden geçirilmesinden bahsederken kârın bununla ne ilgisi var?

Aleksey Nikolayev #:

Kuantumlarınız kar elde etmek için mi tasarlandı? Bunun için bir plan var mı? Yaklaşık da olsa hızlı bir örneklem hesaplamak için aşırı basitleştirme yapın ve gerçek sonucun bu örneklemin kuyruğuna düşüp düşmediğini kontrol edin.

Monte Carlo gibi basit ve yaygın olarak bilinen fikirleri irdeleme konusundaki isteksizliğinize eşlik eden, insanların sizin zihniyetinizi irdelemesini talep etme isteğiniz yorucu.

Sanırım bu kadar yeter.

Herkesin kendi zamanını yönetme hakkı vardır.

Ancak, görünüşe göre, tavsiye verdiğiniz soruyu anlamamışsınız.

Yardım etmeye çalıştığınız için teşekkür ederim.

 
Aleksey Vyazmikin #:

Anlıyorum.

Size bir önerim daha var, orman oluşturma sürecini daha yönetilebilir hale getirmek ve her ağaç için seçilen kuantum segmentinin somut bir alt örneğini kök olarak almaya ne dersiniz?

Derinlik 2-3 bölme olmalıdır, böylece yaprak bazında sınıflandırılabilir sınıf örnekleri %1'den az olmayacaktır.

Modelin daha istikrarlı olacağını düşünüyorum.

Yani, 10 kuanta/bölünme seçerseniz, bu bölünmelerden örnekler üzerinde 10 ağaç eğitir misiniz? Yapması basit gibi görünüyor.
OOS üzerindeki kararlılık hakkında - deney gösterecektir. Veri penceresinin boyutunu değiştirirken (2 ay ve 4) ve hatta %2 kaydırırken (Cumartesi yerine Salı günü eğitim) kararlılığım ihlal edildi. Ağaçlar farklı çıkıyor.

Aleksey Vyazmikin #:

Gifleri yayınladığım örnekle bir deney yaptım, örnekte zaten %47 birim var, veriler tabloda özetlendi.

...
bu kuantum segmentlerinin kalitesinin (kullanışlılığının) orijinallerinden 10 kat daha kötü (daha az) olduğu ortaya çıktı.

Böyle bir bozulma hakkında (zaman içinde), fxsaber ile iletişim kurduğumda, algoritması tarafından karıştırıldığını varsaydım. Onun verilerinde bu kadar güçlü bir fark yok. Görünüşe göre, işaretlemede arka arkaya tüm çubuklara (veya arka arkaya duran satırlara) sahip olmadığı, ancak büyük boşluklara sahip olduğu için. Çubuklarınız yakınsa, geçmişleri ve gelecekleri çok benzerdir, yani sınıf 1'in 20 örneği arka arkaya olabilir. Bunları rastgele hale getirerek ortalamalarını 0101010.... yaparsınız ve 20 "1" serisinin tamamını 20 "0" olarak değiştirmelisiniz. Çünkü bunlar birbirine yakındır ve tek bir örnek olarak sayılabilir. Sizin için öyle değilse bile benim için öyle (tüm çubukları arka arkaya değerlendiriyorum, bu fikir bu yüzden geldi).

Genel olarak, 10 kat gibi güçlü bir farkla 10000 test yapmamanın mümkün olduğunu düşünüyorum. İlk 10 testteki çok net fark (hepsi daha kötü), başka bir 10000'in sonucu orijinal ile eşitliğe yükselteceğini varsaymak için. Eğer 3 kötü, 3 iyi, 4 kabaca eşitse, o zaman evet - istatistikleri biriktirmeye devam edin.

Veriler serileştirilmişse, sorun, tarihin bir yerinde 20 1'lik bir serinin benzer geçmişe sahip 20 0'lık bir seri bulacak olmasıdır. Burada pazar rastgeleleştirmesi söz konusudur. 111111111'u 010101010 yapmak değil.

UPD Bu yüzden piyasa verileri için 01010101 şeklindeki Monte Carlo'nun piyasa verileri için çalışmayacağını düşünüyorum (eğer seri halinde giderse). Bu, bir dikdörtgeni ve bir kareyi eşit karelere bölmek ve sonra karenin hangi birincil şekle ait olduğunu belirlemeye çalışmak gibi bir şey)).

 
Aleksey Vyazmikin #:

Anlaşılır olması için katı diziyi sadece bir örnek olarak yazdım. Ve bu sorunun çözümünün modelin istikrarını artırabileceğini yazdım. Ancak çözüm farklı olabilir.

Yukarıda bahsedilen sorunu çözmeden bile - doğru kuantum tablosunun seçilmesi öğrenmeyi geliştirir, ki bu benim tarafımdan düzinelerce örnek üzerinde test edilmiştir.

Daha sonra eğitim için ön işlemeyi nasıl hızlı bir şekilde yapabileceğinizi, örneği tutarsız verilerden nasıl temizleyebileceğinizi gösterdim. Bu yöntemle yeni veriler üzerinde bile karlı bir model elde edebileceğinizi giflerde görebilirsiniz.

Sonuçta bu yaklaşım işe yarıyor ve benim amacım da bunu geliştirmek.

Bu nedenle, olmadığını söylemek gerçekliği inkar etmektir.

Fiyatın, doğası en azından kısmen sökülemeyecek olan saf SB olduğuna inanmıyorum. Eğer saf SB ise, o zaman tüm konu bir hatadır.

Bir makineciler konferansı yapmamız gerektiğine inanıyorum. Açık büfe ve BAE'de bir yerde. Ve orada önce resmi sonra gayri resmi bir ortamda her şeyi tartışabiliriz. Aksi takdirde bunu forum aracılığıyla yapmak sakıncalı olur.

Program şöyle olurdu: bir gün konferans, bir gün herkes içer, ertesi gün herkes kavga eder, birbirinin göğsünü çekiştirir, sonra tekrar konferans ve böyle devam eder. Anında :)

Sponsor ve ana konuşmacı Saber olur, sonra Alexei Nikolaev, sonra da diğer herkes :)
 
Aleksey Vyazmikin #:

Daha ileri sınıflandırma için verilerin ön işlemden geçirilmesiyle kârın ne ilgisi var?

Giderek dikleşen bilançolarla ilgili sayısız gif'inizin amacı neydi? Belki de sorunuzun cevabını anlamadınız?

 
Maxim Dmitrievsky #:
Bence bir makine konferansı yapmalıyız. Açık büfe olmalı ve BAE'de bir yerde yapılmalı. Ve orada her şeyi tartışmak için resmi ve daha sonra gayri resmi bir atmosferde. Aksi takdirde bunu forum aracılığıyla yapmak sakıncalı olur.

Program şöyle olurdu: bir gün konferans, bir gün herkes içer, ertesi gün herkes kavga eder, birbirinin göğsünü çeker, sonra tekrar konferans ve bu böyle devam ederdi. Anında :)

Sponsor ve ana konuşmacı Saber, sonra Alexei Nikolaev, sonra da diğer herkes olacaktır :)

Saber'in parasının stratejilerine aşina olması fikri harika ve iyi düşünülmüş görünüyor. Neyin yanlış gidebileceğini bile bilmiyorum 🤔

 
Aleksey Nikolayev #:

Saber'in parasının stratejilerine aşina olması fikri harika ve iyi düşünülmüş görünüyor. Neyin yanlış gidebileceğini bile bilmiyorum 🤔

😀😀 eklemeyi unuttum - en başarılı olarak ana sponsor. Ama herkesin katkıda bulunması gerekiyor.
Bence konuşmasına sponsor olacak insanlar bulmak mümkün.

Konferansın amacı muhtemelen belirli stratejileri tartışmak değil, genel yaklaşımları, felsefeyi, araçları vb. tartışmaktır.
 
Forester #:

Yani, 10 kuanta/segment seçerseniz, bu segmentlerden örnekler kullanarak 10 ağaç eğitir misiniz? Yapması basit gibi görünüyor.
OOS üzerindeki kararlılık hakkında - deney gösterecektir. Veri penceresinin boyutunu değiştirirken (2 ay ve 4) ve hatta %2 kaydırırken (Cumartesi yerine Salı günü eğitim) kararlılığım ihlal edildi. Ağaçlar farklı çıkıyor.

Evet, hepsi böyle - yaklaşım elbette daha karmaşık hale getirilebilir, ancak o zaman isterseniz.

Şu anda, doğru hatırlıyorsam, ağaçtaki tahminci, bölmek için en iyi yeri aramadan aralığın sadece yarısına ulaşıyor?

Fikrin başarısına gelince - kesinlikle katılıyorum, ancak su da yatan bir taşın altından akmaz.

Ormancı #:

Fxsaber ile algoritmasıyla karıştırma hakkında konuştuğumda böyle bir bozulmayı (zaman zaman) düşündüm. Onun verilerinde bu kadar güçlü bir fark yok. Görünüşe göre, işaretlemede arka arkaya tüm çubuklara (veya arka arkaya duran satırlara) sahip olmadığı, ancak büyük boşluklara sahip olduğu için. Çubuklarınız yakınsa, geçmişleri ve gelecekleri çok benzerdir, yani sınıf 1'in 20 örneği arka arkaya olabilir. Bunları rastgele hale getirerek ortalamalarını 0101010.... yaparsınız ve 20 "1" serisinin tamamını 20 "0" olarak değiştirmelisiniz. Çünkü bunlar birbirine yakındır ve tek bir örnek olarak sayılabilir. Sizin için öyle değilse bile benim için öyle (tüm çubukları arka arkaya değerlendiriyorum, bu yüzden bu fikir aklıma geldi).


Genel olarak, 10 kat gibi güçlü bir farkla 10000 test yapmamanın mümkün olduğunu düşünüyorum. İlk 10 testteki (hepsi daha kötü) çok bariz fark, başka bir 10000'in sonucu orijinal ile eşitliğe yükselteceğini varsaymak için. Eğer 3 kötü, 3 iyi, 4 kabaca eşitse, o zaman evet - istatistikleri biriktirmeye devam edin.

Veriler serileştirilmişse, sorun, tarihin bir yerinde 20 1'lik bir serinin benzer geçmişe sahip 20 0'lık bir seri bulacak olmasıdır. Burada pazar rastgeleleştirmesi söz konusudur. 111111111'u 010101010 yapmak değil.

UPD Bu yüzden piyasa verileri için 01010101 şeklindeki Monte Carlo'nun piyasa verileri için çalışmayacağını düşünüyorum (eğer seri halinde giderse). Bu, bir dikdörtgeni ve bir kareyi eşit karelere bölmek ve sonra karenin hangi ana şekle ait olduğunu belirlemeye çalışmak gibi bir şey)).

Ne yazık ki, verileri işlerken bir hata yaptım (bu testler için komut dosyasını hızlı bir şekilde yeniden tasarlıyordum ve bir nüans dikkate alınmadı), sonuç olarak tablo şu şekilde

Sonuç olarak, veriler rastgele kuantum tablolarının aralıklarına düşebilir ve mevcut kararlılık testini geçebilir. Varsayılan ayarlar/kriterler kullanıldı - şimdi bunları sıkılaştırmaya çalışacağım ve sonucu göreceğim.

Bununla birlikte, daha önce kuantum kesimlerinin yaklaşık %30'unun diğer iki örnek üzerinde etkinliklerini gösterdiğini yazmıştım, bu nedenle sonuç genellikle beklenen bir şeydi. Her şeyi iki kez kontrol etmeme neden olan sadece garipliğiydi. Seçim sonucunun nasıl iyileştirileceği bir zorluktur.

Bununla birlikte, nicelleştirmenin amacı olasılık kayması olan bir grubu seçmektir. Grubun kendisinin yeni verilerle başka bir hedefe kayacağı gerçeğine rağmen, bölünme yoluyla içinde sabit bir yaprak bulunması mümkündür.

Deneyi yaptığım örneklemde - sanırım günde ortalama 1 sinyal var, bu yüzden çubuklar birbirinden çok uzak.

Yukarıda önerdiğim deneyin sonuçlarına bakmanın daha ilginç olacağını düşünüyorum - rastgele oluşturulan hedef yanıtların örneklenen kuantum segmentlerine ne sıklıkta düştüğünü göstermelidir. Aleksey Nikolayev 'in soyutlamasında önerdiği gibi, sadece bu sabit aralıklı zaten "sandıklar" olacaktır.

Örneğinizi gönderebilirsiniz, ben kuantum segmentlerini seçeceğim ve bu veriler üzerinde değiştirilmiş orman yaratmayı deneyebilirsiniz veya size örneğimi verebilirim.

 
Maxim Dmitrievsky #:
Bence bir makine konferansı yapmalıyız. Açık büfe olmalı ve BAE'de bir yerde yapılmalı. Ve orada her şeyi tartışmak için resmi ve daha sonra gayri resmi bir atmosferde. Aksi takdirde bunu forum aracılığıyla yapmak sakıncalı olur.

Program şöyle olurdu: bir gün konferans, bir gün herkes içer, ertesi gün herkes kavga eder, birbirinin göğsünü çeker, sonra tekrar konferans ve bu böyle devam ederdi. Anında :)

Sponsor ve ana konuşmacı Saber, sonra Alexei Nikolaev, sonra da diğer herkes olacaktır :)

Fourchette - kulağa fena gelmiyor, ancak şiddet ihtiyacı - kendim için fark etmedim. Anlaşılmadığım için üzülüyorum, ancak bu kendi içinde bu kadar güçlü bir saldırganlığa neden olmuyor.

 
Aleksey Vyazmikin #:

Furshet - kulağa fena gelmiyor, ama şiddet ihtiyacı - şey, ben bunu fark etmedim. Anlaşılmamak beni üzüyor, ancak bu kendi içinde bu kadar güçlü bir saldırganlığa neden olmuyor.

Şiddet sadece karşılıklı rızaya dayanır ve tartışmalar sona erdiğinde tüm medeni insanlar
 
Maxim Dmitrievsky #:
Bence bir makine konferansı yapmalıyız. Açık büfe olmalı ve BAE'de bir yerde yapılmalı. Ve orada her şeyi tartışmak için önce resmi sonra gayri resmi bir ortam olmalı. Aksi takdirde bunu forum aracılığıyla yapmak sakıncalı olur.
Program şöyle olurdu: bir gün konferans, bir gün herkes içer, ertesi gün herkes kavga eder, birbirinin göğsünü çeker, sonra tekrar konferans ve böyle devam eder. Anında :)
Sponsor ve ana konuşmacı Saber, sonra Alexei Nikolaev, sonra da diğer herkes olacaktır :)

Makine öğrenimi hakkında okumak istedim ve burada mizahçılar becerilerini geliştiriyorlar.

Mizah şakalarını ve konuyla ilgili olmayan diğer şeyleri başka bir yerde görmek isterim.


Şimdi konuya dönelim.

Piyasanın rastgele olduğunu düşündüğünüzü yazmışsınız, bu ifadenin temeli nedir?

Piyasa fiyat hareketlerinin rastlantısallığını kanıtlayacak sağlam dayanaklarınız var mı?