Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 385

 
Maksim Dmitrievski :


Sana verdikleri bu mu? Anladığım kadarıyla bu bir hedge fonu, kaydolursanız ne verecek?

Farklı modellerle sürüyorum, şimdiye kadar yaptığınız gibi 0,5

Eh, 0,5 ve 0,513 farklıdır, elbette ticaret için yeterli değildir, ancak yine de. Kendilerine hedge fon diyorlar, yasal yapıları nasıl bilmiyorum, Amerika'da resmi olarak böyle bir organizasyon yok gibi görünüyor ama yanılıyor da olabilirim. Kaydolursanız, önceki hafta için piyasayı tahmin etmeye katılabileceksiniz, bu tür veri setlerinde birileri bu konuda > 10k$ toplamayı başarır, ancak ben şahsen sadece birkaç yüz dolar kazananları tanıyorum)))
 
Alyoşa :
Eh, 0,5 ve 0,513 farklıdır, elbette ticaret için yeterli değildir, ancak yine de. Kendilerine hedge fon diyorlar, yasal yapıları nasıl bilmiyorum, Amerika'da resmi olarak böyle bir organizasyon yok gibi görünüyor ama yanılıyor da olabilirim. Kaydolursanız, önceki hafta için piyasayı tahmin etmeye katılabileceksiniz, bu tür veri setlerinde birileri bu konuda > 10k$ toplamayı başarır, ancak ben şahsen sadece birkaç yüz dolar kazananları tanıyorum)))


onlar. Bu nasıl olur? bir veri seti atıyorlar, ağı bunun üzerinde eğitmem gerekiyor ve sonra ne olacak? Bence bu bir hile, bir özellik seçimi yapmanız gerekiyor)

https://docs.microsoft.com/en-us/azure/machine-learning/machine-learning-data-science-select-features

Выбор признаков в процессе обработки и анализа данных группы
Выбор признаков в процессе обработки и анализа данных группы
  • 2017.03.24
  • bradsev
  • docs.microsoft.com
В этой статье описаны цели выбора характеристик и приводятся примеры, поясняющие его роль в совершенствовании данных в процессе машинного обучения. Эти примеры взяты из Студии машинного обучения Azure. Реконструирование признаков: этот процесс направлен на создание дополнительных признаков на основе соответствующих существующих необработанных...
 
Maksim Dmitrievski :


onlar. Bu nasıl olur? bir veri seti atıyorlar, ağı bunun üzerinde eğitmem gerekiyor ve sonra ne olacak? Bence bu bir hile, bir özellik seçimi yapmanız gerekiyor)

https://docs.microsoft.com/en-us/azure/machine-learning/machine-learning-data-science-select-features

Kayıt ol oradaki kuralları yarım sayfa oku. Sadece seti indirin, öğrenin, testte çalıştırın ve onlara gönderin, id ve sütun adlarının onlarınki gibi olması için sonucun nasıl görünmesi gerektiğine dair bir örnek var.
 
Alyoşa :
Kayıt ol oradaki kuralları yarım sayfa oku. Sadece seti indirin, öğrenin, testte çalıştırın ve onlara gönderin, id ve sütun adlarının onlarınki gibi olması için sonucun nasıl görünmesi gerektiğine dair bir örnek var.

evet daha sonra deneyeceğim.. kısacası bu veri seti hiçbir şey kaydetmiyor, umutsuz, kalıp yok)
 

numerai'nin kuralları bu yıl birkaç kez değişti.

Eskiden kolay ve güzeldi - modeli tren masasında eğitmek, test tablosundaki hatayı kontrol etmek, onlara tahminler göndermek, onları gizli kontrol tablolarına tahmin etmek, üzerindeki hatayı hesaplamak. Gizli masada en az hata yapan kazanır. Test veri setindeki hatanın gerçekten gizli veri setlerinde ortaya çıkan hatayla çakışması çok iyi ve doğruydu, modelinizi kontrol edebilirsiniz.

Sonra bir şeyi değiştirdiler ve test masasındaki hata artık gizli test masalarındaki hatayla ilişkili değildi. Tepeden tüm liderler gitti; Modellerini gizli kontrol listelerine soktuğu için şanslı olan rastgele insanlar kazanmaya başladı. IMHO numerai'den, bir tür rastgele tortudan ve bir yarışmadan başarısız oluyor.

Sonra tüm yeterli olanların rastgele rekabetlerinden atıldığını gördüler, hatalarını anladılar ve yine bir şeyleri değiştirdiler. Artık tahminler çeşitli kriterlere göre değerlendiriliyor. Hepsinden önemlisi, "benzersiz" kriteri beni çileden çıkarıyor, eğer biri daha önce benzer sonuçlar gönderdiyse, o zaman sizinki intihal olarak reddedilecektir. Onlar. Birkaç kişi bir model oluşturmak için aynı çerçeveyi kullanırsa, erken uyanan ve tahmini gönderen kişi parayı alacaktır.
Modelin doğruluğu, karları hesaplarken artık genellikle işe yaramaz. 0 hatası alabilir, en üstte 1. sırada olabilir ve en üstteki, kendilerinin indirmek için verdikleri test verilerindeki sonucu gösterdiğinden hiçbir şey kazanamazsınız, en üstteki artık gizli kontrol listelerinin sonucunu göstermez.
Rekabetlerinin şu anki yinelemesi IMHO saçmalığı, şeffaflık yok, her şey kafa karıştırıcı. Yine yarışmada bir şeyleri değiştirmelerini bekliyorum, umarım yine yeterli olur.

 
Maksim Dmitrievski :

evet daha sonra deneyeceğim.. kısacası bu veri seti hiçbir şey kaydetmiyor, umutsuz, kalıp yok)
Bu tabloyu deneyin. Modeli yalnızca data_type=="validation" olan satırlarda eğitin. Bu, modeli değerlendirmek ve zirveye çıkmak için kullanılan verilerdir. %100 doğruluk elde ederseniz, ilk sırada yer alırsınız. Bu sadece böyle bir hile için nakit ödül verilmeyecektir.
Dosyalar:
 
Dr. tüccar :
Bu tabloyu deneyin. Modeli yalnızca data_type=="validation" olan satırlarda eğitin. Bu, modeli değerlendirmek ve zirveye çıkmak için kullanılan verilerdir. %100 doğruluk elde ederseniz, ilk sırada yer alırsınız. Bu sadece böyle bir hile için nakit ödül verilmeyecektir.

oh güzel, yarın deneyeceğim.. eğitim için harika)
 
Dr. tüccar :
Bu tabloyu deneyin. Modeli yalnızca data_type=="validation" olan satırlarda eğitin. Bu, modeli değerlendirmek ve zirveye çıkmak için kullanılan verilerdir. %100 doğruluk elde ederseniz, ilk sırada yer alırsınız. Bu sadece böyle bir hile için nakit ödül verilmeyecektir.


tekrar 0,5



 

Eğitim ve değerlendirme veri kümelerindeki sonucun nasıl örtüştüğünü anlamak önemlidir. Orada bölünmüş bir veri kümesi bloğu görüyorum, mantıksal olarak (belki yanılıyorum) orada veriler rastgele iki gruba ayrılıyor, model ilk grupta eğitiliyor ve model sadece ikinci grupta tahmin ediyor ve değerlendiriyor.

Eğitimin devam ettiği aynı verileri tahmin ederseniz sonuç ne olur?
Ardından, eğitimin gitmediği verileri tahmin edin ve her iki durumda da modelin doğruluğunu karşılaştırın.

Eğitilen verilerde %100 ve tahmin edilen verilerde %50 doğrulukla tahmin yapıyorsa, model gereğinden fazla uyuyor, bu da kötü.

 
Dr. tüccar :

Eğitim ve değerlendirme veri kümelerindeki sonucun nasıl örtüştüğünü anlamak önemlidir. Orada bölünmüş bir veri kümesi bloğu görüyorum, mantıksal olarak (belki yanılıyorum) orada veriler rastgele iki gruba ayrılıyor, model ilk grupta eğitiliyor ve model sadece ikinci grupta tahmin ediyor ve değerlendiriyor.

Eğitimin devam ettiği aynı verileri tahmin ederseniz sonuç ne olur?
Ardından, eğitimin gitmediği verileri tahmin edin ve her iki durumda da modelin doğruluğunu karşılaştırın.

Eğitilen verilerde %100 ve tahmin edilen verilerde %50 doğrulukla tahmin yapıyorsa, model gereğinden fazla uyuyor, bu da kötü.


%50 ayrıca kursiyerler için tahminde bulunur, ayırma tarihini kaldırır ve aynı seti test olarak gönderir

Birincisi, buradaki küme çok büyük, ikincisi, özelliklerin doğası hiç bilinmiyor ve vektörler ve orman gibi doğrusal modeller burada açıkça uygun değil, karmaşık bir ağ dışı yapmanız gerekiyor, belki bu nedenidir. Bu stüdyodaki bir nöronu daha karmaşık bir nörona nasıl değiştireceğimi henüz anlamadım, örneğin evrişim yapmaya çalışın

Bundan: https://gallery.cortanaintelligence.com/Experiment/Neural-Network-Convolution-and-pooling-deep-net-2

oku, dene .. Ben hala gridlerde acemiyim .. )