Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1266

 
Andrey Khatimliansky :

Bu dalda - bir ziyarette. Tamamen paylaşın makale geldi

Numerai, "Bütün ülkelerin proleterleri birleşin!" sloganına kandı. Karl Marx'tan, Geoffrey Hinton'dan MO yorumunda :)
 
Maksim Dmitrievski :

Ve bu arada, bu tam olarak

forumdaki moronların sayısı göz önüne alındığında (en sevdiğiniz mudo sihirbazı dahil ..), bu konuyu artık desteklemeyi gerekli görmüyorum çünkü özellikle kendim için herhangi bir fayda görmedim

Maksim, yanılıyorsun! Sizin için bir fayda var, görevlerin formülasyonu ve sunumunda bir fayda var. Ancak, ikna olmadım.

 
Yuri Asaulenko :

Maksim, yanılıyorsun! Sizin için bir fayda var, görevlerin formülasyonu ve sunumunda bir fayda var. Ancak, ikna olmadım.

Klinik dolbe'nin burada yaşadığını görüyorsunuz, bunlar forum maskeleri değil, gerçek klinik vakalar, onlara bir kelime veriyorsunuz, her mesajla size iki tane veriyorlar.

 
elibrarius :

Alglib-a ormanlarında anlaşılmaz bir kod buldum. dataanalysis.mqh'den çapraz etropi hesaplama fonksiyonunun tam kodu:

//+------------------------------------------------------------------+
//| Average cross-entropy (in bits per element) on the test set      |
//| INPUT PARAMETERS:                                                |
//|     DF      -   decision forest model                            |
//|     XY      -   test set                                         |
//|     NPoints -   test set size                                    |
//| RESULT:                                                          |
//|     CrossEntropy/(NPoints*LN(2)).                                |
//|     Zero if model solves regression task.                        |
//+------------------------------------------------------------------+
static double CDForest::DFAvgCE(CDecisionForest &df,CMatrixDouble &xy,
                                const int npoints)
  {
//--- create variables
   double result=0;
   int    i=0;
   int    j=0;
   int    k=0;
   int    tmpi=0;
   int    i_=0;
//--- creating arrays
   double x[];
   double y[];
//--- allocation
   ArrayResizeAL(x,df.m_nvars);
   ArrayResizeAL(y,df.m_nclasses);
//--- initialization
   result=0;
   for(i=0;i<=npoints-1;i++)
     {
      for(i_=0;i_<=df.m_nvars-1;i_++)
         x[i_]=xy[i][i_];
      //--- function call
      DFProcess(df,x,y);
      //--- check
      if(df.m_nclasses>1)
        {
         //--- classification-specific code
         k=(int)MathRound(xy[i][df.m_nvars]);
         tmpi=0;
         for(j=1;j<=df.m_nclasses-1;j++)
           {
            //--- check
            if(y[j]>(double)(y[tmpi]))
               tmpi=j;
           }

         //--- check
         if(y[k]!=0.0)
            result=result-MathLog(y[k]);
         else
            result=result-MathLog(CMath::m_minrealnumber);
        }
     }
//--- return result
   return(result/npoints);
  }

Kırmızıyla vurgulanan kod parçası, kodda aşağıda hiçbir şekilde kullanılmayan bir şeyi ( tmpi ) dikkate alır. O zaman neden dahil?
Ya bir şey tamamlanmadı ya da kod tamamen temizlenmedi.
Genel olarak, bu f-ii'yi anlamaya başladım çünkü 1 ağacı keşfetmek istedim. Ve ormandaki ağaç sayısını = 1 olarak belirledikten sonra, tüm hataların 0 ile 1 arasında olduğunu ve bunun 100'den 300+'e kadar olduğunu gördüm.
Birisi çapraz entropiyi anlıyor - kod genellikle doğru mu, yoksa bitmemiş bir şey mi kaldı?

Wikipedia'ya göre olmalı



Genel olarak değer, sonsuza kadar, olabilir mantık hesaplanırken, doğru sınıf için sıfır olasılık tahmin edilirse, çünkü onun dışındaki diğer tüm sınıflar formüle sıfır katsayılı olarak dahil edilir ve orada bu aksaklığı bir şekilde çözmeye çalıştılar - tmpi'de buldukları döngüde Bu örnekte en yüksek olasılık değerine sahip sınıf, belki formüle eklemek istediler ama görünüşe göre üzerinde düşünmediler :)
 
Ivan Negreshniy :
Genel olarak değer, sonsuza kadar, olabilir mantık hesaplanırken, doğru sınıf için sıfır olasılık tahmin edilirse, çünkü onun dışındaki diğer tüm sınıflar formüle sıfır katsayılı olarak dahil edilir ve orada bu aksaklığı bir şekilde çözmeye çalıştılar - tmpi'de buldukları döngüde Bu örnekte en yüksek olasılık değerine sahip sınıf, belki formüle eklemek istediler ama görünüşe göre üzerinde düşünmediler :)
tmpi yalnızca 5 hatadan 1'inde kullanılır. Görünüşe göre diğer işlevler için boşluk olarak kullanılmış, ancak diğerleri onu kaldırmayı unutmuş.
1. tmpi'de toplam kullanılır ve kullanılır, 2.'de vardır ancak kullanılmaz.
Genel olarak, bu işi etkilemez.
 
elibrarius :
tmpi yalnızca 5 hatadan 1'inde kullanılır. Görünüşe göre diğer işlevler için boşluk olarak kullanılmış, ancak diğerleri onu kaldırmayı unutmuş.
1. tmpi'de toplam kullanılır ve kullanılır, 2.'de vardır ancak kullanılmaz.
Genel olarak, bu işi etkilemez.

Temel olarak, iyi bir hata hesaplama formülünün, yalnızca bir doğru olanı değil, tüm sınıflar üzerindeki olasılık dağılımını dikkate alabileceğini kastediyorum.

Aynı zamanda, örneklerden birinde doğru sınıfın olasılığı sıfırsa, o zaman her şey sonsuza uçar.

Muhtemelen bu yüzden ikinci dereceden hata regresyonunu tercih ediyorum :)

 
Ivan Negreshniy :
Temel olarak, iyi bir hata hesaplama formülünün, yalnızca bir doğru olanı değil, tüm sınıflar üzerindeki olasılık dağılımını dikkate alabileceğini kastediyorum.
Pekala, 5 tane f-inci hata var. Bu biraz garip, ancak diğer 4'ü 0'dan 1'e beklendiği gibi değişiyor. Yani bir seçim var
 
Şimdi, yatırımcılar tarafından onarılan Kesha (SanSanych'in torunu) ve Alyosha'nın şubeyi yönetmesine izin verin. Adil olacak.
 
Alexander_K2 :
Şimdi, yatırımcılar tarafından onarılan Kesha (SanSanych'in torunu) ve Alyosha'nın şubeyi yönetmesine izin verin. Adil olacak.

Bu konuyu bırakıp, diğer ilgili konularla daha yeterli, yeni bir konuya başlamak daha mantıklı.

Bu arada, fiyatlarda normal bir dağılım buldum. "Yanlış" veri işlemeden kaynaklanan tüm anormalliklerin bizim tarafımızdan getirildiğini TIP'de zaten yazdım.)

Bu günlerden biri veya daha önce Python konusunu düzenleyeceğim.

 
Yuri Asaulenko :

Bu konuyu bırakıp, diğer ilgili konularla daha yeterli, yeni bir konuya başlamak daha mantıklı.

Bu arada, fiyatlarda normal bir dağılım buldum. "Yanlış" veri işlemeden kaynaklanan tüm anormalliklerin bizim tarafımızdan getirildiğini TIP'de zaten yazdım.)

Bu günlerden biri veya daha önce Python konusunu düzenleyeceğim.

Ne yazık ki, forumda Matematik, Kuzey Rüzgarı ve Durdurma düzeyindeki insan eksikliği nedeniyle, tüm bu konuların geleceği yok. BENİM NACİZANE FİKRİME GÖRE.