Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2368

 
Vladimir Perervenko :
Yanlışlıkla benim için şaşırtıcı bir ifadeye sahip bir makale okudum. Tahminler, yanıtlar ve artıklar: Normal olarak dağıtılması gereken gerçekten ne var?

Doğrusal regresyonla ilgili pasaj, yazarı teoriye / matstat'a aşina olmayan bir kişi olarak ele verir. Standart LR varsayımları, girdilerin deterministik olduğu (örneğin zamanlar) ve çıktı dağılımlarının gürültü dağılımına bağlı olduğu (ve her çıktının girdiye bağlı olarak ve diğerlerinden farklı olarak kendi beklenen değerine sahip olacağı) şeklindedir.

Başka bir seçenek - eğer girdiler ve çıktılar bazı ortak dağılımlardan alınırsa, o zaman burada doğrusal regresyon modelinin uygulanabilirliği için koşul daha da zordur - JOINT (en azından iki boyutlu) dağılımı normal olmalıdır. Bu varsayım olmadan, ÇUŞ'lar unutulabilir.

 
Vladimir Perervenko :
Yanlışlıkla benim için şaşırtıcı bir ifadeye sahip bir makale okudum. Tahminler, yanıtlar ve artıklar: Normal olarak dağıtılması gereken gerçekten ne var?

Birkaç alıntı:

"Birçok bilim insanı, istatistiksel analizdeki değişkenlerin normalliği veya anormalliği konusunda endişe duymaktadır. Aşağıdaki ve benzeri görüşler sıklıkla ifade edilmekte, yayınlanmakta veya öğretilmektedir:

  • "   İstatistikleri tutmak istiyorsanız, her şey normal olarak dağıtılmalıdır.   ".
  • "   Verilerimizi normallik varsayımına uyacak şekilde normalleştirdik.   ".
  • "   Verilerimizi çok çarpık olduğu için günlüğe dönüştürdük.   ".
  • "   Modeli yerleştirdikten sonra artıkların homoskedastisitesini test ettik.   ".
  • "   Verilerimiz normallik varsayımına uymadığı için parametrik olmayan bir test kullandık.   ".

Veri normalleştirme, normal dağıtım ve bir sürü ekstra için ağların gereksinimleri nedeniyle. ayarlar - ağaç benzeri sistemlere geçildi. Verileri olduğu gibi hatırlayacaklar.

Ve AI'yı (sıradan insanlar için makalelerden birinde) sinir ağlarına veya ağaçlara dayalı veritabanları olarak adlandırdıktan sonra, onları tam olarak 1 hücrede (sayfa) çok benzer birkaç satırı depolayabilen veritabanları olarak ele almaya başladım, yani . aynı zamanda genelleme yapmak. Ağacı son örneğe bölerken, hücreler genelleme yapılmadan sadece aynı satırları içerecektir - yani. temiz bir veritabanı elde edersiniz. Hala genelleme yapmamız gerekiyor, bu yüzden yaprakların bölünmesini erken durduruyoruz.

 
Vladimir Perervenko :

Print ile ilgili değil, jeneratörler ve yineleyicilerle ilgili.

Vladimir! hakkında bir açıklama yapabilir misiniz?

Bu paket bu kodu değiştirmeden kodumu hızlandırabilirse, bu benim için çok ilginç, sadece çalışan bir örnek verin lütfen

 
mytarmailS :

Vladimir! hakkında bir açıklama yapabilir misiniz?

Bu paket bu kodu değiştirmeden kodumu hızlandırabilirse, bu benim için çok ilginç, sadece çalışan bir örnek verin lütfen

Pakette birçok örnek var. Bulamıyor musunuz? getireceğim

> # A generator statement creates a generator factory. The
> # following generator yields two times and then returns ` "c" `:
> generate_abc <- generator(function() {
+   yield( "a" )
+   yield( "b" )
+   "c"
+ })
> 
> # Or equivalently:
> generate_abc <- generator(function() {
+   for (x in letters[ 1 : 3 ]) {
+     yield(x)
+   }
+ })
> 
> # The factory creates generator instances. They are iterators
> # that you can call successively to obtain new values:
> abc <- generate_abc()
> abc()
[ 1 ] "a"
> abc()
[ 1 ] "b"
> 
> # Once a generator has returned it keeps returning `exhausted()`.
> # This signals to its caller that new values can no longer be
> # produced. The generator is exhausted:
> abc()
[ 1 ] "c"
> abc()
exhausted
> 
> # You can only exhaust a generator once but you can always create
> # new ones from a factory:
> abc <- generate_abc()
> abc()
[ 1 ] "a"
> 
> 
> # As generators implement the coro iteration protocol, you can use
> # coro tools like `loop()`. It makes it possible to loop over
> # iterators with ` for ` expressions:
> loop( for (x in abc) print(x))
[ 1 ] "b"
[ 1 ] "c"
> 
> # To gather values of an iterator in a list, use `collect()`. Pass
> # the `n` argument to collect that number of elements from a
> # generator:
> abc <- generate_abc()
> collect(abc, 1 )
[[ 1 ]]
[ 1 ] "a"

> 
> # Or drain all remaining elements:
> collect(abc)
[[ 1 ]]
[ 1 ] "b"

[[ 2 ]]
[ 1 ] "c"

> 
> 
> # coro provides a short syntax `gen()` for creating one-off
> # generator _instances_. It is handy to adapt existing iterators:
> numbers <- 1 : 10
> odds <- gen( for (x in numbers) if (x %% 2 != 0 ) yield(x))
> squares <- gen( for (x in odds) yield(x^ 2 ))
> greetings <- gen( for (x in squares) yield(paste( "Hey" , x)))
> 
> collect(greetings)
[[ 1 ]]
[ 1 ] "Hey 1"

[[ 2 ]]
[ 1 ] "Hey 9"

[[ 3 ]]
[ 1 ] "Hey 25"

[[ 4 ]]
[ 1 ] "Hey 49"

[[ 5 ]]
[ 1 ] "Hey 81"

> 
> 
> # Arguments passed to generator instances are returned from the
> # `yield()` statement on reentry:
> new_tally <- generator(function() {
+   count <- 0
+   while (TRUE) {
+     i <- yield(count)
+     count <- count + i
+   }
+ })
> tally <- new_tally()
> tally( 1 )
[ 1 ] 0
> tally( 2 )
[ 1 ] 2
> tally( 10 )
[ 1 ] 12
 
Vladimir Perervenko :

Bu baskı ile ilgili değil, üreteçler ve yineleyicilerle ilgili.

imkanı yok? ))

 
Maksim Dmitrievski

Gelecekte ML tabanlı çift ticareti hakkında yeni bir makale yayınlayacak mısınız?

 
Evgeni Gavrilovi :

Gelecekte ML tabanlı çift ticareti hakkında yeni bir makale yayınlayacak mısınız?

Evet, henüz vakit olmadı. Makaleler, planlarını düşünmek ve ardından programlamak için çok zaman gerektirir.

 
Maksim Dmitrievski :

Evet, henüz vakit olmadı. Makaleler, planlarını düşünmek ve ardından programlamak için çok zaman gerektirir.

Daha sonra komut dosyasını bu stratejiyi kullanarak siparişleri doğrudan Python'da açan makaleye ekleyebilir misiniz?

 
Evgeni Gavrilovi :

Veya bu stratejiyi kullanarak komut dosyasını doğrudan Python'da siparişleri açan makaleye ekleyebilir misiniz?

Evet, yapılabilir. Ancak bir danışman şeklinde daha uygundur

 
Maksim Dmitrievski :

Evet, yapılabilir. Ancak bir danışman şeklinde daha uygundur


Habre https://m.habr.com/ru/post/549202/ adresinde bir makale yayınlandı, ne dersiniz? Pratik bir şey yapılabilir mi? Bu ve genel olarak sizin (ve diğer matematikçilerin) uzman görüşü ilginç.