Sinir ağının girişine ne beslenmeli? Fikirleriniz... - sayfa 62

 

Teknik uygulamaya geri dönelim...

Ağaçta bir bölünme seçerken optimizasyon mevcuttur.
Bunun için farklı formüller vardır. 100 ağaç eğitimi durumunda, bu optimizasyon yalnızca mutlak veri öğrenmeye giden yolu belirler. Öğrenmenin kalitesini etkilemez, %100'dür. Gerçek öğrenme yalnızca %100 öğrenme olarak anlaşılır.

Bu nedenle, öğrenme (öğretilenin tam olarak ezberlenmesi) != optimizasyondur. Ancak yetersiz eğitim verdiysek, yani tam ezberlemeden önce bölmeyi durdurduysak, bu yolun farklı varyantlarında durabiliriz - o zaman model ve öğrenme kalitesi (yetersiz eğitim derecesi) farklı bölme seçim algoritmaları, farklı öğrenme derinliği, çalışma sayfasındaki farklı örnek sayısı ile farklı olacaktır.
Kesin/net verilerin (çarpım tablosu, Ohm kanunu, vb.) öğretilmesi durumunda yetersiz eğitim kötü bir fikirdir. Ezberlemek/öğrenmek için ne kadar çok örnek verirseniz, cevap yeni veriler üzerinde o kadar doğru olacaktır.


Ancak piyasa verilerinin söz konusu olduğu durumda, gürültüyü ezberlememek için daha erken durmanız, değerlendirmeniz ve bu az öğrenilmiş modellerden birini seçmeniz gerekir. Sonuç olarak, az öğrenilmiş/geliştirilmemiş modeller için optimizasyon ve değerlendirmenin gerekli olduğu ortaya çıkmaktadır. Mükemmel derecede doğru bir veritabanının değerlendirmeye ihtiyacı yoktur, eğitmek istediği her şeye sahiptir.

 

Öğrenme bir süreçtir, bir sonuç değil.

100 ya da %50 öğrenme diye bir şey olamaz. Böyle bir kategori yoktur.

Öğrenmenin kalitesi sadece doğrulama ve öğrencinin dersleri nasıl öğrendiğinin test edilmesiyle kontrol edilir. Kursiyerlerin sadece öğretmenden sonra tekrar etmeleri veya notlarını okumaları ile test edilmez.

Öğrenme ve ezberleme yeteneği tüm modeller için farklıdır, her şeyi ağaçlara ve ormanlara indirgemeyin.

Ve işte sihrin gerçekleştiği yer burasıdır; aptal öğrenci (model) genellikle daha zeki olandan daha iyi bir tahmincidir. Tıpkı hayattaki gibi. Ve bunun bir mantığı var.

Tüm bunlar , temellerin temeli olmasına rağmen burada kimsenin adını bile duymadığımakine öğrenimiteorisinde yazılmıştır .

MO dünyasında sihir var, ama sizin tüm bu saçmalıklarınız değil.
 
mytarmailS #:
Bu, gürültülü bir fonksiyonu minimize etmekle ilgili bir optimizasyon bölümüdür. Gürültü fonksiyonu optimizasyonu ya da buna benzer bir şey, hafızamdan yazıyorum.
Aslında her şey çoktan icat edildi, bir tüccar biraz know-how yaparsa, bu daha çok cehaletten kaynaklanır.

Ve Saber basit ve ilkel bir şekilde erken bir mola verdi ve orada neredeyse hiç plato yoktu, daha ziyade ruh için sadece huzur vardı.
Gürültülü optimizasyona bir örnek

Anladığım kadarıyla yaklaşımın genel felsefesi aşağıdaki gibidir:
1. Optimize edilmiş fonksiyonun gürültüsünü öğrenen (farklı bölümlerde farklıdır) ve bunu tahmin eden bir model vardır.
2. Değer + tahmin edilen gürültünün belirli bir ortalaması hesaplanır.

3. Mutlak bir değer değil, sözde bir plato elde ederiz
 
Forester #:

Teknik uygulamaya geri dönelim...

Ağaçta bir bölünme seçerken optimizasyon mevcuttur.
Bunun için farklı formüller vardır. 100 ağaç eğitimi durumunda, bu optimizasyon yalnızca mutlak veri öğrenmeye giden yolu belirler. Öğrenmenin kalitesini etkilemez, %100'dür. Gerçek öğrenme yalnızca %100 öğrenme olarak anlaşılır.

Bu nedenle, öğrenme (öğretilenin tam olarak ezberlenmesi) != optimizasyondur. Ancak yetersiz eğitim verdiysek, yani tam ezberlemeden önce bölmeyi durdurduysak, bu yolun farklı varyantlarında durabiliriz - o zaman model ve öğrenme kalitesi (yetersiz eğitim derecesi) farklı bölme seçim algoritmaları, farklı öğrenme derinliği, çalışma sayfasındaki farklı örnek sayısı ile farklı olacaktır.
Tek değerli/mutlak verilerin (çarpım tablosu, Ohm kanunu, vb.) öğretilmesi durumunda yetersiz eğitim kötü bir fikirdir. Ezberleme/öğrenme için ne kadar çok örnek verirseniz, cevap yeni veriler üzerinde o kadar doğru olacaktır.


Ancak piyasa verileri söz konusu olduğunda, gürültüyü ezberlememek için daha önce durmanız, değerlendirmeniz ve bu az öğrenilmiş modellerden birini seçmeniz gerekir. Sonuç olarak, az öğrenilmiş/geliştirilmemiş modeller için optimizasyon ve değerlendirmenin gerekli olduğu ortaya çıkmaktadır. Mükemmel derecede doğru bir veritabanının değerlendirmeye ihtiyacı yoktur, eğitmek istediği her şeye sahiptir.

Aşağıdaki düşünceyi genişletin:

Ödev 1:
Aritmetik vardır ve işlemlerinden biri çarpmadır. Ve 0'dan 9'a kadar sayılar vardır. Çarpma işleminin kuralını öğrenin, iki sayıyı birbiriyle çarparak bir çarpım tablosu oluşturun ve çarpım tablosunu öğrenin.

Görev 2:
Bir çarpım tablosu var. İşte burada
...
...
...
Öğrenin.


İkinci seçenekte, öğrenci çarpma kuralını bilmiyor, ancak doğru cevapları biliyor.


Bu faaliyetlerin her ikisi de öğrenme midir?

Değilse, bu tür faaliyetleri nasıl kategorize edersiniz (tanımlarsınız)
 
Maxim Dmitrievsky #:

Ama öyle değil. Yeni veriler üzerindeki yanıtların doğruluğu (yeni veri derken eğitim verileri dışındaki verileri kastediyoruz) eğitim örneklerinin sayısına değil, her bir modelin özelliklerine bağlı olacaktır.

Düzenlenmiş veri durumunu ele alırsak. Örneğin çarpım tablosu. Ne kadar çok örnek verirseniz, cevaplar yeni veriler üzerinde o kadar doğru olacaktır.
Yeni veri tamamen farklı değil, eğitim örnekleri arasında olmalıdır. Yani enterpolasyon az ya da çok iyi gidecektir. 1 ağaç en yakın eğitim örneğini verecektir. Diğer verilerle eğitim verilerinin sınırları dışındaki verileri kastediyorsanız, bu zaten ekstrapolasyondur. Ağaç uç bir örnek verecektir, çünkü en yakını odur.


Piyasa verilerini ele alırsak, büyük bir gürültü değeriyle, gerçek örüntüden herhangi bir tepe noktası gürültü tepe noktalarıyla karışacaktır ve bir şekilde gürültü tepe noktasını değil gerçek tepe noktasını seçmemiz gerekir. İfadeleriniz burada doğrudur.

 
Forester #:

Eğer örüntülü veri durumunu ele alırsak. Örneğin çarpım tablosu. Ne kadar çok örnek verirseniz, cevaplar yeni veriler üzerinde o kadar doğru olacaktır.
Yeni veri tamamen farklı değil, eğitim örnekleri arasında olmalıdır. Yani enterpolasyon az ya da çok iyi gidecektir. 1 ağaç en yakın eğitim örneğini verecektir. Diğer verilerle eğitim verilerinin sınırları dışındaki verileri kastediyorsanız, bu zaten ekstrapolasyondur. Ağaç en dıştaki örneği verecektir, çünkü o en yakın olanıdır.


Piyasa verilerini ele alırsak, büyük bir gürültü değeriyle, gerçek modelden herhangi bir tepe noktası gürültü tepe noktalarıyla karışacaktır ve bir şekilde gürültü tepe noktasını değil gerçek tepe noktasını seçmemiz gerekir. İfadeleriniz burada doğrudur.

Kalıpların varlığı ya da yokluğu hakkında hiçbir şey bilmiyoruz. Biz sadece eğitim yapıyoruz ve bunun hakkında konuşuyoruz.

Ortak yaklaşım ve bunun ne anlama geldiği(sihir) hakkında konuşuyoruz. Öğrenmenin büyüsü ortalama bir insan için sezgilere aykırıdır çünkü insanlar bunu anlayamazlar :)

Aşırı antrenman yapmamak neden önemlidir, yetersiz antrenman yapmamak neden önemlidir. Özelliklerin ve parametrelerin sayısını azaltmak neden önemlidir. vs. vs. vs.
 
Ivan Butko #:
Aşağıdaki düşünceyi genişletin:

Görev 1:
Aritmetik vardır ve işlemlerinden biri çarpmadır. Ve 0'dan 9'a kadar sayılar vardır. Çarpma işleminin kuralını öğrenin, iki sayıyı birbiriyle çarparak çarpım tablosu oluşturun ve çarpım tablosunu öğrenin.

Görev 2:
Bir çarpım tablosu var. İşte burada.
...
...
...
Öğren.


İkinci seçenekte, öğrenci çarpma kuralını bilmez, ancak doğru cevapları bilir.


İkisi de öğreniyor mu?

Eğer değilse, bu tür faaliyetleri nasıl kategorize edersiniz (tanımlarsınız)?

Her ikisi de eğitimdir. Birinci durumda bir kural/kanun öğretilir. İkinci durumda ise birinci durumdaki cevaplar öğrenilir.
Doğal olarak, kuralların, formüllerin, yasaların öğretilmesi daha etkilidir, çünkü küçük bir formülle ezberlemeden milyonlarca cevap alabilirsiniz.
Burada forumda piyasa kanunları ve kâseler üzerine başlıklar vardı. Belki bir yasa vardır, ama gürültü onunla örtüşür(

 
Forester #:

Her ikisi de eğitimdir. Birinci durumda bir kural/kanun öğretilir. İkinci durumda ise 1. durumdaki cevaplar öğrenilir.
Doğal olarak, kuralların, formüllerin, yasaların öğretilmesi daha etkilidir, çünkü küçük bir formüle sahip olarak onları ezberlemeden milyonlarca cevap alabilirsiniz.
Burada forumda piyasa kanunları ve kâseler üzerine başlıklar vardı. Belki bir yasa vardır, ancak gürültü onunla örtüşmektedir(







Yine gürültü. Herkes gürültüden bahsediyor ama kuralları ve yasaları bilmiyorsak gürültüyü nasıl tanımlayabiliriz? Ya her tik kuralların ve yasaların bir bileşeniyse ve sorun mimarilerin bir grafiğin "kodunu" çözememesi ise?

Burada bir varsayım gibi görünüyor (bir fiyat grafiğindeki gürültü fikri)

 

Eğitim, doğru eğitim materyali gerektirir. Modern MOE'ler şikayet edilemeyecek kadar iyidir.

Bir öğretmenle yapılan MOE, verilerde seyrek örüntüler aramayı hiç içermez. Bunların eğitim örneğinde anlamlı miktarlarda bulunmasını gerektirir.

 
Forester #:

Eğer örüntülü veri durumunu ele alırsak. Örneğin çarpım tablosu. Ne kadar çok örnek verirseniz, cevaplar yeni veriler üzerinde o kadar doğru olacaktır.
Yeni veri tamamen farklı değil, eğitim örnekleri arasında olmalıdır. Yani enterpolasyon az ya da çok iyi gidecektir. 1 ağaç en yakın eğitim örneğini verecektir. Diğer verilerle eğitim verilerinin sınırları dışındaki verileri kastediyorsanız, bu zaten ekstrapolasyondur. Ağaç en dıştaki örneği verecektir, çünkü o en yakın olanıdır.


Piyasa verilerini ele alırsak, büyük bir gürültü değeriyle, gerçek modelden herhangi bir tepe noktası gürültü tepe noktalarıyla karışacaktır ve bir şekilde gürültü tepe noktasını değil gerçek tepe noktasını seçmemiz gerekir. İfadeleriniz burada doğrudur.


I van Butko #:







Yine gürültü... Herkes gürültüden bahsediyor ama kuralları ve yasaları bilmiyorsak gürültüyü nasıl tanımlayabiliriz? Ya her tik kuralların ve yasaların bir bileşeniyse ve sorun mimarilerin bir grafiğin "kodunu" çözememesi ise?

Burada bir varsayım gibi görünüyor (fiyat grafiğindeki gürültü fikri)

Gürültü ve desenler hakkında

Piyasa verilerindeki gürültünün varlığı ve miktarı ile örüntülerin var olup olmadığı ve ne ölçüde var olduğu bilinmemektedir.

Öğrenme, ezberleme ve akılda tutma hakkında

Koruma - Veriler, kalitesi değerlendirilmeden değişkenlere basitçe yazılıyorsa , buna koruma denebilir. Verilerin değişkenlere (veritabanı, tablo, matris, vb.) normal şekilde yazılması buna örnektir.

Ezberleme: Kaydetme işlemi sırasında kalite değerlendirmesi yapılırsa , bu zatenezberlemedir. Örneğin, ezberlenecek soru sayısı üzerinden doğru cevapların yüzdesinin tahmin edilmesi. Bu durumda, ne kadar çok örnek olursa, olası uygulamaların kapsamı da o kadar geniş olur. Örneğin, 2 x 8 ' lik bir görev için cevap 16 olacaktır, ancak 18 x 67 için cevap herhangi bir şey olabilir, çünkü bu soru örneklere dahil edilmemiştir.

Öğrenme: Depolanan ve ezberlenen verilerden öğrenme, kalite değerlendirmesi ile mümkündür. Eğitim, hafızaya alınan verilerin işlenmesi için kurallar oluşturma sürecidir. Örneğin, sütunla çarpma kuralının uygulanması. Burada yalnızca gerekli minimum bilgiyi (çarpım tablosu) hatırlamanız gerekir ve sütun kuralını kullanarak 18 x 67 ve hatta 1.657875 x 3.876754 dahil olmak üzere herhangi bir sayı kombinasyonunu çarpabilirsiniz.

Öğrenmeye örnek olarak, sadece verileri ezberlemekle kalmayıp aynı zamanda sütun çarpımı gibi hesaplamalar yaparak farklı verileri işlemek için kurallar uygulayan GPT benzeri modeller verilebilir.

Şimdi, öğrenme, ezberleme ve akılda tutma kavramlarını ele aldıktan sonra şu soruyu sorabiliriz: Makine öğreniminde (GPT benzeri modelleri içermeyen) öğrenme, piyasa verilerini analiz etmek için nerede uygulanır?

Not: Bunlar temel konular, daha sonra değerlemenin önemi ve diğer ilginç konulara geçeceğiz.

P.P.S. Aşırı öğrenme , eksik öğrenme ve benzeri durumlar ne niceliksel ne de niteliksel olarak değerlendirilemez, bu nedenle bunlar hakkında anlamlı ve anlamlı bir şekilde konuşmak pek mantıklı değildir.