Segment aralıklarını birleştirmek için algoritma - oluşturmaya yardımcı olun - sayfa 5

 


)

 
Dmitry Fedoseev :

1. Tamamen anlaşılmaz ve şimdiden tamamen farklı bir şey.

Zaten görev nedir? Pratik amaç nedir? Belki o farklı şeyler yapar.

Pekala, ilgileniyorsanız, daha ayrıntılı konuşalım. CatBoost makine öğrenmesi algoritmasında, bölmeyi ayarlamak için gözlemlerden (dizi) elde edilen değişkenin (predictor) değer kümesinin numaralandırılması, bir ön ızgara (niceleme) oluşturularak çözülür, böylece sayılar segmentlere ayrılır. (dönemler / aralıklar) ve değerlerin numaralandırılması tüm sayılar üzerinde değil, yalnızca bu sınırlar boyunca gerçekleşir. Farklı sayıda istenen kenarlığa sahip olanlar da dahil olmak üzere, ızgaraları oluşturmak için çeşitli yerleşik yöntemler vardır. Görsel olarak, ızgara seçeneği aşağıdaki şekilde görünüyor, burada dizinin her 100 değeri, değeri y ölçeğinde bir artırır - değerlerin tekrarlanabilirliği bu şekilde görünür.

Görev, öğrenme için en uygun ızgarayı oluşturmaktır, yani. (segmentteki) aralıklar arasındaki bilgilerin daha çok hedeflerden birine (0/1) ait olacağı böyle bir ızgara, bağımlılığın sabitliğini ve gözlemlerin yeterliliğini korur.

Şimdi farklı ızgaralar alıyorum, belirtilen kriterlere göre segmentlerini seçiyorum (daha önce yazdım) ve seçilen segmentleri tek bir ızgarada birleştirmek için birbirine bağlamam gerekiyor.

 
Aleksey Nikolayev :


)

Yardım edebileceksem yardım ederim, yardım edemezsem yardım istemekten çekinmem.

Ayrıca, son zamanlarda burada sorunlar nadiren ortaya çıkıyor ve insanların çözüme katılmasının ilginç olacağını düşündüm.

 
Aleksey Vyazmikin :

///

Şimdi farklı ızgaralar alıyorum, belirtilen kriterlere göre segmentlerini seçiyorum (daha önce yazdım) ve seçilen segmentleri tek bir ızgarada birleştirmek için birbirine bağlamam gerekiyor.

Soru bununla ilgiliydi. Nasıl yapmak istersin?

 
Dmitry Fedoseev :

Soru bununla ilgiliydi. Nasıl yapmak istersin?

Hmmm... yani yazdığınız senaryo neredeyse tüm işi yapabilir. Başka seçenekler var mı? Kombinasyon sayısını azaltmak için bir seçenek önerdim.


Bu seçeneği düşünüyorum :)

Почему амеба справилась с вычислениями лучше современного компьютера
Почему амеба справилась с вычислениями лучше современного компьютера
  • www.popmech.ru
В 2018 году группа исследователей из токийского университета Кейо решила использовать амебу для решения так называемой «задачи коммивояжера», известной в области компьютерных наук проблемы. Суть ее такова: представьте, что вы – путешествующий от города к городу...
 
Aleksey Vyazmikin :

Hmmm... yani yazdığınız senaryo neredeyse tüm işi yapabilir. Başka seçenekler var mı? Kombinasyon sayısını azaltmak için bir seçenek önerdim.


Bu seçeneği düşünüyorum :)

Belki birkaç bölüm olduğunda. Ve ne zaman çok, nasıl olunur?

Kombinasyon sayısını azaltma seçeneğini hangi anlamda önerdiniz? Tüm kombinasyonlar yeterli değil mi yoksa bir kriter var mı?

 
Dmitry Fedoseev :

Belki birkaç bölüm olduğunda. Ve ne zaman çok, nasıl olunur?

Kombinasyon sayısını azaltma seçeneğini hangi anlamda önerdiniz? Tüm kombinasyonlar yeterli değil mi yoksa bir kriter var mı?

Çok şey olduğunda - düşünmelisin ...

Bir seçenek olarak, her bölümle başlamayı, ancak her noktadaki kombinasyon sayısıyla sınırlı tutmayı da öneriyorum.

Şekil, bölümleri bir daire biçiminde ve ok uzunluğu biçiminde değerlendirmelerini göstermektedir, şekilde sadece en kısa iki ok seçilmiştir, "yolların" geri kalanı kesilir (hariç). Bu tür oklar (aslında grafikler) şeklinde tahmini bir katsayı (gösterge) olabilir.


Bu nedenle, hesaplama maliyetini düşürürken en kötü seçenekleri seçmeyeceğimizi düşünüyorum.
 
Aleksey Vyazmikin :

Çok şey olduğunda - düşünmelisin ...

Bir seçenek olarak, her bölümle başlamayı, ancak her noktadaki kombinasyon sayısıyla sınırlı tutmayı da öneriyorum.

Şekil, bölümleri bir daire biçiminde ve ok uzunluğu biçiminde değerlendirmelerini göstermektedir, şekilde sadece en kısa iki ok seçilmiştir, "yolların" geri kalanı kesilir (hariç). Bu tür oklar (aslında grafikler) şeklinde tahmini bir katsayı (gösterge) olabilir.


Bu nedenle, hesaplama maliyetini düşürürken en kötü seçenekleri seçmeyeceğiz sanırım.
Bu, noktadan itibaren yaklaşık olarak aynı uzun kısa oranının olduğu ve sadece uzun veya kısa segmentli alanların olmadığı durum içindir.
 
Valeriy Yastremskiy :
Bu, noktadan itibaren yaklaşık olarak aynı uzun kısa oranının olduğu ve sadece uzun veya kısa segmentli alanların olmadığı durum içindir.

Hangi segmentlerin uzun veya kısa olduğu ne fark eder veya bir tahminle mi ilgilidir (şekle benzer şekilde okun uzunluğu)?

Bir arzumuz var - örnekteki en iyi iki yola adım atmak, eğer bunlardan daha azı varsa, o zaman sadece bir yol vardır.

Lütfen bunun neden zor olabileceğini açıklayın.

 

Segmentleri aralıklara göre segmentlere (gruplara) bölerek kombinasyon sayısını da azaltabilirsiniz.

Resimlerde 4 grup aralık sınırları var, sadece gruplar içinde arama yapıyoruz ve daha sonra grup içindeki en iyi seçenekleri diğer gruplar arasında birleştiriyoruz.

Eşit olarak bölmek zordur, bu nedenle grubun sınırları boyunca bölümler ayrı ayrı seçilebilir ve gruplar arası sonuçları birleştirirken kullanılabilir.