yardıma ihtiyacım var! Görev çözülmedi, demirin sınırlamalarıyla karşılaşıyorum - sayfa 6

 
YuraZ :

Ne aradığımı bilmiyorum...

>>> Tüm dizileri tekrarlamak ve bazı hesaplamalar yapmak gereklidir.

Pekala - öyle olsun - arıyorum - ama 20 konseri sıralamak için arıyorum ...

Prensip olarak, arama, bazı numaralandırma ve karşılaştırmaların olduğu gerçeğine dayanmaktadır.

yazarın yazdıklarından yola çıkıyorum

belki veriler azaltılamaz - sıkıştırılamaz - indekslenemez


verileri SQL'e koymak mantıklıdır

yani iş mantığını sunucuya + verilere aktarın

EA, numaralandırma ve hesaplamalar için sunucuya yalnızca kısa veriler gönderir

ve hazır bir cevap al

Kaba kuvvet araması Orta Çağ'dır.
 
Integer :

Ah, burada beni şaşırtan ne çok şey var.

Bana öyle geliyor ki, çocuk anlamalı. Bazı metinler bir algoritma tarafından sıkıştırılırsa, bugün ve yarın da sıkıştırılmış biçimde tamamen aynı olacaktır.

bu arada - 3 terabayt birkaç saat boyunca sunucudan sunucuya kopyalandı - 1 gb ağ

ZIP'de sıkıştırıldığında, 3 terabayt bir günden fazla sıkıştırıldı

Önce sunucunun belleğinde sıkıştıran ve ardından yedekleyen harika bir yardımcı program LiteSpeed satın alırken

3 terabaytlık sıkıştırma birkaç saate düşürüldü

paketi açma (bir şeyi değiştirmek, geri yüklemek, silmek için) birkaç saat sürer


Sıkıştırılmış verilerde bir arama algoritması çözmek harika!

belki gelecekte birileri zaten sıkıştırılmış veritabanlarında ekleme ve silme araması için algoritmalar bulacaktır.

... ama şimdiye kadar endüstriyel ölçekte böyle bir algoritma yok


Endüstriyel veritabanları vardır ORACL MS SQL dünyada hiç kimse verileri sıkıştırılmış biçimde saklamaz - eğer bunlarla yoğun bir çalışma yapılıyorsa

 
YuraZ :

1. bu arada - 3 terabayt birkaç saat boyunca sunucudan sunucuya kopyalandı - 1 gb ağ

ZIP'de sıkıştırıldığında, 3 terabayt bir günden fazla sıkıştırıldı

Önce sunucunun belleğinde sıkıştıran ve ardından yedekleyen harika bir yardımcı program LiteSpeed satın alırken

3 terabaytlık sıkıştırma birkaç saate düşürüldü

paketi açma (bir şeyi değiştirmek, geri yüklemek, silmek için) birkaç saat sürer


2. Arama algoritmasını sıkıştırılmış verilerde çözmek harika!

3. belki gelecekte birileri zaten sıkıştırılmış veritabanlarında ekleme ve silme araması için algoritmalar bulacaktır.

4. ... ama şimdiye kadar endüstriyel ölçekte böyle bir algoritma yok


Endüstriyel veritabanları vardır ORACL MS SQL dünyada hiç kimse verileri sıkıştırılmış biçimde saklamaz - eğer bunlarla yoğun bir çalışma yapılıyorsa

1. Burada ele alınan görev için veri sıkıştırma bir kez yapılır, verileri bir hafta boyunca sıkıştırmak mümkündür.

2. Ne güzel?

3. Peki o zaman ne icat edilecek? Soru şu, gerekli mi, değil mi?

4. Peki ne değil?

 
Integer :

1. Burada ele alınan görev için veri sıkıştırma bir kez yapılır, verileri bir hafta boyunca sıkıştırmak mümkündür.

2. Ne güzel?

3. Peki o zaman ne icat edilecek? Soru şu, gerekli mi, değil mi?

4. Peki ne değil?

1) p1 sadece p4'ü çözdükten sonra

2) iyi - bilmiyorum, belki de büyük veri dizilerinde arama yapma sorusu ( FAST ) yeterince kalifiye uzmanlar tarafından ve bir kereden fazla düşünülmüştür - ve henüz bir algoritma yok

3) evet, Tanrı biliyor, belki sıkıştırılmış verilerde bir arama icat edecekler, ancak karar verilmedi ve büyük olasılıkla sadece gerekli olmadığı için ...

4) belki - gezegendeki en iyi beyinler, sıkıştırılmış verilerde ( HIZLI ) arama için bir algoritma bulmaya devam edecektir.

(YAVAŞÇA) sıkıştırılmış verilerde arama yapabilirsiniz - teknikle (açma ve sonra arama) bu bir soru değil ...

 

Evet, sıkıştırılmış verilerde kimse aramadan bahsetmiyor. İki sıkıştırılmış diziyi karşılaştırmak hakkında konuşun.

Bir dizi diyelim, "aaa", "bbb", "www". Üç dizi öğesinin her biri, diğerlerinden bağımsız olarak kendi başına sıkıştırılabilir. Diyelim ki sıkıştırdık ve "a", "b", "c" dizisini aldık.

Dizide bulunması gereken istenen "bbb" dizgisine sahibiz. Aramadan önce sıkıştırır ve "b" alırız. Şimdi arıyoruz ve buluyoruz.

 
Integer :

Evet, sıkıştırılmış verilerde kimse aramadan bahsetmiyor. İki sıkıştırılmış diziyi karşılaştırmak hakkında konuşun.

Bir dizi diyelim, "aaa", "bbb", "www". Üç dizi öğesinin her biri, diğerlerinden bağımsız olarak kendi başına sıkıştırılabilir. "a", "b", "c" dizisini sıkıştırıp elde ettiğinizi varsayalım.

Dizide bulunması gereken istenen "bbb" dizgisine sahibiz. Aramadan önce sıkıştırır ve "b" alırız. Şimdi arıyoruz ve buluyoruz.

fikir net...

ve henüz endüstriyel veri tabanlarında bunun için (hızlı bir arama ile) bir metodoloji yoktur.

görünüşe göre sebepler var

 
Integer :

Ah, burada beni şaşırtan ne çok şey var.

Bana öyle geliyor ki, çocuk anlamalı. Bazı metinler bir algoritma tarafından sıkıştırılırsa, bugün ve yarın da sıkıştırılmış biçimde tamamen aynı olacaktır.

Aynı sıkıştırma algoritmasını kullanarak ve çıktıda iki farklı metni sıkıştırarak, tamamen aynı iki veri dizisi elde edebileceğinizi mi söylüyorsunuz?

Bunu söylediğime göre mi karar verdin?

 
YuraZ :

fikir net...

ve henüz endüstriyel veri tabanlarında bunun için (hızlı bir arama ile) bir metodoloji yoktur.

görünüşe göre sebepler var

Elbette sebepleri var :)

Veri sıkıştırma, fazlalığın ortadan kaldırılmasıdır. Ve sıkıştırma ne kadar verimli olursa, yedeklilik o kadar az olur. Ve yukarıda önerilen yöntemle arama yapmak işe yaramaz, çünkü. sıkıştırılmış metinde, herhangi bir kısım metnin tamamına bağlı olacaktır.

 
Contender :

Elbette sebepleri var :)

Veri sıkıştırma, fazlalığın ortadan kaldırılmasıdır. Ve sıkıştırma ne kadar verimli olursa, yedeklilik o kadar az olur. Ve yukarıda önerilen yöntemle arama yapmak işe yaramaz, çünkü. sıkıştırılmış metinde, herhangi bir kısım metnin tamamına bağlı olacaktır.

:-) Ne hakkında konuşuyoruz...
 
elugovoy :

Bunu söylediğime göre mi karar verdin?

Nasıl ima edersin:

Bir metin düzenleyicide olduğu gibi 4-8 kez sıkıştırma sağlayacaktır. Sıkıştırma algoritmalarının her dosya için kendi kayıt ağaçlarını oluşturduğunu düşünün.

Başka bir deyişle, kaynak dosya için bir ağaç olacak ve bulmanız gereken verilerin bir kısmı için tamamen farklı sizinki olacak .

Nasıl bir arama yapmayı önereceğinizi merak mı ediyorsunuz? teorik olarak bile

Nasıl arama yapılır, biraz önce yazdım.