도움이 필요하다! 숙제가 풀리지 않아 철의 한계에 부딪혀 - 페이지 6

 
YuraZ :

내가 뭘 찾고 있는지 모르겠어...

>>> 모든 시퀀스 를 반복 하고 몇 가지 계산을 해야 합니다.

글쎄 - 그것은 - 찾고 -하지만 20 공연을 통해 정렬을 찾고 있습니다 ...

검색은 원칙적으로 약간의 열거 및 비교가 있다는 사실을 기반으로 합니다.

나는 저자가 쓴 것에서 진행한다

아마도 데이터를 축소할 수 없음 - 압축 - 인덱싱됨


데이터를 SQL에 넣는 것이 논리적입니다.

즉, 비즈니스 로직을 서버 + 데이터로 전송

EA는 열거 및 계산을 위해 서버에 짧은 데이터만 보냅니다.

그리고 준비된 답변을 얻으십시오

무차별 대입 검색은 중세 시대입니다.
 
Integer :

오, 여기서 얼마나 많은 것들이 나를 놀라게 합니까?

아이가 이해해줘야 할 것 같습니다. 어떤 텍스트가 어떤 알고리즘에 의해 압축된다면, 그것은 오늘과 내일도 압축된 형태로 정확히 동일할 것입니다.

그건 그렇고 - 3테라바이트가 몇 시간 동안 서버에서 서버로 복사되었습니다 - 1GB 네트워크

ZIP으로 압축시 하루 이상 3테라바이트 압축

서버 메모리에서 먼저 압축한 다음 백업하는 멋진 유틸리티 LiteSpeed를 구입할 때

3테라바이트의 압축이 몇 시간으로 단축되었습니다.

압축 풀기(뭔가 변경, 복원, 삭제) 몇 시간 동안 동일하게 지속


압축된 데이터에서 검색 알고리즘을 해결하는 것은 멋진 일입니다!

아마도 미래에 누군가 이미 압축된 데이터베이스에서 삽입 및 삭제를 검색하는 알고리즘을 제시할 것입니다.

... 그러나 지금까지 산업적 규모의 그러한 알고리즘은 없습니다.


산업용 데이터베이스가 있습니다. ORACL MS SQL 전 세계 어느 누구도 데이터를 압축된 형태로 저장하지 않습니다. 집중적인 작업이 수행되는 경우

 
YuraZ :

1. 그런데 - 3테라바이트가 몇 시간 동안 서버에서 서버로 복사되었습니다 - 1GB 네트워크

ZIP으로 압축시 하루 이상 3테라바이트 압축

서버 메모리에서 먼저 압축한 다음 백업하는 멋진 유틸리티 LiteSpeed를 구입할 때

3테라바이트의 압축이 몇 시간으로 단축되었습니다.

압축 풀기(뭔가 변경, 복원, 삭제) 몇 시간 동안 동일하게 지속


2. 압축된 데이터에서 검색 알고리즘을 해결하는 것은 멋지다!

3. 아마도 미래에 누군가 이미 압축된 데이터베이스에서 삽입 및 삭제를 검색하는 알고리즘을 제시할 것입니다.

4. ...하지만 지금까지 산업 규모의 그러한 알고리즘은 없습니다


산업용 데이터베이스가 있습니다. ORACL MS SQL 전 세계 어느 누구도 데이터를 압축된 형태로 저장하지 않습니다. 집중적인 작업이 수행되는 경우

1. 여기에서 고려하는 작업은 데이터 압축이 한 번 수행되며 일주일 동안 데이터를 압축할 수 있습니다.

2. 멋진 점은 무엇입니까?

3. 그러면 무엇을 발명할 것인가? 문제는 그것이 필요한지 아닌지입니다.

4. 그래서 아닌 것은 무엇입니까?

 
Integer :

1. 여기에서 고려하는 작업은 데이터 압축이 한 번 수행되며 일주일 동안 데이터를 압축할 수 있습니다.

2. 멋진 점은 무엇입니까?

3. 그러면 무엇을 발명할 것인가? 문제는 그것이 필요한지 아닌지입니다.

4. 그래서 아닌 것은 무엇입니까?

1) p4를 푼 후에만 p1

2) 글쎄요 - 아마도 대규모 데이터 배열에서 검색하는 문제( FAST )는 자격을 갖춘 전문가가 이미 한 번 이상 생각해 보았을 것입니다. 그리고 아직 알고리즘이 없습니다.

3) 예, 신은 알고 있습니다. 아마도 그들은 압축 데이터에서 검색을 발명할 것이지만 결정되지 않았으며 아마도 필요하지 않기 때문일 것입니다 ...

4) 아마도 - 지구상에서 가장 뛰어난 사람들은 압축된 데이터에서 ( FAST ) 검색을 위한 알고리즘을 여전히 생각해 낼 것입니다.

압축된 데이터에서 (천천히) 검색할 수 있습니다 - 기술(압축 해제 후 검색)을 사용하면 이것은 질문이 아닙니다...

 

예, 아무도 압축 데이터에서 검색에 대해 말하지 않습니다. 두 개의 압축된 시퀀스를 비교하는 방법에 대해 이야기하십시오.

"aaa", "bbb", "www"라는 배열을 가정해 보겠습니다. 세 가지 배열 요소 각각은 다른 요소와 독립적으로 자체적으로 압축할 수 있습니다. 압축하여 배열 "a", "b", "c"를 얻었다고 가정해 보겠습니다.

배열에서 찾아야 하는 원하는 문자열 "bbb"가 있습니다. 검색하기 전에 압축하여 "b"를 얻습니다. 이제 우리는 찾고 찾습니다.

 
Integer :

예, 아무도 압축 데이터에서 검색에 대해 말하지 않습니다. 두 개의 압축된 시퀀스를 비교하는 것에 대해 이야기하십시오.

배열 "aaa", "bbb", "www"를 가정해 보겠습니다. 세 가지 배열 요소 각각은 다른 요소와 독립적으로 자체적으로 압축할 수 있습니다. 압축하여 배열 "a", "b", "c"를 얻는다고 가정합니다.

배열에서 찾아야 하는 원하는 문자열 "bbb"가 있습니다. 검색하기 전에 압축하고 "b"를 얻습니다. 이제 우리는 찾고 찾습니다.

아이디어가 명확하다...

그러나 산업 데이터베이스에는 이에 대한 방법론(빠른 검색 포함)이 없습니다.

분명히 이유가있다

 
Integer :

오, 여기서 얼마나 많은 것들이 나를 놀라게 합니까?

아이가 이해해줘야 할 것 같습니다. 어떤 텍스트가 어떤 알고리즘에 의해 압축된다면, 그것은 오늘과 내일도 압축된 형태로 정확히 같을 것입니다.

동일한 압축 알고리즘을 사용하고 출력에서 두 개의 다른 텍스트를 압축하면 두 개의 완전히 동일한 데이터 시퀀스를 얻을 수 있다는 말씀이신가요?

내가 이 말을 하기로 결정한 것은 무엇 때문입니까?

 
YuraZ :

아이디어가 명확하다...

그러나 산업 데이터베이스에는 이에 대한 방법론(빠른 검색 포함)이 없습니다.

분명히 이유가있다

물론 이유가 있습니다 :)

데이터 압축은 중복성을 제거하는 것입니다. 압축이 더 효율적일수록 중복성은 줄어듭니다. 그리고 위에서 제안한 방법으로는 검색이 되지 않기 때문입니다. 압축된 텍스트에서 일부는 전체 텍스트에 종속됩니다.

 
Contender :

물론 이유가 있습니다 :)

데이터 압축은 중복성을 제거하는 것입니다. 압축이 더 효율적일수록 중복성은 줄어듭니다. 그리고 위에서 제안한 방법으로는 검색이 되지 않기 때문입니다. 압축된 텍스트에서 일부는 전체 텍스트에 종속됩니다.

:-) 우리가 무슨 이야기를 하고 있는지...
 
elugovoy :

내가 이 말을 하기로 결정한 것은 무엇 때문입니까?

어떻게 암시합니까?

글쎄, 그것은 텍스트 편집기와 같이 4-8 배 압축을 줄 것입니다. 압축 알고리즘 이 각 파일에 대해 자체 레코딩 트리를 생성한다는 사실을 고려하십시오.

즉, 소스 파일에 대해 하나의 트리가 있고 찾아야 하는 데이터의 일부에 대해 완전히 다른 자신만의 트리가 있을 것입니다 .

검색 수행을 제안하는 방법이 궁금하십니까? 이론적으로도

검색을 수행하는 방법은 조금 일찍 썼습니다.