인용 부호의 종속성 통계(정보 이론, 상관 관계 및 기타 기능 선택 방법) - 페이지 7

 
TheXpert :

상대 증분으로 작업하는 경우 어떻게 이산할 수 있습니까?

그리고 두 번째 질문 -- 몇 자 ) ?


그리고 우리는 그것들을 이산화합니다. 두 가지 주요 구성표가 있습니다. 분위수(PDF를 균일하게 만들기) 및 동일 범위(PDF는 원시 데이터와 매우 유사함)입니다.

문자 수는 연구원이 설정합니다.

 
Mathemat : 그리고 저에게 이 작업에서 TI는 주로 데이터 마이닝 도구입니다. 이 데이터로 무엇을 할 것인가는 또 다른 질문입니다. 우리가 육안으로 볼 수 없는 것을 실제로 보는 것이 중요합니다. 그리고 어떤 다른 과학에 대해 이야기하고 있습니까?

STATISTICS 패키지에서 "데이터 마이닝" 탭을 엽니다. 약 20개의 섹션 이름과 개별 절차가 있습니다. 이 모든 것이 이 분야의 교과서 및 논문과 완벽하게 일치 하지만 데이터 마이닝을 위한 TI에 대해서는 아무 것도 없습니다 .

 
alexeymosc :
분명히, 프로세스에 대한 우리의 해석에서 이들은 수익의 이산 값인 것 같습니다.

"경제적 및 기타 의미"를 포함하지 않는다면 어떤 과정을 말하는 것입니까? 과정은 "물리적" 현상이며 원인과 결과가 있습니다. 예를 들어, 사과가 뉴턴의 머리에 떨어지는 과정. 시장에 붙어서 사고 파는 과정. 대가가 모두 어디에 있습니까?

다음 순간. ter.inf.의 기반이 되는 ter.ver.는 고려되는 이벤트 또는 기호의 독립성을 요구합니다. 그렇지 않으면 이러한 수학 장치의 사용이 올바르지 않습니다. 수익에 독립성이 있는 곳은 어디입니까? 투기적 동기로 주식을 몇 개 샀고(우리는 DC가 아니라 실제 시장에 대해 이야기하고 있음) 가격에서 수익이 발생했다고 가정합니다. 얼마 후, 몇 번의 수익을 올린 후 이 주식을 매각하기로 결정했고 또 다른 수익이 발생했습니다. 이 두 가지 사건은 나를 통해 나의 투기적 동기가 매우 명확하게 상호 연결되어 있습니다. 시장에는 나와 같은 바보들이 많이 있고 그들은 모두 같은 방식으로 사고팔고 있기 때문에 모든 수익은 서로 연결되고 의존적입니다. 그렇다면 왜 독립적인 사건의 종속적인 사건에 수학적 장치를 적용하려고 합니까? 이 올바른지?

따라서 그것은 명백하지 않습니다.

 
faa1947 :

STATISTICS 패키지에서 "데이터 마이닝" 탭을 엽니다. 약 20개의 섹션 이름과 개별 절차가 있습니다. 이 모든 것이 이 분야의 교과서 및 논문과 완벽하게 일치 하지만 데이터 마이닝을 위한 TI에 대해서는 아무 것도 없습니다 .


이것은 통계의 결함입니다. 그건 그렇고, 나는 그것을 스스로 사용합니다.
 
alexeymosc :

그리고 우리는 그것들을 이산화합니다. 두 가지 주요 구성표가 있습니다. 분위수(PDF를 균일하게 만들기) 및 등간격(PDF는 원시 데이터의 결과와 매우 유사함)입니다.

문자 수는 연구원이 설정합니다.

저것들. 시장의 알파벳을 모르면 직접 만들어보고 공부해보겠습니다.

물론 내가 틀릴 수도 있고 자주 하지는 않지만 이 접근 방식은 나에게 성공적이지 않은 것 같다.

 
HideYourRichess :

저것들. 시장의 알파벳을 모르면 직접 만들어보고 공부해보겠습니다.

물론 내가 틀릴 수도 있고 자주 하지는 않지만 이 접근 방식은 나에게 성공적이지 않은 것 같다.


알다시피, 나는 논쟁하고 싶지도 않고 좋아하지도 않습니다. 하지만 연구자들은 연속 변수에 대해 이것을 하고, 그것들을 이산화합니다. 다른 방법은 없습니다. 대안은 TI를 연속 변수에 전혀 적용하지 않는 것입니다.

하지만 어떻게 하느냐는 별개의 문제다. 연속값의 분포 분석을 통해 알파벳의 글자수를 결정하는 방법(파젠윈도우즈-구글룰이라고...)이 있는데 이 경우에는 사용하지 않고 잃어버렸던 것 같아요 조금.

 
무슨 내용인지 이해를 못하신 것 같습니다. 글쎄, 행운을 빌어.
 
HideYourRichess :
무슨 말인지 전혀 이해하지 못한 것 같습니다. 글쎄, 행운을 빕니다.

증분의 독립성에 대한 귀하의 추론을 이해했습니다. 완전히 동의할 수 있을지 모르겠습니다. 나는 또한 이 주제에 대해 Mathemat와 상의할 것입니다.
 
HideYourRichess :

"경제적 및 기타 의미"를 포함하지 않는다면 어떤 과정을 말하는 것입니까? 과정은 "물리적" 현상이며 원인과 결과가 있습니다. 예를 들어, 사과가 뉴턴의 머리에 떨어지는 과정. 시장에 붙어서 사고 파는 과정. 대가가 모두 어디에 있습니까?

다음 순간. ter.inf.의 기반이 되는 ter.ver.는 고려되는 이벤트 또는 기호의 독립성을 요구합니다. 그렇지 않으면 이러한 수학 장치의 사용이 올바르지 않습니다. 수익에 독립성이 있는 곳은 어디입니까? 내가 투기적 동기로 주식을 몇 개 샀고(우리는 DC가 아닌 실제 시장에 대해 이야기하고 있음) 가격에서 수익이 발생했다고 가정합니다. 얼마 후, 몇 번의 수익을 올린 후 이 주식을 매각하기로 결정했고 또 다른 수익이 발생했습니다. 이 두 가지 사건은 나를 통해 나의 투기적 동기가 매우 명확하게 상호 연결되어 있습니다. 시장에 나와 같은 바보들이 많이 있고 그들은 모두 같은 방식으로 사고 팔기 때문에 모든 수익은 서로 연결되어 의존적입니다. 그렇다면 왜 독립적인 사건의 종속적인 사건에 수학적 장치를 적용하려고 합니까? 이 올바른지?

따라서 그것은 명백하지 않습니다.


이 경우 독립성은 요구되지 않는 것으로 이해하며 평가 대상일 뿐입니다.
 
러시아어에서 TI를 사용하는 많은 예는 러시아어 및 기타 언어의 알파벳 알파벳 분석과 단어 및 구(단어 시퀀스) 분석과 관련이 있습니다. 그러나 이들 기호는 모두 통계적으로 독립적이지 않은 선험적이며 이러한 예 의존도를 나타내는 값인 상호 정보를 평가하는 데 사용됩니다. 따라서 연구된 양의 선험적 독립성은 TI의 올바른 적용을 위한 필수 조건이 아닙니다.