Estadística de la dependencia entre comillas (teoría de la información, correlación y otros métodos de selección de características) - página 10

 

Hablando de un tipo diferente de dependencia.

¿Cómo depende "a" de "b" fuera de cualquier texto? No lo hace, es decir, no se puede obtener "a" de otros caracteres.

¿Y si depende de, por ejemplo, 1, 2, 3, 4, 5, 6? Evidentemente, no es un conjunto muy apropiado para el alfabeto, sea cual sea la etiqueta.

¿No es así?

 
TheXpert:

Hablando de un tipo diferente de dependencia.

¿Cómo depende "a" de "b" fuera de cualquier texto? No lo hace, es decir, no se puede obtener "a" de otros caracteres.

¿Y qué hay de depender de, digamos, 1, 2, 3, 4, 5, 6? Obviamente, no es un conjunto muy apropiado para el alfabeto, independientemente de cómo se etiquete.

¿No es así?

¿Por qué no? El sistema numérico hexadecimal. Es un alfabeto normal - tan bueno como el binario :)

Y las letras rusas Y, Y, Y pueden derivarse de otras letras.

 
Avals:

Y las letras rusas yu, ya, yo pueden derivarse de otras letras.

No son letras, sino sonidos :)

¿O es como ese chiste? "¡Qué sencillo es el idioma ruso: la palabra "yosh" se escribe con dos letras!"

 
TheXpert:

No son letras, sino sonidos :)

¿O es como ese chiste? "¡Qué sencillo es el idioma ruso: la palabra "yosh" se escribe con dos letras!"

bueno, no te quejes)). También hay ejemplos en otros idiomas en los que un carácter se sustituye por varios, es decir, un carácter puede derivarse de los demás. No entiendo bien el principio de esto. Y de todos modos, ¿cómo se determina si es el alfabeto correcto o no?
 

Yo también estoy un poco confundido, pero algo me dice que HideYourRichess tiene razón.

La comparación con un sistema numérico probablemente no sea del todo correcta. Un número puede ser representado por una sola cifra, mientras que las comillas tienen muchas representaciones, es decir, un símbolo puede ser expresado por un enorme (infinito para ser más exactos) número de variantes a través de otros símbolos, es decir

a == tsdrmiikepi == fsrpl == mflncp == javlpor == fwlfrmilfpf == .

No es correcto, en mi opinión.

 

Señores, he visto un artículo de investigadores alemanes justo en la línea del tema. Lo publicaré cuando lo encuentre. Es decir, no propongo nada nuevo, todo está estudiado desde hace al menos 10 años.

Hay un investigador Battiti (puede buscar el artículo por las palabras Mutual Information Feature Selection). Es el padre de la metodología de selección de variables con ayuda de la información mutua. Hay compañeros que trabajan con diferentes fuentes de datos experimentales, en particular, con datos sobre la actividad solar (que es generalmente una fuente popular de valores). Y los resultados confirman la utilidad de la estadística I (X,Y) para el pronóstico. Tendré que leer cómo discretiza los valores aleatorios allí y crea un alfabeto. Parece que nadie se ha preocupado tanto por la teoría (como los veteranos locales).

 

¿Qué tiene que ver el sistema numérico, TheXpert? No entiendo por qué la conversación ha girado en torno a los sistemas numéricos.

Sinceramente, no veo ningún argumento de HideYourRichess que interfiera de alguna manera en la aplicación de la IT a las cotizaciones.

 
Mathemat:

¿Qué tiene que ver el sistema numérico, TheXpert? No entiendo por qué la conversación ha girado en torno a los sistemas numéricos.

No es un tirón, sólo una cuestión de opinión. ¿Qué tienen de malo los números como alfabeto?

Sinceramente, no veo ningún argumento de HideYourRichess que interfiera de alguna manera en la aplicación de la IT a las cotizaciones.

Elección del alfabeto.

______

Taki probablemente prefiera leerlo.

 
TheXpert:

Yo también estoy un poco confundido, pero algo me dice que HideYourRichess tiene razón.

La comparación con un sistema numérico probablemente no sea del todo correcta. Un número se representa con una sola cifra, mientras que las comillas se representan con muchas variantes, es decir, un símbolo puede expresarse con un número enorme (infinito para ser más exactos) de variantes a través de otros símbolos, es decir

a == tsdrmiikepi == fsrpl == mflncp == yawlpor == fwlfrmilfpf == .

No es bueno, en mi opinión.


escriba la palabra "Trastorno" en diferentes idiomas y lo mismo es cierto :) e incluso el mismo alfabeto puede dar ejemplos de sinónimos, o palabras obsoletas

s.w. Un número también puede representarse de infinitas maneras, según el cálculo, que es de hecho un alfabeto.

El alfabeto es algo nocional, inventado por el hombre para enumerar un gran número de objetos y fenómenos con un número menor de caracteres. Por supuesto, los caracteres deben ser un conjunto discreto. No hay otros requisitos estrictos para ello: es una cuestión de usabilidad.

 
Mathemat:

Matemáticas:

HideYourRichess, si crees que todo el terver se debe a la serie de Bernoulli o a la ley de los grandes números, estás muy equivocado.

No lo pienso, lo sé con certeza.

¡Son cinco! ¡Quiero dos!
HideYourRichess: ¿No entiendes que ahí estamos hablando de una secuencia de eventos independientes?

¿A qué eventos independientes se refiere? ¿Sobre una secuencia de caracteres alfabéticos de la fuente? No, no son necesariamente independientes, ya se le ha explicado. Un texto literario ruso ordinario es una secuencia de letras dependientes. Si fueran independientes, los textos literarios estarían mucho peor comprimidos por el archivero de lo que realmente están. Coge un texto literario y baraja y compara los resultados de archivar el original y el barajado.

¿O crees que los conjuntos de fuentes y receptores son variables independientes?

La noción de entropía de la información fue introducida por Shannon para los caracteres independientes. Si no me cree, consulte un diccionario académico. No voy a discutir más con usted sobre este tema. No se puede calcular la entropía de la información para el mercado, ya que no se conoce el alfabeto, no se conoce la frecuencia de los símbolos y tampoco se conoce la independencia de los símbolos (pero sabemos que las acciones de los participantes en el mercado son muy dependientes).

La siguiente cuestión, la entropía condicional, es sólo el caso de que existan dependencias entre los caracteres del alfabeto original. Esto no es lo mismo que la entropía de la información, de la que se habló.

No entiendo a qué conclusiones te lleva el ejemplo del archivero, pero te diré lo siguiente. La tarea del archivero es traducir la entropía condicional en entropía informativa. Es decir, crear un alfabeto limitado perfectamente definido, cuyos caracteres, en la secuencia resultante, sean lo más independientes posible. Si se mezcla la estructura ordenada de un texto literario a nivel de letras, por supuesto que esas secuencias de letras se romperían y la compresión se deterioraría. Hasta el punto de que ya no se puede comprimir un conjunto de letras completamente aleatorio. ¿Y qué? ¿Qué tiene eso que ver?