[Archivo] Matemáticas puras, física, química, etc.: problemas de entrenamiento cerebral no relacionados con el comercio de ninguna manera - página 383

 
Richie:

WWer, ¿qué significa "tamaño de primera base"? La suma de los miembros ?

El número de elementos (números).
 
WWer:

Hay que determinar (de forma probabilística (2sigma por ejemplo) el tamaño de la primera base a partir de la nueva base.

El tamaño es, según tengo entendido, el rango de valores extremos, ¿o qué? En este caso, si se conoce la distribución, se puede resolver el problema.

Pero si el tamaño es una cantidad de números, no lo entiendo. Dame un ejemplo, por favor.

 
Mathemat:

El tamaño es, supongo, la propagación de los extremos, ¿o qué? En este caso, con una distribución conocida, se puede resolver el problema.

Pero si el tamaño es una cantidad de números, no entiendo algo. Dame un ejemplo, por favor.


Tomemos los números naturales para simplificar: 1 2 3 4 5 ... X. Esta es la "X" que necesitamos encontrar.

elige al azar un número de esta base. Por ejemplo, "3"... la probabilidad de elegir cualquier número = 1/X.

Ejemplo. Supongamos que hay 10 números: 1 2 3 4 5 6 7 8 9 10 (he dicho 10 por el ejemplo, en realidad es el número que tenemos que encontrar)

Muestras 20 números: 5 2 9 5 3 8 4 10 3 2 7 1 8 5 2 6 1 10 1

Aquí, ahora vamos a olvidar que teníamos el tamaño de la primera base, y sólo de la segunda base tenemos que encontrar.

Está claro que la primera base será mucho mayor y los números no son consecutivos.

 

Vaya, ¿este problema tiene alguna solución?

Siempre que los números de la primera base de datos no tengan repeticiones, podemos pasar por las muestras siguientes y volver a calcular el número de elementos (si el mismo número se repite en ellas, no se tienen en cuenta las repeticiones: sólo se ha tenido en cuenta una vez, y se saltan las demás). ¿Pero dónde está la garantía de que la base de datos original no contiene más elementos de los que hemos podido recalcular? La probabilidad es la probabilidad. Tendríamos que hacer muchas muestras. Y el resultado sólo se verificará (no importa cuántas muestras hayamos hecho) - siempre habrá una probabilidad de que al menos 1 elemento no esté incluido en ninguna muestra....

 

Sinceramente, no entiendo la idea. ¿Y si los números son cuadrados de números naturales, es decir, 1, 4, 9, ..., 625? ¿A qué equivale X?

¿Y cómo se puede estimar a partir de una "muestra" mayor que la población original?

¿Puede insinuar una aplicación práctica, para qué sirve?

 
drknn:

Vaya, ¿se puede resolver ese problema?

Siempre que los primeros números de la base no tienen repeticiones, se puede ir a las selecciones posteriores y volver a calcular el número de elementos (si el mismo número de repetidos en ellos, entonces las repeticiones no cuentan - sólo 1 vez que contó, y otras ocurrencias de la falta). ¿Pero dónde está la garantía de que la base de datos original no contiene más elementos de los que hemos podido recalcular? La probabilidad es la probabilidad. Tendríamos que hacer muchas muestras. Y el resultado sólo se verificará (no importa cuántas muestras hayamos hecho) - siempre habrá una probabilidad de que al menos 1 elemento no esté incluido en ninguna muestra....

Sí, claro que sí)


por eso digo "probabilísticamente".... así que la respuesta debería ser algo así: tamaño de la base 100000-110000 con una probabilidad del 97%.... y si hacemos 300.000 muestras tenemos una probabilidad del 95% de la base.

 
Mathemat:

Sinceramente, no entiendo la idea. ¿Y si los números son cuadrados de números naturales, es decir, 1, 4, 9, ..., 625? ¿A qué equivale X?

¿Y cómo lo estimo a partir de una "muestra" mayor que la población original?

¿Puede dar una pista de la aplicación práctica, para qué sirve?

Envío consultas al servidor, y como respuesta obtengo 10 identificaciones de usuario aleatorias de la base de datos. Aquí quería resolver un problema de este tipo al mismo tiempo, que sabría cuántos al menos hay ID, y cuántas consultas para enviar)

zy. ahora tengo 400000 id.

 
WWer:

Hola, ¿quién puede resolver este problema?):

Hay una base de números diferentes. Seleccione al azar los números de la misma y formó otra base (es decir, ya hay números se puede repetir). Puedes seleccionar todos los que quieras, pero es una pérdida de recursos y de tiempo.

Hay que determinar (de forma probabilística (2sigma por ejemplo) el tamaño de la primera base a partir de la nueva base.

+ También estaría bien calcular cuántas muestras hay que hacer para obtener al menos el 90% de la primera base.


MOJ de la muestra multiplicado por 2
 
Prival:
determinar el OLS de la muestra y multiplicar por 2.
¿Ols de qué?
 
WWer:
¿MOS de qué?


ha seleccionado 100 números de una base, si la base está numerada del 1 al .... X en orden. entonces tal vez *2 de estos 100 números serán X

La función matad. rnd(2000) gerencia un número aleatorio de 1 a 2000. Tomamos 100 valores de i=0...100 y calculamos todo con ellos. Por supuesto, el resultado no será exacto, ya que esta estadística es un intervalo de confianza - también puedes calcularlo y, dependiendo de la precisión que necesites, determinar el tamaño de muestra adecuado