jueves, noviembre 25, 2004

NumeroGooglia

Bueno, llevo 54 posts, así que creo que es hora de hacer un remake de otro post. En este caso se trata de algo más que un post de otro blog. Es un artículo de la revista Investigación y Ciencia de este mes, llamado Numerogooglia.

El artículo, escrito por Juan M. R. Parrondo, nos habla de uno de esos momentos aburridos ante el ordenador en que se le ocurre buscar su propio número en el Google.
En un principio se sorprendió porque apareciera 31 veces su número de telefono ,3686105*, pero luego trató de indagar un poco en ello.

Primero trata de contar las páginas que tienen números en su interior. Para ello busca todas las paginas que contengan "the" (8.000.000.000 páginas) y luego elimina las que contengan un uno (69.000.000 páginas), o un 2 (80.000.000 paginas), o un 3 (70.300.000 páginas), o un 4 (70.6000.000 páginas), o un 5 (70.900.000 páginas), o un 6 (70.200.000 páginas), o un 7 (71.200.000 páginas), o un 8 (71.600.000 páginas), o un 9 (71.400.000 páginas), o un 0 (71.800.000 páginas). Por alguna razón no busco mediante un OR todas ellas.

Bueno, pero esto no es lo importante. De toda maneras algo no sale bien, porque si buscas páginas donde aparezcan las palabras Time o Space obtenemos 51.000.000 resultados, pero si buscamos aquellas en las que sale Time, pero no Space salen 58.000.000 resultados.

Bueno, que me estanco. Luego, muy inteligente, Parrondo razona que no todos los numeros aparecen con la misma frecuencia, no es lo mismo un 1 que un 1364902746. Prueba entonces con varios números largos, pero agregando una cifra de cada vez. Descubre entonces que la gráfica sigue una curva logarítmica. La probabilidad de que salga 12346789 en una página es 0.068 veces la probabilidad de que salga 12345678.
Partiendo entonces de que 1.000.000.000 de páginas contengan números, le sale que un número de 7 cifras debería estar en unas 100 páginas.

Pero el avezado científico, aun ocioso ante Google, decide echar mano de una extraña ley que asegura que "la probabilidad de que, en unos datos provenientes del mundo real, el primer dígito sea 'd' es el logaritmo decimal de (1 + 1/d).
Se pone a comprobarlo en Google y sí, tras diversos experimentos descubre que, más o menos, Google sigue esta ley.

Obtiene así que para un número de 7 cifras que empiece por '1', lo normal es aparecer unas 134 veces en Google. Para su caso, empezar por 3, lo normal son 56, 25 más que las 31 que aparece su teléfono.
ASí, de una manera científica, aunque algo imprecisa, ha llegado a la conclusión de que el Gran Hermano no le vigila. Su número es, incluso, raro.

Ahora bien, señala que hay casos excepcionales. El número 1234567 aparece 199.000 veces, yo lo encontré 389000. Y dice que hay un número que aparece en 600.000 páginas y nos reta a encontrarlo. No sé cual es :(

* NOTA 1: ¿Porqué da su número? Si bien no está entero, tampoco es cosa de darlo. Así que me inclino a pensar que son falacias.

NOTA 2: Mi número aparece 245 veces cuando debería aparecer 35... FBI, sé que estás ahí.

NOTA 3: MUAHAHAHA lo he descubierto. No solo eso, sino que he encontrado uno de 8 cifras que aparece 3.050.000.

2 comentarios:

Abe dijo...

Luego dices que no tienes tiempo libre...

Por cierto, no haces ná más que actualizar y actualizar :P

Anónimo dijo...

Encontré un número de 7 cifras que aparece 1.160.000 veces...
pero no consigo encontrar ese de 8 :P