Ley de Benford!

En la mayoría de los casos, los descubrimientos científicos comienzan con una pregunta generada por una una observación, esto es también cierto en el mundo de las matemáticas. Un interesante ejemplo es la historia de la Ley de Benford, o la ley de los primeros dígitos. Esta ley es bastante interesante considerando que para algunas personas es bastante obvia, pero para la mayoría es incomprensible, dado que se basa en un hecho observable más que en una deducción analítica; y también, porque es de los casos en que un descubrimiento es presentado y practicamente ignorado, y que después se vuelve nuevamente a encontrar.

La ley de Benford presenta el hecho de que en general todos los números de un conjunto de datos (o grupo de números) tienen más probabilidad de comenzar con dígitos de rango bajo como 1 o 2, que con dígitos de rango alto como 8 o 9. Esta ley presenta una distribución de probabilidad que indica la posibilidad de que un determinado dígito sea el primero en un numero dado (Ejemplo: el primer dígito del valor 203,543 es 2). Esto es aplicable a una amplia gama de valores como la población de países, el número de bytes en archivos de sistemas informáticos, saldos de cuentas bancarias, números en la naturaleza, cifras financieras y comerciales, declaraciones de impuestos, datos meteorológicos, conjuntos de datos experimentales y de cosmología, etc.

 

La historia.

El primero en descubrir este fenómeno fue Simon Newcomb, un famoso astrónomo estadounidense, que publicó un artículo científico sobre este fenómeno en una revista matemática, en el año 1881. Mas dado que este no presentaba todos los antecedentes matemáticos, causo que el mismo fuera prácticamente olvidado.

Medio siglo después en 1938, Frank Benford, un físico trabajando en General Electric (Interesante, cómo esta ley tiene mucha más atención de científicos relacionados con la física que con las matemáticas), re-descubrió este fenómeno, prácticamente de la misma manera que Newcomb lo hizo previamente. Este descubrimiento se debió al desgaste y suciedad observada en libros de tablas de logaritmos (El logaritmo es la operación opuesta a la potenciación, asi como la resta es la operación opuesta a la suma). En esa época, sin la disponibilidad de las computadoras, para hacer multiplicaciones de números grandes, se hacía uso de las tablas de logaritmos para facilitar y acelerar los cálculos, ya que estas complicadas multiplicaciones pueden ser reducidas a sumas de logaritmos. Estos libros tienen una lista de valores de logaritmos en un rango de 1 a 9, ya que cualquier número puede reducirse a uno de estos valores, digamos que el logaritmo del número 5123 se puede obtener como el logaritmo de 5.123 (obtenido de este libro), Más 3, el valor para el logaritmo base 10 para 1000.
Es en estos libros donde Benford notó que las páginas iniciales, correspondientes a logaritmos de dígitos bajos, mostraban signos de más uso y desgaste que las páginas al final de los mismos, correspondientes a logaritmos de dígitos altos.

Distribución de probabilidad

Distribución de probabilidad de Benford (wikipedia)

Intrigado por esta observación, Benford realizó un experimento que tomó aproximadamente 20,000 números que “ocurren naturalmente”, de fuentes muy diversas, que van desde raíces cuadradas de números enteros, constantes numéricas, así como algunos conjuntos de datos inusuales, como la longitud de grandes rios o todos los números incluidos en una edición de la revista “Reader’s digest” y comparó la frecuencia de los primeros dígitos independiente para cada grupo de datos y para todos datos en conjunto, y las distribuciones de probabilidad fueron similares, teniendo números que empiezan con 1 cerca de un tercio de las veces y en proporción seis veces mayor que aquellos que empiezan con 9. La explicación para esta distribución, aunque puede parecer extraña, es en realidad bastante lógica.

El mejor ejemplo que me encontré para explicar esta distribución es presentado un excelente video en YouTube, (en Inglés solamente), donde explican el caso de un generoso (y totalmente hipotético), banco que da una tasa de interés diaria del 10%; Así que, si empiezas con un dólar, entonces empezaré a ganar 1.10 el primer día, 1.21 el segundo y 1.33 el tercero, teniendo una cantidad mayor a 1 dólar hasta el octavo día, cuando la cantidad se mueve a 2.14, y de ahí comienza a incrementarse en dígitos más altos, 2.35, 2.59, etc., hasta llegar a 10.83; a partir de este valor el ciclo comienza de nuevo. Ahora iniciando en los valores inferiores a 20; 11.92, 13.11, 14.42, etc. donde todos estos números empiezan con 1. Después de varias iteraciones para centenas o millardos, notarás que de hecho los valores que empiezan con uno suceden alrededor del 30% de las veces. Independientemente del número de veces que repetimos este ejercicio. Esto puede ser repetido con números de rifas, o cualquier otra irrestricta secuencia de números.

 

Bien, cual es el alboroto?

La ley de Benford no es sólo una curiosidad matemática; dado que es una base demostrable de cómo los números ocurren naturalmente, esta ley se utiliza para identificar casos en los que se sospecha que los número son no-naturales; es decir, en detección de fraude, y se utiliza para analizar datos de diferentes operaciones como precios de acciones, datos de préstamos, declaraciones de impuestos, transacciones de tarjetas de crédito, saldos en cuentas de clientes, precios de inventario, etc. Cuando los números de estos registros son manipulados tienden a desviarse de la probabilidad de distribución definida por Benford, y este es un indicador utilizado requerir un análisis más detallado. Y en varios casos este indicador es el detonante para detectar fraudes.

Identificación de fraude

Identificación de fraude con la ley de Benford (isaca.org)

La ley de Benford también tiene sus limitaciones, esta funciona en conjuntos de datos naturales y no restringidos; Por lo que, para casos de pequeños conjuntos de datos (menos de 500 valores), valores calculados como números telefónicos, o conjuntos con valores máximos o mínimos predeterminados como la altura de las personas, esta ley no funcionará. Pero para cualquier otro caso esta ley se puede aplicar. Puedes revisar diferentes ejemplos de esta distribuciónen el sitio Testing benford’s law, donde varios ejemplos son presentados.  

Por lo tanto, para los interesados en alterar o “cocinar libros”, es mejor no hacerlo, y prestar atención a esta ley, recuerda, “los primeros dígitos mandan!!”.

Saludos, Alex – Science Kindle.

 

Subscribe to ScienceKindle!
I agree to have my personal information transfered to MailChimp ( more information )
Join my newsletter and be part of the community receiving the latest articles and news about my site.
We hate spam. Your email address will not be sold or shared with anyone else.
Please follow and like us:
0 Shares

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.