Ir al contenido

PGD | §1.2 – Unidad binaria de información

< §1.1 – El concepto de información

La medida de información expresada por la variedad, junto con la definición anterior de información compuesta, nos permite en principio calcular esta medida para una fuente compuesta de un número arbitrario de fuentes simples. Sin embargo presenta dos inconvenientes. Por un lado, un mensaje de variedad 1 no transporta información: esto se debe a que el mensaje elegido es el único posible, por lo cual no existe ninguna incertidumbre con respecto a su elección o recepción:

Un mensaje de variedad 1 no contiene información.

Como con cualquier otra magnitud, sería deseable que un mensaje así tenga una medida cero.

Por otro lado, si se agregan paulatinamente fuentes simples, la medida en términos de variedad de una fuente compuesta aumenta muy rápidamente. Por ejemplo, en un sistema de impresión convencional, un color se especifica según los distintos porcentajes de punto de las tintas que lo forman. Normalmente, el porcentaje de punto de cada tinta varía de 0% a 100% en pasos de 1%, por lo que cada tinta puede tomar 101 valores posibles. Si no se imponen restricciones para formar un color —es decir, se admite cualquier combinación de porcentajes de punto para cada tinta—, el color resultante (fuente de información compuesta) tiene una variedad que resulta del producto de las variedades de los porcentajes de punto de cada tinta (fuentes simples):

Variedad del color =

= Variedad de C • Variedad de M • Variedad de Y • Variedad de K

= 101 • 101 • 101 • 101 = 104.060.401

Obsérvese que con apenas 4 fuentes de información con variedades del orden de 100 tenemos ya una variedad resultante del orden de cientos de millones.

Unidad binaria de información

Existe otra manera de medir la información que se basa en establecer un mecanismo para la selección de un mensaje entre la totalidad de las opciones disponibles. Dado que un mensaje de variedad 1 no contiene información, se deduce que la mínima variedad que transporta información es dos; esto nos sugiere que podríamos utilizar como patrón de medida la información comunicada por un mensaje de variedad dos, por ejemplo, la respuesta a una pregunta del tipo Sí-No. ¿Cómo especificar el mensaje mediante este mecanismo?

Volvamos nuestra atención a una fuente simple, como el color de la tinta que debemos reponer en una de nuestras impresoras inkjet. Las posibilidades son:

Color de la tinta
Cian
Magenta
Amarillo
Negro

Dado que las posibilidades son cuatro, no podemos seleccionar el color por una simple pregunta cuya respuesta sea sí o no; esto nos sugiere que deberemos emplear más de una pregunta.

Dividamos la lista en dos mitades: una mitad superior (cian, magenta) y una inferior (amarillo, negro). Podríamos así preguntar: ¿está la tinta elegida en la mitad superior? La respuesta será “sí” (si se trata de cyan o magenta) o “no” (si es amarillo o negro). Todavía no llegamos a una respuesta única, pero ya es posible vislumbrar que eso se resuelve con una nueva pregunta: si contestamos “sí” dividamos a su vez la mitad superior en dos (o la inferior si contestamos “no”) y formulemos nuevamente la misma pregunta: ¿está la tinta elegida en la mitad superior? Esta segunda respuesta nos indicará finalmente el color elegido.

Completemos el cuadro anterior con las respuestas a la primera y segunda preguntas:

Color de la tinta La 1ra respuesta es… La 2da respuesta es…
Cian
Magenta No
Amarillo No
Negro No No

Este análisis nos sugiere que, para especificar una de las tintas, es suficiente formular dos preguntas cuyas respuestas sean sí o no. Esto es consistente con la noción de variedad, ya que cada respuesta tiene variedad 2, y cada pregunta puede considerarse una fuente de información independiente; luego la variedad resultante es 2 • 2 = 4, el número de tintas posibles. Sin embargo, para que esto sea verdad para cualquiera de las tintas, es necesario elegir las preguntas de manera que cada respuesta descarte el mayor número posible de opciones, y esto sólo es posible si tanto la respuesta Sí como la No descartan la mitad de las opciones disponibles.

En consecuencia, podemos decir que una de las tintas (variedad 4) puede indicarse también por las respuestas dadas a dos preguntas del tipo Sí-No. Si cada una de estas respuestas la tomamos como una unidad de información, un mensaje de variedad 4 equivale a dos unidades de este tipo. Definiremos entonces

Llamaremos unidad binaria de información a la información suministrada por la respuesta a una pregunta del tipo Sí-No.

Debe quedar claro que las posibles respuestas y No a una pregunta representan sólo una de las formas más comunes de este tipo de preguntas, pero se extiende también a otras respuestas posibles[1], como verdadero y falso, normal y anormal, etc.

En la tecnología electrónica digital se emplean como mensajes o respuestas dos niveles de tensión o corriente eléctrica, que se identifican como bajo y alto, o también como cero (nivel de corriente o tensión bajo o nulo) y uno (nivel de corriente o tensión alta o máxima), y se simbolizan 0 y 1 respectivamente. Esto hizo ventajoso el uso del sistema de numeración binario, que a diferencia del decimal emplea sólo los dígitos 0 y 1 para representar cualquier número, llamados así dígitos binarios o bits (por su expresión en inglés binary digit).

De esta forma, una unidad binaria de información puede quedar expresada por una pregunta cuya respuesta sea Sí o No, o también 0 ó 1; es por lo tanto equivalente a los posibles valores de un dígito binario o bit. Por consiguiente:

Tanto en el contexto de la tecnología digital como en la teoría de la información, la unidad binaria de información recibe también el nombre de bit.

Volviendo a nuestro ejemplo, especificar una tinta entre las cuatro posibles requiere una cantidad de información igual a 2 bits.

Debemos notar que esta nueva forma de medir información está directamente relacionada con la variedad, de modo que si conocemos una es posible determinar directamente la otra. Como cada bit de información representa 2 posibilidades (variedad 2), y 2 bits de información, como vimos más arriba, representan 2 x 2 = 4 posibilidades (variedad 4), tres bits representarán una variedad 2 • 2 • 2 = 8, etc. Aparece así, naturalmente, la relación entre ambas formas de medir información:

Variedad = 2 • 2 • 2 • … • 2 = 2(número de bits)

En lo sucesivo representaremos variedad con la letra V, mientras que el número de bits quedará representado con n. La expresión anterior queda entonces

Relación entre variedad y número de bits:
V = 2n

Esta relación nos permitirá pasar de información expresada en variedad a información expresada en bits y viceversa[2].

Ahora estamos en condiciones de ver por qué este sistema soluciona las dificultades mencionadas al comienzo. De acuerdo a esta definición, la cantidad de bits de un mensaje es igual al número de preguntas del tipo si/no que es necesario hacer para resolver sin ambigüedad el mensaje elegido. Un mensaje de variedad 2 requiere una sola pregunta; un mensaje de variedad 4 (como el ejemplo de las tintas recién analizado) requiere 2 preguntas, etc. Un mensaje de variedad 1 no requiere hacer ninguna pregunta, ya que no existe incertidumbre sobre su elección: luego la cantidad de bits es cero. Así hemos salvado la primera objeción.

Resta ver cómo se comporta esta nueva forma de medir al combinar dos o más fuentes de información simple en una fuente de información compuesta.

Actividades para el capítulo §1.2

  1. Una tienda dispone de 8 modelos de camisas. Cada modelo viene en una cierta variedad de colores. Si la variedad de todas las camisas (que difieren en modelo y/o color) es 32, ¿cuál es la variedad de los colores disponibles?
  2. Exprese en bits la información necesaria para comunicar la elección de una camisa cualquiera del punto anterior.
  3. Explique por qué podemos considerar que comunicar el resultado de arrojar una moneda requiere 1 bit de información.
  4. Sabemos que un dado tiene 6 caras. ¿Cuántas caras debería tener para que comunicar el resultado de arrojarlo demandara 3 bits de información?
§1.3 – Información compuesta medida en bits >

1 Para que un conjunto de respuestas sirva a este propósito debe cumplir con la condición de ser binario (dos respuestas), exhaustivo (abarca todas las posibilidades) y excluyente (una y sólo una de las dos es verdadera).
2 Esta relación puede invertirse, y así es n = log2 V. Para que n sea entero, V deberá ser una potencia de dos. Esto no necesariamente es así en general, y en caso de no serlo el número de bits resulta fraccionario. No obstante, quedará claro más adelante que en las aplicaciones que nos interesan las cosas se disponen de forma que n sea entero, y por lo tanto V será efectivamente una potencia de dos (es decir, los conjuntos de interés tendrán variedad 2, 4, 8, 16, 32, 64, 128, 256, etc).