Ir al contenido

PGD | §2.3 – Cuantificación en aplicaciones reales

< §2.2 – Cuantificación de una imagen

Si volvemos a examinar los ejemplos antes mostrados, es evidente que al elegir mayor número de niveles estamos en mejores condiciones de reconstruir las suaves variaciones de intensidad que ocurren en el cielo del paisaje contenido en esa imagen particular. Lo que no es tan evidente es cuántos niveles son necesarios para que el ojo humano no distinga la diferencia entre la imagen original y la cuantificada, o cuántos se precisan para su tratamiento posterior. Para ello se imponen otras consideraciones:

  • Se ha encontrado que el ojo humano tiende a distinguir variaciones de brillo[1] de hasta el 1% en términos relativos. Adoptando este criterio, deberíamos elegir niveles que disten no más del 1% entre sí. La menor cantidad de niveles que cumplen esta condición estaría representada por la escala 1%, 2%, …, 99%, 100%. Esto es un total de 100 niveles, para los cuales se requieren no menos de 7 bits. Según lo visto anteriormente, elegir estos 7 bits nos llevaría a utilizar en realidad 27 = 128 niveles.
  • Por otro lado hemos visto, desde el punto de vista tecnológico, que los sistemas actuales permiten manejar un byte (conjunto de 8 bits) como unidad mínima de almacenamiento y proceso. Luego, por sencillez de implementación, podrían adoptarse estos 8 bits como profundidad de color, lo que nos permitiría un conjunto de 28 = 256 niveles de cuantificación diferentes.
  • Finalmente, otra cuestión tiene que ver con el procesamiento digital de la imagen. Existen toda una variedad de técnicas de retoque fotográfico y corrección de color que operan numéricamente sobre la imagen digitalizada. Cuando deben hacerse largos cálculos sobre ciertos datos, los errores de truncamiento y redondeo afectarán el resultado final tanto más cuanto más cálculos se realicen y cuanto menos precisos sean los datos; análogamente, para tener cierto margen en el procesamiento posterior de una imagen, es conveniente disponer del mayor número posible de niveles. Existen actualmente métodos que requieren 16 o más bits de información por canal, esto es, una discriminación de no menos de 216 = 65.536 niveles diferentes.

Estas consideraciones sirven para justificar los valores usualmente elegidos, al menos en lo que respecta a su uso en fotografía y artes gráficas en general, a saber:

  • 8 bits por canal en imágenes de buena calidad en su formato final, es decir que no serán sometidas a edición posterior (esta es la profundidad más común);
  • 16 bits por canal en imágenes obtenidas en ámbitos profesionales y/o que deban ser sometidas a retoque o corrección posterior;
  • 32 bits por canal en imágenes especiales de alto rango dinámico (conocidas en la fotografía como HDR – High Dynamic Range).

Otros modos de cuantificación de color

Hemos mencionado las imágenes en escala de grises, las imágenes color en RGB y las imágenes color en CMYK como diferentes formas de cuantificar color (en sentido general), pero no son las únicas. Según los canales y profundidad de bits empleados, son posibles otros métodos:

Imágenes de mapa de bits (bitmap)

Imagen en modo bitmapEn estas imágenes, cada muestra es obligada a adoptar un nivel entre dos posibles: blanco o negro, normalmente por el procedimiento de comparar el valor de la muestra con un umbral de decisión ubicado típicamente en el 50% de la escala: los valores mayores a ese umbral serán tomados como blancos y los menores como negros. De esta forma, cada muestra genera sólo un bit de información, y de allí su denominación. Tenemos en este caso un solo canal (C = 1) mientras que Q = 1 bit. Un ejemplo de aplicación son las imágenes de líneas o plumas que resultan en general de escanear un texto o un dibujo; otro ejemplo son las imágenes de tramas que se generan previamente a la exposición de una película o el grabado de planchas. Las imágenes transmitidas por fax también utilizan este tipo de cuantificación.

Imágenes en color indexado

IndiceColorCódigo (2 bits)
0◼︎00
1◼︎01
2◼︎10
3◼︎11

Imagen en modo color indexadoEsta modalidad es apropiada para aquellas imágenes que constan de unos pocos colores planos (muy común en logotipos), para lo cual el modelo RGB generaría una cantidad de información excesiva. Aquí se analiza previamente la imagen para averiguar cuántos colores diferentes contiene; luego se prepara una tabla donde se guarda cada color y se le asigna un número de orden, es decir, se numeran los colores presentes en la imagen. De esta manera, a cada pixel le corresponde un número o índice que señala su color en la tabla; de aquí el nombre de color indexado. Como cada pixel contiene sólo un índice, será C = 1; según la cantidad de colores que contenga la tabla será la profundidad de color resultante. Por ejemplo, si en la imagen se detectan 4 colores diferentes (como en el ejemplo mostrado), la tabla contendrá 4 valores, luego cada índice, y por tanto el valor de cada pixel, será un número de 2 bits. En general, una imagen en color indexado tiene un Q igual al número de bits de los índices de la tabla asociada. Los logotipos y ciertas imágenes con similares características que se usan frecuentemente en las páginas web son ejemplos de este tipo.

Imágenes CMYK con colores especiales (spot colors)

En la industria gráfica son imágenes que contienen canales de color adicionales al modelo CMYK. Equivalen a la representación digital de documentos que contienen colores especiales (spot colors) agregados a los de proceso. Aquí el número de canales C será igual a 4 más los colores especiales agregados, mientras que normalmente es Q = 8 bits.

Imágenes multicanal

Son imágenes que provienen en general del ámbito astronómico o científico, donde la información de cada pixel resulta de combinar varias fuentes diferentes; por ejemplo, imágenes de objetos del espacio exterior obtenidas a través del análisis de ondas de radar, ultravioleta e infrarrojo además del espectro visible (que comúnmente se las denomina “imágenes en color falso”). Aquí habrá tantos canales como fuentes diferentes de información se empleen, mientras que por lo general la profundidad es de 8 bits, aunque eso dependerá de la aplicación.

Imágenes duotono

En impresión, los 256 niveles teóricos de una imagen en escala de gris de 8 bits se reducen a aproximadamente 100, lo que ocasiona un efecto de pérdida de contraste y de detalle. Para paliar este fenómeno se emplean reproducciones de trama de mediotono que usan negro superpuesto a una o más tramas de otro color, con el propósito de lograr un mayor contraste y mejor definición en los tonos medios. Estas reproducciones se denominan duotonos en general, aunque tengan más de 2 tramas. En particular, se denominan respectivamente duotonos, tritonos o cuatritonos según empleen dos, tres o cuatro tramas diferentes. Como cada una de ellas se genera a partir de una misma imagen grayscale, desde el punto de vista digital un duotono en general es simplemente una imagen de escala de gris más la indicación de las tramas y curvas de transferencia a emplear, de manera que constan de un solo canal (C = 1) y se cuantifican en Q = 8 bits.

Imágenes de 16 bits

Como mencionamos antes, ciertas imágenes de alta calidad (como las producidas por escáneres y cámaras fotográficas de alta gama) se cuantifican en 16 bits, pudiendo ser en escala de gris, RGB o CMYK según el caso. El número de canales C será 1, 3 ó 4 respectivamente, mientras que Q = 16 bits.

Imágenes de alto rango dinámico (HDR)

Son imágenes especiales donde es necesario cuantificar una gama de intensidades extremadamente amplia, para las cuales 16 bits serían insuficientes. En general son RGB solamente (y por lo tanto C = 3) con Q =  32 bits. Por lo común se obtienen a partir de un conjunto de imágenes del mismo objeto o escena tomadas con diferentes exposiciones, que se someten luego a un proceso de síntesis para producir una imagen HDR con la profundidad de bits indicada.

Imágenes Lab

Si bien veremos en más detalle el modelo Lab en la asignatura Gestión de color, por el momento lo consideraremos un sistema para la descripción del color que utiliza tres componentes: el primero, L, indica un valor de brillo del color, mientras que los otros dos, a y b, definen su cromaticidad. Desde el punto de vista digital, sin embargo, no difiere de RGB en el sentido que emplea 3 canales; a su vez cada uno de ellos puede utilizar 8 ó 16 bits. Luego, para las imágenes Lab resulta C = 3 y Q = 8 ó 16 bits, según el caso. —

Resumen de tipos de imagen según su cuantificación

Como síntesis de los métodos de cuantificar la información de brillo y color de una imagen, se presenta en la tabla siguiente un resumen de los parámetros correspondientes a los diferentes tipos de imagen según su modo de cuantificación. Obsérvese que la última columna expresa Q en bytes (en lugar de bits) para permitir obtener el peso de imagen directamente en bytes.

DescripciónNúmero de canales
C
Profundidad de color
Q (bits)
Profundidad de color
Q (bytes)
Mapa de bits (bitmap)111/8
Escala de gris (grayscale)181
Duotonos, tritonos y cuatritonos181
Escala de gris (grayscale) de 16 bits1162
Color indexado con tabla de n bits
(n ≤ 8)
1nn/8
Color RGB381
Color RGB 16 bits3162
Color RGB HDR3324
Color CMYK481
Color CMYK 16 bits4162
Color CMYK
+ n spot colors
4 + n81
Multicanal (n canales)n8
(según aplicación)
1
(según aplicación)
Color Lab381
Color Lab 16 bits
3162

Esta clasificación no es exhaustiva; se presentan solamente los casos más comunes en aplicaciones gráficas, de fotografía e internet.

§2.4 – Almacenamiento de una imagen digital >

1 Para ser precisos, este “brillo” no se define como intensidad de luz radiada sino como cantidad “percibida” por el ojo humano, el cual responde de una manera no lineal a dicha intensidad. Cuando hablamos de brillo siempre admitiremos que es intensidad medida en términos perceptuales.