Ir al contenido

PGD | §2.1 – Muestreo de una imagen

< §1.6 – Digitalización en general

En el capítulo precedente hemos analizado, dentro de un punto de vista teórico, la posibilidad de representar información proveniente de magnitudes continuas de una manera digital, mediante muestreo y cuantificación. Ahora estamos en condiciones de aplicar estos resultados al caso particular de las imágenes.

Algunas consideraciones preliminares

Si bien todos sabemos lo que es una imagen, en lo que sigue lo entenderemos como un área sobre la cual se distribuye información lumínica, tanto en intensidad de brillo como en color, perceptible por un ser humano o por un dispositivo tecnológico con capacidad equivalente.

Esencialmente, el concepto de imagen tal como la entendemos hoy en día surge a partir de la técnica de la fotografía, y aún antes a través del arte de la pintura, que obtiene una reproducción de una escena real sobre un sustrato plano, proyectando así información tridimensional sobre un área de dos dimensiones. Desde luego, este procedimiento se logra a expensas de una pérdida de información por la dimensión faltante, que otras tecnologías aún en desarrollo están tratando de remedar[1].

Los primeros avances en digitalización de imágenes se originan en el ámbito científico, al desarrollar métodos de captura de imágenes, por ejemplo satelitales, y su posterior análisis de manera numérica a través de sistemas de cómputo, por lo cual algunos conceptos provienen de esta etapa. En estas primeras aplicaciones, el interés en la imagen radica no en aspectos artísticos, históricos o emocionales, sino en la información de valor técnico o científico que es posible extraer de ella. Por ejemplo, al tomar una imagen satelital de una determinada área del planeta, interesa reconocer y medir los objetos, accidentes geográficos, etc., presentes en esa zona.

En cambio, cuando el uso de la imagen radica en cuestiones estéticas, no hay un interés directo en la medida de los objetos presentes en ella sino en su poder expresivo y en su facultad de recrear una situación o evento real.

En el primer caso, la digitalización estará orientada a captar la mayor información posible que permita su posterior análisis; en el segundo caso, la digitalización se definirá en base a la técnica empleada para su reproducción posterior.

Para iniciar el análisis de la manera más sencilla posible, consideraremos una imagen que consiste en un área rectangular plana donde se tiene una distribución de luz variable, queriendo decir con esto que cualquier punto de ese rectángulo puede tener una intensidad de luz independiente de los otros. Esta intensidad de luz cumple (por ahora) dos condiciones:

  1. Sólo consideraremos variaciones de brillo de una luz blanca (lo que en la práctica se denomina comúnmente una imagen en escala de gris);
  2. Ese brillo varía desde un valor cero (que entenderemos por negro) hasta un valor máximo conocido (que entenderemos por blanco).

Esta intensidad o brillo así distribuido será la magnitud continua que intentaremos digitalizar.

Muestreo de una imagen

Aplicaremos ahora los conceptos antes vistos sobre muestreo, observando ante todo que si comparamos esta situación con los ejemplos precedentes podremos notar dos diferencias:

  • La magnitud a digitalizar (brillo) está distribuida en el espacio, en lugar de variar en el tiempo;
  • La distribución de esta magnitud es bidimensional, en lugar de ocupar sólo una dimensión.

Para empezar, consideremos una imagen plana monocromática rectangular, de la cual conocemos inicialmente sus dimensiones lineales W (ancho) y H (alto). Debe quedar claro desde ahora que estas dimensiones son longitudes, y por lo tanto se expresarán en metros, milímetros, pulgadas, kilómetros, años-luz, etc.

Definición de imagen
Ejemplo de una imagen de referencia junto con la nomenclatura empleada para indicar sus dimensiones: W para el ancho y H para el alto.

¿Qué entenderemos por muestrear esta imagen? Como la información de brillo se extiende en el espacio, tomaremos muestras de esa magnitud a intervalos regulares; como ocupa un área, repetiremos este proceso en ambas direcciones, horizontal y verticalmente.

¿Cuál será ese intervalo? Sabemos que esto depende de consideraciones prácticas; en una imagen dependerá de cómo varíe el brillo de una parte a otra y con qué rapidez. Una imagen muy detallada requerirá un intervalo menor que otra que tenga grandes zonas de brillo muy homogéneo. La imagen mostrada como ejemplo tiene zonas de mucho detalle; luego deberemos emplear un intervalo pequeño, en comparación con sus dimensiones.

El muestreo se hará midiendo el valor del brillo en una serie de puntos horizontales y verticales formando una retícula o trama; para que el número de muestras tomadas, por ejemplo, en la dimensión horizontal, abarque exactamente el ancho de la imagen, supondremos que el intervalo se ha elegido apropiadamente. Supondremos también que la misma verificación se ha hecho en la dimensión vertical. Para aclararlo, si la imagen mide 40 cm en sentido horizontal, un intervalo entre muestras de 1 mm sería apropiado, pues ello implicaría exactamente 400 muestras; en cambio, un intervalo de 1,5 mm no lo permite, ya que quedaría algo de imagen sin muestrear.

Llamaremos d al intervalo entre muestras, y NW al número de muestras en dirección horizontal. La observación anterior nos dice que el ancho de la imagen dividido el intervalo entre muestras nos dará el total de muestras horizontales, es decir:

NW = W /

Análogamente, en la otra dirección, si llamamos NH al número de muestras verticales, debe ser:

NH = H / d

En la imagen siguiente podemos ver, de manera esquemática, la distribución de las muestras. El intervalo elegido se ha exagerado con fines ilustrativos.

Muestreo de una imagen
Ubicación de las NW muestras a lo ancho y de las NH muestras a lo alto de la imagen. La distancia entre ellas es igual al intervalo de muestreo d.

Aquí hemos aceptado, implícitamente, que el intervalo entre muestras horizontales es el mismo que el intervalo entre muestras verticales. Esto no necesariamente es así, pues existen casos donde los intervalos son diferentes; en este caso deberemos llamar dW al intervalo horizontal y dH al intervalo vertical. El número de muestras en cada dirección se calculan ahora, respectivamente,

NW = W / dW     y      NH = H / dH .

En lo sucesivo supondremos que el intervalo entre muestras es el mismo en ambas direcciones, salvo indicación contraria.

El significado de tomar esos puntos como ubicación de las muestras es que debemos asignar a cada uno de ellos un valor de brillo. Este valor sería aquél que un instrumento de medición lumínica arrojara en cada punto, prescindiendo de su entorno[2].

El resultado de este procedimiento sería el que vemos a continuación, donde el “área de influencia” de cada muestra (esto es, el conjunto de puntos que están más cerca de la misma que de otra vecina) es reemplazada por el valor medido en el centro de aquélla. Cada una de estas áreas o celdas, naturalmente, tendrán un ancho igual a la distancias entre sus centros, es decir, serán cuadrados de lado d. (Se aprecia también que el intervalo elegido es demasiado grande, pues se ha perdido el detalle al extremo de que parece imposible saber cuál era la imagen original).

Muestreo de una imagen
Representación del resultado del muestro de una imagen. Cada cuadrado tiene un valor tonal igual al valor de la muestra en su centro.

Hemos obtenido así una representación formada por celdas, que ahora constituyen la fracción más pequeña o elemental de la imagen de la cual se tiene información de brillo. Por este motivo se denomina también a cada celda un elemento de imagen, conocido más comúnmente como pixel (que deriva de su denominación en inglés picture element, elemento de imagen).

Resolución de una imagen

Imaginemos que logramos capturar una vista en altura de un área extensa, digamos de varios kilómetros cuadrados, para analizarla presencia de cursos de agua en la región. Supongamos que pretendemos detectar arroyos de al menos dos metros de ancho entre orillas. ¿Qué intervalo de muestreo elegiremos?

Si elegimos un intervalo mayor a dos metros entre muestras, corremos el riesgo que uno de esos arroyos pase justo entre medio de dos muestras sucesivas, y por lo tanto no aparezca en la imagen muestreada. Para que eso no ocurra, el intervalo no debe ser mayor a esos dos metros.

Vemos así que si la imagen muestreada debe permitir la detección de objetos de tamaño L, el intervalo de muestreo d no deberá ser superior a L. Esta capacidad de la imagen para resolver la presencia de objetos de cierto tamaño se expresa a través de la siguiente definición:

(Primera acepción) Se denomina resolución de una imagen al tamaño del menor objeto que dicha imagen permite detectar.

Si el intervalo de muestreo es d, se dice que la imagen tiene una resolución igual a d.

Históricamente este fue el primer significado del término resolución como capacidad de resolver (es decir diferenciar, detectar) objetos en una imagen del primer tipo que mencionamos, que provienen en general de las aplicaciones científicas. En nuestro ejemplo, si el intervalo de muestreo es de 2 metros, diremos que la resolución de esa imagen es de 2 metros. Obsérvese que en esta primera acepción la resolución es una longitud, y por lo tanto se expresa mediante unidades de ese tipo[3].

En cambio, en las imágenes del segundo tipo (artísticas), el concepto que prevalece no es el tamaño de los objetos que aparecen en ellas sino la técnica empleada al reproducirlas. Aquí es necesario contar con muestras suficientemente cercanas entre sí para que al disponerlas sobre el medio o sustrato empleado den a la vista una sensación de continuidad que oculte el resultado del muestreo; cuando las muestras no son suficientes el muestreo se hace visible, fenómeno conocido como pixelado, que oportunamente analizaremos.

En este caso es de mayor interés saber de cuántas muestras se dispone por cada unidad de longitud de sustrato. Conociendo el intervalo entre muestras d podemos calcular cuántas muestras caben en una unidad de longitud dada; por ejemplo, si el intervalo de muestreo es de 0,1 mm significa que caben 10 muestras por cada milímetro.

En general, si d se expresa en una determinada unidad de longitud (milímetros en el ejemplo), el número de muestras por cada una de esas unidades será 1/d, los que nos permite establecer esta definición:

(Segunda acepción) Se denomina resolución de una imagen
al número de muestras empleadas por cada unidad de longitud.

En esta acepción, la resolución la expresaremos mediante el símbolo R.

Si el intervalo de muestreo es d, se dice que la imagen tiene una resolución R igual a 1/d.

Relación entre intervalo de muestreo y resolución:
R = 1/d

Las unidades más comunes en las que se expresa la resolución son pixeles por pulgada o ppi (pixels per inch) y pixeles por milímetro o ppm. De uso muy difundido (aunque técnicamente erróneo) es la expresión puntos por pulgada o dpi (dots per inch) y, aunque mucho menos difundido, su contraparte puntos por milímetro o dpm (dots per millimeter), pues el término dot tiene que ver con puntos de impresión y no con muestras. Una manera más correcta sería utilizar como unidad muestras por pulgada o spi (samples per inch), pero rara vez se usa.

(Una discusión más completa del concepto de resolución aplicado a la gráfica en general, incluyendo ejemplos de las dos acepciones descriptas aquí, puede verse en este artículo).

Como esta forma de entender la resolución es la más común en las artes gráficas, obtendremos el número de muestras en cada dirección a partir de R en lugar de d. Para ello basta observar que

NW = W / d = W • (1/d) = WR,

es decir,

NW = WR,

y análogamente en la otra dirección será[4]

NH = HR.

Para que estas relaciones sean válidas, tanto W y H como R deberán estar expresadas en unidades coherentes: por ejemplo, si W y H están expresadas en milímetros, R deberá estarlo en muestras por milímetro.

Llamaremos ahora N al número total de muestras tomadas en una imagen, que resultará, naturalmente, igual al producto de las muestras horizontales y verticales, es decir,

N = NWNH.

Reemplazando por sus equivalentes tendremos

N = (WR) • (HR) = WHRR,

que se puede expresar de manera más compacta como

Relación entre total de muestras, dimensiones y resolución:

N = WHR2

Lo importante de esta relación es que aquí se encuentra sintetizado, en esencia, el proceso de muestreo. Nos dice que si una de las dimensiones (W ó H) aumentara, por ejemplo al doble, el número total de muestras aumentará también al doble; pero si la resolución R aumentara al doble, el número total de muestras aumentaría al cuádruple. Esto es de interés, dado que este número decidirá más tarde el volumen de información generado por esa imagen, e impone una elección cuidadosa de la resolución a emplear.

Ejemplo:

Una imagen de 13 x 18 cm se muestrea a una resolución de 300 ppi. Calcular el número total de muestras generadas.

Sabiendo que 1 pulgada equivale a 25,4 mm, encontramos que

300 ppi = 300/25,4 ppm = 11,81 ppm = aproximadamente 12 ppm.

Así, expresando las dimensiones en mm, tendremos

N = WHR2 = 130 • 180 • 122 = 3.369.600 muestras[5].

 

Actividades para el capítulo §2.1

  1. A continuación se muestra una imagen satelital de una ruta argentina. El área mostrada representa un cuadrado de 120 metros de lado. La imagen tiene 386 muestras (pixeles) en cada dirección. Calcule la resolución en metros de esta imagen.sampling-far
  2. Examinando en detalle el área central de la imagen anterior, haciendo visibles las muestras individuales (pixeles), puede verse el automóvil blanco en el medio de la ruta. Utilizando el resultado anterior, estime las dimensiones (ancho y largo) del vehículo.sampling-near
§2.2 Cuantificación de una imagen >

1 Por ejemplo la holografía.
2 Un punto es una idea abstracta; en la práctica un instrumento de este tipo medirá la intensidad de luz en una zona que podrá ser muy pequeña, pero que tendrá un área definida, y en ella la intensidad de luz puede no ser estrictamente la misma en todos sus puntos. El valor medido será en realidad un promedio del valor lumínico en esa zona.
3 Dentro de este enfoque, las imágenes obtenidas mediante microscopios electrónicos pueden tener resoluciones del orden de micrones, ya que esta sería la distancia entre muestras.
4 En el caso que los intervalos de muestreo en cada dirección sean diferentes se tendrán dos resoluciones para la misma imagen: una horizontal RW = 1/dW y otra vertical RH = 1/dH.
5 Naturalmente, también es posible convertir las dimensiones de la imagen a pulgadas para así emplear la resolución en su unidad original, sin que esto cambie el resultado. Lo importante es mantener la coherencia de las unidades: si R está en ppi, W y H deberán estar en pulgadas; si R está en ppm, W y H deberán estar en mm.