Saltar al contenido

La batalla de los ∆E (epílogo)

Aunque en el artículo anterior dimos por ganador a ∆E00 gracias al considerable esfuerzo de preparación y verificación al que fue sometido, y a pesar de ser la métrica recomendada por la CIE y por ISO, sabemos que en la industria no es fácil de un día para el otro cambiar de norma, aún cuando sus ventajas sean palpables. De hecho, a pesar de esta recomendación, muchas personas hoy siguen usando rutinariamente ∆ECMC y ∆E94 (por no mencionar que también están los que no han abandonado ∆Eab). En esta última parte intentaremos determinar qué es lo que podemos esperar al adoptar una de estas métricas, mediante ciertas gráficas convenientemente elaboradas que nos permitan comparar las métricas entre sí.

Si bien en los articulos previos hemos hecho algunas de esas comparaciones, se trata de tener algún tipo de panorama que nos permita evaluarlas todas en conjunto.

¿Cómo comparar métricas entre sí?

Para responder esta pregunta, digamos ante todo que, siendo una métrica una fórmula de comparación, comparar metricas significa entonces... ¡comparar comparaciones! Ante esta inquietud que me quitó el sueño durante mucho tiempo (bueno, en verdad no tanto), la primera reacción fue indagar cómo los investigadores que elaboraron las diferentes métricas se atrevieron en su momento a decir "esta métrica que acabo de inventar es mejor que aquélla". ¿Cómo establecen objetivamente la superioridad de una métrica?

En el primer artículo de esta serie, habíamos establecido que:

Una métrica será juzgada superior a otra cuando las diferencias de color que predice tienen mejor correlación con lo que un observador humano puede percibir.

Esto significa que para demostrar dicha superioridad debemos definir de manera objetiva la correlación entre lo predicho por la métrica y la percepción humana.

En los diferentes papers donde se publican estas investigaciones aparece frecuentemente un factor de correlación denominado suma estandarizada de cuadrados residuales (Standardized Residuals Sum of Squares), conocido también como STRESS. En términos llanos, este método opera sobre un conjunto de observaciones (pares de colores comparados en nuestro caso) y contrasta la diferencia observada entre ellos con lo obtenido por la fórmula. Se calcula entonces la diferencia entre estas diferencias (error o desvío), que puede ser una cantidad positiva (la fórmula predice una diferencia mayor a la observada) o negativa (predice una diferencia menor).

El mérito de una métrica tiene que ver con el conjunto total de esos desvíos; si todos juntos representan una cantidad pequeña, la métrica debe ser mejor que otra donde ese resultado sea mayor. El método más simple de tener "todas los desvíos juntos" sería sumarlos, pero siendo algunos positivos y otros negativos corremos el riesgo que tiendan a cancelarse. Entonces los matemáticos e ingenieros usamos el viejo truco de elevar esos desvíos al cuadrado, volviéndolos así todos positivos, para después sí sumarlos. El método STRESS aplica una variante de esta técnica, donde en lugar de obtener un valor absoluto de error, genera uno relativo en una escala porcentual, lo que permite comparar diferentes factores entre sí.

Una comparación más "visual"

El método STRESS puede parecer sencillo de entender para los especialistas, pero para el público en general, aún para aquéllos con formación técnica, quizás resulte un arcano. Pensé entonces en una forma quizás algo más intuitiva, basado en una idea simple:

Imaginemos que nos movemos libremente en el espacio L*a*b* dando "saltos" de exactamente 1 ∆E usando la fórmula ∆Eab, la más sencilla. Entonces cada salto tendrá una longitud de 1 (uno) sólo para esa métrica; las otras dirán que ese salto es mayor o menor, según el "lugar" donde nos encontremos. Como el espacio es tridimensional, para simplificar eligiremos recorrer ese espacio mediante caminos lineales o "senderos" a lo largo de los cuales nos moveremos, los que nos permitirá representar en una gráfica simple cómo cambia la longitud de ese salto en comparación con la métrica más simple al recorrer ese camino. Para que la visualización sea más completa, eligiremos varios caminos distintos.

Obviamente, hay infinidad de criterios para elegir esos caminos; para mantenernos del lado de la simplicidad, nos limitaremos a dos tipos:

  • Saldremos desde el eje L* (a* = b* = 0) y nos alejaremos en línea recta hacia valores de C* crecientes, con h* constante, para varios valores de h* (diferencias de "croma"):

    Delta-E-Map-on-C
    Caminos rectilíneos a partir de L*, cada uno a h* = constante
  • Daremos una vuelta en un círculo alrededor del eje L*, con un radio C* constante, pasando por todos los h*, para varios valores de C* (diferencias de "tono"):

    Delta-E-Map-on-h
    Caminos circulares alrededor de L*, cada uno a C* = constante

En ambos casos, nos mantendremos en el "medio" del espacio L*a*b*, es decir, el plano L* = 50.

Esta "excursión matemática" fue posible gracias a una versión avanzada (actualmente en desarrollo) de un complemento de Excel que publiqué hace tiempo (disponible aquí) y facilita enormemente este tipo de cálculo. Lo importante para nosotros aquí es que los resultados son fáciles de graficar. Vamos a presentarlos sin demora.

Caminos rectilíneos (h* = constante)

En la gráfica siguiente, para L* = 50 y h* variando en pasos de 5ª, mostramos el ∆E que representa un paso ∆Eab = 1 (que en este caso equivale a ∆C* = 1 ya que L* y h* son constantes en cada paso) en cada una de las métricas ∆Eab, ∆ECMC, ∆E94, y ∆E00. Por tomar ∆Eab como referencia, ésta es necesariamemte siempre 1. Aquí analizamos el comportamiento de las diferencias entre muestras que sólo cambian su "croma". Podemos ver que:

  • Sólo ∆E00 tiene en cuenta el tono en los cambios de croma, ya que la curva correspondiente "oscila" entre la de ∆E94 y ∆ECMC, que permanecen "fijas". Luego, ∆E00 se comporta igual que ∆E94 en el amarillo (h* = 90º) y el azul (h* = 270º), y se comporta casi igual a ∆ECMC en el rojo-magenta (h* = 0º) y el verde-turquesa (h* = 180º);
  • Con ∆E94 vamos a subestimar las diferencias cerca del eje acromático para valores de C* menores a 6 (aproximadamente) para los colores en el eje a* (b* cercano a cero);
  • Con ∆ECMC vamos a sobreestimar un poco las diferencias casi siempre, pero en especial sobre el eje b* (a* cercano a cero);
  • Por último, debemos notar que ∆Eab sobreestima casi siempre las diferencias de croma ni bien nos alejamos de la zona acromática, llegando a estimaciones 5 veces mayores para los colores muy saturados (C* > 90).
Delta-E-Comparison-on-Cv4
Comparación de los ∆E predichos por cada fórmula con respecto a ∆Eab para pasos de ∆C* = 1 (h* = constante), para varios h* desde 0º a 360º, en pasos de 5º (para ver simultáneamente estas curvas con los caminos correspondientes, hacer click sobre la imagen).

Caminos circulares (C* = constante)

Es el turno de la gráfica siguiente, donde para L* = 50 y C* variando en pasos de 2, mostramos el ∆E que representa un paso ∆Eab = 1 en cada una de las métricas ∆Eab, ∆ECMC, ∆E94, y ∆E00. En este caso no podemos hablar de "∆h* = 1" ya que h* es una medida angular; la distancia entre dos colores que difieren en h* depende de C* (esta diferencia suele indicarse como ∆H* y equivale a la cuerda entre las muestras sobre el círculo C* al que pertenecen[1]). Como antes, siendo ∆Eab la métrica de referencia, ésta permanece constantemente en 1. Aquí analizamos el comportamiento de las diferencias entre muestras que sólo cambian su "tono". Podemos ver que:

  • ∆E94 (además de ∆Eab, naturalmente) no contempla el cambio de tono en las diferencias de color (les otorga a toda el mismo "peso", sólo dependiendo de C*), lo que se manifiesta en la gráfica "plana" que se observa;
  • ∆ECMC se adapta a los cambios de tono pero parece exagerar en el naranja (h* ≈ 63º), además de presentar tres cambios abruptos, los otros dos en el verde (h* ≈ 171º) y en azul (h* ≈ 286º);
  • ∆E00 se adapta también a los cambios de tono, pero de manera mucho más suave y uniforme, oscilando alrededor de ∆E94, lo que sugiere un "mejor" compartamiento.
Delta-E-Comparison-on-hv1
Comparación de los ∆E predichos por cada fórmula con respecto a ∆Eab para pasos de ∆H* = 1 (C* = constante), para varios C* desde 2 a 100, en pasos de 2 (para ver simultáneamente estas curvas con los caminos correspondientes, hacer click sobre la imagen).

Quiero usar ∆E00. ¿Qué debo tener en cuenta?

Supongamos que estamos convencidos de la superioridad de ∆E00, como ya hemos mostrado. Si estuviéramos implementando un sistema de tolerancias desde cero, sin vinculación alguna con el pasado, sería relativamente sencillo (aunque no trivial) buscar las tolerancias apropiadas a aplicar con ∆E00. El problema aparece cuando quiero conservar un resultado estadístico compatble con mi experiencia anterior. Aquí surge la pregunta del millón:

¿Existe una equivalencia entre tolerancias ∆Eab y ∆E00?

Si esa equivalencia existiera, podrìamos modificar los límites en uso para ∆Eab por los correspondientes para ∆E00 y esperar un porcentaje de aceptación/rechazo similar al acostumbrado. Pero, lamentablemente, no existe nada parecido a decir "tantos ∆Eab equivalen a tantos ∆E00", como veremos en breve. Esto significa que:

  • Tomando ∆E00 como nuestro estándar, necesariamente debemos reconocer que, a veces, hemos aceptado trabajos que deberían haberse rechazado, como así también a la inversa;
  • Si queremos conservar aproximadamente el mismo porcentaje de aceptación/rechazo, no sólo las tolerancias deben modificarse sino que quizás una sola tolerancia no sea suficiente.

Con respecto a lo primero, ya nada podemos hacer, ¿verdad? Pero con respecto a lo segundo, tenemos al menos las indicaciones de la ISO 12647-2:2013, que dice que las tolerancias de los sólidos CMYK tienen un límite de ∆Eab de 5, pero si comparo mediante ∆E00 ese límite para CMY debe reducirse a 3,5, quedando en 5 para negro. Esta indicación suministra otro argumento (en realidad el mismo, pero visto del otro lado) a quienes prefieren "quedarse" en ∆Eab: la sensación (errónea) de tener que cumplir tolerancias más estrechas. Y para agregar más ruido, la norma no explica por qué una tolerancia de 5 ∆Eab parece ser equivalente a 3,5 ∆E00, y sólo para los sólidos cromáticos.

En un estudio[2] donde se buscó específicamente si era posible establecer una equivalencia entre ∆Eab y ∆E00, no sólo se concluye que no es posible sino que llega a establecerse que los valores de tolerancia óptimos (al menos para el conjunto de datos analizados) para que el porcentaje de trabajos aceptados coincida con el que resultaría de la aplicación del límite clásico de 5 ∆Eab según ISO 12647-2:2013 deben ser diferentes para cada tinta. Los resultados son los siguientes:

Método C M Y K
∆Eab ISO 12647-2 5
∆E00 ISO 12647-2 3,5 5
∆E00 que daría el mismo resultado que ∆Eab ISO 12647-2
(ver texto)
4,1 3,2 2,4 3,8

El informe explica también que no es posible elegir un límite "intermedio". Por ejemplo si elegimos el mayor (cian: 4,1), todos los amarillos pasarían, mientras que si elegimos el menor (amarillo: 2,4) alrededor de la mitad de los cian fallarían. El valor propuesto de 3,5 parece estar elegido como un compromiso.

 


1 Com mayor precisión, la relación entre ∆H* y ∆h* en este caso es \Delta H^* = 2C^*sen(\Delta h^*/2).
2 Tolerance Equivalency between ∆Eab and ∆E00 Metrics, Lufei Yu, Rochester Institute of Technology, 2015.
Publicado enColorimetríaHistoria

Sé el primero en comentar

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *