¿Qué es exactamente un desenfoque gaussiano?

América Aguilar
América Aguilar

El desenfoque es un efecto visual que se usa comúnmente al editar fotos y videos digitalmente. Uno de los desenfoques más comunes utilizados en estos campos es el desenfoque gaussiano. Tal vez haya utilizado esta herramienta miles de veces sin volver a considerarla. En última instancia, lo hace agradable y, de hecho, borra las cosas.

Por supuesto, a menudo nos gusta profundizar más aquí en La-Tecnologia, así que aquí está nuestro curso relámpago sobre lo que sucede cuando ejecutas una operación de desenfoque tonta.

¡Es matemáticas! Todo es matemático.

Distribución gaussiana 2D mostrada en gráfico 3D. Tenga en cuenta los valores más altos en el centro y más pequeños en el exterior en forma de campana curva.

En realidad, las imágenes digitales son solo muchos números, por lo que podemos trabajar con ellos matemáticamente. Cada píxel, que consiste en una imagen en color digital típica, tiene tres valores: su intensidad en rojo, verde y azul. Por supuesto, las imágenes en escala de grises constan de un solo valor por píxel, que representa su intensidad en una escala de negro a blanco, con grises entre ellos.

Independientemente de la imagen, ya sea en color o en escala de grises, el principio básico del desenfoque gaussiano sigue siendo el mismo. Cada píxel de la imagen que queremos desenfocar se considera de forma independiente, y su valor ha cambiado dependiendo de su propio valor y su entorno, según una matriz de filtro llamada kerno.

Este diagrama muestra la forma en que se procesa cada píxel. Para un núcleo de 3 × 3, se prueban el píxel interesante y todos los píxeles que lo rodean directamente. Luego, el kernel se utiliza para generar un nuevo valor de píxel de salida basado en un promedio ponderado de los píxeles probados en función de la distribución gaussiana.

El núcleo consta de una matriz rectangular de números que siguen una distribución gaussiana, así como una distribución normal o una curva de campana. Nuestro núcleo rectangular consta de valores más altos en el medio y que caen hacia los bordes exteriores de la matriz cuadrada, como la altura de una curva de campana en dos dimensiones. El kernel corresponde al número de píxeles que consideramos cuando cada píxel individual está borroso. Los núcleos más grandes distribuyen el desenfoque alrededor de una región más amplia, ya que cada píxel es modificado por más píxeles circundantes.

Núcleo gaussiano 5 × 5. Tenga en cuenta el factor externo que asegura que todos los valores totales sumen 1. Esto evita agregar intensidad a la imagen, simplemente promedie los píxeles sin cambiar su intensidad.

Para que cada píxel se someta a la operación oscura, se toma una sección rectangular igual al tamaño del núcleo alrededor del píxel interesante. Estos valores de píxeles circundantes se utilizan para calcular un promedio de peso para el nuevo valor del píxel original basado en la distribución gaussiana en el propio núcleo. Gracias a la distribución, el valor original del píxel central tiene el mayor peso, por lo que no destruye la imagen por completo. Píxeles inmediatamente adyacentes con la siguiente mayor influencia en el nuevo píxel, y así sucesivamente. Este promedio local suaviza los valores de los píxeles, y ese es el desenfoque.

Los casos Edge también son simples. Cuando se prueba un píxel de borde, los píxeles circundantes que de otro modo no existirían reciben el mismo valor de su vecino más cercano o reciben un valor que coincide con su espejo con un píxel en el área de prueba.

A la izquierda, una imagen de origen. Todos los píxeles dentro del borde rojo son los probados para calcular el valor final del píxel rojo central cuando se realiza un desenfoque gaussiano con un núcleo de 7 × 7. Bien, el resultado del desenfoque.

El mismo cálculo se ejecuta para cada píxel en la imagen borrosa original, con la imagen de salida final compuesta por los valores de píxel calculados por el proceso. Para imágenes en escala de grises, es así de simple. Las imágenes en color se pueden hacer de la misma manera, con el desenfoque calculado por separado para los valores de rojo, verde y azul de cada píxel. Alternativamente, puede especificar los valores de píxeles en algún otro espacio de color y suavizarlos allí.

Aquí vemos una imagen original y una versión filtrada por un desenfoque gaussiano de tamaño de núcleo tres y tamaño de núcleo diez. Tenga en cuenta el aumento de desenfoque a medida que aumenta el tamaño del núcleo. Más píxeles insertados en los resultados promedio son más suaves.

Por supuesto, las imágenes más grandes requieren más cálculos para lidiar con la mayor cantidad de píxeles, y los tamaños de núcleo más grandes intentan tener más píxeles circundantes para cada píxel interesante y, por lo tanto, pueden contar mucho más tiempo. Sin embargo, en las computadoras modernas, incluso las imágenes borrosas de alta resolución con núcleos de gran tamaño se vuelven parpadeantes. Sin embargo, por lo general, es raro usar un tamaño de núcleo superior a 50 o menos, ya que las cosas ya son bastante confusas en ese momento.

El desenfoque gaussiano es un gran ejemplo de matemáticas simples ampliamente utilizadas en el procesamiento de imágenes. ¡Ahora sabes cómo funciona a un nivel fundamental!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *