Tratamiento de imágenes por ordenador

El tratamiento de imágenes por ordenador se ha convertido en un elemento omnipresente en nuestra vida cotidiana, influyendo desde la fotografía y el cine hasta la medicina y la publicidad. En un mundo cada vez más visual, la capacidad de manipular y mejorar imágenes de manera digital se ha vuelto cada vez más importante, con software cada vez más avanzado y apps que permiten modificar imágenes en segundos para dispositivos móviles. Aquí te mostramos cómo funciona este tratamiento de este tipo de archivos.

¿Qué es una imagen por ordenador?

Una imagen digital o imagen por ordenador es una representación en dos dimensiones de una imagen creada a partir de una matriz numérica, generalmente en formato binario (compuesta por unos y ceros). La naturaleza de la imagen puede ser estática o dinámica, determinando así si se trata de una imagen matricial (o mapa de bits) o de un gráfico vectorial, como veremos más adelante.

Existen diversas formas de obtener imágenes digitales, como puede ser escaneando una imagen o fotografiándola para su digitalización. También se puede dibujar o generar a partir de programas o generarlas mediante IA, o mediante renderizado.

Además, debes saber que estas imágenes por ordenador pueden ser modificadas fácilmente mediante el software adecuado, es decir, no son inmutables. Por ejemplo, se pueden usar distintas herramientas de edición, filtros, borrado, ajuste de tamaño, etc.

Una vez la imagen está creada o modificada, se puede almacenar en un formato dado. Existen multitud de formatos de imagen, cada uno con sus propias características. Por ejemplo, tenemos algunos casos como JPG, PNG, BMP, SVG, etc. Cada formato tendrá una serie de características para su almacenamiento y su posterior edición o visualización.

Generalmente, los archivos de imágenes almacenadas tienen varias partes como:

Cabecera: en ella se almacenan datos como los atributos que indican las dimensiones de la imagen, el tipo de codificación (formato), etc.
Imagen binaria: se trata de una información sobre la propia imagen, es decir, cómo se conforma la imagen en cuanto a forma, colores, etc. Y esto puede variar su estructura en función del formato.
Metadatos: los archivos también incluyen una sección de metadatos, es decir, información adicional que pueden ser muy variados según el formato. Por ejemplo, pueden ser la sensibilidad a la escala, fecha de modificación, quién lo creó, e incluso algunos datos comúnmente empleados por las cámaras digitales o por algunos programas.

Características de una imagen digital

Las características fundamentales de una imagen digital incluyen:

Resolución: se refiere al número de píxeles que componen una imagen. Se expresa generalmente como la cantidad de píxeles en ancho y alto, por ejemplo, 1920×1080 px. La resolución afecta la calidad y la claridad de la imagen, siendo una resolución más alta sinónimo de mayor detalle.
Profundidad de Color (Bits por Píxel): indica cuántos bits se utilizan para representar el color de cada píxel. Por ejemplo, una profundidad de color de 8 bits por canal para RGB significa que hay 8 bits (256 posibles valores) para representar el componente rojo, verde y azul de cada píxel. Una mayor profundidad de color permite representar una gama más amplia de colores, proporcionando mayor riqueza cromática y detalle en la imagen.
Espacio de Color: describe cómo se representan y organizan los colores en una imagen. Ejemplos comunes incluyen RGB (Rojo, Verde, Azul), CMYK (Cian, Magenta, Amarillo, Negro) y escala de grises. El espacio de color influye en la reproducción precisa de colores y es crucial en aplicaciones como diseño gráfico, impresión y fotografía.
Relación de Aspecto: es la proporción entre la anchura y la altura de una imagen. Puede expresarse como una relación (por ejemplo, 16:9) o como una fracción (por ejemplo, 4/3). La relación de aspecto determina la forma y el aspecto visual de la imagen, siendo fundamental en la visualización en pantallas y proyecciones.
Tamaño del Archivo: es la cantidad de espacio que ocupa una imagen en el almacenamiento digital. Se mide en bytes, kilobytes (KB), megabytes (MB) u otras unidades. El tamaño del archivo influye en la eficiencia de almacenamiento, transmisión y procesamiento de la imagen.
Formato de Archivo: especifica cómo se almacenan y organizan los datos de la imagen. Ejemplos incluyen JPEG, PNG, GIF, TIFF, entre otros muchos, que puede ser propietarios o libres, comprimidos o no comprimidos. Diferentes formatos tienen ventajas específicas, como compresión sin pérdida (PNG), compresión con pérdida eficiente (JPEG) o soporte para animaciones (GIF).
Metadatos: son información adicional incorporada en la imagen, como la fecha de creación, la ubicación geográfica o detalles de la cámara utilizada. Los metadatos son útiles para organizar y categorizar imágenes, así como para proporcionar información contextual sobre la captura.

HWMonitor: todos los sensores de tu PC en tiempo real

Estas características son esenciales para comprender y trabajar con imágenes digitales, ya que impactan la calidad visual, la manipulación, la transmisión y el almacenamiento de la información visual.

Tipos de imágenes según formación

Según la formación de la imagen y su archivo, podemos encontrar dos tipos fundamentales que deberías conocer, como son:

Mapa de bits

Un mapa de bits o raster, también denominada como imagen matricial, es un conjunto de datos que representa una cuadrícula rectangular de píxeles o puntos de color. Esta matriz puede ser visualizada o modificada, así como creada mediante software de dibujo.

La caracterización de las imágenes en mapa de bits se realiza comúnmente mediante su altura y ancho en píxeles (aunque también puede hacerse de otras formas), así como su profundidad de color en bits por píxel. La profundidad es la que determina la cantidad de colores distintos que se pueden almacenar en cada punto o píxel. Es decir, a mayor profundidad de bits, mejor será la calidad de la imagen o, al menos, más rica en cuanto a la gama cromática que puede tener.

También es importante destacar que cada punto o píxel que compone un mapa de bits contiene información del color de forma independiente, representada por canales separados. Estos colores pueden estar en distintos formatos como puede ser el conocido RGB, CMYK, LAB, etc. Incluso, algunos mapas de bits más avanzados, también pueden incluir un canal o capa de transparencia con la misma profundidad que los colores, permitiendo así diferentes niveles de transparencia. Esto último es usado en archivos avanzados como PNG o TIFF, ya que otros formatos como BMP, JPG, etc., no admiten transparencias, son más simples, simplemente mostrando los píxeles con el color correspondiente para conformar la imagen.

Las imágenes en mapa de bits tienen una limitación frente a los gráficos vectoriales. Y es que no se pueden cambiar sus dimensiones sin una pérdida notable de calidad. Se pueden ampliar con pérdidas bastante importantes de su calidad, y también se pueden disminuir, en este caso se nota menos esta pérdida. Por tanto, la resolución en la que se crea el mapa de bits es fundamental. Tanto en las apps de edición como en los dispositivos de captura de estas imágenes, se puede modificar la resolución en las configuraciones. Por ejemplo, se puede elegir que sea un mapa de bits de 512×512 px, o de 1280×720 px, etc. Mientras mayor sea la resolución, más tamaño hará falta para almacenar el archivo, pero también tendrá mayor detalle al tener más cantidad de píxeles.

Los gráficos en mapa de bits almacenan simplemente el color de cada píxel en la matriz en su parte de imagen binaria del archivo, junto con la cabecera y metadatos. Por este motivo, los mapas de bits son muy utilizados para captura de fotografías digitales, dibujos en programas apps muy conocidas como puede ser Paint, Corel PaintShop, Krita, etc.

Además, hay que decir que estos mapas de bits se pueden convertir de un formato a otro mediante el software apropiado. Incluso también se podrían comprimir para que las imágenes ocupen menos espacio, es decir, sean más livianas y tarden menos en cargar, aunque esto podría llevar a algo de pérdida de calidad. También se podría transformar un mapa de bits a una imagen en formato vectorial. Cuando se convierte un mapa de bits a gráfico vectorial se conoce como vectorización, mientras que el proceso inverso para transformar un gráfico vectorial en un mapa de bits se conoce como rasterización.

Gráfico vectorial

Una imagen vectorial, también denominada gráfico vectorial, es una representación digital que se compone de objetos geométricos, como segmentos, polígonos, arcos, polilíneas, elipses, círculos, curvas de Bézier, bezigonos, texto (TrueType o FreeType), y muros, cada uno definido por atributos matemáticos como forma, posición, ángulo, color, etc. Esto permite tener imágenes por ordenador mucho más dinámicas que los mapas de bits.

Por tanto, tenemos un tipo de imagen diferente a lo que hemos visto anteriormente en los mapas de bits, que simplemente es una matriz de píxeles con su información del color. La principal ventaja de los gráficos vectoriales es su capacidad para redimensionar el tamaño de una imagen sin experimentar pérdida de calidad. Por tanto, se puede crear una imagen a un tamaño determinado, y luego escalarla al tamaño deseado sin estos problemas de pérdida. Además, permiten manipular, estirar y transformar imágenes de manera relativamente sencilla. Estas capacidades se deben a que no guardan píxeles y su color en un mapa o matriz, sino que almacenan información en la imagen binaria de los objetos que componen en la imagen, por lo que simplemente cambiando el atributo referente al tamaño, se pueden ampliar sin pérdida.

Android vs iOS: ¿Qué sistema operativo me conviene más en términos de seguridad?

Gracias a este dinamismo, los gráficos vectoriales son más empleados en imágenes para programas CAD, para imágenes en documentos PostScript, PDF, para creación de tipografías o fuentes TrueType, OpenType, PostScript, etc., así como para videojuegos que necesitan adaptarse al tamaño o resolución de pantalla, para las webs, publicidad, impresión, plotter de corte, máquinas CAM y CNC, etc.

Los formatos de archivos de gráficos vectoriales también pueden ser variados como en el caso de los mapas de bits. Por ejemplo, tenemos algunos formatos conocidos como SWF, SVG, y VML, entre otros. Entre los programas para el tratamiento de este tipo de imágenes tenemos ejemplos como Inkscape, InDesign, CorelDRAW, Adobe Illustrator, etc.

Para finalizar, hay que destacar que los gráficos vectoriales también pueden incluir transparencias como los mapas de bits, y que tienen algunas otras ventajas respecto a los mapas de bits, como pueden ser:

Requieren menos espacio de almacenamiento, ya que la información vectorial es simple, frente a los bits y canales.
No pierden calidad al ser redimensionados, permitiendo escalar de forma ilimitada.
Algunos formatos admiten animación.

No obstante, también tiene sus desventajas frente a los mapas de bits, como pueden ser las siguientes:

No son adecuados para codificar fotografías o videos del mundo real, como la captura mediante cámaras, escáneres, etc.
Los datos que describen el gráfico vectorial requieren procesamiento, lo que puede ralentizar la representación en pantallas o impresoras. Y, aunque se construya una imagen con gráficos vectoriales, su visualización finalmente debe traducirse a píxeles en pantalla o impresión.

Tipos de imágenes según su compresión

La compresión de imágenes es un proceso esencial en la gestión de datos visuales, permitiendo reducir el tamaño de los archivos sin perder significativamente la calidad de la imagen, aunque la pérdida o no dependerá del tipo de técnica empleada para la compresión. Sin embargo, hacer una imagen menos pesada, o que el archivo ocupe menos espacio de almacenamiento, puede tener ventajas para el uso en webs donde no se desea ralentizar la carga a consecuencia de estas imágenes, o para ahorrar espacio en los medios de almacenamiento.

Dentro de las imágenes con compresión podemos destacar técnicas o algoritmos como:

Run-Length Encoding (RLE): es una técnica simple pero efectiva para comprimir imágenes, especialmente útil para imágenes con regiones de color sólido. En este método, se codifican las secuencias repetitivas de píxeles mediante la representación del valor del píxel y la longitud de la secuencia. Por ejemplo, una fila de píxeles blancos (255) en una imagen podría codificarse como «255, 10» si hay 10 píxeles consecutivos con el mismo valor. Aunque RLE es eficaz en ciertos escenarios, su rendimiento puede ser limitado en imágenes con variaciones más complejas de color y texturas, ya que no explora patrones más sofisticados.
JPEG (Joint Photographic Experts Group): es un estándar de compresión de imágenes ampliamente utilizado. A diferencia de RLE, JPEG utiliza un enfoque de compresión con pérdida, lo que significa que se pierde cierta información visual, pero permite una mayor compresión. El algoritmo JPEG se basa en la transformada de coseno discreta (DCT) y la cuantización. En el proceso JPEG, la imagen se divide en bloques y se aplica la DCT a cada bloque para convertir la información espacial en frecuencial. Luego, se realiza la cuantización, donde se reducen los valores de la DCT para eliminar información redundante. La cantidad de pérdida se controla mediante la calidad seleccionada durante el proceso de compresión. Aunque JPEG es altamente eficiente en términos de compresión, la pérdida de información puede ser notoria, especialmente cuando se realizan compresiones agresivas. Además, no es ideal para imágenes con áreas de color sólido o detalles finos.
PNG (Portable Network Graphics): es otro formato común que utiliza compresión sin pérdida. A diferencia de JPEG, PNG es ideal para imágenes con áreas de color sólido, transparencias y detalles nítidos. Utiliza un algoritmo de compresión basado en la predicción y la filtración. En PNG, se aplica una serie de filtros a cada línea de píxeles para reducir la redundancia antes de la compresión. La compresión sin pérdida hace que PNG sea preferido en situaciones donde la fidelidad visual es crucial.
GIF (Graphics Interchange Format): es conocido por su capacidad para almacenar imágenes animadas, pero también es un formato de compresión eficiente para imágenes estáticas. Utiliza el método de compresión Lempel-Ziv-Welch (LZW), que busca secuencias repetitivas de datos y las reemplaza por códigos más cortos. Aunque GIF ofrece una compresión eficiente, es más adecuado para imágenes con una paleta de colores limitada, ya que solo puede representar hasta 256 colores.

Diferencias entre navegador y buscador

El proceso de tratamiento de imágenes por ordenador

El tratamiento de imágenes por ordenador, se refiere al conjunto de técnicas y algoritmos utilizados para manipular imágenes digitales mediante el uso de un sistema informático. Este campo combina principios de ingeniería, matemáticas, estadísticas y ciencias de la computación para analizar, modificar y mejorar imágenes de diversas fuentes, como fotografías, escáneres, cámaras digitales, resonancias magnéticas, entre otras.

Las aplicaciones de este tratamiento de imágenes puede ser para distintos usos, como pueden ser la captura de imágenes, la edición o modificación de la misma, para generar imágenes en movimiento, para insertar en videojuegos, realidad virtual, realidad aumentada o mixta, etc.

En cuanto a las técnicas empleadas para el procesamiento de imágenes por ordenador, hay que destacar:

Captura de Imágenes: las imágenes digitales se adquieren mediante dispositivos de captura como cámaras digitales, escáneres u otros sensores. Estas imágenes, representadas como matrices de píxeles, son la base del tratamiento de imágenes.
Preprocesamiento: antes de aplicar técnicas específicas, a menudo se realiza un preprocesamiento para mejorar la calidad de la imagen. Esto puede incluir operaciones como corrección de color, ajuste de contraste, eliminación de ruido y mejora de la nitidez.
Filtrado: se utilizan diversos filtros para resaltar, suavizar o eliminar ciertos detalles de una imagen. Los filtros pueden ser lineales o no lineales y se aplican según los objetivos específicos del tratamiento.
Transformaciones geométricas: permiten modificar la geometría de una imagen, como rotar, escalar o trasladar. Estas transformaciones son útiles para alinear imágenes, corregir distorsiones y realizar ajustes espaciales.
Segmentación: consiste en dividir una imagen en segmentos significativos o regiones con características similares. La segmentación es fundamental para el reconocimiento de patrones, detección de objetos y análisis de contenido.
Reconocimiento de patrones: se utilizan algoritmos de aprendizaje automático y técnicas de visión por computadora para identificar patrones y objetos en las imágenes. Esto es esencial en aplicaciones como reconocimiento facial, clasificación de objetos y análisis de imágenes médicas.
Restauración de imágenes: se busca recuperar o mejorar imágenes afectadas por degradación, como las causadas por el ruido, la difracción o la dispersión.
Compresión de Imágenes: la compresión reduce el tamaño de los archivos de imágenes para facilitar el almacenamiento y la transmisión. Algoritmos como JPEG y PNG son comúnmente utilizados para este propósito.
Blurring (Desenfoque o suavizado): es una técnica que reduce la nitidez y los detalles en una imagen. Esto se logra mediante la aplicación de un filtro que promedia los valores de los píxeles circundantes, creando una apariencia más suave y menos definida. El blurring se emplea para reducir el ruido en imágenes, difuminar detalles no deseados o crear efectos estéticos suaves.
Embossing (Relieve): es una técnica que resalta los bordes y detalles de una imagen, creando una apariencia en relieve. Se logra resaltando las transiciones de intensidad entre píxeles vecinos y aplicando sombras y luces para simular la apariencia tridimensional. Se utiliza para mejorar la visibilidad de los detalles en imágenes y resaltar características importantes.
Sharpening (Enfoque): es una técnica que resalta los detalles y los bordes de una imagen para hacerla más nítida y definida. Se logra realzando las diferencias de intensidad entre píxeles adyacentes. El enfoque se aplica para mejorar la claridad y la definición en fotografías, especialmente cuando se quiere destacar detalles finos.
Watercoloring (Acuarela): simula el aspecto de una pintura acuarelada. Se caracteriza por suavizar los bordes y difuminar los colores, dando a la imagen un aspecto artístico y orgánico. La acuarela se utiliza para crear efectos artísticos en imágenes, proporcionando un estilo pictórico y distintivo.
Convolution Kernel (Núcleo de Convolución): es una técnica que aplica transformaciones locales a una imagen mediante la convolución de la imagen con una matriz específica (kernel). Cada elemento del kernel contribuye a la transformación de la intensidad de los píxeles en su vecindario. Los núcleos de convolución son esenciales para aplicar filtros y efectos en procesamiento de imágenes, como desenfoque, detección de bordes y realce de detalles.

Tratamiento de imágenes por ordenador: cómo trata el software este tipo de archivos