El tractament d'imatges per ordinador s'ha convertit en un element omnipresent a la nostra vida quotidiana, influint des de la fotografia i el cinema fins a la medicina i la publicitat. En un món cada cop més visual, la capacitat de manipular i millorar imatges de manera digital s'ha tornat cada cop més important, amb programari cada cop més avançat i apps que permeten modificar imatges en segons per a dispositius mòbils. Aquí us mostrem com funciona aquest tractament d'aquest tipus d'arxius.
Què és una imatge per ordinador?

Una imatge digital o imatge per ordinador és una representació en dues dimensions d'una imatge creada a partir d'una matriu numèrica, generalment en format binari (composta per uns i zeros). La naturalesa de la imatge pot ser estàtica o dinàmica, determinant així si és una imatge matricial (o mapa de bits) o un gràfic vectorial, com veurem més endavant.
Existeixen diverses maneres d'obtenir imatges digitals, com pot ser escanejant una imatge o fotografiant-la per a la seva digitalització. També es pot dibuixar o generar a partir de programes o generar-los mitjançant IA o mitjançant renderitzat.
A més, has de saber que aquestes imatges per ordinador poden ser modificades fàcilment mitjançant el programari adequat, és a dir, no són immutables. Per exemple, es poden fer servir diferents eines d'edició, filtres, esborrament, ajustament de mida, etc.
Un cop la imatge està creada o modificada, es pot emmagatzemar en un format donat. Hi ha multitud de formats d'imatge, cadascun amb les seves característiques. Per exemple, tenim alguns casos com JPG, PNG, BMP, SVG, etc. Cada format tindrà una sèrie de característiques per a l'emmagatzematge i la posterior edició o visualització.
Generalment, els arxius d'imatges emmagatzemades tenen diverses parts com:
- Capçalera: s'hi emmagatzemen dades com els atributs que indiquen les dimensions de la imatge, el tipus de codificació (format), etc.
- Imatge binària: es tracta d'una informació sobre la pròpia imatge, és a dir, com es conforma la imatge quant a forma, colors, etc. I això pot variar-ne l'estructura en funció del format.
- metadades: els fitxers també inclouen una secció de metadades, és a dir, informació addicional que poden ser molt variats segons el format. Per exemple, poden ser la sensibilitat a l'escala, data de modificació, qui ho va crear, i fins i tot algunes dades comunament emprades per les càmeres digitals o per alguns programes.
Característiques d'una imatge digital
Les característiques fonamentals d'una imatge digital inclouen:
- resolució: fa referència al nombre de píxels que componen una imatge. S'expressa generalment com la quantitat de píxels en amplada i alçada, per exemple, 1920×1080 px. La resolució afecta la qualitat i la claredat de la imatge, sent una resolució més alta sinònim de més detall.
- Profunditat de Color (Bits per Píxel): indica quants bits es fan servir per representar el color de cada píxel. Per exemple, una profunditat de color de 8 bits per canal per a RGB significa que hi ha 8 bits (256 possibles valors) per representar el component vermell, verd i blau de cada píxel. Una major profunditat de color permet representar una gamma més àmplia de colors, proporcionant més riquesa cromàtica i detall a la imatge.
- Espai de Color: descriu com es representen i s'organitzen els colors en una imatge. Exemples comuns inclouen RGB (Vermell, Verd, Blau), CMYK (Cian, Magenta, Groc, Negre) i escala de grisos. L'espai de color influeix en la reproducció precisa de colors i és crucial en aplicacions com a disseny gràfic, impressió i fotografia.
- Relació d'aspecte: és la proporció entre l'amplada i l'alçada d'una imatge. Es pot expressar com una relació (per exemple, 16:9) o com una fracció (per exemple, 4/3). La relació d'aspecte determina la forma i l'aspecte visual de la imatge, i és fonamental en la visualització en pantalles i projeccions.
- Mida de l'arxiu: és la quantitat despai que ocupa una imatge en lemmagatzematge digital. Es mesura en bytes, kilobytes (KB), megabytes (MB) o altres unitats. La mida del fitxer influeix en l'eficiència d'emmagatzematge, transmissió i processament de la imatge.
- Format d'arxiu: especifica com s'emmagatzemen i s'organitzen les dades de la imatge. Exemples inclouen JPEG, PNG, GIF, TIFF, entre molts altres, que pot ser propietaris o lliures, comprimits o no comprimits. Diferents formats tenen avantatges específics, com ara compressió sense pèrdua (PNG), compressió amb pèrdua eficient (JPEG) o suport per a animacions (GIF).
- metadades: són informació addicional incorporada a la imatge, com la data de creació, la ubicació geogràfica o detalls de la càmera utilitzada. Les metadades són útils per organitzar i categoritzar imatges, així com per proporcionar informació contextual sobre la captura.
Aquestes característiques són essencials per comprendre i treballar amb imatges digitals, ja que impacten la qualitat visual, la manipulació, la transmissió i l'emmagatzematge de la informació visual.
Tipus d'imatges segons formació
Segons la formació de la imatge i el seu fitxer, podem trobar dos tipus fonamentals que hauries de conèixer, com són:
Mapa de bits
Un mapa de bits o raster, també anomenada com a imatge matricial, és un conjunt de dades que representa una quadrícula rectangular de píxels o punts de color. Aquesta matriu es pot visualitzar o modificar, així com crear-la mitjançant programari de dibuix.
La caracterització de les imatges en mapa de bits es realitza comunament mitjançant la seva alçada i amplada en píxels (encara que també es pot fer d'altres formes), així com la seva profunditat de color en bits per píxel. La profunditat és la que determina la quantitat de colors diferents que es poden emmagatzemar a cada punt o píxel. És a dir, com més profunditat de bits, millor serà la qualitat de la imatge o, almenys, més rica quant a la gamma cromàtica que pot tenir.
També és important destacar que cada punt o píxel que compon un mapa de bits conté informació del color de manera independent, representada per canals separats. Aquests colors poden estar en diferents formats com pot ser el conegut RGB, CMYK, LAB, etc. Fins i tot, alguns mapes de bits més avançats també poden incloure un canal o capa de transparència amb la mateixa profunditat que els colors, permetent així diferents nivells de transparència. Això últim és usat en fitxers avançats com PNG o TIFF, ja que altres formats com BMP, JPG, etc., no admeten transparències, són més simples, simplement mostrant els píxels amb el color corresponent per conformar la imatge.
Les imatges al mapa de bits tenen una limitació davant dels gràfics vectorials. I és que no se'n poden canviar les dimensions sense una pèrdua notable de qualitat. Es poden ampliar amb pèrdues força importants de la seva qualitat, i també es poden disminuir, en aquest cas es nota menys aquesta pèrdua. Per tant, la resolució en què es crea el mapa de bits és fonamental. Tant a les aplicacions d'edició com als dispositius de captura d'aquestes imatges, es pot modificar la resolució a les configuracions. Per exemple, es pot triar que sigui un mapa de bits de 512×512 px, o de 1280×720 px, etc. Com més gran sigui la resolució, més mida caldrà per emmagatzemar el fitxer, però també tindrà més detall en tenir més quantitat de píxels.
Els gràfics en mapa de bits emmagatzemen simplement el color de cada píxel a la matriu a la part d'imatge binària del fitxer, juntament amb la capçalera i metadades. Per aquest motiu, els mapes de bits són molt utilitzats per capturar fotografies digitals, dibuixos en programes apps molt conegudes com pot ser Paint, Corel PaintShop, Krita, etc.
A més, cal dir que aquests mapes de bits es poden convertir d'un format a un altre mitjançant el programari apropiat. Fins i tot també es podrien comprimir perquè les imatges ocupin menys espai, és a dir, siguin més lleugeres i triguin menys a carregar, encara que això podria portar a una mica de pèrdua de qualitat. També es podria transformar un mapa de bits a una imatge en format vectorial. Quan es converteix un mapa de bits a gràfic vectorial es coneix com a vectorització, mentre que el procés invers per transformar un gràfic vectorial en un mapa de bits es coneix com a rasterització.
gràfic vectorial
Una imatge vectorial, també denominada gràfic vectorial, és una representació digital que es compon d'objectes geomètrics, com segments, polígons, arcs, polilínies, el·lipses, cercles, corbes de Bézier, bezigons, text (TrueType o FreeType), i murs, cadascun definit per atributs matemàtics com a forma, mate. Això permet tenir imatges per ordinador molt més dinàmiques que els mapes de bits.
Per tant, tenim un tipus d'imatge diferent del que hem vist anteriorment als mapes de bits, que simplement és una matriu de píxels amb la informació del color. La principal avantatge dels gràfics vectorials és la seva capacitat per redimensionar la mida duna imatge sense experimentar pèrdua de qualitat. Per tant, es pot crear una imatge a una mida determinada, i després escalar-la a la mida desitjada sense aquests problemes de pèrdua. A més, permeten manipular, estirar i transformar imatges de manera relativament senzilla. Aquestes capacitats es deuen al fet que no guarden píxels i el seu color en un mapa o matriu, sinó que emmagatzemen informació a la imatge binària dels objectes que componen a la imatge, per la qual cosa simplement canviant l'atribut referent a la mida, es poden ampliar sense pèrdua.
Gràcies a aquest dinamisme, els gràfics vectorials són més emprats en imatges per programes CAD, per a imatges en documents PostScript, PDF, per a creació de tipografies o fonts TrueType, OpenType, PostScript, etc., així com per videojocs que necessiten adaptar-se a la mida o resolució de pantalla, per a les webs, publicitat, impressió, plotter de tall, màquines CAM i CNC, etc.
Els formats de fitxers de gràfics vectorials també poden ser variats com en el cas dels mapes de bits. Per exemple, tenim alguns formats coneguts com SWF, SVG, i VML, entre altres. Entre els programes de tractament d'aquest tipus d'imatges tenim exemples com Inkscape, InDesign, CorelDRAW, Adobe Illustrator, etc.
Per acabar, cal destacar que els gràfics vectorials també poden incloure transparències com els mapes de bits, i que en tenen algunes altres avantatges respecte als mapes de bits, com poden ser:
- Requereixen menys espai d'emmagatzematge, ja que la informació vectorial és simple, davant dels bits i els canals.
- No perden qualitat en ser redimensionats, permetent escalar de forma il·limitada.
- Alguns formats admeten animació.
No obstant això, també té desavantatges davant dels mapes de bits, com poden ser les següents:
- No són adequats per codificar fotografies o vídeos del món real, com ara la captura mitjançant càmeres, escàners, etc.
- Les dades que descriuen el gràfic vectorial requereixen processament, cosa que pot alentir la representació en pantalles o impressores. I, encara que es construeixi una imatge amb gràfics vectorials, la visualització finalment s'ha de traduir a píxels en pantalla o impressió.
Tipus d'imatges segons la compressió
La compressió d'imatges és un procés essencial en la gestió de dades visuals, permetent reduir la mida dels fitxers sense perdre significativament la qualitat de la imatge, encara que la pèrdua o no dependrà del tipus de tècnica emprada per a la compressió. No obstant això, fer una imatge menys pesada, o que el fitxer ocupi menys espai demmagatzematge, pot tenir avantatges per a lús en webs on no es vol alentir la càrrega a conseqüència daquestes imatges, o per estalviar espai en els mitjans demmagatzematge.
Dins les imatges amb compressió podem destacar tècniques o algorismes com:
- Run-Length Encoding (RLE): és una tècnica simple però efectiva per comprimir imatges, especialment útil per a imatges amb regions de color sòlid. En aquest mètode, es codifiquen les seqüències repetitives de píxels mitjançant la representació del valor del píxel i la longitud de la seqüència. Per exemple, una fila de píxels blancs (255) en una imatge es podria codificar com a «255, 10» si hi ha 10 píxels consecutius amb el mateix valor. Encara RLE és eficaç en certs escenaris, el seu rendiment pot ser limitat en imatges amb variacions més complexes de color i textures, ja que no explora patrons més sofisticats.
- JPEG (Joint Photographic Experts Group): és un estàndard de compressió d'imatges àmpliament utilitzat. A diferència de RLE, JPEG utilitza un enfocament de compressió amb pèrdua, cosa que significa que es perd certa informació visual, però permet una major compressió. L'algorisme JPEG es basa en la transformada de cosinus discreta (DCT) i la quantització. Al procés JPEG, la imatge es divideix en blocs i s'aplica la DCT a cada bloc per convertir la informació espacial en freqüencial. Després, es fa la quantització, on es redueixen els valors de la DCT per eliminar informació redundant. La quantitat de pèrdua es controla mitjançant la qualitat seleccionada durant el procés de compressió. Tot i que JPEG és altament eficient en termes de compressió, la pèrdua d'informació pot ser notòria, especialment quan es fan compressions agressives. A més, no és ideal per a imatges amb àrees de color sòlid o detalls fins.
- PNG (Portable Network Graphics): és un altre format comú que utilitza compressió sense pèrdua. A diferència de JPEG, PNG és ideal per a imatges amb àrees de color sòlid, transparències i detalls nítids. Utilitza un algorisme de compressió basat en la predicció i la filtració. A PNG, s'aplica una sèrie de filtres a cada línia de píxels per reduir la redundància abans de la compressió. La compressió sense pèrdua fa que PNG sigui preferit en situacions on la fidelitat visual és crucial.
- GIF (Graphics Interchange Format): és conegut per la seva capacitat per emmagatzemar imatges animades, però també és un format de compressió eficient per a imatges estàtiques. Utilitza el mètode de compressió Lempel-Ziv-Welch (LZW), que cerca seqüències repetitives de dades i les reemplaça per codis més curts. Tot i que GIF ofereix una compressió eficient, és més adequat per a imatges amb una paleta de colors limitada, ja que només pot representar fins a 256 colors.
El procés de tractament d'imatges per ordinador

El tractament d'imatges per ordinador, fa referència al conjunt de tècniques i algorismes utilitzats per manipular imatges digitals mitjançant l'ús d'un sistema informàtic. Aquest camp combina principis d'enginyeria, matemàtiques, estadístiques i ciències de la computació per analitzar, modificar i millorar imatges de diverses fonts com fotografies, escàners, càmeres digitals, ressonàncies magnètiques, entre d'altres.
Les aplicacions d'aquest tractament d'imatges pot ser per a diferents usos, com ara la captura d'imatges, l'edició o la modificació d'imatges, per generar imatges en moviment, per inserir en videojocs, realitat virtual, realitat augmentada o mixta, etc.
Quant a les tècniques emprades per al processament d'imatges per ordinador, cal destacar:
- Captura d'imatges: les imatges digitals s'adquireixen mitjançant dispositius de captura com ara càmeres digitals, escàners o altres sensors. Aquestes imatges, representades com a matrius de píxels, són la base del tractament d'imatges.
- Preprocessament: abans d'aplicar tècniques específiques, sovint es fa un preprocessament per millorar la qualitat de la imatge. Això pot incloure operacions com correcció de color, ajustament de contrast, eliminació de soroll i millora de la nitidesa.
- Filtrat: s'utilitzen diversos filtres per ressaltar, suavitzar o eliminar certs detalls d'una imatge. Els filtres poden ser lineals o no lineals i s'apliquen segons els objectius específics del tractament.
- Transformacions geomètriques: permeten modificar la geometria d'una imatge, com ara rotar, escalar o traslladar. Aquestes transformacions són útils per alinear imatges, corregir distorsions i fer ajustaments espacials.
- Segmentació: consisteix a dividir una imatge en segments significatius o regions amb característiques similars. La segmentació és fonamental per al reconeixement de patrons, la detecció d'objectes i l'anàlisi de contingut.
- Reconeixement de patrons: sutilitzen algoritmes daprenentatge automàtic i tècniques de visió per ordinador per identificar patrons i objectes en les imatges. Això és essencial en aplicacions com ara reconeixement facial, classificació d'objectes i anàlisi d'imatges mèdiques.
- Restauració d'imatges: es busca recuperar o millorar imatges afectades per degradació, com les causades pel soroll, la difracció o la dispersió.
- Compressió d'imatges: la compressió redueix la mida dels fitxers d'imatges per facilitar l'emmagatzematge i la transmissió. Algorismes com JPEG i PNG són comunament utilitzats per a aquest propòsit.
- Blurring (Desenfocament o suavitzat): és una tècnica que redueix la nitidesa i els detalls en una imatge. Això s'aconsegueix mitjançant l'aplicació d'un filtre que fa una mitjana dels valors dels píxels circumdants, creant una aparença més suau i menys definida. El blurring es fa servir per reduir el soroll en imatges, difuminar detalls no desitjats o crear efectes estètics suaus.
- Embossing (Relleu): és una tècnica que ressalta les vores i detalls d'una imatge, creant una aparença amb relleu. S'aconsegueix ressaltant les transicions d'intensitat entre píxels veïns i aplicant-hi ombres i llums per simular l'aparença tridimensional. Sutilitza per millorar la visibilitat dels detalls en imatges i ressaltar característiques importants.
- Sharpening (Enfocament): és una tècnica que ressalta els detalls i les vores d'una imatge per fer-la més nítida i definida. S'aconsegueix realçant les diferències d'intensitat entre píxels adjacents. L'enfocament s'aplica per millorar-ne la claredat i la definició en fotografies, especialment quan es vol destacar detalls fins.
- Watercoloring (Aquarel·la): simula laspecte duna pintura aquarel·lada. Es caracteritza per suavitzar les vores i difuminar-ne els colors, donant a la imatge un aspecte artístic i orgànic. L'aquarel·la es fa servir per crear efectes artístics en imatges, proporcionant un estil pictòric i distintiu.
- Convolution Kernel (Nucli de Convolució): és una tècnica que aplica transformacions locals a una imatge mitjançant la convolució de la imatge amb una matriu específica (kernel). Cada element del nucli contribueix a la transformació de la intensitat dels píxels al veïnat. Els nuclis de convolució són essencials per aplicar filtres i efectes en processament d'imatges, com ara desenfocament, detecció de vores i realçament de detalls.