L'app de Gemini ja comprova si una imatge ha estat creada amb la IA de Google

  • Gemini pot analitzar imatges i avisar si van ser generades o editades amb la IA de Google usant SynthID.
  • La marca d‟aigua digital és invisible, persisteix després de retallades o compressió i ja s‟ha aplicat a milers de milions d‟imatges.
  • Google afegirà metadades C2PA i planeja estendre la verificació a vídeo, àudio i serveis com la Cerca.
  • La funció ajuda a combatre desinformació i deepfakes, però de moment només cobreix de manera fiable el contingut generat dins de l'ecosistema de Google.

Eina per verificar imatges generades per IA

En un moment en què s'ha tornat complicat distingir una foto real d'una altra creada per intel·ligència artificial, Google ha decidit fer un pas més amb el seu assistent Gemini. L'aplicació integra ara una funció que permet comprovar si una imatge ha passat pels models d'IA de la companyia, especialment rellevant per a usuaris d'Espanya i Europa que volen saber què hi ha darrere de les imatges que reben per xarxes socials, missatgeria o correu.

Aquesta novetat fa que, amb pujar una imatge a l'app de Gemini i formular una pregunta senzilla com “Va ser creada amb la IA de Google?” o “Està generada per IA?”, l'assistent analitzi la fotografia i respongui si ha estat generada o editada mitjançant els seus sistemes. A més, no es limita a un sí o un no: acompanya la resposta amb context addicional sobre el contingut, cosa que ajuda a valorar millor la seva procedència.

Com verifica Gemini si una imatge va ser creada amb la IA de Google

Ús de SynthID a Gemini per detectar imatges generades per IA

L'eix d'aquest sistema és SynthID, la tecnologia de marques d'aigua invisibles que Google va presentar fa dos anys. Aquesta eina insereix un senyal digital directament als píxels de les imatges generades o retocades amb els seus models d'IA, sense que s'apreciï cap canvi a simple vista. La marca roman fins i tot quan la foto es retalla, es comprimeix o se li apliquen filtres, cosa habitual quan es comparteix per missatgeria o xarxes.

Quan l'usuari puja una foto a l'app i llença la pregunta, Gemini examina la imatge buscant aquesta marca d'aigua SynthID. Si la trobeu, indica que la fotografia “va ser creada o editada per la IA de Google” i afegeix informació complementària, per exemple context sobre el tipus de contingut i on s'ha vist una cosa similar a la web. Si no detecta la marca, aclareix que la imatge no sembla que hagi estat generada amb els models de Google, encara que deixa oberta la possibilitat que procedeixi d'altres eines d'IA.

Aquest tipus de verificació és especialment útil a situacions quotidianes en què es reben imatges molt realistes: des de suposades fotos d'actualitat compartides en grups de WhatsApp fins a anuncis o creativitats a les xarxes. En lloc de dependre només de l'ull humà, l'usuari es pot recolzar en una marca tècnica incrustada a la pròpia imatge.

Google assegura que SynthID ja s'ha aplicat a milers de milions de continguts generats pels seus models, inclosos els que produeixen sistemes com Nano Banana Pro (el model de generació d'imatges associat a Gemini), cosa que dóna una idea de l'abast que pot tenir aquesta comprovació a l'ecosistema de la companyia.

Al costat de la marca d'aigua invisible, Google manté a més una marca visible a moltes de les imatges generades pels usuaris dels plans gratuïts i de Google AI Pro, una mena de brillantor de Gemini que actua com a avís clar per a l'usuari mitjà. En entorns professionals, però, aquesta marca visible es pot desactivar per oferir un llenç net, de manera que la verificació recau sobre SynthID i les metadades.

Pas a pas: com utilitzar la verificació d'imatges a l'app de Gemini

Procés a l'app de Gemini per comprovar imatges

El procés està pensat perquè qualsevol persona amb un mòbil Android o iOS pugui fer-lo servir sense complicacions tècniques. No cal ser expert en edició ni a IA generativa; conèixer consells per escriure bons prompts pot ajudar i només cal seguir uns quants passos des de la pròpia app de Gemini.

En primer lloc, cal obrir l'aplicació i tocar el botó d'afegir fitxer, que sol aparèixer a la part inferior de la pantalla amb una icona “+”. Des d'aquí es pot triar la imatge des de la galeria del mòbil, la carpeta de fitxers o serveis com Google Drive. Un cop carregada la foto, s'introdueix una pregunta de l'estil “Aquesta imatge va ser creada o editada per IA?” o “L'ha generat la IA de Google?” i s'envia la consulta.

En segon lloc, Gemini analitza la imatge, cerca els senyals de SynthID i torna un missatge amb la seva avaluació. Si detecta la marca, ho indica de manera explícita; si no la trobeu, explica que no ha estat creada amb la IA de Google o que no pot determinar-ho amb total seguretat. En alguns casos també assenyala que no és possible saber si s'ha fet servir una altra eina d'IA externa.

El tercer pas és interpretar la resposta amb un cert criteri. Que no aparegui la marca de SynthID no vol dir necessàriament que la foto sigui autèntica en el sentit clàssic (presa amb una càmera sense cap manipulació), només indica que no es detecta el senyal de Google. Pot ser una imatge real, una generada per una altra IA o un contingut tan modificat que la marca s'hagi degradat més del compte.

Google reconeix que existeixen limitacions tècniques en casos extrems: imatges molt senzilles, fitxers molt deteriorats per compressions successives o edicions molt agressives poden dificultar la lectura de la marca. Tot i així, el sistema s'ha dissenyat per resistir retallades habituals, canvis de mida i ajustaments de brillantor o color, amb la idea que resulti útil en l'ús real de xarxes i missatgeria.

SynthID, C2PA i l'objectiu de rastrejar millor el contingut digital

La integració de SynthID a Gemini no arriba sola. Google participa també a la C2PA, una coalició internacional per a la procedència i autenticitat del contingut on hi són presents companyies com Adobe, OpenAI, Meta o Microsoft. Aquest grup ha creat un estàndard de metadades que us permet adjuntar informació fiable sobre l'origen i l'historial d'edició d'una imatge, un àudio o un vídeo.

A la pràctica, aquests metadades C2PA actuen com una mena de fitxa tècnica incrustada a l'arxiu, on s'indica amb quina eina es va crear el contingut, quines modificacions es van fer i en quin moment. Google comença a incorporar aquest tipus de credencials en imatges generades per models com Nano Banana Pro dins de l'app de Gemini, així com en creacions realitzades a través de Vertex AI i Google Ads.

La combinació de SynthID i C2PA permet, per una banda, marcar les imatges generades per la IA de Google i, de l'altra, oferir un canal per verificar també fitxers que procedeixin d'eines de tercers que adoptin l'estàndard. La intenció de la companyia és estendre progressivament aquestes metadades a més productes, inclosos serveis molt utilitzats a Europa com YouTube, Google Fotos o el mateix Cercador.

Per a periodistes, verificadors de dades i mitjans digitals a Espanya i en altres països europeus, disposar de un mecanisme estàndard de procedència del contingut pot resultar clau en cobertures sensibles, des de campanyes electorals fins a conflictes internacionals. Actualment, l'ús de C2PA està creixent, però la seva adopció encara no és universal, i per això la traçabilitat completa continua sent un objectiu a mitjà termini.

A més de la integració directa a l'app, Google ha provat aquesta tecnologia en un portal de verificació específic, SynthID Detector, destinat en un primer temps a periodistes, investigadors i professionals dels mitjans. Aquesta eina destaca les parts d'una imatge amb més probabilitat d'estar marcades i serveix de complement a l'ús més generalista que ara permet Gemini.

Plans de futur: de les imatges al vídeo, l'àudio i la Cerca

Google ha deixat clar que no vol limitar la verificació de les fotos estàtiques. Entre els seus plans figura estendre SynthID a formats com el vídeo i l'àudio, de manera que els continguts generats per IA en aquests suports també es puguin identificar de manera més fiable. Això cobra especial rellevància en un context de proliferació de deepfakes de veu i vídeo, que ja han provocat incidents de desinformació a diversos països europeus.

Un altre dels objectius és portar aquestes capacitats a serveis de gran abast com Google Search, el Cercador. La idea és que, quan un usuari trobi una imatge a la web, pugui consultar de manera senzilla si es tracta de contingut generat per IA i, si escau, per quin model. Aquest tipus d'informació contextual s'està incorporant a poc a poc a alguns resultats, però la integració específica de SynthID i C2PA encara està en fase d'expansió.

En paral·lel, Google continua integrant SynthID en altres eines del seu ecosistema, com l'Editor Màgic i la funció Reimaginar dels mòbils Pixel, que permeten modificar fotos amb IA. D'aquesta manera, qualsevol canvi substancial realitzat per aquests sistemes queda marcat per poder ser detectat posteriorment, fet que afegeix una capa de transparència a funcions que, altrament, podrien generar imatges difícils de distingir d'una fotografia tradicional.

La companyia reconeix que mentre no hi hagi un sistema de marques adoptat de manera general per totes les plataformes de generació d'imatges, la verificació serà necessàriament parcial. No obstant, insisteix que fer aquest pas dins del seu propi ecosistema és una manera d'impulsar l'adopció d'estàndards i oferir als usuaris eines concretes per moure's en un entorn digital cada cop més complex.

En el cas d'Europa, on les institucions comunitàries treballen en marcs reguladors per a la intel·ligència artificial i la desinformació, aquest tipus d'iniciatives tecnològiques poden encaixar com un complement pràctic als requisits legals, posant a disposició de ciutadans, mitjans i administracions sistemes de comprovació accessibles des del mòbil.

Què pot i què no pot fer avui la verificació de Gemini

Tot i que el llançament d'aquesta funció suposa un avenç important, Gemini no és una eina màgica que resolgui tots els problemes d'autenticitat. Ara com ara, el seu punt fort és assenyalar si una imatge ha estat creada o editada per la IA de Google gràcies a SynthID; més enllà d'això, l'assistent només pot fer estimacions basades en l'anàlisi visual.

En proves amb imatges generades per altres eines, com a models externs que no usen SynthID, Gemini ha estat capaç de vegades de intuir que es tractava de contingut sintètic, però sense un nivell de certesa comparable al que ofereix quan detecta la marca invisible. També s'han observat situacions en què el sistema interpreta una fotografia com a estoc quan en realitat procedeix d'una altra IA, cosa que mostra que l'anàlisi purament visual continua tenint marge d'error.

Gemini pot arribar a indicar missatges del tipus: "Aquesta imatge no està feta amb la IA de Google, però no és possible determinar si es va generar amb altres eines de IA". És a dir, l'assistent és transparent en reconèixer els límits quan no disposa de senyals tècnics que li permetin confirmar l'origen de la imatge.

Per a l'usuari mitjà, això implica que la funció de verificació s'ha d'entendre com una ajuda més dins un conjunt d'eines, i no com lúnic criteri per decidir si creure o no en una foto. Seguir sent crític amb el context, la font que la comparteix i l'ús que es fa de la imatge continua sent fonamental, sobretot en temes sensibles com a política, salut o seguretat.

Tot i així, la possibilitat de pujar ràpidament una foto a l'app de Gemini i rebre una resposta amb context en qüestió de segons suposa un recurs pràctic per detectar almenys les imatges vinculades a l'ecosistema de Google, especialment útil en campanyes de publicitat digital, contingut patrocinat, notícies virals o recursos gràfics que circulen per xarxes a Espanya i la resta d'Europa.

L'arribada d'aquesta funció a l'aplicació de Gemini encaixa en una tendència clara al sector tecnològic: grans companyies que incorporen sistemes d'autenticació i procedència directament als seus productes per intentar frenar limpacte de la desinformació i dels continguts manipulats. En aquest context, la combinació de marques d'aigua invisibles, metadades estandarditzades i explicacions en llenguatge natural des del mateix assistent col·loca els usuaris en una millor posició per entendre què hi ha darrere de cada imatge que veuen a les pantalles.

Venice AI, la revolució de la intel·ligència artificial sense restriccions.
Article relacionat:
Com generar imatges amb IA: tècniques i recomanacions per a dissenyadors