Intel·ligència Artificial generativa: Les noves eines sense ànima en la revolució creativa

Fa anys que convivim amb la IA, una evolució tecnològica més: canvien les eines, no la creativitat. Explica com funcionen els models de text i imatge, remarca que no entenen ni innoven, i defensa un ús crític davant la falsa aparença d’humanitat que projecten.

Impacte i avenços en la innovació artística

Fa ja uns quants articles que vinc parlant de detalls específics dels programaris d'intel·ligència artificial. La por que aquest nou programari ens faci fora del mercat laboral, de com tot d'un surten veus queixant-se de plagi, o falta d'ètica en la utilització d'aquestes eines... La IA ha vingut per quedar-se.

Com qualsevol altre programari, necessitem una corba d'aprenentatge per utilitzar-lo d'una forma correcta, solvent i eficient. Fins ara fèiem servir programaris tancats, amb eines que duien a terme tasques concretes i específiques. Ara aquestes eines obertes o generatives amplien les nostres possibilitats creatives, la nostra eficàcia... I com a persona que sempre m'ha agradat provar eines noves, diversificar coneixements, ara us donaré la meva opinió subjectiva.

Soc usuari de tots aquests programaris des de fa anys, tot just van començar a sorgir. I per aquells que diuen que tot el que està fet amb intel·ligència artificial es veu igual, vull puntualitzar que les tendències, són com les onades que van i venen amb més o menys força i durada. Tots recordem com l'arribada de qualsevol actualització del nostre programari predilecte aporta eines noves que tots volem provar, testejar i durant un temps tot el que veus al carrer té el mateix efecte, filtre, tipografia o color. Hem d'esperar que l'efervescència d'aquestes eines baixi. Properament parlaré de com pot canviar el model de negoci de totes aquestes eines.

La feina del dissenyador gràfic ha canviat molt d'ençà que vaig començar en aquest ofici, no tant la part creativa que continua essent, el fonament i puntal de l'ofici, perquè com deia el dissenyador estatunidenc Paul Rand, conegut com el pare del disseny gràfic modern «Tot és disseny. Tot!». Però sí la part tècnica, més enllà fins i tot de la irrupció de nous camps on exercí la nostra activitat, cada vegada més transversal. Ara ens alarmem perquè arriba un nou programari anomenat IA. Però jo, com tots els de la meva generació vàrem començar amb, cúter, tipòmetre, conta fils, "Letraset"... Vàrem passar de forma orgànica a aquells primers ordinadors, toscos, que a poc a poc van anar fent més i més coses. Fins a arribar avui dia on ningú no concept treballar sense aquestes eines, si no és per fer un exercici de nostàlgia. O una classe magistral a les noves generacions. Ara comencem a intuir que potser d'aquí a uns anys la nostra tasca creativa demanarà escriure textos, molt específics perquè les eines de què disposarem facin tota aquella feina que avui passen per tres o quatre programes que fan diferents tasques del procés. Qui m'havia de dir que tant llegir tindria una sortida laboral tan sorprenent. Per tant, d'una manera del tot evolutiva, passarem de treballar de forma manual fent dibuixos, esbossos. A realitzar textos, que al final serviran per a comunicar les necessitats dels nostres clients, amb uns nous programaris. Canviaran les eines que no la finalitat. Apropar els productes d'una marca al seu públic.

Però anem al quid de la qüestió que són i com funcionen aquests engins d'IA generativa. Si bé avui hi ha IA per qualsevol tasca específica em centraré en dos models principals: els models de Generació de Text (LLM: Large Language Models). I els de Generació d'Imatge (Models de Difusió). Com ja he dit en altres entrades aquestes eines recreen, que no creant. Per tant, no tenen capacitat de fer creacions, pròpies des de zero. S'han de basar en mostres que tinguin a les seves biblioteques. Això fa que també els sigui impossible innovar.

Generació de Text (LLM: Large Language Models) El programari de text funciona com el text predictiu avançat d'un telèfon, però a escala massiva. Analitza milers de milions de textos d'internet (llibres, articles, webs) per a entendre la gramàtica, els fets i el context. Quan escrius una ordre (prompt), el model Transforma, calcula estadísticament quina és la paraula més probable que ha de seguir a l'anterior. Construeix oracions coherents paraula per paraula en temps real. Però com pots entendre no té consciència del que fa i ni tan sols podem dir que sàpiga ben bé el que fa.

Generació d'Imatge (Models de Difusió) El programari d'imatge aprèn a dibuixar des de zero esborrant el caos visual. S'entrena a la intel·ligència artificial mostrant-li milions d'imatges i les seves descripcions en text. Per a crear una imatge, el programari comença amb un llenç d'estàtica o "soroll" (com una pantalla de televisió sense senyal). Després, usant la teva ordre de text com a guia, el programa va "netejant" aquest soroll capa per capa fins a revelar la imatge nítida que li vas demanar. Crea una obra visual totalment única a través de la predicció de píxels. Com ja he dit, no té consciència del que fa i ni tan sols podem dir que sàpiga ben bé el que fa.

Per tant, en aquest moment podem fer un estudi comparatiu entre aquests programaris i l'aprenentatge d'un nen. I veurem com aquest últim guanya per golejada. La principal diferència radica en el fet que els nens aprenen mitjançant l'exploració física, l'empatia i l'assaig i error amb molt poques dades, desenvolupant un sentit comú. En contrast, la IA processa volums massius de dades per a trobar patrons estadístics, mancant de consciència, emocions o comprensió real del món. L'aprenentatge infantil és holístic, multisensorial i altament eficient en termes d'energia i dades. Construeixen el seu aprenentatge a través de la interacció física amb el seu entorn, desenvolupant la psicologia del desenvolupament i la teoria de la ment per a entendre les intencions d'uns altres. Poden aprendre què és un "gos" veient només dos o tres exemples. No necessiten milions d'imatges. La curiositat intrínseca és el seu motor d'aprenentatge és la motivació natural, l'emoció i el joc, la qual cosa els permet adaptar-se a situacions totalment noves sense entrenament previ.

Per contra, la intel·ligència artificial actual, especialment l'aprenentatge profund o (deep learning) funciona mitjançant models matemàtics i estadístics. Processant patrons, no "entenen" el significat de les coses, sinó que prediuen la següent paraula, píxel o acció més probable basant-se en bilions d'exemples previs. Depenen de les dades, requereixen conjunts de dades massives (big data) per a entrenar-se, la qual cosa es coneix com a aprenentatge supervisat o no supervisat. La IA tradicional, basada en regles lògiques programades manualment. O la IA moderna, amb xarxes neuronals artificials capaces d'autoajustar-se, destacant avui dia els Models de Llenguatge Gran (LLM) que generen text, codi i art.

Com podeu veure tot i que han entrat amb molta força són eines, molt simples, bàsiques fins i tot. La perversió està en com ens les han venut. Per tal de fer-nos partícips de la seva evolució, necessària. Totes elles utilitzen un to amigable gràcies al disseny conversacional, una disciplina que busca humanitzar la tecnologia. En entrenar-se amb quantitats massives de textos escrits per humans, els models aprenen a imitar la naturalitat, l'empatia i la cortesia perquè interactuar amb ells resulti més intuïtiu, còmode i accessible. Les raons principals darrere d'aquesta elecció són l'experiència d'usuari (UX). Un to afable redueix la fricció. En lloc de rebre comandos freds o tècnics, els usuaris obtenen respostes fluides que faciliten tasques diàries, augmentant la satisfacció general. Augment de la confiança, els missatges cordials i complaents imiten la interacció social, la qual cosa genera un clima de seguretat que convida l'usuari a continuar interactuant de manera natural. Això no obstant, els experts adverteixen que aquest llenguatge pot resultar enganyós. Sovint, la simpatia de la IA fa que oblidem que no és una persona, la qual cosa pot portar a confiar cegament en les seves respostes i a passar per alt possibles errors o invencions. Perquè parlem de màquines, algoritmes, programaris, servidors... Tan freds en el fons com el teu programa de dibuix, de retoc fotogràfic o el de posada en pàgina.

Ens llegim.

Badia Grafista

Cercar en aquest blog