La recerca de noves molècules és un dels grans reptes de la química moderna. Des del desenvolupament de fàrmacs fins a la creació de materials més sostenibles, tot s’enfoca cap atrobar combinacions d’àtoms amb propietats útils. Un equip investigador de la Universitat Rovira i Virgili (URV) ha desenvolupat una eina d’intel·ligència artificial capaç de generar milions de molècules noves que, tot i que no ser conegudes encara, compleixen les lleis de la química i, per tant, podrien ser reals. Els resultats de la recerca s’han publicat a la revista Nature Machine Intelligence.
El sistema, anomenat CoCoGraph, funciona de manera similar a les eines d’intel·ligència artificial generativa de text o d’imatges, com ChatGPT o DALL·E. “Aquests models creen contingut nou que s’assembla molt al real. El nostre algoritme fa el mateix, però amb molècules”, explica Roger Guimerà, professor de recerca ICREA del Departament d’Enginyeria Química de la URV.
A diferència d’altres aplicacions d’IA, però, el model no respon encara a instruccions concretes. De moment, té un objectiu és més bàsic: generar molècules plausibles, és a dir, estructures que compleixin les regles de la química.
Ara bé, el repte és enorme. Si es dona al sistema una mateixa fórmula molecular —per exemple, la del paracetamol— es pot construir una quantitat ingent de combinacions d’àtoms. En canvi, només una petita fracció d’aquestes combinacions és viable en la realitat.
“L’espai de molècules possibles és immens. S’estima que podria haver-hi fins a 10⁶⁰ molècules diferents, que són moltes més que molècules d’aigua a l’oceà”, explica Guimerà”. Per contra, les molècules conegudes només en representen una part ínfima. Això fa que trobar noves molècules útils sigui com buscar una agulla en un paller gegantí.

Com funciona el model
Per generar aquestes noves molècules, CoCoGraph utilitza una tècnica anomenada model de difusió, habitual en la generació d’imatges. El procés consisteix a “desordenar” progressivament una molècula real i entrenar el sistema perquè aprengui a reconstruir-la.
“Partim d’una molècula real, trenquem els enllaços i en creem de nous de manera aleatòria. El model aprèn a revertir aquest procés i reconstruir estructures coherents”, comenta Marta Sales-Pardo, investigadora del Departament d’Enginyeria Química que també ha participat en la recerca.
A diferència de les imatgesles molècules són estructures discretes (grafs), cosa que fa el problema molt més complex des del punt de vista matemàtic.
Molècules sempre vàlides
Una de les principals innovacions del model és que incorpora directament les regles bàsiques de la química. Per exemple, cada àtom manté sempre el nombre correcte d’enllaços i això garanteix que el 100% de les molècules generades siguin químicament vàlides, a diferència d’altres models que poden produir estructures impossibles.
A més, el sistema és més eficient: utilitza menys paràmetres, necessita menys potència de càlcul i pot generar molècules més ràpidament.
L’equip investigador ha comparat CoCoGraph amb altres models d’última generació i han analitzat fins a 36 propietats fisicoquímiques de les molècules generades, com la solubilitat o la complexitat estructural. El resultat és que les molècules generades són químicament més realistes que en altres models en aproximadament dues terceres parts d’aquestes propietats.
Comprovació entre la comunitat científica
Per comprovar fins a quin punt aquestes molècules són plausibles, l’equip va fer un experiment amb 121 experts en química de la mateixa Universitat. A cada participant se li mostraven vint parelles de molècules —una de real i una de generada per la nova IA— i havia d’identificar quina era la real.
Els resultats van mostrar que els experts s’equivoquen en aproximadament 4 de cada 10 casos, és a dir, sovint confonen les molècules generades amb les reals. “Això vol dir que moltes de les molècules que generem són molt convincents”, explica Sales.
Tot i que el model encara no permet dissenyar molècules amb una funció concreta, ja se n’han fet proves prometedores. Per exemple, s’han identificat molècules amb propietats similars al paracetamol dins dels milions de molècules generades. També han explorat tècniques per modificar parcialment una molècula existent —una mena de “retoc” químic— per crear noves variants amb característiques semblants.
Aquestes aproximacions podrien ser útils en el futur per optimitzar fàrmacs o desenvolupar materials nous.
El primer pas cap a una IA que dissenyi molècules a mida
L’equip investigador té clar que això és només el començament. L’objectiu principal a mitjà o a llarg termini és poder demanar a la intel·ligència artificial una molècula amb propietats específiques que sigui soluble, no tòxica i que resulti útil per a una aplicació específica.
“De moment només generem molècules. El pas següent serà poder guiar aquesta generació amb objectius concrets”, diu Manuel Botella, estudiant de doctorat que també ha participat en la recerca.
Si s’aconsegueix, aquesta tecnologia podria transformar camps com la química, la farmacologia o la ciència de materials i accelerar el descobriment de noves solucions en un espai químic pràcticament inexplorat.
- Sergio Camus: ‘No podem rendir-nos i hem de lluitar per salvar la categoria’
- Port Tarragona invertirà més de 770.000 euros en una planta fotovoltaica a les cobertes dels Tinglados del Moll de Costa
- La terminal marítima polivalent del Moll d’Andalusia del port de Tarragona estarà operativa a finals del 2028
- La Mostra de Teatre Jove continua aquest dimecres amb Bloqueig creatiu, de la companyia 4×4
- Els primers investigats del cas Montoro s’acullen al seu dret a no declarar al jutjat de Tarragona

