A Catalunya, on les grans empreses oferien fins fa poc només serveis de tecnologia de la parla en castellà, les desenvolupadores de programari lliure s’han unit per mitjà de grups de defensa de la llengua, cadascuna amb un interès específic. Unes volen, en primer lloc, garantir l’ús del català en el món digital, i les altres estan interessades a crear alternatives als productes de les grans empreses perquè les usuàries tinguin el control sobre les seves dades.
Amb l’ajuda d’una comunitat de voluntàries disposada a gravar i validar mostres de veu, s’està treballant amb una iniciativa capaç de reconèixer, entendre el missatge i generar una resposta amb veu humana en català. L’objectiu, doncs, és que la tecnologia entengui i parli el català.
Projecte AINA
Impulsat pel Departament de Polítiques Digitals, amb la col·laboració del BSC, es tracta del projecte AINA, pensat per generar corpus i models informàtics de la llengua catalana perquè les empreses que creen aplicacions basades en intel·ligència artificial (IA), com ara assistents de veu, traductors automàtics, agents conversacionals, etc, puguin fer-ho fàcilment en català.
El projecte ha estat batejat amb el nom d’AINA en homenatge a la filòloga menorquina Aina Moll, figura central de la promoció i la normalització del català i primera Directora General de Política Lingüística de la Generalitat de Catalunya del 1980 al 1988.
El Projecte AINA té un pressupost global de 13,5 milions d’euros per al període 2020-2024 i és un dels projectes prioritzats pel Departament de Polítiques Digitals per ser finançat amb els fons europeus NextGenerationEU. De moment, el projecte arrenca amb una aportació inicial de 250.000€ que el Departament de Polítiques Digitals ha assignat al BSC per ampliar els corpus de la llengua catalana i així obtenir models lingüístics que abastin les diferents variants i registres.
La nostra llengua és la teva veu
El proper pas serà generar els models de la llengua, models de parla i models de traducció utilitzant xarxes neuronals multicapa.
Precisament, el Projecte AINA ha facilitat una plataforma online amb CommonVoice, per recollir l’enregistrament de milions i milions d’hores de veu en català de persones de totes les edats, varietats dialectals i registres. Cada enregistrament, servirà per construir el diccionari oral de català, que tota màquina necessita per aprendre la nostra llengua.
Serà un diccionari obert i accessible a tothom, i aquesta base de dades podrà ser utilitzada per totes les companyies tecnològiques. Tothom hi pot participar en aquest enllaç.
La Laia i l’Aina pel català a l’àmbit digital
El català, com moltes altres llengües minoritàries, es troba en una situació difícil en l’àmbit digital, on els idiomes més parlats del món s’imposen en un mercat cada cop més global. A Parlem en som conscients i en tenim un bot conversacional. Es diu Laia i va ser el primer xatbot d’intel·ligència artificial en català.
Esperem que, com la Laia, l’Aina permeti que el català faci un salt qualitatiu i quantitatiu en l’ecosistema digital, i que la ciutadania pugui participar en català en el món digital al mateix nivell que els parlants d’una llengua global, com ara l’anglès, i evitar així l’extinció digital de la llengua.