AINA és una iniciativa basada en intel·ligència artificial (IA) que van impulsar el Departament de Vicepresidència i de Polítiques Digitals i Territori i el Barcelona Supercomputing Center (BSC-CNS) el 2020 per aconseguir el 2022 que les màquines entenguin, parlin el català i puguin mantenir una conversa fluïda i natural amb les persones. Es destinaran tres milions d’euros al projecte i es potenciarà la recaptació de veus pel corpus de Common Voice de la Fundació Mozilla, que recentment ha superat les 1.500 hores enregistrades en català i s'espera arribar a les 2.000 hores abans que acabi l’any.
Malgrat el corpus textual del català ja supera els 10 GB i el de veu els 25 GB, les xifres encara es troben lluny de llengües com l’anglès, el corpus més extens amb més de 825 GB de dades. A més, existeix una manca de varietat, amb un 76% de les veus de Common Voice que corresponen al dialecte central del català i hi ha manca de presència femenina donat que un 63% d'elles corresponen a homes.
Com es pot participar?
Per tal d’aconseguir que la ciutadania se sumi al projecte, el Govern ha iniciat la campanya "La nostra llengua és la teva veu" i es duran a terme accions concretes al territori per aconseguir la participació de les variants amb menys mostres. Es pot col·laborar amb el projecte AINA validant els talls de veu, escrivint les frases que s'incorporaran al corpus o validant frases escrites. Trobaràs més informació en aquest enllaç.
En aquest vídeo trobareu la presentació pública del projecte: