Softcatalà ofereix un servei de transcripció d’àudio i vídeo en català

Softcatalà ofereix un servei de transcripció d’àudio i vídeo en català

Softcatalà ha presentat aquest mes un nou servei de transcripció d’àudio i vídeo a text. Aquest servei, també anomenat dictat, és útil per a transcriure enregistraments, apunts o pòdcasts a text, o per a crear subtítols per a vídeos i es troba disponible al web de Softcatalà.

Una vegada més, l’associació sense ànim de lucre Softcatalà posa a l’abast del públic catalanoparlant una eina per a facilitar i promoure l’ús del català a l’àmbit digital i tecnològic. Amb aquest nou servei és més senzill transcriure els fitxers en català d’àudio i vídeo a text, sense necessitat d’eines en altres llengües. Es basa en models lliures de xarxes neuronals entrenades per a processar els fitxers i generar el text corresponent.

Com s’utilitza el servei de transcripció?.- El servei de transcripció és molt fàcil d’utilitzar. Només cal enviar un fitxer d’àudio o vídeo en algun dels següents formats: MP3, WAV, OGG, FLAC, AVI, MP4, MOV o MKV.

Aquest fitxer es processarà als nostres servidors i, quan finalitzi aquesta acció, s’enviarà un correu electrònic a l’usuari amb l’enllaç a la transcripció. La duració d’aquest procés, o el temps d’espera, depèn del nombre de transcripcions que hi hagi pendents de processar. El fitxer s’esborrarà dels  sistemes de Softcatalà 72 hores després de ser transcrit.

Un cop finalitzada la transcripció, es pot baixar el text de la transcripció tant en format text com en SubRip (str), que és el format més popular de subtítols.

A més de baixar els textos, també hi ha l’opció d’un editor en línia que permet acabar d’esmenar la transcripció, ja que aquests serveis cometen errades. Com ocorre amb qualsevol servei automàtic, sempre cal que els usuaris revisin els resultats per a garantir que no s’hi han comès errades.

Altres informacions.- Segons informa Softcatalà, el nou servei transcriu el text del fitxer d’àudio/vídeo, però també la puntuació i les majúscules, cosa que fins ara cap altre sistema oferia. Per a fer-ho, s’utilitzen els models de transcripció lliures de l’empresa OpenAI, anomenats Whisper. Softcatalà té un projecte focalitzat en millorar-los per al català.

La privadesa de dades és també un tema crucial. En aquest sentit, l’opció de fer la transcripció a través del web de Softcatalà podria no ser apta per a tothom. Per això, han estat treballant amb el projecte Buzz perquè incorporin el català i els mateixos models que ofereix l’associació catalana, perquè el servei de transcripció estigui disponible a l’ordinador de l’usuari. Així, a més, es pot evitar entrar a la cua de transcripcions del sistema del traductor, el que reduiria el temps d’espera en rebre la transcripció.- El Bloc de l’Estanis/Comunicació 360º (Il·lustració: Softcatalà)