IA-Speaken helburu orokorra garuneko kaltetik eratorritako hizketa-nahasmenduak dituzten pertsonei zuzendutako laguntza-sistema integral eta pertsonalizatua diseinatzea, garatzea eta baliozkotzea da. Sistema honen helburua da paziente horiek aurre egin beharreko komunikazio-oztopoak murriztea, eguneroko elkarreragina erraztuz, gizarteratzea sustatuz eta bizi-kalitatea hobetzen lagunduz.
Estrategia horrekin, IA-SPEAKek hizketa-gaitasuna hobetzeari zein eguneroko komunikazio eraginkor eta berehalakoari heltzen dio.
Esparru honetan, honako helburu espezifiko hauek planteatzen dira:
Nair Center-ek funtsezko zeregina betetzen du audio-prozesamendurako gailu aurreratuen garapena eta hizketa ez-estandarra ezagutzeko eta itzultzeko ikaskuntza sakoneko ereduen inplementazioa gidatuz.
Ahots-prozesamenduko arkitekturaren diseinua da bere ekarpen nagusia. Aurreprozesamenduko pipelin automatizatuen bidez patroi aldakorrak eta konplexuak interpretatzen ditu, seinaleen kalitatea optimizatzeko iragazketa, normalizazioa eta segmentazioa aplikatuz. Esparru honetan, diarizazio aurreratuko algoritmoak garatzen ditu, espektrogramak eta MFCC koefizienteak erauzten ditu, eta, horri esker, erabiltzaile bakoitzaren berezitasunak identifika daitezke eta sistema osoari eusten dioten ahots-profil pertsonalizatuak sor daitezke.
Ahots-itzulpen ez-estandarreko modulua da ekarpen nabarmenetako bat, elkarri lotutako lau bloketan egituratua: datu-sarrera, transkripzioa, klonazioa eta irteera optimizatua. Transkripzioak Whisper eta WhisperX ereduak erabiltzen ditu, fine-tuning bidez doituak, paziente bakoitzaren ahoskeraren berezitasunak ikasteko, azentu edo dialekto berri batera egokitzearen antzera. Ahotsa klonatzeko moduluak, espainierara egokitutako F5-TTS bezalako ereduetan oinarrituak, audio sintetikoa sortzen du, eta erabiltzailearen ahots-identitatea argiago eta ulergarriago mantentzen du, komunikazioan zinezkotasuna bermatuz.
Azkenik, Nair Center-ek bere esperientzia aplikatzen du gomendio-sistema multimodaletan, ahots-analisiak, aurpegi-ezagutza, erabiltzaile-profila eta aurrerapen historikoa integratuz. Errefortzu sakoneko ikaskuntza-teknikekin, sistemak ariketa pertsonalizatuak eta paziente bakoitzaren eboluziora egokituak iradokitzen ditu denbora errealean.






