Resumen de Redes neuronales artificiales aplicadas al reconocimiento de palabras independiente del locutor

SE PROPONE Y DESCRIBE UNA ARQUITECTURA NEURONAL HIBRIDA PARA RECONOCIMIENTO DE PALABRAS HABLADAS, ESTA FORMADA POR DOS COMPONENTES, UNO DE LOS CUALES TIENE APRENDIZAJE SUPERVISADO Y EL OTRO ES DE TIPO AUTOORGANIZATIVO. EL SISTEMA UTILIZA COMO ENTRADA, INFORMACION DE LA EVOLUCION DEL CONTENIDO FRECUENCIAL DE LA SEÑAL A LO LARGO DEL TIEMPO QUE DURA LA PRONUNCIACION (ESPECTROGRAMAS). PARA SU FORMACION, SE HAN UTILIZADO LAS TECNICAS CLASICAS DE DIGITALIZACION Y ANALISIS DE SEÑAL EN EL DOMINIO DE LA FRECUENCIA. POSTERIORMENTE SE HA "CONDENSADO" DICHA INFORMACION EN UN NUMERO FIJO DE COMPONENTES MEDIANTE VARIAS ALTERNATIVAS DE COMPRESION FRECUENCIAL Y TEMPORAL.

CON UNA BASE DE DATOS FORMADA POR 10 PRONUNCIACIONES DIFERENTES DE 10 PALABRAS DEL IDIOMA CASTELLANO REGISTRADAS PARA 10 LOCUTORES, SE HA PROBADO LA VALIDEZ DE LA ARQUITECTURA PARA EL RECONOCIMIENTO INDEPENDIENTE DE LOCUTOR. AUNQUE LA FASE DE ENTRENAMIENTO DE LA RED PUEDE SER COSTOSA EN TIEMPO DE CPU, UNA VEZ AJUSTADOS LOS PESOS, PUEDE CONSIDERARSE QUE EL SISTEMA RECONOCEDOR OFRECE UNA SALIDA EN TIEMPO REAL. ACOPLAR LAS DOS REDES SUPONE UN AUMENTO DE LAS PRESTACIONES DEL SISTEMA GLOBAL SIN UN SOBRE-COSTE EN TIEMPO DE APRENDIZAJE AL INTRODUCIR LA SEGUNDA SUBRED.

Acceso de usuarios registrados

¿Es nuevo? Regístrese

Coordinado por: