Registro:
Documento: | Tesis Doctoral |
Disciplina: | fisica |
Título: | Producción de la voz, control neuronal y biometría |
Autor: | Trevisan, Marcos Alberto |
Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
Publicación en la Web: | 2023-05-09 |
Fecha de defensa: | 2006 |
Fecha en portada: | 2006 |
Grado Obtenido: | Doctorado |
Título Obtenido: | Doctor de la Universidad de Buenos Aires en el área de Ciencias Físicas |
Director: | Mindlin, Gabriel |
Idioma: | Español |
Palabras clave: | FISICA DE LA VOZ; BIOMETRIA; TOPOLOGIA; CONTROL NEURONAL VOCALVOICE PHYSICS; BIOMETRICS; TOPOLOGY; NEURAL MOTOR CONTROL |
Formato: | PDF |
Handle: |
http://hdl.handle.net/20.500.12110/tesis_n4470_Trevisan |
PDF: | https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n4470_Trevisan.pdf |
Registro: | https://bibliotecadigital.exactas.uba.ar/collection/tesis/document/tesis_n4470_Trevisan |
Ubicación: | Dep.FIS 004470 |
Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Trevisan, Marcos Alberto. (2006). Producción de la voz, control neuronal y biometría. (Tesis Doctoral. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de http://hdl.handle.net/20.500.12110/tesis_n4470_Trevisan |
Resumen:
Este trabajo puede separarse en dos partes. La primera está dedicada al problema biométrico de la voz, es decir, al uso de la voz como caracterización unívoca del hablante. La segunda está dedicada al control neuronal vocal. En la historia de la biométrica, los intentos de descifrar la forma en que está codificada la identidad de una persona en su voz están basados en tratamientos estadísticos de sus propiedades espectrales. El éxito relativo de estas técnicas se debe a la dificultad de establecer distancias entre estas propiedades. Todos los sistemas de identificación necesitan umbrales de decisión para aceptar o rechazar usuarios. En la primera parte exploramos dos alternativas a este punto de vista. En primer lugar, se construyó un modelo de producción de voz de baja dimensión con el objeto de reproducir la diversidad de los procesos vocales y poder describirlos en términos de un mínimo conjunto de parámetros anatómicos relevantes. Una vez construido el modelo, una pregunta surge inmediatamente: ¿Podrán ajustarse sus parámetros para identificar la voz de cada persona? Los intentos por responder esta pregunta inauguran la segunda alternativa, que consiste en la definición de huellas vocales tipológicas basadas en herramientas creadas para caracterizar la estructura de las órbitas de los sistemas dinámicos, y que nos permitieron traducir cualidades espectrales de la voz en índices topológicos robustos. Los resultados sugieren una nueva dirección en la identificación de las personas por la voz a través de arreglos de números enteros, independientes de umbrales de decisión. La segunda parte de este trabajo está dedicada a la interacción del sistema vocal de un modelo animal sencillo (aves) con el sustrato neuronal que lo controla. En las últimas décadas, el estudio del canto de las aves se desarrolló hasta convertirse en un campo de investigación privilegiado, permitiendo la experimentación con organismos que desarrollaron habilidades de aprendizaje vocal con fuertes paralelos con la adquisición del habla. Este campo se está transformando también en un área de modelado neuronal. La investigación en este campo busca entender la emergencia de patrones acústicos complejos y la estructura del aprendizaje vocal, independiente de factores culturales y sociales. Basándonos en el modelo vocal desarrollado para el habla, la segunda parte del trabajo está dedicada a construir modelos neuronales para aproximarse a estos dos problemas.
Abstract:
This work is twofolded. The rst part is devoted to voice biometrics, i.e. the problem of a one to one characterization between voice and speaker. The second part is dedicated to the neural vocal control. In the history of voice biometrics, efforts to unveil the speaker's identity were based on spectral descriptions of voiced sounds. The relative success of these techniques is due to the difficulty of establishing how close is close enough when comparing spectral features. Every system needs a threshold to be defined in order to accept or reject users. In the rst part of this work we explore alternatives to this point of view. In the rst place, we built a low dimensional dynamical system which allowed us reproducing the diversity of the vocal processes in terms of a minimal set of anatomically relevant parameters. Once the model was constructed, a question naturally arised: Could its parameters reproduce a particular speaker's voice? Our results leaded to a second perspective which introduces the concept topological voiceprints based on a set of tools created in order to characterize the orbits structure of dynamical systems. That tools allowed us to translate spectral features into sets of robust integers. Our results suggest a new direction in the identification of subjects by voice: one in which arrangements of integers dene voiceprints that stand on their own, despite any acceptance/rejection thresholds. The second part of this work is devoted to the interaction of the vocal system in a simple animal model (birds) and the neural substrate controlling its dynamics. During the last few decades, birdsong developed into a privileged research eld that allowed neuroscientists to experiment with biological organisms that developed vocal learning skills presenting strong analogies with language acquisition. In the present, birdsong is becoming a denite eld of neural modeling. Research in this eld is devoted to understand the emergengy of complex acoustic patterns and to study the neural architecture of vocal learning, independently from social and cultural factors involved in language acquisition. Based on the human vocal model, we developed neural models to address these two specic problems.
Citación:
---------- APA ----------
Trevisan, Marcos Alberto. (2006). Producción de la voz, control neuronal y biometría. (Tesis Doctoral. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/tesis_n4470_Trevisan
---------- CHICAGO ----------
Trevisan, Marcos Alberto. "Producción de la voz, control neuronal y biometría". Tesis Doctoral, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2006.https://hdl.handle.net/20.500.12110/tesis_n4470_Trevisan
Estadísticas:
Descargas totales desde :
Descargas mensuales
https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n4470_Trevisan.pdf