Registro:
Documento: | Tesis de Grado |
Título: | Patrones de repetición para clasificación e identificación de proteínas |
Autor: | Rago, Pablo Diego |
Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
Publicación en la web: | 2025-06-12 |
Fecha de defensa: | 2017 |
Fecha en portada: | 2017 |
Grado Obtenido: | Grado |
Título Obtenido: | Licenciado en Ciencias de la Computación |
Departamento Docente: | Departamento de Computación |
Director: | Turjanski, Pablo Guillermo |
Jurado: | Ferreiro, Diego Ulises; Lanzarotti, Esteban Omar |
Idioma: | Español |
Palabras clave: | PROTEINAS; SUBCADENAS UNICAS MINIMALES; REPETICIONES SUPERMAXIMALES; CLASIFICACION |
Formato: | PDF |
Handle: |
http://hdl.handle.net/20.500.12110/seminario_nCOM000660_Rago |
PDF: | https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000660_Rago.pdf |
Registro: | https://bibliotecadigital.exactas.uba.ar/collection/seminario/document/seminario_nCOM000660_Rago |
Ubicación: | Dep.COM 000660 |
Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Rago, Pablo Diego. (2017). Patrones de repetición para clasificación e identificación de proteínas. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de http://hdl.handle.net/20.500.12110/seminario_nCOM000660_Rago |
Resumen:
Las proteínas son grandes moléculas formadas por cadenas lineales de aminoácidos. Una abstracción posible de esta estructura permite pensar a las mismas como cadenas de caracteres, donde cada aminoácido se corresponde con un carácter, y así es posible representar su estructura primaria. Algunas proteínas naturales presentan patrones estructurales recurrentes. Estas moléculas pueden ser clasificadas de acuerdo al largo de la mínima unidad de repetición (fibrilares, repetitivas y globulares). Las proteínas repetitivas a pesar de ser muy similares a nivel de estructura terciaria, pueden tener repeticiones extremadamente variables a nivel de estructura primaria. En su trabajo del año 2016, Turjanski et al proponen una definición matemática de repetición para buscar ocurrencias de estas secuencias en diferentes familias de proteínas. En este trabajo el grupo describe que cadenas largas de repeticiones exactas son infrecuentes en proteínas particulares, incluso para aquellas que se conoce que se pliegan en estructuras de motivos estructurales recurrentes. Por otro lado, también detallan que estas proteínas son repetitivas dentro de sus familias, exhibiendo cadenas de aminoácidos que son repeticiones exactas provenientes de la familia de referencia. Como producto de esto, proponen un algoritmo para cuantificar las chances de que una proteína particular pertenezca a una cierta familia. En el presente trabajo se estudian y proponen modificaciones al algoritmo mencionado para mejorar su eficiencia a nivel performance computacional y calidad de resultados obtenidos. Para ello se exploran varias opciones. La principal variante se basa en utilizar la noción de supermaximalidad de repeticiones en reemplazo de maximalidad. Adicionalmente se estudia incorporar al algoritmo el uso de otras características de la repetición, como ser la cantidad de instancias y su longitud, entre otras. Los resultados obtenidos han sido comparados con los obtenidos en el trabajo de Turjanski et. al. En algunos casos, los resultados obtenidos han sido superiores a los existentes, arrojando indicios de cuáles serían las características que permiten la mejora. Adicionalmente, se realizó una búsqueda de subcadenas únicas minimales dentro de una familia, con el objetivo de identificar unívocamente una proteína dentro de una familia. Se implementó un algoritmo y se analizaron los resultados obtenidos en base a la familia de proteínas ankyrin. La intención es, a futuro, poder combinar dicha información con la de repeticiones y así poder obtener un algoritmo más preciso aún.
Citación:
---------- APA ----------
Rago, Pablo Diego. (2017). Patrones de repetición para clasificación e identificación de proteínas. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nCOM000660_Rago
---------- CHICAGO ----------
Rago, Pablo Diego. "Patrones de repetición para clasificación e identificación de proteínas". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2017.https://hdl.handle.net/20.500.12110/seminario_nCOM000660_Rago
Estadísticas:
Descargas mensuales
Total de descargas desde :
https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000660_Rago.pdf
Distrubución geográfica