Registro:
| Documento: | Tesis de Grado |
| Título: | Análisis de coocurrencia de repeticiones maximales en familias de proteínas utilizando reglas de asociación |
| Autor: | Seijo, Jonathan Adrian |
| Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| Publicación en la web: | 2025-06-12 |
| Fecha de defensa: | 2023 |
| Fecha en portada: | 2023 |
| Grado Obtenido: | Grado |
| Título Obtenido: | Licenciado en Ciencias de la Computación |
| Departamento Docente: | Departamento de Computación |
| Director: | Ferreiro, Diego Ulises |
| Director Asistente: | Turjanski, Pablo Guillermo |
| Jurado: | Nadra, Alejandro Daniel; Ruz, Cecilia Ana |
| Idioma: | Español |
| Palabras clave: | FAMILIAS DE PROTEINAS; REPETICIONES MAXIMALES; REGLAS DE ASOCIACION; ALGORITMO APRIORI |
| Formato: | PDF |
| Handle: |
http://hdl.handle.net/20.500.12110/seminario_nCOM000544_Seijo |
| PDF: | https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000544_Seijo.pdf |
| Registro: | https://bibliotecadigital.exactas.uba.ar/collection/seminario/document/seminario_nCOM000544_Seijo |
| Ubicación: | Dep.COM 000544 |
| Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Seijo, Jonathan Adrian. (2023). Análisis de coocurrencia de repeticiones maximales en familias de proteínas utilizando reglas de asociación. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de http://hdl.handle.net/20.500.12110/seminario_nCOM000544_Seijo |
Resumen:
Existen ciertas repeticiones de caracteres en secuencias, las repeticiones máximas, que han sido estudiadas para buscar patrones recurrentes que puedan caracterizar a diferentes familias de proteínas a partir de sus secuencias de aminoácidos. Por otra parte, el análisis de reglas de asociación es una técnica de Data Mining utilizada para encontrar, de forma automática, relaciones interesantes entre elementos de una base de datos. En un trabajo previo se vincularon las reglas de asociación con las repeticiones máximas existentes en las secuencias de proteínas de la familia Ankyrin. En el presente trabajo, extendemos dicho análisis para poder involucrar a otras dos familias (TPR y LRR). Encontramos diferencias de órdenes de magnitud entre las cantidades de reglas generadas para estas tres familias de proteínas, que se explican por diferencias observadas en las frecuencias de sus repeticiones máximas. Además, resulta que estas familias no comparten reglas de asociación, debido a que sus conjuntos de repeticiones maximales frecuentes casi no tienen elementos en común. Presentamos algunas optimizaciones temporales y espaciales para el proceso de generación de reglas de asociación (con y sin pérdida de reglas) e investigamos una forma de obtener los mismos conjuntos de reglas a partir de los k-meros de las secuencias pero sin calcular sus repeticiones maximales. Utilizamos una medida, el lift, para analizar la relevancia de las reglas generadas y observamos que resulta insuficiente cuando se aplica al dominio de nuestro problema. Por último, extendemos una herramienta para la visualización de reglas y proteínas (Protein Rule Visualization Tool) para permitir la exploración de datos provenientes de múltiples familias.
Citación:
---------- APA ----------
Seijo, Jonathan Adrian. (2023). Análisis de coocurrencia de repeticiones maximales en familias de proteínas utilizando reglas de asociación. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nCOM000544_Seijo
---------- CHICAGO ----------
Seijo, Jonathan Adrian. "Análisis de coocurrencia de repeticiones maximales en familias de proteínas utilizando reglas de asociación". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2023.https://hdl.handle.net/20.500.12110/seminario_nCOM000544_Seijo
Estadísticas:
Descargas mensuales
Total de descargas desde :
https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000544_Seijo.pdf
Distrubución geográfica