Resumen:
Se considera el problema de identificar automáticamente la acción ejecutada en un video. Dada una lista de posibles acciones (por ejemplo, correr, sentarse, aplaudir, etc.) y un video en el que se muestra un actor llevando a cabo una de ellas, se quiere contar con un algoritmo que permita reconocer la acción siendo ejecutada. Las áreas de aplicación para el reconocimiento de acciones son muy variadas, e incluyen la identificación de personas, la obtención automática de descripciones de videos, la vigilancia basada en el análisis de videos capturados por cámaras de seguridad, la interacción con computadoras mediante movimientos, etc. El problema es desafiante porque, por un lado, la apariencia de una misma acción puede variar mucho en distintos videos y, por otro, acciones distintas pueden tener una apariencia similar. En esta tesis se estudia un enfoque particular para el tema, que intenta reconocer la acción ejecutada en un video a partir de los descriptores de parches espacio-temporales extraídos del mismo en determinados puntos de interés. Se analizan algoritmos para cada uno de los 3 pasos principales del enfoque: la detección de puntos de interés, la obtención de descriptores y el reconocimiento de la acción a partir de los descriptores. Para todos los pasos, se implementaron algoritmos existentes. Para el tercer paso se desarrollaron, además, 2 nuevos algoritmos. Uno de ellos apunta, principalmente, a lograr una mejora en el tiempo consumido para determinar la acción presente en un video. En líneas generales, la estrategia seguida para conseguir dicha mejora consiste en organizar de una manera particular la base de datos de descriptores. El otro intenta mejorar la capacidad de clasificar correctamente un video mediante la utilización de varios tipos de descriptores por punto de interés. El enfoque elegido es evaluado utilizando 2 bases de datos de videos disponibles públicamente, obteniendo resultados muy alentadores.
Abstract:
In this thesis, we will be considering the problem of automatically identifying an action performed in a video. Given a list of possible actions (e.g. running, sitting, clapping hands, etc.) and a video showing an actor performing any one of them, the goal is to produce an algorithm for the recognition of the action being performed. The fields of application for action recognition are varied, and include people recognition, automatically achieving video descriptions, vigilance based on the analysis of security cam-captured videos, interaction with computers via movement, etc. The problem is challenging because, on one hand, the appearance of an action can vary in different videos and, on the other hand, different actions can have similar appearance. In this thesis a specific approach to the subject will be taken, that of trying to recognize an action performed in a given video using descriptors of spatio-temporal patches extracted from certain interest points in that same video. Algorithms for each of the three main steps will be analyzed: detecting interest points, obtaining descriptors, and recognizing the action using those descriptors. For every step, existing algorithms were applied. For the third step two new algorithms were developed. The first algorithm aims at lowering the amount of time consumed in determining the action present in the video. Broadly, the strategy followed to achieve such improvement is that of organizing the descriptors data base in a particular fashion. The second algorithm intends to improve on the ability to correctly classify a video through the use of several types of descriptors for each interest point. The chosen approach to the subject is then evaluated by the use of two freely available video data bases, with very promising results.
Citación:
---------- APA ----------
Ubalde, Sebastián. (2009). Reconocimiento de acciones en video. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nCOM000764_Ubalde
---------- CHICAGO ----------
Ubalde, Sebastián. "Reconocimiento de acciones en video". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2009.https://hdl.handle.net/20.500.12110/seminario_nCOM000764_Ubalde
Estadísticas:
Descargas mensuales
Total de descargas desde :
https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000764_Ubalde.pdf
Distrubución geográfica