Software para detección y parametrización de objetos.
Documentación
Detección de cuadrados I
Feb 14th
Como primera aproximación para detectar las carátulas de CDs se me ha ocurrido lo siguiente. También utilizaré este post a modo de “en que punto me encuentro”.
Acotando el problema:
- El dispositivo de captura de imagenes no se mueve. (El fondo está fijo)
- El CD entra en la imagen. (Se puede filtrar por movimiento)
Content-based Image Retrieval (descripción y bibliografía)
Jan 16th
La Consulta de imágenes mediante ejemplo (Content-based Image Retrieval o CBIR) es un sistema de búsqueda para recuperar imágenes basándose en su contenido, refiriéndose en su contexto a colores, formas, texturas o cualquier otra información que pueda derivarse de la propia imagen.

En la prehistoria de los sistemas CBIR se utilizaban metadatos que consisten en palabras o frases cortas que tratan de definir lo que contenía una imagen. La inclusión de estos metadatos se realizaba manualmente y servía como índice y parámetro de recuperación. En la actualidad este proceso podría ocupar a toda la población de un país pequeño y sería extremadamente costoso. Se debe indexar la información para poder recuperarla de forma rápida y efectiva. Es por eso que los metadatos dejan de tener sentido para colecciones de imágenes grandes y toman fuerza los sistemas automáticos de indexación y recuperación basados en lo que contiene la imagen.
Must Read (Debes leer): Bases de Datos de Imágenes: Arquitectura de los Sistemas de…
1.1. Estado del Arte
Al tratarse de un área de gran importancia por su estrecha relación con el mundo de los buscadores y sistemas de recomendación se han realizado numerosas investigaciones al respecto. Ya en los ochenta se comenzó a referenciar los sistemas de bases de datos de imágenes como hacen H. Tamura y Yokoya [2] en su análisis de tendencias o la pregunta que enuncian Chang y Hu [1] Sistemas de Información de Imágenes: ¿Dónde vamos desde aquí?. Estos estudios muestran la fuerte necesidad de arquitecturas y algoritmos capaces de indexar y recuperar imágenes de forma rápida y segura sin consumos elevados de tiempo y coste de proceso.
Descripción Formal – Caso Concreto
Jan 14th
Se pretende diseñar y desarrollar un sistema capaz de determinar la existencia de una carátula de CD en una imagen, obtenida por un dispositivo móvil. Así como determinar el autor, el título del disco, el estilo musical e incluso reproducir las pistas del CD. Utilizando para ello un sistema de recuperación de información basado en contenido (CBIR). Este sistema recibirá tan solo la parte de la imagen en la que se encuentre la carátula. El algoritmo de detección de la carátula de CD y el aislamiento de la misma consistirá en la etapa de preprocesado de la imagen.
Un sistema CBIR coherente almacena exclusivamente información del mismo tipo. Si se trata de carátulas de CD contendrá información exclusiva sobre carátulas de CD. Por tanto el resto de objetos que aparezcan en la imagen contaminarán los resultados. Para obtener información fiable del sistema CBIR se le deben suministrar imágenes que única y exclusivamente contengan carátulas de CD.
Se ha tomado como caso concreto la detección y aislamiento de carátulas de CD en imágenes obtenidas por un dispositivo portátil por considerarse un reto concreto, complicado, comprensible, fácilmente acotable, usable y útil.
- Concreto: se trata de un cuadrado de doce por doce centímetros, su tamaño no varía excepto por la perspectiva y es totalmente plano.
- Complicado: existen millones de carátulas de CDs, algunas de ellas muy parecidas. Por otro parte es relativamente complicado detectar un objeto concreto en una imagen, asilarlo y determinar si es lo que se está buscando basándose tan solo en el tamaño y sin tener en cuenta color, textura y formas interiores.
- Comprensible: pese a tratarse de sistemas complejos para oídos inexpertos es fácil comprender su uso así como su utilidad.
- Facilmente acotable: se pueden limitar las colecciones de carátulas de CDs para delimitar la complejidad. Las imágenes de entrada pueden ser tanto o tan poco complicadas como se considere oportuno. El desarrollo puede ser de complejidad gradual creciente.
- Usable: al tratarse de un dispositivo móvil de uso común se podrá utilizar en cualquier lugar cuando se posea una conexión.
- Útil: para las personas con discapacidad visual diferenciar un CD de otro es realmente complicado si no lo han marcado previamente pues no suelen contener caracteres braille.
De manera general la arquitectura del sistema debe permitir la inclusión de nuevas formas a detectar y debe ser sencillo e intuitivo incluir nuevos objetos a detectar. Se pretende dotar de especial importancia al diseño, la modularidad y la reutilizabilidad serán factores críticos en esta inminente etapa.
Perdido entre papers…
Jan 6th
He andado un poco perdido, quizá abrumado por la tarea de recolectar e intentar leer y comprender todos los papers. He estado un poco desanimado por tener la vacaciones ocupadas con el Master.
Pero parece que ya me he centrado y he organizado las ideas. Creo que lo único que necesitaba era descansar bien y organizar primero mis ideas. Estoy trabajando y creo que voy bien, pero esto no ha echo más que empezar…
He perdido mucho tiempo y ahora tengo que recuperarlo.
Lineas de investigación para el estado del arte de OpenVoV
Nov 23rd
He estado mirando papers y comprobando cuales son las líneas de investigación por las que debo dirigir el estado del arte. Las líneas de investigación que he considerado oportunas y los papers que me han parecido relevantes son los siguientes:
Detección y parametrización de objetos
- Estimación borrosa de la distancia cámara-objeto sobre imagen visual
- Efficient Object Pixel-Level Categorization using Bag of Features
- Distance Metric between 3D Models and 2D Images for Recognition and Classification
- An Empirical Study of Context in Object Detection
- Robust Real-time Object Detection
Calibración de filtros
Recuperación de imágenes basándose en contenido
- PicSOM A Framework for Content Based Image Database Retrieval using Self Organizing Maps
- Image Retrieval: Ideas, Influences, and Trends of the New Age
Proyectos similares o relacionados
Comenzar por el principio
Nov 17th
Puede parecer una frase obvia y sobreexplotada pero tras la aparente sencillez se esconde cierta complejidad.
Cuando hablamos del principio de un proyecto en TI nos referimos a la etapa de Análisis, aquella en la que recabamos información sobre los últimos avances en la línea de investigación/desarrollo que queremos cubrir. Cuando se trata de un proyecto formal, una de las primeras subtareas de esta etapa se llama “Estado del Arte” o “Estado de la cuestión”. Es por aquí por donde debemos comenzar.
Lets go!
Presentación
Nov 15th
Bienvenidos al blog de desarrollo del proyecto Open Virtual Objects Viewer:
Descripción:
Open Virtual Object Viewer es un proyecto que pretende diseñar una arquitectura software genérica para detección, categorización y parametrización de objetos. Se implementará un caso concreto como ejemplo de desarrollo basado en el reconocimiento de carátulas de CDs y reproducción (sonido/braille/magnificación) del nombre, autor y categoría musical como ayuda a invidentes.
La arquitectura pretende definir una estructura modular fácilmente ampliable. Que permita realizar pequeñas modificaciones en determinados métodos para incluir nuevas formas a detectar y por tanto incrementar la capacidad de detección de objetos, la inteligencia global del sistema y su utilidad. Por este motivo este proyecto solo puede funcionar si el código es libre.
Este Trabajo Fin de Master de la Univ. Rey Juan Carlos se presenta al 4º Concurso Universitario de Software Libre.
Para saber más: About



