Archive for January, 2010

Content-based Image Retrieval (descripción y bibliografía)

La Consulta de imágenes mediante ejemplo (Content-based Image Retrieval o CBIR) es un sistema de búsqueda para recuperar imágenes basándose en su contenido, refiriéndose en su contexto a colores, formas, texturas o cualquier otra información que pueda derivarse de la propia imagen.

Esquema de funcionamiento de un sistema CBIR

En la prehistoria de los sistemas CBIR se utilizaban metadatos que consisten en palabras o frases cortas que tratan de definir lo que contenía una imagen. La inclusión de estos metadatos se realizaba manualmente y servía como índice y parámetro de recuperación. En la actualidad este proceso podría ocupar a toda la población de un país pequeño y sería extremadamente costoso. Se debe indexar la información para poder recuperarla de forma rápida y efectiva. Es por eso que los metadatos dejan de tener sentido para colecciones de imágenes grandes y toman fuerza los sistemas automáticos de indexación y recuperación basados en lo que contiene la imagen.

Must Read (Debes leer):  Bases de Datos de Imágenes: Arquitectura de los Sistemas de…

1.1. Estado del Arte

Al tratarse de un área de gran importancia por su estrecha relación con el mundo de los buscadores y sistemas de recomendación se han realizado numerosas investigaciones al respecto. Ya en los ochenta se comenzó a referenciar los sistemas de bases de datos de imágenes como hacen H. Tamura y Yokoya [2] en su análisis de tendencias o la pregunta que enuncian Chang y Hu [1] Sistemas de Información de Imágenes: ¿Dónde vamos desde aquí?. Estos estudios muestran la fuerte necesidad de arquitecturas y algoritmos capaces de indexar y recuperar imágenes de forma rápida y segura sin consumos elevados de tiempo y coste de proceso.

Read the rest of this entry »

Descripción Formal – Caso Concreto

Se pretende diseñar y desarrollar un sistema capaz de determinar la existencia de una carátula de CD en una imagen, obtenida por un dispositivo móvil. Así como determinar el autor, el título del disco, el estilo musical e incluso reproducir las pistas del CD. Utilizando para ello un sistema de recuperación de información basado en contenido (CBIR).  Este sistema recibirá tan solo la parte de la imagen en la que se encuentre la carátula. El algoritmo de detección de la carátula de CD y el aislamiento de la misma consistirá en la etapa de preprocesado de la imagen.

Un sistema CBIR coherente almacena exclusivamente información del mismo tipo. Si se trata de carátulas de CD contendrá información exclusiva sobre carátulas de CD. Por tanto el resto de objetos que aparezcan en la imagen contaminarán los resultados. Para obtener información fiable del sistema CBIR se le deben suministrar imágenes que única y exclusivamente contengan carátulas de CD.

Se ha tomado como caso concreto la detección y aislamiento de carátulas de CD en imágenes obtenidas por un dispositivo portátil por considerarse un reto concreto, complicado, comprensible, fácilmente acotable, usable y útil.

  • Concreto: se trata de un cuadrado de doce por doce centímetros, su tamaño no varía excepto por la perspectiva y es totalmente plano.
  • Complicado: existen millones de carátulas de CDs, algunas de ellas muy parecidas. Por otro parte es relativamente complicado detectar un objeto concreto en una imagen, asilarlo y determinar si es lo que se está buscando basándose tan solo en el tamaño y sin tener en cuenta color, textura y formas interiores.
  • Comprensible: pese a tratarse de sistemas complejos para oídos inexpertos es fácil comprender su uso así como su utilidad.
  • Facilmente acotable: se pueden limitar las colecciones de carátulas de CDs para delimitar la complejidad. Las imágenes de entrada pueden ser tanto o tan poco complicadas como se considere oportuno. El desarrollo puede ser de complejidad gradual creciente.
  • Usable: al tratarse de un dispositivo móvil de uso común se podrá utilizar en cualquier lugar cuando se posea una conexión.
  • Útil: para las personas con discapacidad visual diferenciar un CD de otro es realmente complicado si no lo han marcado previamente pues no suelen contener caracteres braille.

De manera general la arquitectura del sistema debe permitir la inclusión de nuevas formas a detectar y debe ser sencillo e intuitivo incluir nuevos objetos a detectar. Se pretende dotar de especial importancia al diseño, la modularidad y la reutilizabilidad serán factores críticos en esta inminente etapa.

Perdido entre papers…

He andado un poco perdido, quizá abrumado por la tarea de recolectar e intentar leer y comprender todos los papers. He estado un poco desanimado por tener la vacaciones ocupadas con el Master.

Pero parece que ya me he centrado y he organizado las ideas. Creo que lo único que necesitaba era descansar bien y organizar primero mis ideas. Estoy trabajando y creo que voy bien, pero esto no ha echo más que empezar…

He perdido mucho tiempo y ahora tengo que recuperarlo.