El último avance de Google relacionado con su plataforma de inteligencia artificial (aprendizaje máquina y redes neuronales) permitirá realizar búsquedas de vídeos según el contenido, por sustantivos como ‘perro’, ‘flor’, ‘sombrero‘, ‘persona’ o verbos como ‘correr’, ‘nadar’, ‘volar’.
Es decir, que será posible buscar en YouTube aquellos vídeos en los que aparezca un tigre de bengala durmiendo la siesta, un señor con un gorro rojo o un gato volando.
Los sistemas de aprendizaje máquina y las redes neuronales proporcionan a los ordenadores la capacidad de reconocer objetos, personas o entidades que aparecen en imágenes y fotografías. De forma muy básica, el proceso pasa por proporcionar al ordenador muestras de imágenes con información sobre lo que aparece en ellas: perro, planta, persona, gorro, coche,...)
Después cuando el ordenador recibe una imagen sin esa información la compara con todas las demás imágenes que sí conoce para tratar de “averiguar” de forma automática qué es lo que hay o qué está sucediendo en la imagen. Esto permite, por ejemplo, que los programas de almacenamiento de fotografías (como Google Fotos) ya sean capaces reconocer los rostros de los familiares y amigos que aparecen habitualmente en las fotografías, independientemente de cuál sea la situación, la escena o la iluminación de las fotografías sucesivas.
La tecnología de reconocimiento de imágenes hace posible también la búsqueda de imágenes a partir de palabras clave o por sustantivos (montaña, vaca, árbol, camiseta,...) como hace la app The Roll, por ejemplo; también que los ordenadores sean capaces de reconocer dónde se tomó una fotografía con relativa precisión aunque no consten los datos GPS o reconstruir un rostro a partir de un puñado de píxeles.
La API de Google para la búsqueda en vídeos está disponible por ahora como beta privada. En un futuro próximo se tratará de un potente herramienta de búsqueda, casi imprescindible por el creciente uso de contenidos de vídeo.
Relacionado,
- Google utiliza el aprendizaje máquina para reducir el consumo de datos del móvil
- La tecnología de Facebook para describir con palabras las fotografías a usuarios con problemas de vista
- La red neuronal de Google que puede saber dónde se tomó una foto sólo con mirarla, sin los datos GPS
- Un algoritmo que produce vídeos a partir de imágenes fijas para que los ordenadores entiendan las escenas en movimiento
- Cómo los ordenadores colorean de forma creíble viejas fotos en blanco y negro
- Aprendizaje automático contra reconocimiento facial