/ machine learning

Jaguar Vision, un algoritmo para entender cómo ve la gente

Queremos otorgarle a nuestra tecnología la capacidad de ver, por eso tomamos al jaguar: preciso y veloz, y le atribuimos la agilidad de la ballena al navegar la información. Así nace Jaguar Vision.

Jaguar Vision será el resultado de entrenar una red neuronal convolucional, uno de los algoritmos de machine learning más eficientes para clasificación de imágenes. Una CNN (por sus siglas en Inglés), funciona imitando la respuesta de las neuronas a estímulos visuales, así puede reconocer los patrones que comparte un grupo de imágenes y aprender la forma de sus elementos. Esto se logra a partir de unidades de reconocimiento llamadas filtros: cientos, miles o incluso millones de ellos. Cada uno debe ser entrenado para reconocer cierta particularidad dentro de una región de la imagen (esquinas, patas, pies, hocicos, caras, agua, etc.) que cuando son identificadas en conjunto indican el contenido certero de la imagen (perro, gato, humano).

El entrenamiento de nuestros modelos de redes neuronales requerirá de un banco de imágenes y etiquetas que nuestros aliados Fragments distribuirán globalmente con su App de micro-tareas (Fig. 1). Utilizando trabajadores/anotadores humanos que participan de la plataforma, repartiremos la labor de etiquetado de datos y los recibiremos ya estructurados, así funciona la tecnología blockchain.

Pero el algoritmo busca ir más allá. Haremos uso de una CNN para reconocer la forma compositiva de los elementos situados en la imagen (Fig. 2). ¿Cómo están distribuidos los elementos en el espacio definido por la imagen? Centrados, puestos en diagonal, divididos por una línea horizontal. Estas particularidades serán reconocidas por la CNN así como los objetos partícipes de las imágenes (cereza, perro, gato, humano).

Un algoritmo capaz de reconocer estas características en un objeto visual podría unirse a nuestras herramientas de análisis de redes digitales que miden la opinión de los observadores, la efectividad de lo mostrado y los patrones de comunicación visual de una entidad para darnos un mejor entendimiento de la forma en que nos relacionamos con el entorno visual en Internet. Es así como en Whale & Jaguar nos aproximamos a la información que vemos, sentimos y con la que interactuamos.