Facebook está utilizando a Instagram para entrenar su IA

La carrera para construir la inteligencia artificial más avanzada del mundo continúa y todo parece indicar que Facebook tiene un arma secreta: los miles de millones de imágenes publicadas en Instagram.

Durante su conferencia anual F8, la cual tomó lugar recientemente, los representantes de Facebook revelaron uno de sus programas de investigación más recientes, en el cual han utilizado miles de millones de imágenes publicadas por los usuarios de Instagram, haciendo énfasis en aquellas publicadas con hashtags, para entrenar a sus modelos de reconocimiento de imágenes. 

La compañía tuvo que utilizar cientos de tarjetas gráficas (GPU) que permanecían activas de forma permanente para poder procesar la inmensa cantidad de imágenes que estaban analizando, lo cual dio como resultado la creación de diversos modelos de deep learning que superaron los benchmarks de la industria, siendo el mejor resultado logrado por la compañía un 85.4% de precisión en ImageNet.

Si alguna vez has utilizado hashtags en tus imágenes de Instagram, entonces probablemente ya sepas que dichas etiquetas no requieren de un proceso de investigación bastante complejo.  Generalmente existe una razón por la que los usuarios usan cada hashtag en específico y para Facebook el reto era simplemente determinar los aspectos más relevantes de cada imagen y asociarlos con los hashtags.

Cuando se está trabajando con una escala tan masiva como esta, siendo la prueba más grande de 3,5 mil millones de imágenes con 17.000 hashtags en total, hasta una compañía tan grande como Facebook se queda corta en recursos para supervisar la información continuamente.

Mientras que otros benchmarks de reconocimiento de imágenes dependen mayormente de personal humano para analizar inmensas cantidades de imágenes, Facebook tuvo que encontrar otros métodos más eficientes para llevar a cabo este ambicioso proyecto.

La investigación de «pre-entrenamiento» se enfocó en desarrollar sistemas para encontrar hashtags relevantes. Esto incluyó la separación de hashtags que fueran sinónimos y también de aquellos que fueran bastante generales. Esto dio como resultado a lo que el grupo de investigación se refiere como «el modelo de predicción de hashtags a larga escala».

Las implicaciones de privacidad de este proyecto son interesantes. Por un lado, Facebook solamente está utilizando información e imágenes públicas, ya que decidieron ignorar a todos los perfiles privados de Instagram. Sin embargo, la mayoría de los usuarios con cuentas públicas no están al tanto de que sus imágenes serán usadas para proyectos como este.

Cabe constar que este proyecto se enfocó en el reconocimiento de objetos dentro de nuestras imágenes, ya que hasta los momentos no cuentan con la capacidad tecnológica para reconocer a seres humanos con eficiencia.

La compañía también anunció una serie de cambios a sus aplicaciones más importantes durante el evento, incluyendo una actualización de diseño para Messengermás características para las Historias en vídeo de Instagram, entre otras cosas.

La compañía también anunció un nuevo servicio para citas románticas que podría contar con suficientes características como para destruir a Tinder. Sin embargo, todo dependerá de qué tantas personas puedan volver a confiar en la compañía luego de sus diversas controversias relacionadas con el mal uso de la información personal de los usuarios de la plataforma.

:)