Facebook est√° utilizando a Instagram para entrenar su IA

La carrera para construir la inteligencia artificial m√°s avanzada del mundo contin√ļa y todo parece indicar que¬†Facebook tiene un arma secreta: los miles de millones de im√°genes publicadas en Instagram.

Durante su conferencia anual F8, la cual tomó lugar recientemente, los representantes de Facebook revelaron uno de sus programas de investigación más recientes, en el cual han utilizado miles de millones de imágenes publicadas por los usuarios de Instagram, haciendo énfasis en aquellas publicadas con hashtags, para entrenar a sus modelos de reconocimiento de imágenes. 

La compa√Ī√≠a tuvo que utilizar¬†cientos de tarjetas gr√°ficas (GPU)¬†que permanec√≠an activas de forma permanente para poder procesar la inmensa cantidad de im√°genes que estaban analizando, lo cual dio como resultado¬†la creaci√≥n de diversos modelos de deep learning que superaron los benchmarks de la industria,¬†siendo el mejor resultado logrado por la compa√Ī√≠a un 85.4% de precisi√≥n en ImageNet.

Si alguna vez has utilizado hashtags en tus imágenes de Instagram, entonces probablemente ya sepas que dichas etiquetas no requieren de un proceso de investigación bastante complejo.  Generalmente existe una razón por la que los usuarios usan cada hashtag en específico y para Facebook el reto era simplemente determinar los aspectos más relevantes de cada imagen y asociarlos con los hashtags.

Cuando se est√° trabajando con una escala tan masiva como esta, siendo la prueba m√°s grande de¬†3,5 mil millones de im√°genes¬†con 17.000 hashtags en total,¬†hasta una compa√Ī√≠a tan grande como Facebook se queda corta en recursos¬†para supervisar la informaci√≥n continuamente.

Mientras que otros benchmarks de reconocimiento de imágenes dependen mayormente de personal humano para analizar inmensas cantidades de imágenes, Facebook tuvo que encontrar otros métodos más eficientes para llevar a cabo este ambicioso proyecto.

La investigaci√≥n de «pre-entrenamiento» se enfoc√≥ en desarrollar¬†sistemas para encontrar hashtags relevantes. Esto incluy√≥ la separaci√≥n de hashtags que fueran sin√≥nimos y tambi√©n de aquellos que fueran bastante generales. Esto dio como resultado a lo que el grupo de investigaci√≥n se refiere como¬†«el modelo de predicci√≥n de hashtags a larga escala».

Las implicaciones de privacidad de este proyecto son interesantes. Por un lado, Facebook¬†solamente est√° utilizando informaci√≥n e im√°genes p√ļblicas,¬†ya que decidieron ignorar a todos los perfiles privados de Instagram. Sin embargo, la mayor√≠a de los usuarios con cuentas p√ļblicas no est√°n al tanto de que sus im√°genes ser√°n usadas para proyectos como este.

Cabe constar que este proyecto se enfocó en el reconocimiento de objetos dentro de nuestras imágenes, ya que hasta los momentos no cuentan con la capacidad tecnológica para reconocer a seres humanos con eficiencia.

La compa√Ī√≠a tambi√©n anunci√≥ una serie de cambios a sus aplicaciones m√°s importantes durante el evento, incluyendo¬†una actualizaci√≥n de dise√Īo para Messenger,¬†m√°s caracter√≠sticas para las Historias en v√≠deo de Instagram, entre otras cosas.

La compa√Ī√≠a tambi√©n anunci√≥¬†un nuevo servicio para citas rom√°nticas¬†que podr√≠a contar con suficientes caracter√≠sticas como para destruir a Tinder. Sin embargo, todo depender√° de qu√© tantas personas puedan volver a confiar en la compa√Ī√≠a luego de sus diversas controversias relacionadas con el mal uso de la informaci√≥n personal de los usuarios de la plataforma.

:)