por Daniel Martos - 25 abr 2024

¡Sí, señores, señoras y señorites! Los avances en el desarrollo de la Inteligencia Artificial siguen su derrotero de crecimiento ad infinitum, y el primer trimestre del año trajo varias novedades en este campo, que nos permiten visualizar un 2024 muy prometedor. Lo cierto es que las tres empresas tecnológicas más grandes en este momento (OpenAI, Google y Microsoft) han decidido reforzar sus esfuerzos (léase: inversiones) en dotar de mayores y mejores funcionalidades a la IA, aunque cada una de ellas con distintos enfoques; y también, con diversos resultados. Hagamos un repaso de lo que nos deja el primer trimestre de 2024:

 

¡Maldito Bard!

Google intentó dar un refresh a su IA, que cambió su nombre de Bard a Gemini, ofreciendo una versión gratuita y una paga. Como recordarán, las ventajas del primero eran la actualización en tiempo real de la información; y el respaldo de la compañía que le dio origen, lo que auspiciaba un éxito rotundo.

 

Quedado a mitad de camino, el proyecto de Mountain View, había demostrado problemas desde el origen, donde desde su face beta ya tenía muestras de respuestas incorrectas, inconclusas o, al menos, dudosas. Si bien ofrecía “cierta” integración con la suite ofimática de Google, esta nunca terminó de funcionar correctamente.

 

Consciente de este panorama, la empresa de la gran G anunció en su blog el cambio de nombre y las versiones advance (que requiere suscripción), y la versión móvil, que prometía una performance mucho mayor a la que en la práctica pudimos comprobar.

 

Lo cierto es que la versión advance, que pudimos testear en Un Ratito Más, tiene una mayor tasa de respuesta, lo que nos da una sensación de inmediatez que con Bard no teníamos. No obstante, nos encontramos con dos problemas que le restan eficacia y van en detrimento de la experiencia del usuario: la inclusión de información incierta en las respuestas (mismo problema que mostraba Bard) y la reiterante confusión de idiomas en las que recae la herramienta al utilizar links o preguntas que incluyen términos con palabras de idiomas foráneos, más allá de que están reconocidos y adoptados en el español, según la RAE.

 

Lo que sí es verdad, es que hay que reconocerle a Google la iniciativa.

 

¿Y dónde está el Piloto?

Con una jugada maestra que incluyó la versión de ChatGPT 4 en su motor, Copilot, la apuesta de Microsoft (y más allá de que a nivel personal suelo ser muy crítico de esta empresa) da un paso enorme que a partir de su nuevo nombre y versión, trajo muchas novedades, entre ellas:

 

-Capacidad de generar imágenes, a demanda: con la adopción de Dall-E, cualquier usuario o usuaria puede darle unas instrucciones a Copilot y la herramienta responderá, luego de unos pocos segundos, con el diseño hecho a la perfección; o casi, ya que la literalidad en cuanto a inclusión de texto, siempre remite al inglés. La ilustración que mostramos a continuación es un ejemplo de esto que estamos comentando: le pedimos a Copilot un mono sentado en una mariposa con un cartel que tuviera escrito “Un ratito más”, pero no logró escribirlo en nuestro idioma.

 

24 04 25 DM IA War 1

Le pedimos a Copilot un mono sentado en una mariposa con un cartel que tuviera escrito “Un ratito más”, pero no logró escribirlo en nuestro idioma

 

-Conexión a internet en tiempo real: no solo para la extracción de datos, sino también para el análisis de sitios web, síntesis noticiosas, o reviews rápida de cualquier tópico.

 

-Análisis de imágenes preciso: probamos desde esta columna la capacidad de reconocimiento de Copilot, con una experiencia más que satisfactoria: le mostramos a Copilot una imagen de un tacho de basura en una oficina y nos resumió: “Eso es un contenedor de basura. Se utiliza para desechar residuos y mantener limpio el entorno. En la imagen, puedes ver un contenedor blanco con una etiqueta grande que dice ‘Residuos’. La etiqueta también tiene una imagen de un bote de basura. El contenedor está ubicado en una habitación con paredes y suelo de baldosas. A la izquierda del contenedor, hay parte de otro objeto que parece ser una silla o un taburete negro. ¡Recuerda siempre reciclar y desechar correctamente tus residuos!”

 

GPT Reloaded

Si tenemos que hablar del desarrollo de OpenAI, lo cierto es que no hay demasiadas noticias para compartir. Solo podríamos mencionar que la información de la versión actual 3.5 (al 28/03/2024) actualizó su base de datos anterior que estaba hasta mediados de 2021, e incluye información hasta enero de 2022.

 

Sí existen varios proyectos en danza dentro de la empresa: Sora promete ser un generador de videos a demanda con altísimas funcionalidades, la capacidad de recordar las interacciones previas con nosotros (aún en fase de pruebas) y la puesta en valor de su tienda de aplicaciones que, sin embargo, ha recibido muchas críticas por la proliferación de aplicaciones sin sentido, o pseudo-spam.

 

En síntesis, el desarrollo de la Inteligencia Artificial está lejos de llegar a su apogeo, lo cual celebramos y nos entusiasma por todo aquello que puede significar para nosotros, mortales usuarios. ¡Hasta el mes que viene!