Los chatbots de IA generativa se convirtieron rápidamente en herramientas indispensables en diversos sectores, transformando la forma en que interactuamos con la tecnología. Estas avanzadas plataformas ya no sirven únicamente para chatear, sino que evolucionaron hasta convertirse en sistemas multimodales capaces de comprender tanto el lenguaje como la información visual.
Esto las convierte en algunas de las herramientas de inteligencia artificial más sofisticadas de la actualidad. A medida que el mercado sigue creciendo y evolucionando, se desarrollan a tasas sin precedentes nuevos e innovadores chatbots que ofrecen capacidades y funcionalidades mejoradas.
En este artículo, quiero resaltar cinco chatbots de IA generativa notables que destacan por sus características únicas y la amplia gama de tareas que pueden realizar. Desde ayudar a codificar y escribir hasta generar imágenes e incluso entablar conversaciones complejas, estos chatbots representan la vanguardia de la tecnología de IA, demostrando el increíble potencial de la IA generativa en diversas aplicaciones.
ChatGPT
ChatGPT no fue la primera herramienta de IA generativa que se hizo pública. Los interesados en la IA llevamos ya unos años jugando con generadores de imágenes y similares. Pero fue la primera en impresionar a un público más amplio sobre lo preparada que estaba la IA para llegar al gran público.
A las pocas semanas de su lanzamiento, alcanzó el millón de usuarios activos. Se difundió la noticia de que se trataba de la aplicación con el crecimiento de audiencia más rápido de la historia, aunque este récord se batió poco después, cuando Meta lanzó Threads.
Durante el año transcurrido desde su publicación, OpenAI trabajó duro para mantener nuestro interés. En primer lugar, lanzó una versión Pro basada en su último y más potente modelo de gran lenguaje (LLM) GPT-4. A continuación, añadió funciones de navegación web y un nuevo motor de búsqueda. Luego añadió funciones de navegación web y generación de imágenes con Dall-E, lo que lo hace verdaderamente multimodal.
A menudo se llama a ChatGPT "la máquina que lo hace todo", ya que es el primer puerto de escala cuando quieres hacer cualquier trabajo. Si no puede hacerlo por ti, es muy probable que pueda decirte cómo hacerlo tú mismo. ChatGPT es el original y, en muchos sentidos, sigue siendo el mejor. La mayoría de las personas que utilizaron todas las herramientas enumeradas aquí probablemente estarán de acuerdo en que, como caballo de batalla de uso general, ChatGPT está a la cabeza.
Bard de Google
Muchos pensábamos que a Google -el campeón reinante en el mundo de la IA- estaba preparado para la llegada de ChatGPT.
Cuando apareció ChatGPT, se reconoció de inmediato como quizá la primera amenaza seria al dominio a largo plazo de Google en el sector de las búsquedas, fuente de la mayor parte de sus ingresos.
La respuesta fue Bard, que tardó en llegar y al principio parecía una pálida imitación del advenedizo chatbot de OpenAI. Sin embargo, a punto de cumplirse un año de su publicación, evolucionó hasta convertirse en capaz y útil.
A diferencia de OpenAI, Google saltó de un modelo a otro entre bastidores. Al principio, Bard funcionaba con LaMDA antes de que se introdujera un modelo más reciente, PaLM 2, que mejoraba sus capacidades de codificación y matemáticas.
El último cambio fue a Gemini Pro, con una futura actualización a Gemini Ultra en preparación. La última versión de Google supera al GPT-4 en algunas tareas, como el reconocimiento de voz. Las actualizaciones más recientes le dotaron de capacidades de generación de imágenes gracias a su tecnología Imagen 2.
Una ventaja que Bard tiene sobre ChatGPT, al menos para algunos, es lo bien que se integra en el ecosistema de Google. Si eres usuario de Gmail, Workspace, Documents, etc., te impresionará la facilidad con la que es capaz de redactar correos electrónicos, crear documentos, generar datos o automatizar muchas tareas rutinarias.
Microsoft CoPilot
Copilot es el nombre actual de Microsoft para su chatbot de IA insignia, que se lanzó como una nueva versión de su motor de búsqueda Bing llamado Bing Chat, antes de adquirir su propio nombre e identidad independiente.
Microsoft eligió el nombre cuidadosamente, para transmitir la sensación de que su objetivo es ayudarnos, en lugar de simplemente charlar con nosotros. Al integrar la IA en todas sus herramientas de trabajo y productividad, como Windows y Microsoft 365, espera convertirse en la opción dominante en IA, al igual que hizo en esos mercados.
Como gran inversor en OpenAI, Microsoft tiene privilegios a la hora de utilizar su tecnología en sus propios productos. El Bing Chat original fue la primera oportunidad que muchos tuvimos de experimentar GPT-4, y el LLM más potente y completo es hoy la columna vertebral de CoPilot. Al igual que ChatGPT, también utiliza Dall-E para generar imágenes.
Pero su verdadera ventaja es que inyecta IA en herramientas que millones de nosotros utilizamos a diario. Se pueden crear hojas de cálculo, documentos de texto y código informático con indicaciones en lenguaje natural. Es muy utilizado por los programadores gracias a su integración con la plataforma de programación Github, también propiedad de Microsoft.
Llama2
La respuesta de Meta a ChatGPT es su modelo multimodal Llama2. Sin embargo, en lugar de empaquetarlo como un producto comercial, como Microsoft u OpenAI, adoptó un enfoque ligeramente diferente. Siguiendo un modelo de licencia casi de código abierto, el código y los datos de entrenamiento están disponibles para que cualquiera los utilice para crear sus propios chatbots. También se puede acceder a él a través de su propia URL si no eres desarrollador y sólo quieres saber qué puede hacer.
Meta dijo que adoptó este enfoque para hacer que Llama sea lo más accesible posible. Una ventaja es que permite crear instancias privadas que no tienen que enviar datos a Meta o a la nube para que la IA acceda a ellos. Por ello, aunque puede considerarse un chatbot de IA de uso general, del mismo modo que ChatGPT o Bard, se considera especialmente útil para crear aplicaciones más especializadas. Actualmente existen varios LLM de código abierto, pero (según sus propias pruebas) Llama2 los supera a todos.
Claude
Claude fue creado por Anthropic, una empresa creada por antiguos empleados de OpenAI. Es el primer chatbot multimodal que construyeron, capaz de manejar texto, voz, imágenes y documentos. Los usuarios dicen que les parece rápido y capaz y que genera respuestas muy coherentes. Sin embargo, su alcance es algo menor que el de ChatGPT o Bard.
Anthropic declaró su compromiso con una IA ética y transparente, que se refleja en un principio llamado IA Constitucional. Esto dio lugar a un chatbot con una capacidad única para interactuar con usuarios que (quizá sin saberlo) le piden que genere contenidos que podrían ser poco éticos o perjudiciales. Puede explicar las normas que sigue, explicar las razones de su comportamiento y sugerir formas alternativas de realizar tareas sin cruzar sus guardarraíles.
Desde su lanzamiento a principios de 2023, pisándole los talones a ChatGPT, Claude destacó por la fluidez de las conversaciones que puede mantener y su capacidad para comprender sutiles matices y diferencias en la forma de comunicarse de los humanos. Además, permite a los usuarios asignarle un personaje que les guste y con el que les resulte agradable hablar.
*Con información de Forbes US