Las maravillas de la IA Generativa inundaron las redes y durante la primera mitad de 2023 el asombro llenó los títulares de cada día. Ahora que comienza a estar claro el juego entre los diversos fabricantes de IA, es un momento para tomar nota de qué es lo importante entender para usar la IA Generativa en forma correcta.
Uno de los principales problemas es que las IA Generativas alucinan, esto es que producen información falsa pero que es verosimil, incluso puede ser tan extremadamente verosímil que a un experto le costaría darse cuenta. Pero esas alucinaciones son mas frecuentes si se desconoce cómo usar estas herramientas. Es que no se trata sólo de preguntar o pedir algo sin entender demasiado cómo debiera ser la respuesta.
Usar una IA Generativa conlleva también una responsabilidad por parte del usuario. La de entender el problema y los contextos sobre los que se está realizando la consulta. Los dos métodos principales que se deben tener en cuenta es saber cómo precisar la consulta (o ingeniería rápida) y cómo ir refinando las respuestas.
¿Qué es la ingeniería rápida?
La ingeniería rápida consiste en comunicar eficazmente nuestras necesidades a las aplicaciones de IA, garantizando que puedan ayudarnos de manera precisa y exacta. Tomémonos un momento para profundizar en este concepto.
Imagínese usar Bing Chat AI para resolver un problema matemático. Si hacemos una pregunta vaga como "¿Puedes ayudarme con un problema de matemáticas?" Es probable que recibamos una respuesta, pero puede que no sea exactamente lo que necesitamos. Sin embargo, si proporcionamos instrucciones claras y específicas como "Calcule la suma de 13 y 7", estamos practicando ingeniería rápida. ¿El resultado? Obtenemos una respuesta más precisa y relevante porque hemos guiado a la IA con una instrucción o indicación bien estructurada.
En el ámbito empresarial, piense en solicitar un análisis de tendencias de ventas o de mercado a una herramienta basada en OpenAI. Si hacemos una pregunta amplia como "Hábleme sobre la industria bancaria", es posible que no recibamos la información detallada que necesitamos. Sin embargo, al aplicar ingeniería rápida y decir: "Proporcione un informe detallado sobre las tendencias actuales del mercado para la industria bancaria de EE. UU., incluidos datos sobre las estrategias recientes de nuestros principales competidores y las preferencias de los consumidores", hemos establecido expectativas claras. Esta precisión permite que el modelo de lenguaje grande (LLM) seleccionado comprenda nuestra solicitud de manera integral y brinde información valiosa.
Entonces, ya sea que estemos resolviendo problemas matemáticos o buscando un análisis de mercado en profundidad, recuerde que la claridad de nuestras instrucciones es importante. Cuanto mejor diseñemos nuestras indicaciones, más precisas y valiosas serán las respuestas que recibamos.
Recomiendo fomentar una cultura de ingeniería rápida y alentar a los equipos a compartir las mejores prácticas y aprendizajes en la elaboración de indicaciones efectivas. Y esto requiere cierto trabajo específico dentro de las organizaciones. Este enfoque colaborativo puede mejorar significativamente la eficacia, impulsar la productividad y conducir a una toma de decisiones más inteligente. ¡Es una inversión que vale la pena en más de un sentido!
Cada vez es más común observar a los desarrolladores priorizar la adquisición de habilidades de ingeniería rápidas e incorporar tareas de optimización rápidas en la fase de prueba de la aplicación.
¿Qué es el ajuste fino?
El segundo método para desbloquear todo el potencial de la IA generativa es el ajuste. Permite a las personas aprovechar los modelos de IA previamente entrenados y adaptarlos a dominios específicos, lo que la convierte en una habilidad invaluable para quienes buscan aprovechar la IA de manera efectiva y alinearla con sus requisitos únicos.
En esencia, el ajuste nos permite perfeccionar modelos previamente entrenados como GPT-3.5 o GPT-4 para aplicaciones precisas al someterlos a un conjunto de datos más específico que se alinea estrechamente con la tarea específica en cuestión (es decir, una aplicación centrada en dar opiniones legales basadas en la base de conocimientos existente).
El ajuste fino implica proporcionar al modelo un conjunto de datos que contenga ejemplos etiquetados pertinentes a la tarea específica en cuestión. Mi aprendizaje es que el éxito del ajuste depende de los datos adicionales y la capacitación que implica. Esto incluye proporcionar retroalimentación o calificar las respuestas de la IA y dirigir el sistema con preguntas meticulosamente diseñadas utilizando técnicas de ingeniería rápidas.
Si bien es cierto que el ajuste de la IA generativa conlleva costos adicionales, a menudo es tres veces más rentable a largo plazo en comparación con entrenar un modelo desde cero o invertir muchas horas en optimizar consultas utilizando técnicas de ingeniería rápidas, especialmente cuando se trata de tareas complejas como crear un chatbot en un dominio que requiere un alto conocimiento.
¿Por qué invertir en ajustes?
Como se mencionó anteriormente, el ajuste y la ingeniería rápida representan métodos distintos para aprovechar las capacidades de LLM para abordar tareas específicas. Ciertas tareas pueden requerir ajustes para lograr resultados óptimos, mientras que otras pueden abordarse de manera efectiva únicamente mediante una ingeniería rápida. Esto suele generar las siguientes preguntas: ¿Por qué y cuándo deberíamos considerar invertir en ajustes?
Ambos métodos mencionados poseen sus respectivas ventajas e inconvenientes; Realmente depende del caso de uso particular y de los recursos disponibles. Según los conocimientos adquiridos en los proyectos en los que ha participado mi equipo, a continuación se presentan algunas conclusiones clave:
• Depender únicamente de ingeniería rápida puede ser un desafío cuando se busca lograr alta precisión y calidad, ya que los LLM aún pueden generar resultados irrelevantes o erróneos. El ajuste fino se vuelve invaluable para mejorar la precisión y la calidad de los resultados del modelo. También mitiga el riesgo de generar respuestas irrelevantes o contradictorias que se traduzcan en la satisfacción del cliente.
• La elaboración de indicaciones efectivas a través de la ingeniería de indicaciones puede ser un proceso laborioso y que requiere mucho tiempo, y a menudo requiere pruebas, errores y experimentación exhaustivas para descubrir la indicación óptima. Además, las indicaciones extendidas pueden introducir latencia y disminuir la eficiencia del modelo.
• El ajuste fino reduce la dependencia del diseño rápido, mejorando la solidez y la coherencia del modelo en diferentes formatos y estilos de entrada. También amplía las capacidades del modelo, permitiéndole realizar tareas más allá de las admitidas por el modelo original previamente entrenado.
Por estas razones, recomiendo invertir en ajustes en cualquier organización que busque aprovechar el poder de la IA de manera efectiva en casos de uso destinados a seguir siendo competitivos. Sin duda, el ajuste reduce los altos costos asociados con el entrenamiento de modelos desde cero, lo que hace que la adopción de la IA sea más viable financieramente.
En conclusión, el ajuste en el ámbito de la IA generativa constituye una fuerza transformadora tanto para las empresas como para los desarrolladores. Facilita la utilización eficaz de modelos avanzados de IA previamente entrenados en un espectro diverso de aplicaciones. Su eficiencia, rentabilidad y capacidad para aprovechar el conocimiento preexistente la convierten en un activo indispensable dentro del panorama contemporáneo de la IA. Para seguir siendo competitivo e impulsar la innovación, invertir en ajustes no es sólo una opción sino una necesidad.
*Con información de Forbes US