Copilot es la versión de Microsoft de la IA generativa en la cual la compañía realiza inversiones para mejora la suite de productos que la hizo famosa a nivel mundial. En la actualidad, hay alrededor de una docena de productos de la marca Copilot que potencian diversas funciones del software y los servicios de Microsoft, como los resúmenes en Microsoft Outlook y las transcripciones en Microsoft Teams.
Esto se suma a la herramienta Copilot de GitHub, propiedad de Microsoft, para generar código, y al Copilot que reside en Windows y la web, que sirve como asistente de propósito general.
El nuevo lanzamiento cumplió con las expectativas y aquí se detallan muchos de los Microsoft Copilots disponibles y qué hacen, y las diferencias entre las ediciones premium y gratuita. Entre ellos la nueva forma de generar Agentes de IA que es uno de los nuevos temas de la industria. Se trata de agentes inteligentes que realizan tareas por nosotros y que ahora se pueden programar sin conocimientos de código.
¿Qué es Microsoft Copilot?
Microsoft Copilot, anteriormente conocido como Bing Chat , está integrado en el motor de búsqueda de Microsoft, Bing, así como en Windows 10, Windows 11 y la barra lateral de Microsoft Edge . ( Las PC más nuevas incluso tienen una tecla de teclado dedicada para iniciar Copilot). También hay aplicaciones independientes de Copilot para Android e iOS y una sala de Telegram en la aplicación .
mpulsado por versiones optimizadas de los modelos de OpenAI (OpenAI y Microsoft tienen una estrecha relación de trabajo ), Copilot puede realizar una variedad de tareas descritas en lenguaje natural, como escribir poemas y ensayos, así como traducir textos a otros idiomas y resumir fuentes de la web (aunque de manera imperfecta ).
Copilot, al igual que ChatGPT de OpenAI y Gemini de Google , puede explorar la web (en el caso de Copilot, a través de Bing) para obtener información actualizada. A veces se equivoca , pero para consultas oportunas, el acceso a los resultados de búsqueda puede darle a Copilot una ventaja sobre los bots fuera de línea como Claude de Anthropic .
Copilot puede crear imágenes tocando Image Creator , el generador de imágenes de Microsoft basado en el modelo DALL-E 3 de OpenAI . Y puede generar canciones mediante una integración con Suno , la plataforma de generación de música con inteligencia artificial. Al escribir algo como "Crear una imagen de una cebra" o "Generar una canción con un ritmo de jazz" en Copilot, aparecerá la herramienta correspondiente.
En cuanto a las integraciones, Copilot admite complementos para aplicaciones y sitios web de terceros. Hay complementos para Instacart (para planificación de comidas y preguntas relacionadas con la cocina), Kayak (para planificación de viajes), OpenTable (para reservas en restaurantes) y Shopify, por nombrar algunos ejemplos. Se agregan más de forma regular.
Copilot también gestiona Copilot Pages , un lienzo digital integrable donde los usuarios pueden editar y compartir contenido creado por Copilot. Los clientes que pagan (más información a continuación) obtienen acceso a BizChat , un centro centrado en los negocios que se conecta con Pages para extraer datos de la web (y archivos de trabajo) para ayudar a crear cosas como planes de proyectos, notas de reuniones, propuestas y más.
¿Qué configuraciones de Windows puede controlar Copilot? En Windows 11 ( pero no necesariamente en Windows 10 ), Copilot puede controlar ciertas configuraciones y funciones , actuando como una especie de conserje digital.
Con Copilot, ya sea escribiendo o usando la funcionalidad de reconocimiento de voz de Windows 11, los usuarios pueden realizar acciones en una PC como activar o desactivar el ahorro de batería, mostrar información del dispositivo y del sistema, iniciar subtítulos en vivo, mostrar la dirección IP de la PC y vaciar la papelera de reciclaje.
Un interruptor en la experiencia Copilot en Windows 11 alterna entre el modo "Trabajo" y "Web", y el primero incorpora las capacidades de Microsoft 365 de Copilot en la interfaz de Windows.
La apuesta del Microsft se centra en Copilot Pro que es su producto profesional con un precio de 20 dólares al mes. Los clientes de Copilot Pro obtienen acceso prioritario a los modelos OpenAI más potentes (por ejemplo, o1 ) durante las horas pico. Además, solo se puede acceder a determinadas funciones de Copilot con una suscripción Pro, como imágenes de mayor resolución de Image Creator.
Copilot Pro también brinda a los usuarios acceso a funciones de inteligencia artificial generativa en el conjunto de aplicaciones de productividad de Microsoft 365: Word, Excel, PowerPoint, Outlook y OneNote.
En Word y OneNote, Copilot puede escribir, editar, resumir y generar texto. En Excel y PowerPoint, Copilot puede convertir indicaciones en lenguaje natural en presentaciones y visualizaciones (opcionalmente basadas en datos de archivos y plantillas). Y en Outlook, Copilot puede ayudar a redactar respuestas por correo electrónico con botones para ajustar la extensión o el tono.
Se están incorporando más funciones como parte de la actualización Copilot Wave 2 de Microsoft .
Copilot en PowerPoint pronto incorporará imágenes aprobadas por la empresa desde una biblioteca de SharePoint, mientras que Outlook tendrá una función de "Priorizar mi bandeja de entrada" que resume cada correo electrónico (y brinda información como quién ha respondido mejor). A fines de 2024, los usuarios de Outlook también tendrán la capacidad de "enseñar" a Copilot temas, palabras clave y personas de interés para que esos correos electrónicos siempre se marquen como de alta prioridad.
En Excel, Copilot puede dar formato a los datos, crear gráficos, generar tablas dinámicas y guiar a los usuarios en la creación de nuevas fórmulas y macros. También puede utilizar el lenguaje de programación Python para realizar análisis de datos avanzados: en lenguaje natural, los usuarios pueden describir tareas de previsión, análisis de riesgos y visualización de datos y Copilot traducirá el texto al código Python necesario para realizar estas tareas.
Una versión futura de Copilot en Word le permitirá extraer rápidamente datos de documentos externos de Word, PowerPoint y PDF, así como de correos electrónicos, documentos cifrados y reuniones. Por otra parte, en OneDrive, Copilot resumirá, mostrará métricas y comparará las diferencias entre los archivos.
Debido a la naturaleza compleja y problemática de la tecnología de IA generativa actual, los copilotos de Microsoft tienen sus problemas.
Los modelos cometen errores ocasionales al resumir o responder preguntas debido a su tendencia a alucinar , incluso al resumir reuniones. El Wall Street Journal citó un caso en el que, para uno de los primeros usuarios que utilizaba Copilot para reuniones de Teams, Copilot inventó los asistentes e insinuó que las llamadas trataban sobre temas que en realidad nunca se discutieron.
En cuanto a GitHub Copilot, el propio GitHub advierte que puede producir patrones de codificación inseguros , errores y referencias a API obsoletas o expresiones idiomáticas que reflejen el código imperfecto en sus datos de entrenamiento. El código que sugiere Copilot podría no siempre compilarse o ejecutarse, o incluso no tener sentido.
También preocupan mucho a Copilot las cuestiones de seguridad y privacidad , pero quizá el elefante en la habitación sea la cuestión no resuelta del uso legítimo.
Al igual que la mayoría de los modelos de IA generativa, los modelos que impulsan Copilots de Microsoft se entrenaron con datos públicos, algunos de los cuales están protegidos por derechos de autor o bajo una licencia restrictiva. Microsoft, entre otros, argumenta que la doctrina del uso justo la protege de reclamos por derechos de autor. Pero eso no ha impedido que los propietarios de los datos presenten demandas colectivas contra la empresa , GitHub, OpenAI y muchas más por lo que los propietarios alegan son claras violaciones de licencias y propiedad intelectual.
Microsoft ofrece políticas para proteger a ciertos clientes de batallas judiciales derivadas de impugnaciones por uso legítimo, al menos en circunstancias limitadas. Sin embargo, eso no resuelve el dilema ético de entrenar modelos con datos sin permiso, que puede ser más de lo que algunos clientes pueden aceptar.