IA: Esto es lo que hay que saber sobre el lanzamiento de Llama3 por parte de Meta

Mientras ChatGPT, Anthropic, Mistral, Google, AWS, 01.ai y otros actores del LLM generan titulares publicando modelos nuevos y más capaces, haciéndose obsoletos unos a otros de la noche a la mañana en ciertos puntos de referencia, muchos cuestionaron la estrategia de Meta en IA.

Sus fuertes inversiones en investigación fundamental, dirigidas por uno de los "padres del aprendizaje profundo", el Dr. Yann LeCun, y su enfoque de código abierto desconcertaron a muchos analistas del sector. ¿Cómo iba a hacer dinero la empresa? ¿Por qué permite que tantos competidores tomen Llama, construyan sobre ella y superen a la propia Llama en las pruebas comparativas?

La semana pasada, Meta respondió definitivamente a muchas de estas preguntas y anunció una gama de modelos Llama 3 muy capaces que dejan en la cuneta a los puntos de referencia de la competencia. Estos modelos también son de código abierto, así que si querés construir sobre ellos y crear una aplicación dentro de su organización, desde luego que podés. Pero, por primera vez, Meta hizo algo más: publicó sistemas basados en Llama para los consumidores a través de sus numerosos canales.

Pensalo. Mientras que cientos de millones de personas entraron en ChatGPT, Bing de Microsoft e incluso Grok de xAI, Meta tiene miles de millones de usuarios en WhatsApp, Instagram y Facebook Messenger. Se trata de mensajeros que pueden soportar perfectamente la IA conversacional. Y el asistente de IA Meta parece ser asombroso.

Como explicó la empresa al anunciarlo: "Podés utilizar Meta AI en Facebook, Instagram, WhatsApp y Messenger para hacer cosas, aprender, crear y conectar con las cosas que le importan". Sólo tenés que llamar a @Meta AI en el chat y empezar a conversar. También está disponible a través de la página web de Meta.AI y puede generar texto e imágenes.

Meta, Llama 3, Mark Zuckerberg — La semana pasada, Meta respondió definitivamente a muchas de estas preguntas y anunció una gama de modelos Llama 3 muy capaces que dejan en la cuneta a los puntos de referencia de la competencia.

Hacer que las herramientas de Llama, muy capaces, sean gratuitas en sus plataformas probablemente desmonetizará la mayoría de las ofertas de otros proveedores de LLM. Y puesto que la mayoría de las otras herramientas se basan en modelos que no son de código abierto, el nivel de confianza del público hacia las herramientas de Meta debería ser significativamente mayor. El enfoque de código abierto es estratégico y ayuda a toda la industria a crecer con un propósito claro: generar confianza y lograr la validación a escala mundial de los modelos internos de Meta para evitar los numerosos fiascos experimentados por Google y otros en el pasado.

Actualmente, Meta Llama 3 supera a otros modelos publicados en la mayoría de los puntos de referencia. Esto podría muy bien ser el ocaso de la era de las startups sobrevaloradas que desarrollan sus propios LLM y el amanecer de una nueva era en la que todos los LLM orientados al consumidor pertenezcan sólo a unos pocos actores prominentes, al igual que vimos con la búsqueda. Y Meta será el jugador dominante en este juego.

Me puse en contacto con Yann LeCun para pedirle un comentario, y no estuvo de acuerdo. "Todo lo contrario: los modelos de código abierto de alto rendimiento abren la puerta a una gran variedad de jugadores que pueden ajustar esos modelos a lenguas, culturas, sistemas de valores, inclinaciones políticas y centros de interés particulares".

Espero que tenga razón y que Meta siga abriendo sus potentes modelos de código abierto para que la comunidad prospere.

El rey murió, ¡viva el rey!

Llama 3 gusta en la mayoría de los puntos de referencia. Como informaron sus desarrolladores en X, supera a todos los demás modelos de código abierto y es probable que supere a la mayoría de los modelos superiores en muchos puntos de referencia.

Ahmad Al-Dhale, vicepresidente de genAI en Meta, compartió los puntos que comparan los principales modelos de código abierto.

It's here! Meet Llama 3, our latest generation of models that is setting a new standard for state-of-the art performance and efficiency for openly available LLMs.

Key highlights

• 8B and 70B parameter openly available pre-trained and fine-tuned models.
• Trained on more… pic.twitter.com/iaOBYaOli5
— Ahmad Al-Dahle (@Ahmad_Al_Dahle) April 18, 2024

El Dr. Ashton Zhang, científico investigador de Meta que trabaja en Llama y autor de Dive into Deep Learning, un libro de código abierto sobre IA, tuiteó los datos de las pruebas comparativas con comentarios.

Llama 3 has been my focus since joining the Llama team last summer. Together, we've been tackling challenges across pre-training and human data, pre-training scaling, long context, post-training, and evaluations. It's been a rigorous yet thrilling journey:

🔹Our largest models… pic.twitter.com/aRH4iNZY4B
— Aston Zhang (@astonzhangAZ) April 18, 2024

El modelo 70B puede ejecutarse en tu laptop. Podés ejecutar Llama 3:Instruct en tu MacBook Pro con chip M1 (mi configuración). Acá podés ver lo fácil que es con Open-WebUI.

Run Llama 3 Locally with Open-WebUI

This video is NOT sped up. The model downloaded from @ollama (llama3:instruct), running with @OpenWebUI, on a Macbook Pro M1 Max 64G.

You can run it right now on your own machine (Windows, Linux, Mac) with 1 click. https://t.co/sDpI4TEiwa pic.twitter.com/qe5PIv3hQm
— cocktail peanut (@cocktailpeanut) April 18, 2024

Entonces, ¿en qué deberían centrarse las startups de IA?

Yo les aconsejaría que utilizaran los LLM más potentes de los grandes actores y que se centraran en modelos de IA en los que Meta, Microsoft, Amazon y Google tienen poca o ninguna experiencia y en los que la validación del resultado del modelo requiere una importante experiencia en el dominio y experimentación.

Por ejemplo, en Insilico Medicine, desarrollamos múltiples LLM multimodales multiómicos para química y biología, incluida la serie PreciousGPT para la investigación del envejecimiento. Es prácticamente imposible generar los datos y validar estos modelos a escala sin un laboratorio experimental de alto rendimiento totalmente automatizado y una experiencia significativa en estos dominios especializados. Los transformadores entrenados en texto e imágenes no son capaces de resolver estas tareas específicas de dominio, pero sí de ayudar a planificar, ejecutar y analizar el trabajo de los modelos específicos de dominio entrenados en tipos de datos de biología y química.

*Con información de Forbes US

IA: Esto es lo que hay que saber sobre el lanzamiento de Llama3 por parte de Meta

Meta publicó su LLM de código abierto más capaz, Acá está lo que necesitás saber.

El rey murió, ¡viva el rey!

Entonces, ¿en qué deberían centrarse las startups de IA?

Tags

De deportista en Alemania a emprendedora tech: la startup de una argentina de 24 años que quiere revolucionar el entrenamiento

Quién es Robert Citrone, el poderoso inversor que llegó a la Argentina desde EE.UU. y elogia a Javier Milei

Las hermanas que lanzaron mochilas y bolsos a partir de residuos plásticos y confían en revolucionar el rubro de accesorios

Fin al crawling peg: Caputo celebró la renovación del swap chino y admitió una etapa de "transición" del régimen cambiario

"El CEO que ignora la ciberseguridad es un riesgo para su organización"

Más noticias

Taylor Swift, Elon Musk y Trump: Quiénes son las celebridades más atacadas por deepfakes

Cómo es Proyecto Mulberry, la iniciativa de Apple para repensar la IA y la atención médica

El ancla de los US$ 20: cómo este precio arbitrario está frenando la evolución de la IA

La inteligencia artificial gana terreno en temas de salud, sobre todo entre jóvenes sin cobertura médica

El ex PedidosYa que fundó una startup de IA para escalar empresas con "trabajadores digitales"

Tiene solo 22 años y acaba de lanzar una startup que usa IA para prevenir ataques a criptomonedas

En era de aranceles, ¿cuánto saldría el iPhone si se fabricara en EE.UU.?

Fitit, la startup uruguaya que encuentra la talla ideal de indumentaria con IA, desembarcó en España