�ChatGPT no es bueno en matem�ticas? El hallazgo de Apple y la advertencia al usuario

Un estudio reciente pone en duda la precisi�n de ciertas herramientas tecnol�gicas impulsadas por inteligencia artificial.

Ron Shevlin

Las conclusiones de un nuevo estudio de Apple podr�an hacer que los consumidores reconsideren el uso de ChatGPT y otras herramientas de IA generativa para obtener asesoramiento financiero. Adem�s, deber�an moderar los planes de los ejecutivos de bancos y cooperativas de cr�dito que buscan usar la inteligencia artificial para ofrecer orientaci�n financiera a los consumidores.

Los estadounidenses utilizan la IA generativa para recibir asesoramiento financiero

Una encuesta realizada por Motley Fool revel� estad�sticas sorprendentes y, francamente, dif�ciles de creer sobre el uso que los estadounidenses hacen de la herramienta de ChatGPT para obtener recomendaciones financieras. El estudio encontr� que:

El 54% de los estadounidenses utiliz� ChatGPT para recibir recomendaciones financieras. Seis de cada diez integrantes de la Generaci�n Z y Millennials, la mitad de los integrantes de la Generaci�n X, y un tercio de los Baby Boomers recibieron recomendaciones sobre al menos uno de los ocho productos financieros evaluados. Las tarjetas de cr�dito y las cuentas corrientes, mencionadas por el 26% y el 23% de los encuestados respectivamente, fueron los productos m�s consultados.
La mitad de los consumidores dijo que usar�a ChatGPT para obtener una recomendaci�n. Dicho esto, pocos expresaron inter�s en recibir recomendaciones para la mayor�a de los productos. Por ejemplo, solo el 25% indic� que querr�a una recomendaci�n para una tarjeta de cr�dito, y los porcentajes disminuyen para otros productos.
Los encuestados se mostraron "algo satisfechos" con las recomendaciones de ChatGPT. En una escala de 5 puntos (1 = no satisfecho, 5 = muy satisfecho), la calificaci�n promedio de satisfacci�n fue de 3,7, variando desde 3,6 entre los integrantes de la Generaci�n Z y Baby Boomers, hasta 3,8 entre los Millennials y 3,9 en la Generaci�n X.

Seg�n el estudio, los factores m�s importantes que determinaron el uso de esta herramienta por parte de los consumidores para encontrar productos financieros fueron: el rendimiento y la precisi�n de las recomendaciones, la capacidad de entender la l�gica detr�s de dichas recomendaciones, y la posibilidad de verificar la informaci�n en la que se basan.

Un nuevo estudio de Apple podr�an hacer que los consumidores reconsideren el uso de ChatGPT y otras herramientas de IA generativa para obtener asesoramiento financiero.

La IA generativa no destaca en razonamiento matem�tico

Las herramientas de IA generativa pueden hacer muchas cosas asombrosas, pero, como demostr� un nuevo informe de investigadores de Apple, los modelos de lenguaje de gran tama�o (LLM) tienen limitaciones preocupantes en cuanto al "razonamiento matem�tico".�

Los investigadores de Apple concluyeron: "Los LLM actuales no son capaces de realizar un razonamiento l�gico genuino; en su lugar, intentan replicar los pasos de razonamiento observados en sus datos de entrenamiento. Cuando agregamos una sola cl�usula que parece relevante para la pregunta, observamos ca�das significativas en el rendimiento de todos los modelos. Esto sugiere problemas m�s profundos en sus procesos de razonamiento que no pueden mitigarse f�cilmente con el aprendizaje de pocos ejemplos o ajustes finos".

Un art�culo reciente de TechCrunch document� algunos c�lculos matem�ticos aparentemente simples que los LLM no lograron resolver correctamente. Seg�n el art�culo, "Claude no puede resolver problemas b�sicos de palabras, Gemini no entiende ecuaciones cuadr�ticas, y Llama tiene dificultades con sumas simples".

�Por qu� los LLM no pueden realizar c�lculos b�sicos? El problema, seg�n TechCrunch, radica en la tokenizaci�n: el proceso de dividir los datos en partes m�s peque�as. Sin embargo, los tokenizadores no comprenden los n�meros como tales, lo que a menudo destruye las relaciones entre los d�gitos.

Los modelos de lenguaje de gran tama�o (LLM) tienen limitaciones preocupantes en cuanto al "razonamiento matem�tico".�

El aprendizaje autom�tico tambi�n tiene problemas

Molestamente, muchas personas usan el t�rmino "aprendizaje autom�tico" cuando se refieren al an�lisis de regresi�n u otras formas de an�lisis estad�stico. Seg�n la Universidad de California en Berkeley, el aprendizaje autom�tico tiene tres componentes:

Un proceso de decisi�n: en general, los algoritmos de aprendizaje autom�tico se utilizan para hacer una predicci�n o clasificaci�n. Basado en algunos datos de entrada, que pueden estar etiquetados o no, el algoritmo producir� una estimaci�n sobre un patr�n en los datos.
Una funci�n de error: eval�a la predicci�n del modelo. Si hay ejemplos conocidos, una funci�n de error puede hacer una comparaci�n para evaluar la precisi�n del modelo.
Un proceso de optimizaci�n del modelo: si el modelo puede ajustarse mejor a los puntos de datos del conjunto de entrenamiento, entonces se ajustan los pesos para reducir la discrepancia entre el ejemplo conocido y la estimaci�n del modelo. El algoritmo repetir� este proceso iterativo de "evaluar y optimizar", actualizando los pesos de manera aut�noma hasta que se alcance un umbral de precisi�n.

El an�lisis de regresi�n y la mayor�a de las otras formas de an�lisis estad�stico carecen de un proceso de optimizaci�n del modelo.

El problema en el mundo real

Mientras que los resultados de "inversi�n" generalmente son rastreables, los resultados de "gastos" no lo son. Sin embargo, para la gran mayor�a de las personas, la forma en que gastan es un mayor determinante de su desempe�o financiero que la inversi�n. El otro desaf�o es que no gastamos simplemente para optimizar nuestro rendimiento financiero. Gastamos para optimizar nuestro rendimiento emocional. �C�mo va un modelo de aprendizaje autom�tico a rastrear eso?

La IA no est� lista para ofrecer asesoramiento financiero

Proporcionar asesoramiento financiero no es una tarea sencilla: las instrucciones necesarias para hacerlo implican muchas cl�usulas. En otras palabras, los objetivos para establecer un buen asesoramiento financiero no son simples ni directos y son precisamente estas preguntas complejas las que las herramientas de IA generativa no pueden abordar de manera adecuada (seg�n Apple).

Conclusi�n

Los bancos y cooperativas de cr�dito no deber�an depender de la IA para brindar asesoramiento financiero, al menos, no por ahora. Tal vez en cinco o diez a�os, pero no en este momento. Si los proveedores aseguran utilizar aprendizaje autom�tico, preg�ntales sobre su proceso de optimizaci�n de modelos. Si afirman tener un modelo de lenguaje grande, preg�ntales c�mo superan las limitaciones en c�lculos matem�ticos.

*Con informaci�n de Forbes US.