Por qué un mal modelo de lenguaje grande es peor que no tener uno

(dam_point/Shutterstock)

Las compañías están adoptando rápidamente modelos de lenguaje grande (LLM) en sus pilas tecnológicas debido a la popularidad de la inteligencia artificial generativa como ChatGPT y Bard. El ahorro de horas de trabajo gracias al uso de aplicaciones de IA generativa ha llevado a muchos a querer aplicar LLM a sus datos y descubrir qué tesoros pueden encontrar.

A pesar del entusiasmo reciente por la IA, que marca un cambio bienvenido desde las narrativas apocalípticas del pasado, los líderes empresariales deben abordar esta tecnología con cautela y optimismo. En la prisa por adquirir e implementar servicios y herramientas de LLM, las compañías podrían pasar por alto el valor empresarial de esta tecnología y los riesgos potenciales, sobre todo en lo que respecta a su uso en el análisis de datos.

Los LLM no son una solución mágica

Los LLM son un tipo de inteligencia artificial generativa que emplea técnicas de aprendizaje profundo y grandes conjuntos de datos para comprender, resumir y generar contenido basado en texto. A pesar de que esta tecnología puede parecer sorprendente en ocasiones (por las cosas que puede lograr), en realidad el algoritmo ha sido entrenado para predecir la respuesta de texto más coherente basándose en la ingente cantidad de contenido en la que ha sido instruido. Esta respuesta puede resultar útil, pero también conlleva diversos riesgos.


(Ole.CNX/Shutterstock)

La inteligencia artificial generativa ha sido alabada por ofrecer respuestas instantáneas a consultas, recuperar información y crear narrativas creativas, ¡y a veces lo logra! Sin embargo, cada resultado generado por la IA requiere una exhaustiva verificación de los datos antes de ser utilizado en estrategias u operaciones comerciales.

Además, los LLM suelen ser entrenados con conjuntos de datos recopilados de internet y otras fuentes abiertas. La gran cantidad de contenido proveniente de diversos contribuyentes dificulta la tarea de filtrar información inexacta, sesgada u obsoleta. Como resultado, algunas IA generativas pueden generar más ficción que realidad (lo cual puede ser aceptable para ciertos usos). Dadas las limitaciones de recursos en las empresas y la presión por la productividad, los LLM pueden y deben emplearse para agilizar las tareas adecuadas.

No obstante, no se recomienda automatizar por completo tareas con LLM, ya que esto plantea cuatro preocupaciones significativas:

1. Interpretación de las consultas y mensajes

Para que un LLM genere un resultado útil, debe entender la consulta del usuario o el mensaje de la manera prevista. Debido a los matices del lenguaje, pueden surgir malentendidos y aún no existe una solución infalible que garantice resultados consistentes y precisos que cumplan con las expectativas.

2. Generación de datos ficticios


(Arte Logvin/Shutterstock)

Se ha observado que los LLM, como ChatGPT, inventan datos para llenar vacíos en su conocimiento y ofrecer respuestas aparentemente correctas, aunque no lo sean. Están diseñados para producir respuestas que parezcan acertadas, sin garantizar su veracidad. Si se trabaja con proveedores que ofrecen LLM en sus productos o como herramientas independientes, es crucial indagar sobre la formación de sus LLM y las medidas que implementan para reducir resultados inexactos.

3. Seguridad y privacidad

La mayoría de los LLM disponibles en el mercado están accesibles públicamente en línea, lo que dificulta enormemente proteger información confidencial o consultas. Es altamente probable que estos datos sean visibles para el proveedor, quien probablemente los almacenará y usará para entrenar futuras versiones de su producto. En caso de una brecha de seguridad o robo de datos, la organización enfrentará serios problemas. En última instancia, el uso de LLM implica riesgos, dado que aún no existen estándares universales para su empleo seguro y ético.

4. Confianza y credibilidad

A menudo, al automatizar tareas con IA, como la creación de agendas o redacción de contenido, resulta evidente para el usuario final que se ha utilizado un LLM en lugar de un humano. En algunos casos, esta operación es aceptable en función del tiempo ahorrado. Sin embargo, en ocasiones, el contenido generado por LLM alerta a los usuarios y afecta negativamente su experiencia.

A pesar de que los LLM continúan siendo una tecnología en desarrollo, muchos productos impulsados por IA tienen un enorme potencial para ampliar e intensificar la investigación.De datos cuando son guiados por científicos de datos.

Explorar datos de manera más inteligente

Actualmente, estamos observando cómo la inteligencia artificial es altamente efectiva para analizar volúmenes masivos de datos, extraer significado y crear una nueva manera de interpretar esa información. La exploración inteligente implica la utilización de IA en conjunto con representaciones visuales multidimensionales para llevar a cabo una exploración enriquecida de conjuntos de datos extensos y complejos.

Las compañías emplean la inteligencia artificial para potenciar la exploración inteligente, permitiendo a los usuarios investigar y comprender los datos de manera efectiva. Estas tecnologías de IA utilizan lenguaje natural y elementos visuales para narrar la historia completa que se encuentra dentro de los datos, generando conocimientos significativos. Esto agiliza el proceso de análisis para que los analistas puedan focalizarse en aspectos de la narrativa que podrían no ser evidentes en los datos, aportando aún más valor a sus organizaciones.

Aprovechar la inteligencia artificial para el análisis de datos brinda a las empresas la capacidad de examinar sus datos de forma imparcial y creativa. Aunque la IA generativa aún tiene un largo camino por recorrer antes de llegar a su plena madurez, esto no impide que comencemos a utilizarla para explorar nuestros datos con la orientación adecuada.

El futuro se presenta prometedor, al igual que el presente

A pesar de las limitaciones actuales de los LLM, hay un potencial enorme para que esta tecnología beneficie el ámbito del análisis de datos mucho antes de lo que se cree.

Existen numerosas organizaciones que disponen de grandes cantidades de datos que no logran comprender por diferentes motivos. La exploración inteligente guiada por IA les ayuda a encontrar valor en sus datos y a tomar decisiones estratégicas. Al combinar XAI, IA generativa y visualizaciones enriquecidas, los usuarios logran comprender conjuntos de datos complejos y adquirir información que puede potenciar sus negocios.

El horizonte de la inteligencia artificial luce prometedor, pero hay mucho que ganar al utilizarla para mejorar las actividades de análisis de datos en la actualidad. A medida que las empresas continúan evaluando y perfeccionando la IA generativa para potenciar el análisis de datos, existen numerosas funcionalidades que la IA ya puede ofrecer para ayudar a los equipos a obtener un mayor beneficio de sus datos, siempre y cuando aprovechen esta oportunidad con las herramientas adecuadas.

Acerca de los autores: Aakash Indurkhya se graduó de Caltech con especialización en Aprendizaje automático e ingeniería de sistemas. Durante su estadía en Caltech, fundó e impartió un curso sobre marcos de big data y contribuyó a la investigación en curso en teoría computacional en Caltech y ciencia computacional en la Universidad de Duke. En Virtualitics, Aakash supervisa el desarrollo de herramientas y soluciones de IA para clientes y productos de Virtualitics, y posee varias patentes por las innovadoras capacidades de la Plataforma de IA de Virtualitics.

Sarthak Sahu se graduó de Caltech y lidera un equipo de científicos de datos, ingenieros de aprendizaje automático y desarrolladores de plataformas de inteligencia artificial que trabajan en la creación de productos empresariales de inteligencia artificial y en la resolución de problemas desafiantes de aprendizaje automático y análisis de datos para nuestros clientes. Como primer empleado de ML en una startup de IA de rápido crecimiento, cuenta con años de experiencia multifuncional como colaborador individual y gerente de productos técnicos y de ingeniería. Sus áreas de investigación incluyen IA generativa, IA explicada (XAI), análisis de gráficos de red, procesamiento del lenguaje natural (NLP) y visión por computadora (CV).

Artículos relacionados:

Los LLM son más que IA generativa

ChatGPT: 5 cambios que me gustaría ver en un futuro próximo

Una mirada al futuro de la Cumbre de Análisis y Datos de Gartner

¿Nos apoyarás hoy?

Creemos que todos merecen entender el mundo en el que viven. Este conocimiento ayuda a crear mejores ciudadanos, vecinos, amigos y custodios de nuestro planeta. Producir periodismo explicativo y profundamente investigado requiere recursos. Puedes apoyar esta misión haciendo una donación económica a Gelipsis hoy. ¿Te sumarás a nosotros?

Suscríbete para recibir nuestro boletín:

Recent Articles

Related Stories

DEJA UN COMENTARIO

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí