Por qué a las aplicaciones con tecnología de GPT les faltan circuitos de retroalimentación

1.jpg

El auge de las aplicaciones de "capa" construidas sobre modelos generativos de IA ha permitido a las empresas ofrecer experiencias más atractivas y personalizadas a sus usuarios, pero sin recopilar comentarios de los usuarios sobre los resultados de su sistema, están perdiendo oportunidades valiosas para mejorar sus ofertas. En este artículo, exploraremos las realidades de por qué incluir bucles de retroalimentación es esencial para cualquiera que construya algo sobre un modelo de IA de terceros.

Los bucles de retroalimentación son un componente crítico del entrenamiento de modelos de IA

Recientemente, ha habido una ola de aplicaciones que están creando sus productos y funciones como una "capa" sobre modelos de IA de terceros como ChatGPT, Midsommar y otros. Esta tendencia ha permitido a las empresas ofrecer experiencias más atractivas y personalizadas a sus usuarios sin tener que construir sus propios modelos. La flexibilidad y adaptabilidad de los modelos de IA generativa como ChatGPT lo convierten en una herramienta poderosa para una amplia gama de aplicaciones. Estas aplicaciones de "capa" normalmente actúan como el "front-end" con el que interactúa el usuario, complementando y aumentando las solicitudes de los usuarios con experiencia en la materia o contexto con el aviso. Luego, la aplicación envía un aviso al modelo de IA de terceros y el modelo genera una respuesta basada en su modelo de lenguaje. Esta respuesta luego se envía de regreso a la aplicación, que puede procesarla o mostrarla al usuario. Sin embargo, debido a que estas aplicaciones no Train directamente al modelo, la gran mayoría de ellas no incluyen ningún tipo de ciclo de retroalimentación. Esto significa que están perdiendo oportunidades valiosas para mejorar sus ofertas y pueden perderlas por completo si su sistema produce respuestas inseguras o no ideales para sus usuarios.

2.jpg

Bucles de retroalimentación en la práctica

Afortunadamente, no todos han abandonado el circuito de retroalimentación. ChatGPT en sí utiliza un ciclo de retroalimentación para mejorar su modelo de lenguaje mediante el análisis de las entradas y respuestas de los usuarios. Cada vez que un usuario interactúa con el circuito de retroalimentación, la entrada y la respuesta del usuario se registran y se utilizan para refinar el modelo. Esto puede parecer interacciones explícitas, como hacer clic en los íconos de "pulgar hacia arriba" o "pulgar hacia abajo" junto a la salida de ChatGPT, o incluso algo menos explícito, como si el usuario copió o no la salida, la regeneró, reescribió el mensaje y más. Este circuito de retroalimentación permite que ChatGPT aprenda de sus errores y mejore la precisión y la calidad de sus respuestas con el tiempo. Al analizar continuamente las interacciones de los usuarios, ChatGPT puede adaptarse a nuevos datos y mejorar su rendimiento, lo que da como resultado una mejor experiencia de usuario y una mayor participación.

3.jpg

Si bien ChatGPT es un gran ejemplo de una IA que incorpora los comentarios de los usuarios en su modelo de lenguaje, la gran mayoría de estas nuevas aplicaciones de "capa" creadas sobre IA de terceros como ChatGPT no tienen ningún ciclo de retroalimentación o mecanismo de retroalimentación. Esta es una tendencia preocupante porque significa que los usuarios no pueden proporcionar comentarios valiosos para mejorar la precisión, la eficiencia y la facilidad de uso de estas aplicaciones. Sin bucles de retroalimentación, no solo están perdiendo oportunidades valiosas para mejorar sus ofertas, sino que también pueden perderlas por completo si su sistema produce resultados falsos, destructivos o incluso peligrosos para sus usuarios.

Los bucles de retroalimentación no son solo para entrenar modelos de IA, también son para entrenar sistemas de IA además de terceros.

Incluso si los comentarios que se recopilan nunca regresan a OpenAI para mejorar el modelo ChatGPT subyacente, aún se pueden utilizar de muchas maneras. Uno de los ejemplos más sencillos de cómo un circuito de retroalimentación puede mejorar el sistema es el ajuste rápido. Si bien una frase de 5 a 10 palabras puede ser excelente para encontrar un enlace o una respuesta en Google, las indicaciones de ChatGPT suelen tener muchas oraciones, elaboradas a través de prueba y error, para producir el tipo de salida que el creador está buscando. Con comentarios cualitativos y cuantitativos de los usuarios en el otro extremo de esos resultados, estas aplicaciones de "capa" pueden cambiar gradualmente, o incluso AB probar las indicaciones que generan estos resultados, para abordar los comentarios que dejan sus clientes.

Las pruebas AB rápidas, impulsadas por bucles de retroalimentación, están llegando a las aplicaciones de "capa" más avanzadas

Se trata de madurez, no solo de mejora

Tener un circuito de retroalimentación en una aplicación de IA no solo es bueno para mejorar el producto, también es una señal de un producto maduro, porque significa que la organización que lo administra ha hecho su debida diligencia para salvaguardar el producto y se preocupa por mejorar. él. Un circuito de retroalimentación demuestra que la organización está comprometida con la mejora continua de su sistema de IA, en función de los aportes y la retroalimentación de sus usuarios. También muestra que la organización está dispuesta a escuchar a sus usuarios y tomar en serio sus necesidades e inquietudes. Al implementar un circuito de retroalimentación, las organizaciones pueden generar confianza con sus usuarios y demostrar que están comprometidas con la entrega de un producto de alta calidad que satisfaga sus necesidades. En general, un circuito de retroalimentación es un componente esencial de cualquier sistema de IA y es necesario para garantizar que los resultados del sistema sean precisos, valiosos y fáciles de usar. Y si bien se puede incorporar un circuito de retroalimentación en cualquier producto para que estas aplicaciones se conviertan en productos maduros que adoptarán las empresas, y no solo las personas, este tipo de garantías y compromisos de mejora son esenciales.

Un ciclo de retroalimentación es un indicador de un producto de IA maduro

Los bucles de retroalimentación son un componente crítico de cualquier sistema de IA, incluidos los que se construyen sobre modelos de terceros. Al recopilar y analizar los comentarios de los usuarios, las organizaciones pueden mejorar continuamente la calidad y la precisión de sus sistemas, lo que da como resultado una mejor experiencia del usuario y una mayor participación. A medida que seguimos aprovechando el poder de las IA generativas y integrándolas en nuestra vida diaria, es más importante que nunca priorizar la inclusión de circuitos de retroalimentación y garantizar que estos sistemas mejoren y se adapten continuamente para satisfacer las necesidades de sus usuarios.

Artículos relacionados

Ver más >>

¡Desbloquea el poder de la IA con HIX.AI!