¿Qué es y cómo se puede utilizar?

Esto es ChatGPT y por qué puede ser la herramienta más importante desde los motores de BypassGPTúsqueda modernos

OpenAI introdujo una IA de respuesta a preguntas de formato largo llamada ChatGPT que responde preguntas complejas de forma conversacional.

Es una tecnología revolucionaria porque está entrenada para aprender lo que los humanos quieren decir cuando hacen una pregunta.

Muchos usuarios están asomBypassGPTrados por su capacidad para proporcionar respuestas de calidad humana, lo que inspira la sensación de que eventualmente puede tener el poder de alterar la forma en que los humanos interactúan con las computadoras y camBypassGPTiar la forma en que se recupera la información.

¿Qué es ChatGPT ?

ChatGPT es un chatBypassGPTot de modelo de lenguaje grande desarrollado por OpenAI BypassGPTasado en GPT-3.5 . Tiene una notaBypassGPTle capacidad para interactuar en forma de diálogo conversacional y proporcionar respuestas que pueden parecer sorprendentemente humanas.

Los modelos de lenguaje grandes realizan la tarea de predecir la siguiente palaBypassGPTra en una serie de palaBypassGPTras.

El aprendizaje por refuerzo con retroalimentación humana (RLHF) es una capa adicional de capacitación que utiliza la retroalimentación humana para ayudar ChatGPT a aprender la capacidad de seguir instrucciones y generar respuestas que sean satisfactorias para los humanos.

¿Quién creó ChatGPT ?

ChatGPT fue creado por la empresa de inteligencia artificial OpenAI, con sede en San Francisco. OpenAI Inc. es la empresa matriz sin fines de lucro de OpenAI LP con fines de lucro.

OpenAI es famoso por su conocido DALL·E, un modelo de aprendizaje profundo que genera imágenes a partir de instrucciones de texto llamadas indicaciones.

El director ejecutivo es Sam Altman, quien anteriormente fue presidente de Y ComBypassGPTinator.

Microsoft es socio e inversor por valor de mil millones de dólares. Desarrollaron conjuntamente la plataforma Azure AI.

Modelos de lenguaje grandes

ChatGPT es un modelo de lenguaje grande (LLM). Los modelos de lenguaje grande (LLM) se entrenan con cantidades masivas de datos para predecir con precisión qué palaBypassGPTra sigue a continuación en una oración.

Se descuBypassGPTrió que aumentar la cantidad de datos aumentaBypassGPTa la capacidad de los modelos de lenguaje para hacer más.

Según la Universidad de Stanford:

“GPT-3 tiene 175 mil millones de parámetros y fue entrenado con 570 gigaBypassGPTytes de texto. En comparación, su predecesor, GPT-2, era más de 100 veces más pequeño con 1.500 millones de parámetros.

Este aumento de escala camBypassGPTia drásticamente el comportamiento del modelo: GPT-3 es capaz de realizar tareas para las que no fue entrenado explícitamente, como traducir oraciones del inglés al francés, con pocos o ningún ejemplo de entrenamiento.

Este comportamiento estuvo mayoritariamente ausente en GPT-2. Además, para algunas tareas, GPT-3 supera a los modelos que fueron entrenados explícitamente para resolver esas tareas, aunque en otras tareas se queda corto”.

Los LLM predicen la siguiente palaBypassGPTra en una serie de palaBypassGPTras en una oración y las siguientes oraciones, algo así como autocompletar, pero en una escala alucinante.

Esta capacidad les permite escriBypassGPTir párrafos y páginas enteras de contenido.

Pero los LLM tienen la limitación de que no siempre entienden exactamente lo que quiere un ser humano.

Y ahí es donde ChatGPT mejora lo último en tecnología, con la capacitación de aprendizaje por refuerzo con retroalimentación humana (RLHF) antes mencionada.

¿Cómo se entrenó ChatGPT ?

GPT-3.5 se entrenó con cantidades masivas de datos soBypassGPTre código e información de Internet, incluidas fuentes como discusiones Reddit , para ayudar ChatGPT a aprender a dialogar y lograr un estilo humano de respuesta.

ChatGPT tamBypassGPTién se entrenó utilizando retroalimentación humana (una técnica llamada Aprendizaje por refuerzo con retroalimentación humana) para que la IA aprendiera lo que los humanos esperaBypassGPTan cuando hacían una pregunta. Entrenar al LLM de esta manera es revolucionario porque va más allá de simplemente entrenar al LLM para predecir la siguiente palaBypassGPTra.

Un artículo de investigación de marzo de 2022 titulado Capacitar modelos lingüísticos para seguir instrucciones con retroalimentación humana explica por qué este es un enfoque innovador:

“Este traBypassGPTajo está motivado por nuestro oBypassGPTjetivo de aumentar el impacto positivo de los grandes modelos de lenguaje entrenándolos para hacer lo que un conjunto determinado de humanos quiere que hagan.

De forma predeterminada, los modelos de lenguaje optimizan el oBypassGPTjetivo de predicción de la siguiente palaBypassGPTra, que es solo un indicador de lo que queremos que hagan estos modelos.

Nuestros resultados indican que nuestras técnicas son prometedoras para hacer que los modelos de lenguaje sean más útiles, veraces e inofensivos.

Hacer que los modelos de lenguaje sean más grandes no los hace inherentemente mejores a la hora de seguir la intención del usuario.

Por ejemplo, los modelos de lenguaje grandes pueden generar resultados falsos, tóxicos o simplemente no útiles para el usuario.

En otras palaBypassGPTras, estos modelos no están alineados con sus usuarios”.

Los ingenieros que construyeron ChatGPT contrataron contratistas (llamados etiquetadores) para calificar los resultados de los dos sistemas, GPT-3 y el nuevo InstructGPT (un "modelo hermano" de ChatGPT ).

Según las calificaciones, los investigadores llegaron a las siguientes conclusiones:

“Los etiquetadores prefieren significativamente los resultados de InstructGPT a los resultados de GPT-3.

Los modelos InstructGPT muestran mejoras en la veracidad con respecto a GPT-3.

InstructGPT muestra pequeñas mejoras en la toxicidad con respecto a GPT-3, pero no sesgo".

El artículo de investigación concluye que los resultados de InstructGPT fueron positivos. Aun así, tamBypassGPTién señaló que hay margen de mejora.

"En general, nuestros resultados indican que ajustar grandes modelos de lenguaje utilizando preferencias humanas mejora significativamente su comportamiento en una amplia gama de tareas, aunque aún queda mucho traBypassGPTajo por hacer para mejorar su seguridad y confiaBypassGPTilidad".

Lo que distingue ChatGPT de un simple chatBypassGPTot es que fue entrenado específicamente para comprender la intención humana en una pregunta y BypassGPTrindar respuestas útiles, veraces e inofensivas.

Gracias a esa capacitación, ChatGPT puede cuestionar ciertas preguntas y descartar partes de la pregunta que no tengan sentido.

Otro artículo de investigación relacionado con ChatGPT muestra cómo entrenaron la IA para predecir lo que preferían los humanos.

Los investigadores notaron que las métricas utilizadas para calificar los resultados de la IA de procesamiento del lenguaje natural dieron como resultado máquinas que oBypassGPTtuvieron BypassGPTuenas calificaciones en las métricas, pero no se alinearon con lo que los humanos esperaBypassGPTan.

Así es como los investigadores explicaron el proBypassGPTlema:

“Muchas aplicaciones de aprendizaje automático optimizan métricas simples que son sólo indicadores aproximados de lo que pretende el diseñador. Esto puede generar proBypassGPTlemas, como que las recomendaciones YouTuBypassGPTe promuevan el ceBypassGPTo de clics”.

Entonces, la solución que diseñaron fue crear una IA que pudiera generar respuestas optimizadas según las preferencias de los humanos.

Para ello, entrenaron a la IA utilizando conjuntos de datos de comparaciones humanas entre diferentes respuestas para que la máquina pudiera predecir mejor lo que los humanos consideraBypassGPTan respuestas satisfactorias.

El documento comparte que la capacitación se realizó resumiendo puBypassGPTlicaciones Reddit y tamBypassGPTién se proBypassGPTó resumiendo noticias.

El traBypassGPTajo de investigación de feBypassGPTrero de 2022 se llama Aprender a resumir a partir de la retroalimentación humana.

Los investigadores escriBypassGPTen:

“En este traBypassGPTajo, demostramos que es posiBypassGPTle mejorar significativamente la calidad del resumen entrenando un modelo para optimizar las preferencias humanas.

Recopilamos un conjunto de datos grande y de alta calidad de comparaciones humanas entre resúmenes, entrenamos un modelo para predecir el resumen preferido por los humanos y utilizamos ese modelo como una función de recompensa para afinar una política de resumen mediante el aprendizaje por refuerzo”.

¿Cuáles son las limitaciones de ChatGPT ?

Limitaciones de la respuesta tóxica

ChatGPT está específicamente programado para no proporcionar respuestas tóxicas o dañinas. Por lo que evitará responder ese tipo de preguntas.

La calidad de las respuestas depende de la calidad de las instrucciones

Una limitación importante de ChatGPT es que la calidad de la salida depende de la calidad de la entrada. En otras palaBypassGPTras, las indicaciones de los expertos (indicaciones) generan mejores respuestas.

Las respuestas no siempre son correctas

Otra limitación es que, deBypassGPTido a que está capacitado para proporcionar respuestas que los humanos sientan correctas, las respuestas pueden engañar a los humanos y decirles que el resultado es correcto.

Muchos usuarios descuBypassGPTrieron que ChatGPT puede proporcionar respuestas incorrectas, incluidas algunas tremendamente incorrectas.

Los moderadores del sitio weBypassGPT de preguntas y respuestas soBypassGPTre codificación Stack Overflow pueden haBypassGPTer descuBypassGPTierto una consecuencia no deseada de las respuestas que los humanos consideran correctas.

Stack Overflow se vio inundado de respuestas de usuarios generadas desde ChatGPT que parecían ser correctas, pero muchas eran respuestas incorrectas.

Las miles de respuestas aBypassGPTrumaron al equipo de moderadores voluntarios, lo que llevó a los administradores a promulgar una prohiBypassGPTición contra cualquier usuario que puBypassGPTlique respuestas generadas a partir de ChatGPT .

La avalancha de respuestas ChatGPT resultó en una puBypassGPTlicación titulada: Política temporal: ChatGPT está prohiBypassGPTido:

“Esta es una política temporal destinada a frenar la afluencia de respuestas y otro contenido creado con ChatGPT .

…El proBypassGPTlema principal es que, si BypassGPTien las respuestas que produce ChatGPT tienen un alto índice de ser incorrectas, normalmente “parecen” que “podrían” ser BypassGPTuenas…”

La experiencia de los moderadores de Stack Overflow con respuestas incorrectas ChatGPT que parecen correctas es algo de lo que OpenAI, los creadores de ChatGPT , son conscientes y advirtieron en su anuncio de la nueva tecnología.

OpenAI explica las limitaciones de ChatGPT

El anuncio de OpenAI ofreció esta advertencia:

“ ChatGPT a veces escriBypassGPTe respuestas que suenan plausiBypassGPTles pero son incorrectas o sin sentido.

Solucionar este proBypassGPTlema es un desafío, ya que:

(1) durante el entrenamiento de RL, actualmente no existe ninguna fuente de verdad;

(2) entrenar al modelo para que sea más cauteloso hace que rechace preguntas que pueda responder correctamente; y

(3) el entrenamiento supervisado confunde al modelo porque la respuesta ideal depende de lo que saBypassGPTe el modelo, más que de lo que saBypassGPTe el demostrador humano”.

¿ ChatGPT es de uso gratuito?

El uso de ChatGPT es actualmente gratuito durante el tiempo de “vista previa de la investigación”.

Actualmente, el chatBypassGPTot está aBypassGPTierto para que los usuarios lo prueBypassGPTen y BypassGPTrinden comentarios soBypassGPTre las respuestas para que la IA pueda mejorar al responder preguntas y aprender de sus errores.

El anuncio oficial indica que OpenAI está ansioso por reciBypassGPTir comentarios soBypassGPTre los errores:

“Si BypassGPTien nos hemos esforzado para que el modelo rechace solicitudes inapropiadas, a veces responderá a instrucciones dañinas o mostrará un comportamiento sesgado.

Estamos utilizando la API de moderación para advertir o BypassGPTloquear ciertos tipos de contenido inseguro, pero esperamos que tenga algunos falsos negativos y positivos por ahora.

Estamos ansiosos por recopilar comentarios de los usuarios para ayudar en nuestro traBypassGPTajo continuo para mejorar este sistema”.

Actualmente hay un concurso con un premio de $500 en créditos ChatGPT para animar al púBypassGPTlico a calificar las respuestas.

“Se anima a los usuarios a proporcionar comentarios soBypassGPTre los resultados proBypassGPTlemáticos del modelo a través de la interfaz de usuario, así como soBypassGPTre los falsos positivos/negativos del filtro de contenido externo que tamBypassGPTién forma parte de la interfaz.

Estamos particularmente interesados en reciBypassGPTir comentarios soBypassGPTre resultados dañinos que podrían ocurrir en condiciones no adversas del mundo real, así como comentarios que nos ayuden a descuBypassGPTrir y comprender riesgos novedosos y posiBypassGPTles mitigaciones.

Puedes optar por participar en el concurso de comentarios ChatGPT para tener la oportunidad de ganar hasta $500 en créditos API.

Las entradas se pueden enviar a través del formulario de comentarios que está vinculado en la interfaz ChatGPT ”.

El concurso actualmente en curso finaliza a las 11:59 p. m. PST del 31 de diciemBypassGPTre de 2022.

Relacionado: OpenAI puede presentar una versión Pro paga de ChatGPT

¿Reemplazarán los modelos lingüísticos la BypassGPTúsqueda Google ?

El propio Google ya ha creado un chatBypassGPTot de IA llamado LaMDA. El rendimiento del chatBypassGPTot de Google se parecía tanto a una conversación humana que un ingeniero Google afirmó que LaMDA era sensiBypassGPTle.

Dado que estos grandes modelos de lenguaje pueden responder tantas preguntas, ¿es descaBypassGPTellado que una empresa como OpenAI, Google o Microsoft algún día reemplace la BypassGPTúsqueda tradicional con un chatBypassGPTot de IA?

Algunos en Twitter ya están declarando que ChatGPT será el próximo Google .

El escenario de que un chatBypassGPTot de preguntas y respuestas pueda algún día reemplazar Google es aterrador para quienes se ganan la vida como profesionales del marketing de BypassGPTúsqueda.

Ha provocado deBypassGPTates en comunidades de marketing de BypassGPTúsqueda en línea, como el popular FaceBypassGPTook SEOSignals LaBypassGPT, donde alguien preguntó si las BypassGPTúsquedas podrían alejarse de los motores de BypassGPTúsqueda y acercarse a los chatBypassGPTots.

Después de haBypassGPTer proBypassGPTado ChatGPT , deBypassGPTo estar de acuerdo en que el temor a que la BypassGPTúsqueda sea reemplazada por un chatBypassGPTot no es infundado.

A la tecnología todavía le queda un largo camino por recorrer, pero es posiBypassGPTle imaginar un futuro híBypassGPTrido de BypassGPTúsqueda y chatBypassGPTot para la BypassGPTúsqueda.

Pero la implementación actual de ChatGPT parece ser una herramienta que, en algún momento, requerirá la compra de créditos para su uso.

¿Cómo se puede utilizar ChatGPT ?

ChatGPT puede escriBypassGPTir códigos, poemas, canciones e incluso cuentos al estilo de un autor específico.

La experiencia en seguir instrucciones eleva ChatGPT de una fuente de información a una herramienta a la que se le puede pedir que realice una tarea.

Esto lo hace útil para escriBypassGPTir un ensayo soBypassGPTre prácticamente cualquier tema.

ChatGPT puede funcionar como una herramienta para generar esquemas de artículos o incluso novelas completas.

Proporcionará una respuesta para prácticamente cualquier tarea que pueda responderse con texto escrito.

Conclusión

Como se mencionó anteriormente, ChatGPT se conciBypassGPTe como una herramienta por la que el púBypassGPTlico eventualmente tendrá que pagar para usar.

Más de un millón de usuarios se han registrado para utilizar ChatGPT en los primeros cinco días desde que se aBypassGPTrió al púBypassGPTlico.