Guía de Agentes Personalizados (NLPUs)

En el contexto de Chispa AI, una Unidad de Procesamiento de Lenguaje Natural (NLPU) representa un componente esencial y altamente especializado dedicado a la comprensión avanzada del lenguaje natural en el contexto dominicano. Estas unidades están diseñadas para interpretar, analizar y generar texto de manera inteligente y contextualmente relevante para los usuarios dominicanos.

Como unidad fundamental de ChispaChat, agregar e iterar en agentes es crucial. Ahora puedes agregar agentes a tu lista de favoritos de dos maneras:

`A`) Agregar a través del Mercado de Agentes

Si eres nuevo en la redacción de indicaciones, es posible que desees explorar el Mercado de Agentes en ChispaChat. Aquí, puedes encontrar agentes comúnmente utilizados presentados por otros y agregarlos a tu lista con un solo clic, lo que resulta muy conveniente.

`B`) Crear un Agente Personalizado

Cuando necesites manejar tareas específicas, querrás considerar la creación de un agente personalizado para ayudarte a resolver el problema. Puedes agregar y configurar el agente en detalle siguiendo los siguientes pasos:

[!NOTA]

Consejo rápido de configuración: Puedes modificar fácilmente la indicación utilizando el botón de edición rápida en la barra lateral.

Continúa leyendo para entender las técnicas de redacción y los ajustes comunes de los parámetros del modelo para las indicaciones.

Conceptos Básicos de las Indicaciones

La IA generativa es muy útil, pero requiere la orientación humana. En la mayoría de los casos, la IA generativa es como un interno capaz que necesita instrucciones claras para desempeñarse bien. Poder guiar correctamente a la IA generativa es una habilidad poderosa. Puedes guiar a la IA generativa enviando una indicación, que suele ser una instrucción de texto. La indicación es la entrada que proporcionas al agente y influirá en la salida. Una buena indicación debe ser estructurada, clara, concisa y directiva.

Cómo redactar una indicación estructurada

[!CONSEJO]

Una indicación estructurada se refiere a la construcción de la indicación con lógica y estructura clara. Por ejemplo, si deseas que el modelo genere un artículo, tu indicación puede necesitar incluir el tema del artículo, su esquema y su estilo.

Veamos un ejemplo básico de una pregunta de discusión:

"¿Cuáles son los problemas ambientales más urgentes que enfrenta nuestro planeta y qué pueden hacer los individuos para ayudar a abordar estos problemas?"

Podemos convertir esto en una indicación simple respondiendo la siguiente pregunta de inmediato.

Responde a la siguiente pregunta:
¿Cuáles son los problemas ambientales más urgentes que enfrenta nuestro planeta y qué pueden hacer los individuos para ayudar a abordar estos problemas?

Dado que los resultados generados por esta indicación son inconsistentes, con algunas respuestas que consisten solo en una o dos oraciones, no es ideal para una respuesta típica de discusión que debería tener varios párrafos. Una buena indicación debe proporcionar instrucciones específicas de formato y contenido. Necesitas eliminar la ambigüedad en el lenguaje para mejorar la consistencia y la calidad. Aquí tienes una mejor indicación:

Escribe un ensayo detallado que incluya una introducción, párrafos principales y una conclusión, respondiendo a la siguiente pregunta:
¿Cuáles son los problemas ambientales más urgentes que enfrenta nuestro planeta y qué pueden hacer los individuos para ayudar a abordar estos problemas?

La segunda indicación genera salidas más largas con una mejor estructura. El uso de la palabra "ensayo" en la indicación es intencional porque el agente puede entender la definición de un ensayo, lo que hace más probable que genere respuestas coherentes y estructuradas.

Cómo mejorar la calidad y efectividad

[!CONSEJO]

Hay varias formas de mejorar la calidad y efectividad de las indicaciones:

Sé lo más claro posible acerca de tus necesidades. El modelo intentará cumplir con tus requisitos, por lo que si tus requisitos no están claros, la salida puede no cumplir con tus expectativas.

Utiliza gramática y ortografía correctas. El modelo intentará imitar tu estilo de lenguaje, por lo que si tu estilo de lenguaje es problemático, la salida también puede ser problemática.

Proporciona suficiente información contextual. El modelo generará resultados en función de la información contextual que proporciones, por lo que si proporcionas información contextual insuficiente, es posible que no pueda generar los resultados deseados.

Después de formular indicaciones efectivas para preguntas de discusión, ahora necesitas refinar los resultados generados. Esto puede implicar ajustar la salida para que se ajuste a restricciones como el recuento de palabras o combinar conceptos de resultados generados diferentes.

Un método de iteración simple es generar múltiples salidas y examinarlas para comprender los conceptos y la estructura utilizados por el agente. Una vez que se han evaluado las salidas, puedes seleccionar las más adecuadas y combinarlas en una respuesta coherente. Otro enfoque iterativo es comenzar gradualmente y luego expandirse paso a paso. Esto requiere más de una indicación: una indicación inicial para escribir uno o dos párrafos, seguida de indicaciones adicionales para ampliar el contenido ya escrito. Aquí tienes una indicación potencial para una discusión filosófica:

"¿Las matemáticas son inventadas o descubiertas? Explica tu respuesta con un razonamiento cuidadoso."

Agrégalo a una indicación simple como esta:

Escribe un párrafo de apertura respondiendo a la siguiente pregunta:
¿Las matemáticas son inventadas o descubiertas? Explica tu respuesta con un razonamiento cuidadoso.

Generé algunas respuestas y encontré una que me gustó:

Filósofos y matemáticos han debatido si las matemáticas son inventadas o descubiertas.
Algunos argumentan que los conceptos y principios de las matemáticas existen independientemente del pensamiento humano, por lo que pueden considerarse descubiertos en lugar de inventados.
Por ejemplo, los conceptos de números, proporciones y formas geométricas

 se observan en el mundo natural y se pueden abstraer y estudiar sistemáticamente.

Es un buen comienzo. Luego utilicé otra indicación para expandir:

Estoy escribiendo un ensayo detallado respondiendo a la siguiente indicación:
¿Las matemáticas son inventadas o descubiertas? Explica tu respuesta con un razonamiento cuidadoso. Aquí es donde estoy hasta ahora: Filósofos y matemáticos han debatido si las matemáticas son inventadas o descubiertas.
Algunos argumentan que los conceptos y principios de las matemáticas existen independientemente del pensamiento humano, por lo que pueden considerarse descubiertos en lugar de inventados.
Por ejemplo, los conceptos de números, proporciones y formas geométricas se observan en el mundo natural y se pueden abstraer y estudiar sistemáticamente. Escribe el siguiente párrafo de mi ensayo.

Utilicé esta indicación para generar varias expansiones y seleccioné una que me gustó, dando como resultado lo siguiente:

Filósofos y matemáticos han debatido si las matemáticas son inventadas o descubiertas.
Algunos argumentan que los conceptos y principios de las matemáticas existen independientemente del pensamiento humano, por lo que pueden considerarse descubiertos en lugar de inventados.
Por ejemplo, los conceptos de números, proporciones y formas geométricas se observan en el mundo natural y se pueden abstraer y estudiar sistemáticamente.
Por otro lado, algunos argumentan que las matemáticas son en gran medida una invención del pensamiento humano.
Los principios matemáticos se basan en el razonamiento lógico, que es una característica del pensamiento humano.
Por ejemplo, la geometría euclidiana se basa en axiomas y suposiciones abstractas que se aceptan como verdaderos sin necesidad de ser demostrados.
Por lo tanto, la geometría se puede ver como una invención del pensamiento humano en lugar de un descubrimiento.
De manera similar, las fórmulas y ecuaciones matemáticas se utilizan para modelar y predecir fenómenos físicos, que son el resultado del razonamiento humano.

Usando indicaciones de expansión, podemos escribir gradualmente e iterar en cada paso. Esto es útil en situaciones donde necesitas generar una salida de mayor calidad y deseas hacer modificaciones incrementales.

Conceptos del Modelo

ChatGPT

gpt-3.5-turbo: El modelo ChatGPT más rápido actualmente disponible, pero puede sacrificar algo de calidad de texto. La longitud del contexto es de 4k.
gpt-3.5-turbo-16k: Igual que gpt-4, pero con un límite de contexto aumentado de 16k tokens y una tasa de costo más alta.
gpt-4: ChatGPT 4.0 tiene capacidades mejoradas de comprensión y generación de lenguaje en comparación con el 3.5. Tiene una mejor comprensión del contexto y puede generar respuestas más precisas y naturales. Esto se debe a mejoras en el modelo GPT-4, que incluyen un mejor modelado del lenguaje y una comprensión semántica más profunda, pero puede ser más lento que otros modelos. La longitud del contexto es de 8k.
gpt-4-32k: Igual que gpt-4, pero con un límite de contexto aumentado de 32k tokens y una tasa de costo más alta.

Conceptos de Parámetros del Modelo

La LLM puede parecer mágica, pero es esencialmente un problema de probabilidad. La red neuronal genera un conjunto de palabras candidatas a partir del modelo preentrenado en función del texto de entrada y selecciona la de mayor probabilidad como salida. La mayoría de los parámetros relacionados se refieren al muestreo (es decir, cómo seleccionar la salida de las palabras candidatas).

`temperature`

Controla la aleatoriedad de la salida del modelo. Los valores más altos aumentan la aleatoriedad. En general, si introduces la misma indicación varias veces, la salida del modelo será diferente cada vez.

Establece en 0 para una salida fija para cada indicación.
Valores más bajos hacen que la salida sea más enfocada y determinista.
Valores más altos hacen que la salida sea más aleatoria y creativa.

[!NOTA]

En general, cuanto más larga y clara sea la indicación, mejor será la calidad y confianza de la salida generada. En este caso, puedes aumentar el valor de temperatura. Por el contrario, si la indicación es corta y ambigua, configurar un valor de temperatura más alto hará que la salida del modelo sea menos estable.

`top_p`

El muestreo de núcleo de top-p es otro parámetro de muestreo que es diferente de la temperatura. Antes de que el modelo genere la salida, genera un conjunto de tokens. En el modo de muestreo de top-p, la lista de palabras candidatas es dinámica y se selecciona de los tokens en función de un porcentaje. Top-p introduce aleatoriedad en la selección de tokens, permitiendo que otras palabras de alto puntaje tengan la posibilidad de ser seleccionadas en lugar de elegir siempre la de mayor puntaje.

[!NOTA]

Top-p es similar a la aleatoriedad. En general, no se recomienda cambiarlo junto con el parámetro de aleatoriedad, temperatura.

`presence_penalty`

El parámetro de penalización de presencia se puede ver como un castigo por contenido repetitivo en el texto generado. Cuando este parámetro se establece alto, el modelo generativo tratará de evitar generar palabras, frases o oraciones repetidas. Por el contrario, si el parámetro de penalización de presencia es bajo, es posible que el texto generado contenga más contenido repetido. Al ajustar el valor del parámetro de penalización de presencia, puedes controlar la originalidad y diversidad del texto generado. La importancia de este parámetro se refleja principalmente en los siguientes aspectos:

Aumentar la originalidad y diversidad del texto generado: En algunos escenarios de aplicación, como la escritura creativa o la generación de titulares de noticias, es deseable que el texto generado tenga una alta originalidad y diversidad. Al aumentar el valor del parámetro de penalización de presencia, se puede reducir efectivamente la probabilidad de generar contenido repetido en el texto generado, mejorando así su originalidad y diversidad.
Evitar bucles de generación y contenido sin sentido: En algunos casos, el modelo generativo puede producir texto repetitivo y sin sentido que no transmite información útil. Al aumentar adecuadamente el valor del parámetro de penalización de presencia, se puede reducir la probabilidad de generar este tipo de contenido sin sentido, mejorando la legibilidad y utilidad del texto generado.

[!NOTA]

Vale la pena señalar que el parámetro de penalización de presencia, junto con otros parámetros como temperatura y top-p, afecta colectivamente la calidad del texto generado. En comparación con otros parámetros, el parámetro de penalización de presencia se centra más en la originalidad y repetitividad del texto, mientras que los parámetros de temperatura y top-p tienen un mayor impacto en la aleatoriedad y determinismo del texto generado. Ajustando adecuadamente estos parámetros, se puede lograr un control integral de la calidad del texto generado.

`frequency_penalty`

La penalización de frecuencia es un mecanismo que penaliza las ocurrencias frecuentes de nuevo vocabulario en el texto generado, reduciendo la probabilidad de que el modelo repita las mismas palabras. Cuanto mayor sea el valor, mayor será la probabilidad de reducir las palabras repetidas.

-2.0 Cuando comienza a sonar la noticia de la mañana, noté que mi televisor ahora ahora ahora ahora ahora ahora ahora ahora ahora ahora ahora ahora ahora ahora ahora ahora ahora ahora ahora ahora ahora ahora ahora ahora ahora (La palabra más frecuente es "ahora" con un porcentaje del 44.79%)
-1.0 Siempre ve las noticias por la mañana, viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo viendo (La palabra más frecuente es "viendo" con un porcentaje del 57.69%)
0.0 Cuando el sol de la mañana ilumina el pequeño restaurante, aparece en la puerta un cartero cansado, sosteniendo una bolsa de correo en la mano. El propietario prepara calurosamente el desayuno para él, y él comienza a clasificar el correo mientras disfruta de su desayuno. (La palabra más frecuente es "el" con un porcentaje del 8.45%)
1.0 Una niña dormida profundamente es despertada por un cálido rayo de sol. Ve el primer rayo de luz de la mañana, rodeada de sonidos de pájaros y el aroma de las flores, todo está lleno de vitalidad. (La palabra más frecuente es "el" con un porcentaje del 5.45%)
2.0 Todas las mañanas, se sienta en el balcón a desayunar. En el suave atardecer, todo parece muy tranquilo. Sin embargo, un día, mientras estaba a punto de recoger su desayuno, un optimista pajarito voló, trayéndole un buen humor para el día. (La palabra más frecuente es "el" con un porcentaje del 4.94%)

Lecturas Adicionales

Aprende sobre las Indicaciones - https://learnprompting.org/docs/intro