Ir al contenido principal
zero-shot-blog-banner

Comparativa de Zero-Shot, One-Shot y Few-Shot en LLMs

Written on October 10, 2024 by Pedro Medinilla.

4 min.
Read in English

En el campo de la inteligencia artificial y el procesamiento del lenguaje natural, los modelos de lenguaje de gran tamaño (LLMs, por sus siglas en inglés) han revolucionado la manera en que interactuamos con la tecnología. Una de las características más destacadas de estos modelos es su capacidad para aprender y adaptarse a nuevas tareas con casi ninguna información adicional. A continuación, vamos a explorar tres enfoques claves: Zero-Shot, One-Shot y Few-Shot, proporcionando una introducción, explicación detallada, ejemplos de uso y una comparativa entre ellos.

Introducción

Los LLMs han demostrado habilidades impresionantes para comprender y generar texto independientemente del contexto. Una de las razones de su eficacia es su capacidad para generalizar a partir de muy pocos ejemplos o incluso sin ejemplos específicos de una tarea. Los términos Zero-Shot, One-Shot y Few-Shot describen diferentes niveles de esta capacidad de aprendizaje, dependiendo de la cantidad de información previa proporcionada al modelo para realizar una tarea específica.

Zero-Shot

¿Qué es Zero-Shot?

El enfoque Zero-Shot implica que el modelo es capaz de realizar una tarea sin haber sido entrenado específicamente para ella y sin recibir ejemplos durante la interacción. El modelo utiliza su conocimiento previo para inferir cómo abordar la tarea basándose únicamente en una descripción en formato texto.

Ejemplo de Uso

Tarea: Traducir una frase del inglés al español.

Prompt Zero-Shot:

Traduce al español: "The weather is nice today."
 
**Respuesta del Modelo:**
El clima está agradable hoy.

En este ejemplo, el modelo no recibe ejemplos de traducción, pero entiende la tarea a partir de la instrucción proporcionada.

One-Shot

¿Qué es One-Shot?

El enfoque One-Shot proporciona al modelo un único ejemplo de la tarea que se desea realizar. Este ejemplo sirve como referencia para que el modelo entienda mejor el contexto y el formato esperado de la respuesta.

Ejemplo de Uso

Tarea: Traducir una frase del inglés al español.

Prompt One-Shot:

Ejemplo: Inglés: "Good morning." Español: "Buenos días."
 
Traduce al español: "The weather is nice today."
 
**Respuesta del Modelo:**
El clima está agradable hoy.

Aquí, el modelo utiliza el único ejemplo proporcionado para inferir cómo debe realizar la traducción.

Few-Shot

¿Qué es Few-Shot?

El enfoque Few-Shot implica proporcionar al modelo varios ejemplos de la tarea. Esto ayuda al modelo a captar patrones más complejos y a generalizar mejor para realizar la tarea con mayor precisión.

Ejemplo de Uso

Tarea: Traducir frases del inglés al español.

Prompt Few-Shot:

Ejemplo 1: Inglés: "Good morning." Español: "Buenos días."
 
Ejemplo 2: Inglés: "Thank you." Español: "Gracias."
 
Ejemplo 3: Inglés: "See you later." Español: "Hasta luego."
 
Traduce al español: "The weather is nice today."
 
**Respuesta del Modelo:**
El clima está agradable hoy.

Con múltiples ejemplos, el modelo puede entender mejor el patrón de traducción y aplicarlo de manera más efectiva.

Comparativa

AspectoZero-ShotOne-ShotFew-Shot
Cantidad de EjemplosNingunoUn solo ejemploVarios ejemplos
Facilidad de ImplementaciónMuy sencillo, solo una instrucción claraModeradamente sencillo, requiere crear un ejemploMás complejo, requiere múltiples ejemplos
PrecisiónPuede ser menos precisa en tareas complejasMayor precisión que Zero-ShotMayor precisión y capacidad de generalización
Uso de RecursosMenos recursos necesariosRecursos moderados para crear un ejemploMás recursos para generar y gestionar ejemplos
AplicabilidadTareas simples o bien definidasTareas medianamente complejasTareas complejas que se benefician de varios ejemplos

Conclusión

Los enfoques Zero-Shot, One-Shot y Few-Shot ofrecen diferentes niveles de flexibilidad y precisión al utilizar LLMs para diversas tareas. Zero-Shot es ideal para tareas sencillas donde una instrucción clara es suficiente. One-Shot mejora la precisión proporcionando un ejemplo, siendo útil para tareas con una cierta complejidad. Few-Shot es la mejor opción para tareas más complejas que requieren una comprensión más profunda y patrones específicos, aprovechando múltiples ejemplos para optimizar el rendimiento del modelo.

Comprender y seleccionar el enfoque adecuado según la tarea y los recursos disponibles puede maximizar la eficacia de los LLMs, permitiendo una integración más eficiente y precisa de estas tecnologías en aplicaciones del mundo real.

Pon un Tweet de este artículo

¿Disfrutando del post?

No dudes en contactarme si tienes alguna duda, sugerencia o proyecto que pueda ayudarte a hacerlo realidad.

Contactar