Entendiendo la
IA Generativa

ANTHROP\C

¿Qué es la IA Generativa?

La IA Generativa se refiere a sistemas de inteligencia artificial capaces de crear contenido nuevo, no solo analizar datos existentes.

IA Tradicional

Clasifica correos como spam o no spam.

IA Generativa

Puede escribir un correo completamente nuevo por ti.

Los tres pilares que lo hicieron posible

Algoritmos

La arquitectura Transformer (2017) revolucionó el procesamiento de textos extensos.

Explosión de datos

La explosión de datos digitales (sitios web, repositorios de código y otros textos) proveyó la materia prima para entrenar estos sistemas.

Poder de cómputo

Los aumentos masivos de potencia computacional (chips como las GPUs) hicieron posible entrenar estos modelos con toda esa data.

Cómo funciona

Pre-entrenamiento

Los modelos analizan miles de millones de ejemplos de texto, aprendiendo a predecir qué viene después.

Ajuste fino

Los modelos se refinan para seguir instrucciones, ser útiles y evitar contenido dañino.

Despliegue

Los usuarios entregan prompts, y el modelo genera respuestas basadas en ellos y en los patrones que aprendió durante el entrenamiento.

Capacidades clave

  • Habilidades lingüísticas versátiles
  • Capacidades de propósito general
  • Aprendizaje a partir de ejemplos
  • Conexión con herramientas y datos externos

Limitaciones actuales

  • Fecha de corte del conocimiento
  • Imprecisiones potenciales ("alucinaciones")
  • Límites de la ventana de contexto
  • Retos con razonamiento complejo y matemáticas