Un modelo de lenguaje pasa por dos fases antes de llegar a tus manos. Entender ambas es clave para saber con qué estás hablando realmente.
FASE 1 · PRE-ENTRENAMIENTO
Fase 1 · Pre-entrenamiento
El modelo analiza miles de millones de textos y aprende a predecir cuál es el token estadísticamente más probable que viene después. No sabe nada de "ser útil" o "caer bien". Solo predice lo siguiente con base en patrones.
¿Por qué esto importa? El pre-entrenamiento enseña a la máquina qué es probable. El ajuste fino le enseña qué es deseado — según los humanos que lo entrenaron. De ahí nace el servilismo: cuando el modelo prioriza "caer bien" por encima de "ser preciso", es porque así fue recompensado en la fase 2. Saber esto cambia completamente la forma en que le hablas.