La Inteligencia Artificial generativa ha dado un salto impresionante con herramientas como ChatGPT, pero… ¿cómo funciona realmente por dentro? En este artículo vamos a explicar, paso a paso y de forma clara, qué hay detrás de un modelo como este: qué son los tokens, cómo se entrena, y por qué los prompts (las instrucciones que le das) son tan importantes.
📦 1. ¿Qué es ChatGPT?
ChatGPT es un modelo de lenguaje desarrollado por OpenAI basado en la arquitectura GPT (Generative Pre-trained Transformer). Su trabajo es generar texto que tenga sentido, basado en el texto que tú le das. Puede responder preguntas, continuar ideas, resumir, traducir, escribir código y mucho más.
La clave está en que no entiende el lenguaje como un humano, sino que predice la siguiente palabra en función de las anteriores. Y aunque parezca simple, el nivel de precisión que ha alcanzado es sorprendente.
🧩 2. ¿Qué son los tokens?
En vez de trabajar con palabras completas, los modelos como ChatGPT procesan texto en tokens, que son fragmentos de texto. Un token puede ser:
- una palabra completa:
"hola"
- parte de una palabra:
"artifi-"
,"cial"
- un signo de puntuación:
"."
,","
, etc.
Por ejemplo, la frase:
«La inteligencia artificial es fascinante.»
puede convertirse en:["La", " inteligencia", " artificial", " es", " fascinante", "."]
Cada token se transforma en un número (a través de un proceso llamado tokenización) que el modelo puede procesar.
🔢 GPT-4, por ejemplo, puede manejar hasta 128,000 tokens por conversación (según la versión), lo que le permite “recordar” mucho contexto.
🧠 3. ¿Cómo se entrena un modelo como ChatGPT?
ChatGPT no “nace sabiendo”. Se entrena en dos fases principales:
🔹 a) Preentrenamiento
El modelo se alimenta con enormes cantidades de texto: libros, artículos, webs, conversaciones públicas, etc. Su objetivo durante esta fase es aprender a predecir el siguiente token dada una secuencia anterior.
Ejemplo:
Entrada: “La capital de Francia es…”
El modelo intenta predecir: “París”.
No se le enseña explícitamente geografía: aprende por estadística, viendo millones de frases similares.
🔹 b) Fine-tuning (ajuste fino)
Después del preentrenamiento, se afina el modelo con ejemplos cuidadosamente elegidos, donde se le enseña a responder como lo haría un asistente útil y educado. Aquí es donde entra el RLHF (Reinforcement Learning from Human Feedback):
- Humanos escriben buenas y malas respuestas.
- El modelo aprende a priorizar las respuestas más útiles y coherentes.
🧠 4. ¿Qué papel juegan los prompts?
Un prompt es el texto que tú escribes para “hablar” con el modelo. Pero no es solo una pregunta: es la clave que activa una determinada respuesta.
Por ejemplo:
- “Explica qué es el ADN como si fuera una receta de cocina.”
- “Resume este artículo en 3 puntos clave.”
- “Escribe una carta de presentación para un diseñador gráfico.”
El modelo no «piensa», pero responde en función de cómo se formula el prompt. Cuanto más claro y específico, mejores resultados obtienes.
📌 Pro tip:
Puedes guiar a ChatGPT como si fuera un actor interpretando un rol:
“Actúa como un profesor de biología que enseña a niños de 10 años.”
Esto se llama prompt engineering y es una habilidad clave en el uso de IA generativa.
⚙️ 5. ¿Qué hay detrás del “cerebro” de ChatGPT?
GPT-4 tiene cientos de miles de millones de parámetros. Un parámetro es un número que el modelo ajusta durante el entrenamiento, y que determina cómo “piensa”.
Imagina miles de perillas que se afinan mientras el modelo aprende.
Cada capa del modelo procesa la información con más abstracción: desde letras → palabras → frases → ideas.
Y todo esto funciona gracias a los Transformers, una arquitectura de red neuronal inventada en 2017, que revolucionó el campo del lenguaje natural.
🧭 6. ¿Tiene memoria ChatGPT?
Sí… y no.
- En una sesión normal, recuerda el contexto de lo que le has dicho antes, hasta un límite de tokens (por ejemplo, 8k, 32k o más, según el plan).
- Pero no recuerda tus conversaciones pasadas si cierras la sesión, a menos que uses una cuenta con memoria activada.
- En la versión API, puedes diseñar tu propio sistema de memoria.
🤔 Conclusión
ChatGPT no es mágico. Es el resultado de años de investigación, millones de datos y una arquitectura matemática muy avanzada. No “piensa”, pero simula conversaciones de forma tan natural que parece que lo hace.
Saber cómo funciona te ayuda a usarlo mejor, hacer mejores prompts y entender sus límites (y sus peligros).
Si quieres formarte en Inteligencia Artificial, puedes leer mi reseña sobre este programa aquí.
🧪 ¿Quieres experimentar?
Aquí tienes algunos retos para jugar con los prompts:
- Pídele que resuma un texto y luego reformúlalo para otro público.
- Pídele que actúe como diferentes perfiles: abogado, poeta, entrenador, etc.
- Hazle preguntas con ambigüedad y observa cómo responde.
📚 Lecturas recomendadas
- 🔗 The Illustrated Transformer – Jay Alammar (EN)
- 📘 “AI 2041” – Kai-Fu Lee
- 📄 Documentación oficial de OpenAI