Glosario fácil de IA para desarrolladores en 2026: RAG, MCP, agentes, subagentes, vibe coding, CLI y más
glosario
La inteligencia artificial para desarrollo de software ya no gira solo alrededor de “usar un chat para generar código”. En 2026, el vocabulario ha crecido mucho: ahora hablamos de RAG, MCP, agentes, subagentes, tool calling, context windows, copilots, evaluación, guardrails y hasta vibe coding.
Este post reúne los términos más famosos y útiles para entender la IA moderna desde una perspectiva práctica. La idea no es sonar académico, sino entender qué significa cada concepto, para qué sirve, cuándo hace falta, con qué se combina bien y qué está cambiando en 2026.
1. LLM
Qué es
Un LLM (Large Language Model) es un modelo de IA entrenado para entender y generar texto, código y otros formatos de entrada o salida. Es la base sobre la que se construyen copilots, asistentes, sistemas RAG y agentes.
Para qué sirve
Sirve para resumir, explicar, traducir, programar, redactar, clasificar información y razonar sobre instrucciones complejas. En desarrollo, suele actuar como “motor de lenguaje” dentro de una herramienta más grande.
Por qué hace falta
Porque permite trabajar con lenguaje natural en lugar de interfaces rígidas. En vez de programar cada comportamiento manualmente, puedes describir la tarea y dejar que el modelo proponga una solución.
Con qué funciona bien
Se combina muy bien con RAG, tool calling, memoria, MCP y flujos de agentes. Un LLM solo sabe “pensar con texto”, pero combinado con contexto y herramientas puede hacer trabajo útil sobre sistemas reales.
Novedades en 2026
La tendencia fuerte en 2026 es que el valor ya no está solo en el modelo, sino en el sistema que lo rodea: contexto, herramientas, seguridad, evaluación y experiencia de uso. También están ganando peso los modelos más pequeños y eficientes en tareas concretas.
2. RAG
Qué es
RAG significa Retrieval-Augmented Generation. Es una técnica en la que el sistema busca información relevante en documentos, bases de conocimiento o datos privados y se la pasa al modelo antes de responder.
Para qué sirve
Sirve para reducir alucinaciones y hacer que la IA responda usando información real y actualizada. Es muy útil para documentación interna, soporte, bases legales, manuales técnicos o repositorios de conocimiento.
Por qué hace falta
Porque un modelo, por sí solo, no “sabe” automáticamente los datos privados de tu empresa ni los documentos más recientes. RAG soluciona justo ese problema: que la IA no invente, sino que consulte una fuente antes de contestar.
Con qué funciona bien
Se lleva especialmente bien con embeddings, bases vectoriales, reranking, evaluación y agentes. También encaja muy bien con MCP cuando quieres que el sistema recupere datos desde herramientas reales en vez de depender solo de un índice estático.
Novedades en 2026
En 2026 se habla cada vez más de Agentic RAG, es decir, un RAG donde un agente no solo recupera contexto, sino que decide qué buscar, refina búsquedas y combina varias fuentes. La tendencia va de un RAG estático a un RAG más dinámico, iterativo y conectado a flujos reales.
3. MCP
Qué es
MCP significa Model Context Protocol. Es un estándar abierto para conectar modelos y agentes con herramientas, datos y sistemas externos de forma más uniforme.
Para qué sirve
Sirve para que una IA pueda acceder a cosas como archivos, bases de datos, GitHub, Slack, APIs o herramientas internas sin construir una integración distinta para cada caso. Una forma sencilla de entenderlo es como un “USB-C para la IA”.
Por qué hace falta
Porque una de las mayores barreras de los agentes era que estaban aislados del lugar donde vive el trabajo real. MCP reduce ese problema al estandarizar cómo exponer contexto y herramientas a los modelos.
Con qué funciona bien
Funciona muy bien con agentes, tool calling, IDEs, asistentes de terminal y sistemas empresariales. No sustituye a RAG ni a los agentes: se sitúa en otra capa, la de conexión e interoperabilidad.
Novedades en 2026
La gran noticia es su consolidación como estándar cada vez más aceptado. El foco se ha desplazado hacia seguridad, autorización e interoperabilidad, y una parte importante de la conversación gira en torno a cómo dar acceso seguro a herramientas y datos reales.
4. Agentes
Qué es
Un agente de IA es un sistema que no solo responde, sino que también puede planificar, usar herramientas, ejecutar pasos y reaccionar a resultados intermedios para cumplir un objetivo.
Para qué sirve
Sirve para tareas con varios pasos, como investigar, modificar código, abrir tickets, consultar documentación, usar APIs o automatizar procesos. La diferencia frente a un chatbot normal es que el agente puede “hacer”, no solo “decir”.
Por qué hace falta
Porque muchos trabajos reales no se resuelven con una única respuesta. Hace falta decidir, ejecutar, comprobar y volver a intentar, y ahí es donde entra el comportamiento agéntico.
Con qué funciona bien
Se relaciona muy bien con RAG, MCP, memoria, tool calling, browser automation y sistemas de evaluación. Un buen agente suele combinar conocimiento, contexto y capacidad de actuar.
Novedades en 2026
En 2026 el movimiento es hacia agentes más prácticos y menos “demo”. La conversación se centra en fiabilidad, seguridad, acceso a datos frescos, uso de herramientas reales y despliegues que funcionen dentro de flujos de trabajo de verdad.
5. Subagentes
Qué es
Los subagentes son agentes especializados que trabajan como partes de un sistema mayor. En lugar de tener un solo agente que haga todo, el sistema reparte funciones entre varios roles.
Para qué sirve
Sirven para dividir tareas complejas: uno planifica, otro busca datos, otro escribe código, otro revisa calidad y otro valida resultados. Esto mejora la organización y, en algunos casos, la robustez.
Por qué hace falta
Porque pedirle a un único agente que piense, ejecute, revise y corrija todo puede ser ineficiente o errático. Separar responsabilidades ayuda a reducir caos y a controlar mejor cada parte del flujo.
Con qué funciona bien
Funcionan bien con arquitecturas multiagente, pipelines de revisión, sistemas de coding agents y flujos donde hay tareas claramente separables. También pueden apoyarse en MCP para acceder a distintas herramientas según el rol.
Novedades en 2026
En 2026 crece el interés por patrones multiagente para mejorar confiabilidad y resultados, aunque también se insiste más en no complicar la arquitectura sin necesidad. La idea madura es usar subagentes cuando el problema realmente lo justifica.
6. Agentic AI
Qué es
Agentic AI no es exactamente una herramienta, sino una forma de construir sistemas donde la IA persigue objetivos, toma decisiones intermedias y corrige el rumbo cuando algo falla.
Para qué sirve
Sirve para automatizaciones menos rígidas y más adaptables. Por ejemplo, completar un proceso aunque falte información, reintentando, pidiendo datos o cambiando de estrategia.
Por qué hace falta
Porque el mundo real está lleno de excepciones. Un sistema puramente lineal se rompe cuando cambia una condición; uno agéntico intenta resolver el problema con más flexibilidad.
Con qué funciona bien
Se apoya en agentes, memoria, observación del entorno, herramientas y evaluación continua. RAG y MCP suelen ser piezas complementarias dentro de ese enfoque.
Novedades en 2026
En 2026 el término se usa más para describir sistemas útiles orientados a operaciones reales y menos como palabra de moda. La conversación se mueve hacia gobernanza, seguridad, auditoría y retorno práctico.
7. Tool calling
Qué es
Tool calling es la capacidad del modelo o del agente para invocar herramientas externas, como funciones, APIs, buscadores, calculadoras o sistemas internos.
Para qué sirve
Sirve para que la IA haga algo verificable fuera del texto: consultar un dato, crear un archivo, ejecutar una acción o recuperar información estructurada.
Por qué hace falta
Porque hay tareas donde generar texto no basta. Si quieres consultar una base de datos o crear una incidencia, necesitas que el sistema salga del chat y use una herramienta real.
Con qué funciona bien
Encaja perfectamente con agentes, MCP, RAG y CLI tools. A menudo, MCP facilita cómo se exponen esas herramientas al sistema.
Novedades en 2026
La novedad importante es que ya no basta con tener herramientas: importa mucho la seguridad del acceso, el principio de mínimo privilegio y los logs de auditoría. El riesgo de abuso de herramientas y de instrucciones maliciosas se ha vuelto una preocupación central.
8. Vibe coding
Qué es
Vibe coding es una forma informal de describir el desarrollo asistido por IA donde la persona va construyendo a partir de intuición, prompts y pruebas rápidas, sin diseñar demasiado de antemano.
Para qué sirve
Sirve para prototipar muy rápido, explorar ideas, levantar demos y reducir fricción al empezar. Puede ser fantástico para validar conceptos o avanzar cuando el coste de equivocarse es bajo.
Por qué hace falta
Porque baja la barrera de entrada y acelera muchísimo la creación inicial. Muchas personas que antes no podían construir un prototipo ahora pueden hacerlo en horas.
Con qué funciona bien
Funciona bien con copilots, asistentes en IDE, terminales inteligentes y proyectos pequeños o experimentales. Pero necesita revisión, pruebas y criterio humano para pasar a producción.
Novedades en 2026
En 2026 el término se ha popularizado mucho, pero también ha madurado la crítica: crear rápido ya no impresiona tanto; lo importante es validar, revisar y sostener el software. La conversación se está desplazando desde “hacerlo deprisa” hacia “hacerlo fiable”.
9. CLI
Qué es
CLI significa Command Line Interface, es decir, la interfaz de terminal basada en comandos. En el contexto de IA, se ha convertido en uno de los entornos favoritos para agentes de desarrollo.
Para qué sirve
Sirve para editar, ejecutar, inspeccionar, probar, navegar por proyectos y automatizar tareas directamente desde la terminal. Para un agente, la CLI es una interfaz muy estructurada y poderosa.
Por qué hace falta
Porque muchas tareas de desarrollo ya existen en la terminal: Git, tests, compilación, linters, scripts, paquetes y despliegues. Si un agente sabe operar ahí, puede integrarse mejor con el flujo real del programador.
Con qué funciona bien
Se relaciona con coding agents, herramientas Unix, Git, contenedores, MCP y automatización de pipelines. También encaja muy bien con un enfoque “agent-native” de desarrollo.
Novedades en 2026
Una tendencia clara es el auge de experiencias de desarrollo más centradas en terminal y menos dependientes de interfaces visuales pesadas para ciertas tareas agénticas. También están surgiendo capas más portables entre editores y entornos.
10. Copilot
Qué es
Un copilot es un asistente de IA que ayuda a una persona dentro de una herramienta, normalmente sin actuar con demasiada autonomía. Suele sugerir, completar, explicar o acelerar trabajo humano.
Para qué sirve
Sirve para escribir código, generar tests, resumir archivos, proponer comandos, explicar errores y ahorrar tiempo en tareas repetitivas.
Por qué hace falta
Porque no siempre quieres delegar toda la tarea a un agente. Muchas veces solo necesitas una ayuda rápida mientras mantienes control completo.
Con qué funciona bien
Funciona bien con IDEs, terminales, documentación, Git y flujos de revisión humana. En muchos equipos, el copilot es la puerta de entrada antes de adoptar agentes más autónomos.
Novedades en 2026
En 2026 la frontera entre copilot y agente se está difuminando. Muchos asistentes empiezan como copilots, pero añaden más capacidad de ejecutar tareas, usar herramientas y operar sobre el entorno.
11. Context window
Qué es
La context window es la cantidad de información que un modelo puede tener “a la vista” al mismo tiempo en una interacción. Incluye instrucciones, historial, documentos, herramientas y entradas del usuario.
Para qué sirve
Sirve para determinar cuánto contexto cabe antes de que el modelo empiece a perder información o a trabajar con demasiada carga. Es una limitación técnica muy importante en sistemas complejos.
Por qué hace falta entenderlo
Porque muchos fallos no vienen de que el modelo sea malo, sino de que recibe demasiado contexto, el contexto equivocado o información mal organizada.
Con qué funciona bien
Se relaciona con compresión de contexto, RAG, memoria, selección de herramientas y diseño de prompts. Un sistema bien diseñado no mete “todo”, sino lo correcto.
Novedades en 2026
El foco está menos en presumir de ventanas gigantes y más en gestionar el contexto con inteligencia: cargar solo lo necesario, usar memoria selectiva y activar habilidades solo cuando hacen falta.
12. Memoria
Qué es
La memoria en IA es la capacidad del sistema para recordar información útil entre pasos o entre sesiones. No es lo mismo que la ventana de contexto: la memoria busca persistencia o recuperación selectiva.
Para qué sirve
Sirve para recordar preferencias, estado de una tarea, decisiones anteriores o hechos importantes del usuario y del proyecto. Esto mejora continuidad y personalización.
Por qué hace falta
Porque un agente que olvida todo a cada paso se vuelve torpe e ineficiente. La memoria ayuda a no repetir trabajo y a mantener coherencia a lo largo del tiempo.
Con qué funciona bien
Se combina con agentes, RAG, perfiles de usuario, historiales de ejecución y sistemas de contexto estructurado.
Novedades en 2026
La conversación en 2026 gira en torno a memoria útil, no memoria infinita: qué guardar, cuándo recuperarlo y cómo evitar riesgos de privacidad, sobrecarga y errores por contexto irrelevante.
13. Embeddings
Qué es
Los embeddings son representaciones numéricas de texto, código u otros datos que permiten comparar significado de forma matemática. Son una base frecuente para búsquedas semánticas y sistemas RAG.
Para qué sirve
Sirven para encontrar contenido parecido aunque no use exactamente las mismas palabras. Por eso son tan útiles para búsqueda semántica en documentación o conocimiento interno.
Por qué hace falta
Porque buscar por palabras exactas suele quedarse corto. Los embeddings ayudan a localizar fragmentos relevantes por sentido, no solo por coincidencia literal.
Con qué funciona bien
Se combinan con bases vectoriales, chunking, reranking y pipelines RAG.
Novedades en 2026
En 2026 el foco está menos en “tener embeddings” y más en la calidad del pipeline completo: segmentación, evaluación, reordenado y adaptación al caso de uso.
14. Vector database
Qué es
Una base de datos vectorial almacena embeddings y permite recuperar elementos parecidos por similitud semántica. Es una pieza clásica de muchas arquitecturas RAG.
Para qué sirve
Sirve para buscar rápidamente fragmentos relevantes de documentación, tickets, normas, artículos, código o chats anteriores.
Por qué hace falta
Porque sin una forma eficiente de recuperar contexto relevante, el RAG pierde precisión o escala mal.
Con qué funciona bien
Funciona con embeddings, chunking, filtros por metadatos, reranking y agentes que necesitan consultar conocimiento.
Novedades en 2026
La tendencia es integrarlas con pipelines más ricos, no tratarlas como solución mágica por sí solas. La precisión depende tanto del índice como del diseño de recuperación y validación.
15. Guardrails
Qué es
Los guardrails son reglas, controles y límites que ayudan a mantener el comportamiento del sistema dentro de condiciones seguras y útiles.
Para qué sirve
Sirven para filtrar acciones peligrosas, evitar fugas de datos, restringir herramientas, validar formatos de salida y reducir errores costosos.
Por qué hace falta
Cuanto más conectas la IA a herramientas reales, más importante es impedir usos indebidos o decisiones inseguras. El problema ya no es solo una respuesta mala, sino una acción mala.
Con qué funciona bien
Se relaciona con tool calling, agentes, MCP, autorización, revisión humana y evaluación automática.
Novedades en 2026
En 2026 seguridad y confianza son parte central del diseño agéntico. Se habla más de mínimo privilegio, auditoría, defensa frente a instrucciones maliciosas indirectas y revisión de acciones sobre sistemas externos.
16. Evaluación o evals
Qué es
Las evals son pruebas estructuradas para medir si un sistema de IA hace bien su trabajo. En vez de confiar en impresiones subjetivas, intentan comprobar calidad, precisión y robustez.
Para qué sirve
Sirven para comparar prompts, modelos, estrategias RAG, herramientas o configuraciones de agentes. También ayudan a detectar regresiones cuando cambias algo en el sistema.
Por qué hace falta
Porque en IA muchas cosas “parecen funcionar” hasta que fallan en casos reales. Las evals son clave para construir sistemas menos frágiles.
Con qué funciona bien
Se relacionan con observabilidad, trazas, datasets de prueba, revisión humana y métricas de negocio.
Novedades en 2026
La tendencia es clara: menos demos espectaculares y más medición seria. La madurez se está moviendo hacia fiabilidad, trazabilidad y validación continua.
17. Browser agent
Qué es
Un browser agent es un agente capaz de interactuar con interfaces web, como si navegara, hiciera clic, rellenara formularios o leyera pantallas.
Para qué sirve
Sirve para automatizar tareas que viven en aplicaciones web sin API sencilla o cuando el flujo real ocurre en el navegador.
Por qué hace falta
Porque mucho trabajo empresarial sigue ocurriendo en interfaces humanas normales. Si quieres automatizar esos procesos, el navegador es un punto clave.
Con qué funciona bien
Se relaciona con agentes, computer use, tool calling, observación del estado y validaciones de seguridad.
Novedades en 2026
Es una de las áreas que más expectativa genera, pero también una de las más delicadas por fiabilidad, permisos y riesgo operacional.
18. Agent skills
Qué es
Las skills o habilidades de agentes son capacidades especializadas que el sistema puede cargar solo cuando hacen falta. En vez de meter todo el conocimiento y todas las instrucciones siempre, el agente activa una habilidad concreta para una tarea.
Para qué sirve
Sirven para mantener el contexto más limpio, reducir complejidad y hacer que el comportamiento sea más consistente.
Por qué hace falta
Porque uno de los problemas en sistemas complejos es el exceso de contexto y la mezcla de responsabilidades. Cargar habilidades bajo demanda mejora orden y eficiencia.
Con qué funciona bien
Funciona bien con agentes modulares, MCP, tool routing y arquitecturas donde distintas tareas tienen instrucciones muy diferentes.
Novedades en 2026
En 2026 crece el interés por arquitecturas más modulares, donde el agente no lleva siempre todo “encima”, sino que incorpora capacidades en el momento adecuado.
Cómo conectar todo esto sin liarte
Una forma sencilla de verlo es esta:
- LLM: el motor que entiende y genera lenguaje.
- RAG: la capa que le da conocimiento real y actualizado.
- MCP: la capa que conecta la IA con herramientas y datos externos.
- Agentes: la capa que decide pasos y ejecuta acciones.
- Guardrails + evals: la capa que evita desastres y mide si el sistema funciona bien.
Una comparación útil sería esta: si construyes un compañero de programación moderno, el LLM sería el cerebro lingüístico, RAG sería la biblioteca, MCP serían los enchufes y conectores, y el agente sería la parte que organiza el trabajo y mueve las manos.
Qué está cambiando de verdad en 2026
Más allá de las palabras de moda, hay varias ideas que están marcando 2026 con bastante claridad.
- La IA pasa de “responder bonito” a integrarse en flujos reales de trabajo.
- MCP gana peso como estándar de conexión e interoperabilidad.
- RAG evoluciona hacia variantes más agénticas, iterativas y multi-fuente.
- Seguridad, permisos y auditoría ya no son opcionales.
- La productividad no depende solo de generar código, sino de revisar, validar y mantener lo generado.
- El valor se está moviendo desde el modelo aislado hacia la arquitectura completa del sistema.
Cierre práctico
Si eres desarrollador y quieres orientarte bien en 2026, no necesitas memorizar cien siglas. Lo importante es entender las capas: modelo, contexto, recuperación, herramientas, acción y control.
Si dominas esa base, términos como RAG, MCP, agentes o vibe coding dejan de sonar a jerga y empiezan a convertirse en piezas claras de diseño. Y cuando entiendes esas piezas, ya puedes decidir mejor qué construir, qué evitar y qué merece la pena llevar a producción.

