Un LLM (Large Language Model) o Gran Modelo de Lenguaje es un tipo de Inteligencia Artificial diseñado específicamente para entender, procesar y generar lenguaje humano (texto) a gran escala. Son «grandes» tanto por la enorme cantidad de datos con los que se entrenan (a menudo, gran parte de internet) como por el número masivo de parámetros (conexiones internas) que tienen.
Piensa en ellos como cerebros digitales especializados en lenguaje. Han «leído» miles de millones de páginas web, libros y textos, aprendiendo gramática, vocabulario, contexto, estilos de escritura e incluso ciertos tipos de razonamiento y conocimiento del mundo a partir de esos textos. Esto les permite realizar tareas asombrosas como mantener conversaciones coherentes (chatbots), traducir idiomas, resumir documentos largos, escribir artículos, generar código de programación y mucho más.
Modelos como GPT (el que impulsa a ChatGPT), Claude, Gemini o Llama son ejemplos de LLMs. Son la base de muchas de las aplicaciones de IA generativa que vemos hoy en día.