Un glosario esencial para entender los términos de la inteligencia artificial
La inteligencia artificial ha generado una avalancha de nuevos términos y jerga. Este glosario ofrece definiciones de las palabras y frases más importantes que podrías encontrar en este campo.
La inteligencia artificial está transformando el mundo y, al mismo tiempo, inventando un nuevo lenguaje para describir cómo lo hace. Al leer sobre IA, uno se encuentra rápidamente con términos como LLMs, RAG, RLHF y muchos otros que pueden hacer que incluso las personas más inteligentes del mundo tecnológico se sientan inseguras. Este glosario es un intento de aclarar estas confusiones y se actualizará regularmente a medida que el campo evoluciona, convirtiéndose en un documento vivo, similar a los sistemas de IA que describe.
AGI (Inteligencia General Artificial) es un término nebuloso que generalmente se refiere a una IA que es más capaz que el humano promedio en muchas, si no en la mayoría, de las tareas. El CEO de OpenAI, Sam Altman, describió AGI como el "equivalente de un humano medio que podrías contratar como compañero de trabajo". Por otro lado, la carta de OpenAI define AGI como "sistemas altamente autónomos que superan a los humanos en la mayoría de los trabajos económicamente valiosos". La interpretación de Google DeepMind es ligeramente diferente; ellos ven AGI como "IA que es al menos tan capaz como los humanos en la mayoría de las tareas cognitivas". Si esto te confunde, no te preocupes, ya que muchos expertos en la investigación de IA también están en la misma situación.
Agente de IA se refiere a una herramienta que utiliza tecnologías de IA para realizar una serie de tareas en tu nombre, más allá de lo que podría hacer un chatbot básico, como presentar gastos, reservar boletos o incluso escribir y mantener código. Sin embargo, como se ha explicado anteriormente, hay muchos componentes en este espacio emergente, por lo que el término "agente de IA" puede significar diferentes cosas para diferentes personas. La infraestructura también se está desarrollando para cumplir con sus capacidades previstas. Pero el concepto básico implica un sistema autónomo que puede recurrir a múltiples sistemas de IA para llevar a cabo tareas complejas.
Puntos finales de API pueden pensarse como "botones" en la parte trasera de un software que otros programas pueden presionar para hacer que realice acciones. Los desarrolladores utilizan estas interfaces para construir integraciones, por ejemplo, permitiendo que una aplicación extraiga datos de otra o habilitando un agente de IA para controlar servicios de terceros directamente sin que un humano opere manualmente cada interfaz. La mayoría de los dispositivos inteligentes y plataformas conectadas tienen estos botones ocultos disponibles, incluso si los usuarios comunes nunca los ven o interactúan con ellos. A medida que los agentes de IA se vuelven más capaces, pueden encontrar y usar estos puntos finales por sí mismos, abriendo posibilidades poderosas y a veces inesperadas para la automatización.
Razonamiento en cadena permite a los modelos de IA descomponer un problema en pasos intermedios más pequeños para mejorar la calidad del resultado final. Aunque a menudo lleva más tiempo obtener una respuesta, es más probable que la respuesta sea correcta, especialmente en un contexto lógico o de programación. Los modelos de razonamiento se desarrollan a partir de modelos de lenguaje grande tradicionales y se optimizan para el pensamiento en cadena gracias al aprendizaje por refuerzo.
Agentes de codificación son un concepto más específico que un "agente de IA", lo que significa un programa que puede realizar acciones por su cuenta, paso a paso, para completar un objetivo. Un agente de codificación es una versión especializada aplicada al desarrollo de software. En lugar de simplemente sugerir código para que un humano lo revise y lo pegue, un agente de codificación puede escribir, probar y depurar código de manera autónoma, manejando el tipo de trabajo iterativo y de prueba y error que consume el día de un desarrollador. Estos agentes pueden operar en toda la base de código, detectando errores, ejecutando pruebas y enviando correcciones con una supervisión humana mínima.
Compute (cómputo) se refiere al poder computacional vital que permite a los modelos de IA operar. Este tipo de procesamiento alimenta la industria de IA, dándole la capacidad de entrenar y desplegar sus poderosos modelos. El término a menudo es un atajo para los tipos de hardware que proporcionan el poder computacional, como GPUs, CPUs, TPUs y otras formas de infraestructura que forman la base de la moderna industria de IA.
Aprendizaje profundo es un subconjunto del aprendizaje automático auto-mejorado en el que los algoritmos de IA están diseñados con una estructura de red neuronal artificial (ANN) de múltiples capas. Esto les permite hacer correlaciones más complejas en comparación con los sistemas de aprendizaje automático más simples, como modelos lineales o árboles de decisión. La estructura de los algoritmos de aprendizaje profundo se inspira en las vías interconectadas de las neuronas en el cerebro humano.
Difusión es la tecnología en el corazón de muchos modelos de IA que generan arte, música y texto. Inspirados en la física, los sistemas de difusión "destruyen" lentamente la estructura de los datos, como fotos o canciones, añadiendo ruido hasta que no queda nada. En física, la difusión es espontánea e irreversible. Sin embargo, los sistemas de difusión en IA buscan aprender un proceso de "difusión inversa" para restaurar los datos destruidos.
Destilación es una técnica utilizada para extraer conocimiento de un modelo de IA grande con un modelo de 'profesor-alumno'. Los desarrolladores envían solicitudes a un modelo profesor y registran las salidas. Estas salidas se utilizan para entrenar al modelo alumno, que se entrena para aproximarse al comportamiento del profesor. La destilación puede usarse para crear un modelo más pequeño y eficiente basado en un modelo más grande con una pérdida de destilación mínima.
Ajuste fino se refiere al entrenamiento adicional de un modelo de IA para optimizar su rendimiento para una tarea o área más específica que fue el enfoque previo de su entrenamiento, generalmente alimentando nuevos datos especializados (es decir, orientados a tareas).
GAN (Red Generativa Antagónica) es un tipo de marco de aprendizaje automático que subyace en algunos desarrollos importantes en IA generativa, como las herramientas de "deepfake". Los GANs utilizan un par de redes neuronales, una de las cuales se basa en sus datos de entrenamiento para generar una salida que se pasa a la otra para su evaluación.
Alucinación es el término preferido por la industria de IA para referirse a cuando los modelos de IA inventan información incorrecta. Esto se considera un gran problema para la calidad de la IA. Las alucinaciones producen resultados de GenAI que pueden ser engañosos y pueden llevar a riesgos en la vida real, con consecuencias potencialmente peligrosas.
Inferencia es el proceso de ejecutar un modelo de IA, estableciendo un modelo para hacer predicciones o sacar conclusiones de datos previamente vistos. Muchos tipos de hardware pueden realizar inferencias, pero no todos pueden ejecutar modelos igualmente bien.
Modelo de lenguaje grande (LLM) son los modelos de IA utilizados por asistentes de IA populares. Estos modelos son redes neuronales profundas compuestas por miles de millones de parámetros numéricos que aprenden las relaciones entre palabras y frases y crean una representación del lenguaje.
Memoria caché se refiere a un proceso importante que mejora la inferencia, diseñado para hacerla más eficiente. La memoria caché ahorra cálculos específicos para futuras consultas y operaciones de usuarios.
Red neuronal se refiere a la estructura algorítmica en múltiples capas que subyace en el aprendizaje profundo y en la explosión de herramientas de IA generativa.
Código abierto se refiere a software o modelos de IA cuyo código subyacente está disponible públicamente para que cualquiera lo use, inspeccione o modifique.
Paralelización significa hacer muchas cosas al mismo tiempo en lugar de una tras otra, lo cual es fundamental para el entrenamiento y la inferencia en IA.
RAMageddon es un término divertido para referirse a una tendencia preocupante: una escasez creciente de memoria de acceso aleatorio (RAM), que afecta a la mayoría de los productos tecnológicos que usamos.
Mejora recursiva describe un escenario donde los modelos de IA comienzan a mejorarse a sí mismos sin intervención humana, lo que podría llevar a una aceleración en capacidades y autonomía.
Aprendizaje por refuerzo es un método de entrenamiento de IA donde un sistema aprende probando cosas y recibiendo recompensas por respuestas correctas.
Token son los bloques básicos de comunicación entre humanos y máquinas, representando segmentos discretos de datos procesados o producidos por un LLM.
Rendimiento de tokens se refiere a cuántos trabajos de IA puede manejar un sistema a la vez.
Entrenamiento es el proceso de alimentar datos a un modelo para que aprenda patrones y genere salidas útiles.
Transferencia de aprendizaje es una técnica donde un modelo de IA previamente entrenado se utiliza como punto de partida para desarrollar un nuevo modelo para una tarea diferente.
Pérdida de validación es un número que indica qué tan bien está aprendiendo un modelo de IA durante el entrenamiento, siendo más baja mejor.
Ponderaciones son fundamentales en el entrenamiento de IA, determinando la importancia de diferentes características en los datos utilizados para entrenar el sistema.
Este artículo se actualiza regularmente con nueva información.
Lectura rápida
¿Qué es AGI?
La Inteligencia General Artificial se refiere a una IA que es más capaz que el humano promedio en diversas tareas.
¿Qué hace un agente de IA?
Un agente de IA realiza tareas en nombre de los usuarios, como gestionar gastos o programar citas.
¿Qué es la inferencia en IA?
Es el proceso mediante el cual un modelo de IA hace predicciones basadas en datos previamente vistos.
¿Qué son los LLM?
Los Modelos de Lenguaje Grande son utilizados por asistentes de IA para procesar y generar lenguaje.
¿Qué es la alucinación en IA?
Es cuando un modelo de IA genera información incorrecta, lo que puede resultar en riesgos reales.





