Compartimos el Glosario sobre IA Generativa desarrollado por el Banco Interamericano de Desarrollo (BID), en el marco de su programa de formación: «Inteligencia Artificial Generativa: Fundamentos para la Función Pública de América Latina y el Caribe».
A
Aprendizaje automático (machine learning)
El aprendizaje automático o machine learning es una rama de la inteligencia artificial (IA) y la ciencia de la computación que se enfoca en el uso de datos y algoritmos para imitar la forma en que los humanos aprenden, mejorando gradualmente su precisión. El machine learning permite a las computadoras aprender de los datos y mejorar con la experiencia sin ser programadas explícitamente. Se basa en algoritmos que identifican patrones y relaciones en grandes conjuntos de datos, y los usan para construir modelos matemáticos que pueden hacer predicciones o tomar decisiones. Tiene muchas aplicaciones en diversos campos, como la banca, la salud, la educación, el entretenimiento y la seguridad. Algunos ejemplos de machine learning son los asistentes virtuales, los sistemas de reconocimiento facial, los robots, los videojuegos, los traductores automáticos y los coches autónomos (definición generada con herramientas de la IAGen y editada).
Aprendizaje profundo (deep learning)
El aprendizaje profundo o deep learning es un tipo de aprendizaje automático que utiliza redes neuronales artificiales, o que imita el accionar de las redes neuronales, para procesar y comprender grandes cantidades de datos, especialmente datos no estructurados como texto, imágenes, sonido o vídeo. Se inspira en el funcionamiento del cerebro humano, aunque no lo iguala ni lo supera, y permite a las máquinas aprender de forma progresiva y automática las características y los patrones más relevantes para realizar predicciones o decisiones. Tiene muchas aplicaciones en diferentes campos, como la inteligencia artificial, el reconocimiento de voz, la visión por computador, el procesamiento del lenguaje natural, el arte generativo y los vehículos autónomos (definición generada con herramientas de la IAGen y editada).
B
Big data
Big Data es un concepto que se refiere a la gestión y análisis de grandes cantidades de datos que superan la capacidad de las herramientas convencionales. Estos datos pueden provenir de diversas fuentes y presentar diferentes formatos, como texto, audio, video, etc. El Big Data tiene como objetivo extraer valor e información útil de estos datos para mejorar la toma de decisiones, optimizar procesos, generar conocimiento o crear nuevos productos o servicios. Se caracteriza por las llamadas “tres V”: volumen, velocidad y variedad. A estas se han añadido otras dos: valor y veracidad. Estas dimensiones indican el tamaño, la rapidez, la diversidad, la relevancia y la calidad de los datos que se manejan (definición generada con herramientas de la IAGen y editada).
C
Chatbot
Un chatbot o agente conversacional es un asistente virtual – un programa de computación que simula una conversación con una persona, sea hablada o escrita. Cuando la persona usuaria realiza una pregunta en la conversación o formula un comando, el chatbot responde o ejecuta la acción solicitada. Básicamente, el chatbotutiliza una base de conocimientos que consta de una colección de preguntas y sus respuestas, que son identificadas con base en palabras clave introducidas en la conversación. Los avances en la inteligencia artificial, y específicamente en el aprendizaje automático (machine learning), han hecho posible crear agentes conversacionales más avanzados, que utilizan el Procesamiento Natural del Lenguaje (Natural Language Processing – NLP) por lo que pueden simular más una conversación que parece humana, y tener la capacidad de aprender de las interacciones con las personas.
Context Window
Ver Ventana de Contexto.
D
Datos sintéticos
Los datos sintéticos son datos que se generan de forma artificial, mediante programas de computadora o algoritmos, para simular los datos del mundo real. Se utilizan para entrenar y probar modelos de aprendizaje automático, especialmente cuando los datos reales son escasos, costosos o sensibles. Pueden tener las mismas características y propiedades que los datos reales, como el tipo, la distribución, el ruido y la separación de clases, pero sin revelar información personal o confidencial. Los datos sintéticos pueden ayudar a mejorar la precisión, la robustez y la generalización de los modelos de aprendizaje automático, así como a reducir el tiempo y el costo de su desarrollo. Algunos ejemplos de aplicaciones de los datos sintéticos son la visión por computadora, el procesamiento del lenguaje natural, la conducción autónoma y la salud (definición generada con herramientas de la IAGen y editada).
Deep learning
Ver Aprendizaje profundo.
Difussion model
Ver Modelo de difusión.
G
Gemini
Inteligencia Artificial de Google, pero que no tiene mucha precisión.
General Artificial Intelligence (Inteligencia Artificial General)
Ver Inteligencia Artificial General.
Generative Adversarial Network (GAN)
Ver Red Adversaria Generativa.
GitHub
Una de las principales plataformas para crear proyectos abiertos de herramientas y aplicaciones, caracterizada sobre todo por sus funciones colaborativas que ayudan a que varias personas puedan contribuir a mejorar el código. El código de los proyectos que sean abiertos puede ser descargado y revisado por cualquier usuario/usuaria, lo que ayuda a mejorar el producto y crear ramificaciones a partir de él. También pueden crearse proyectos privados, si se prefiere que el código no se vea. GitHub pertenece a Microsoft.
Gran Modelo de Lenguaje
Ver Large Language Model (LLM).
I
Imagen semántica
Una imagen semántica es una imagen que tiene un significado o un sentido asociado a ella, más allá de su representación visual. Una imagen semántica puede transmitir un mensaje, una idea, una emoción, una intención o una valoración, dependiendo del contexto y de la interpretación del receptor. Se compone de dos niveles: el nivel denotativo y el nivel connotativo. El nivel denotativo es el significado literal o directo de la imagen, lo que se ve en ella sin ninguna interpretación. Por ejemplo, el nivel denotativo de una imagen de una nube es que se trata de una nube, sin más. El nivel connotativo es el significado figurado o indirecto de la imagen, lo que se sugiere o se implica con ella, según el código cultural, la intencionalidad del emisor o la percepción del receptor. Por ejemplo, el nivel connotativo de una imagen de una nube puede ser que se refiere a un estado de ánimo triste, a una amenaza de lluvia, a una forma imaginaria o a un símbolo religioso (definición generada con herramientas de la IAGen y editada).
Inteligencia Artificial
La inteligencia artificial (IA) es un campo científico y tecnológico que crea máquinas y programas informáticos capaces de imitar o superar capacidades cognitivas y de resolución de problemas humanos, como el aprendizaje, el razonamiento, la percepción, el lenguaje y la creatividad. La inteligencia artificial se basa en el análisis y procesamiento de grandes cantidades de datos, utilizando algoritmos y modelos matemáticos que simulan el funcionamiento de las redes neuronales del cerebro humano. Existen diversos tipos de IA: IA Estrecha, IA General (GAI), IA Superinteligente, e IA Generativa (IAGen) (definición generada con herramientas de la IAGen y editada).
Inteligencia Artificial Estrecha (Narrow Artificial Intelligence)
Es la IA que vemos en nuestro día a día. Está diseñada para realizar una tarea específica, como recomendarte canciones en Spotify o responder a tus preguntas en Siri (definición generada con herramientas de la IAGen y editada).
Inteligencia Artificial General (General Artificial Intelligence)
Este tipo de IA puede entender, aprender y aplicar su conocimiento a cualquier tarea, al igual que un humano. Aunque es un concepto fascinante, aún no se ha conseguido crear una verdadera Inteligencia Artificial General (definición generada con herramientas de la IAGen y editada).
Inteligencia Artificial Generativa
La inteligencia artificial generativa es un tipo de inteligencia artificial que puede crear contenido nuevo y original a partir de datos existentes o de comandos dados por el usuario. La inteligencia artificial generativa utiliza modelos matemáticos complejos que aprenden los patrones y la estructura de los datos de entrada, como texto, imágenes, sonido o vídeo, y luego generan nuevos datos que tienen características similares o que cumplen ciertos criterios. La inteligencia artificial generativa tiene muchas aplicaciones potenciales en diversos campos, como el arte, la música, la literatura, el diseño, la educación, la medicina y el entretenimiento. Algunos ejemplos de inteligencia artificial generativa son los bots conversacionales, los sistemas de arte de inteligencia artificial, los traductores automáticos y los videojuegos (definición generada con herramientas de la IAGen y editada).
Inteligencia Artificial Superinteligente (Superintelligent Artificial Intelligence)
Este es un tipo teórico de IA que no solo iguala, sino que supera la capacidad cognitiva de los humanos. Podría realizar cualquier tarea intelectual que un humano pueda hacer, y aún más (definición generada con herramientas de la IAGen y editada).
J
JSON
Es un formato de intercambio de datos ligero y fácil de leer. Es un subconjunto de la notación literal de objetos de JavaScript, utilizado para tareas tales como: intercambio de datos entre aplicaciones y sistemas, almacenamiento de datos en archivos, y comunicación entre aplicaciones (definición generada con herramientas de la IAGen y editada).
L
LaMDA (Language Model for Dialogue Applications)
LaMDA es el acrónimo de Language Model for Dialogue Applications, que significa Modelo de Lenguaje para Aplicaciones de Diálogo. Es una tecnología de inteligencia artificial desarrollada por Google que permite generar conversaciones naturales y fluidas sobre una variedad de temas. Se basa en la arquitectura Transformer, una red neuronal que puede leer, comprender y predecir el lenguaje humano. A diferencia de otros modelos de lenguaje, LaMDA se entrenó con diálogos, lo que le permite captar las sutilezas y el contexto de las conversaciones abiertas. LaMDA es un avance en el campo del procesamiento del lenguaje natural que podría abrir nuevas formas de interactuar con la tecnología y nuevas categorías de aplicaciones útiles (definición generada con herramientas de la IAGen y editada).
Large Language Model (LLM)
Un Large Language Model (LLM) o Gran Modelo de Lenguaje en español, es un modelo de inteligencia artificial que puede reconocer, generar, resumir, traducir y predecir textos y otros tipos de contenidos basándose en el conocimiento adquirido de enormes conjuntos de datos. Utiliza técnicas de redes neuronales con muchos parámetros para procesar los lenguajes humanos o los textos usando técnicas de aprendizaje automático (machine learning). Un LLM se entrena con una gran cantidad de datos antes de que pueda recordar los patrones y las estructuras del lenguaje (definición generada con herramientas de la IAGen y editada).
M
Machine Learning
Ver Aprendizaje automático.
Modelo de diffusion (diffusion model)
Un modelo de difusión es un tipo de modelo de aprendizaje automático que se basa en la idea de simular el proceso de difusión de los datos en un espacio latente. La difusión es un fenómeno físico que describe cómo las partículas se mueven de forma aleatoria desde zonas de mayor concentración a zonas de menor concentración. En el contexto del aprendizaje automático, la difusión se puede aplicar a los datos para añadirles ruido y hacerlos más borrosos o aleatorios. Un modelo de difusión aprende a invertir este proceso y a recuperar los datos originales a partir de los datos difundidos. De esta forma, el modelo puede aprender la estructura latente de los datos y generar nuevos datos similares a los originales. Un ejemplo de aplicación de los modelos de difusión es la generación de imágenes. Un modelo de difusión puede empezar con una imagen de ruido blanco y aplicarle un proceso inverso de difusión para generar una imagen natural. La herramienta de IAG DALL-E 2 de OpenAI utiliza modelos de difusión para la generación de imágenes (definición generada con herramientas de la IAGen y editada).
N
Narrow Artificial Intelligence
Ver Inteligencia Artificial Estrecha.
Neural network
Ver Red neural.
P
PaLM (Pathways Language Model)
Gran Modelo de Lenguaje (LLM) de Google, basado en aprendizaje automático e inteligencia artificial responsable. Se destaca en tareas de razonamiento avanzado, incluidos código y matemáticas, clasificación y respuesta a preguntas, traducción y dominio multilingüe, y generación de lenguaje natural. Puede realizar estas tareas gracias a la forma en que fue construido: combinando un escalado óptimo para la computación, una combinación mejorada de conjuntos de datos y mejoras en la arquitectura del modelo. PaLM 2 se basa en el enfoque de Google para crear e implementar IA de manera responsable. Todas las versiones de PaLM 2 se evalúan rigurosamente para detectar posibles daños y sesgos, capacidades y usos posteriores en investigación y aplicaciones en productos (Fuente: AI across Google: PaLM2).
Procesamiento Natural del Lenguaje (PNL)
El Procesamiento Natural del Lenguaje (PNL) es una rama de la inteligencia artificial que se ocupa de la interacción entre las computadoras y el lenguaje humano. Su objetivo es crear sistemas que puedan entender, analizar, generar y traducir textos o voces en diferentes idiomas, de forma similar a como lo hacen las personas. Se basa en el uso de modelos matemáticos, algoritmos y técnicas de aprendizaje automático para procesar y extraer información de los datos lingüísticos. Algunas de las aplicaciones del PNL son los asistentes virtuales, los motores de búsqueda, los sistemas de traducción automática, el análisis de sentimientos, el resumen de textos, el reconocimiento de voz, la generación de contenido y la respuesta a preguntas (definición generada con herramientas de la IAGen y editada).
Prompt
Un promptes una palabra o frase que se utiliza para solicitar una respuesta o acción de un modelo de lenguaje artificial. Un prompt puede tener diferentes propósitos, como iniciar una conversación, generar contenido creativo, resolver una pregunta o realizar una tarea específica. Un prompt puede ser simple o complejo, dependiendo del nivel de detalle y especificidad que se quiera obtener del modelo. Un prompt simple suele contener una sola instrucción o pregunta, mientras que un prompt complejo puede incluir varias condiciones, ejemplos, restricciones o formatos que el modelo debe seguir. Los promptsson una herramienta fundamental para interactuar con los modelos de lenguaje artificial y obtener resultados útiles y relevantes. Se basan en el principio de que los modelos de lenguaje aprenden a partir de los datos con los que se entrenan, y por lo tanto pueden imitar el estilo, el tono y el contenido de esos datos. Al diseñar un prompt, se debe tener en cuenta el tipo y la calidad de los datos que el modelo ha visto, así como el objetivo y el contexto. Un buen promptdebe ser claro, coherente, conciso y consistente con los datos del modelo (definición generada con herramientas de la IAGen y editada).
R
Red Adversaria Generativa (Generative Adversarial Network)
Una Red Adversaria Generativa (GAN por sus siglas en inglés), es un tipo de modelo de inteligencia artificial que puede generar datos nuevos y realistas a partir de una distribución aprendida. Una GAN está formada por dos redes neuronales que compiten entre sí: un generador y un discriminador. El generador intenta crear datos falsos que parezcan auténticos, mientras que el discriminador intenta distinguir entre los datos reales y los falsos. El objetivo de la GAN es que el generador engañe al discriminador y produzca datos que no se puedan diferenciar de los reales. Por ejemplo, una GAN puede generar imágenes de rostros humanos, animales, paisajes o cualquier otro tipo de imagen que haya aprendido a partir de un conjunto de datos. Algunas aplicaciones de las GAN son el diseño gráfico, la mejora de imágenes, la traducción de texto a imagen, la visión nocturna y la creación de arte(definición generada con herramientas de la IAGen y editada).
Red Neuronal Artificial (Artificial Neural Network)
Una Red Neuronal Artificial es un modelo computacional que se inspira en la estructura y el funcionamiento del cerebro humano. Consiste en un conjunto de unidades de procesamiento llamadas neuronas artificiales, que se conectan entre sí mediante enlaces ponderados. Cada neurona recibe una serie de entradas, las combina mediante una función matemática y produce una salida. La salida de una neurona puede ser la entrada de otra, formando así una red de capas. El objetivo de una red neuronal es aprender a realizar una tarea específica, como clasificar datos, reconocer patrones o generar contenido, a partir de ejemplos o experiencias previas. Para ello, la red neuronal ajusta los pesos de los enlaces mediante un proceso de entrenamiento, que consiste en comparar las salidas obtenidas con las salidas deseadas y corregir los errores. De esta forma, la red neuronal mejora su rendimiento y se adapta a los datos (definición generada con herramientas de la IAGen y editada).
S
Superintelligent Artificial Intelligence (Inteligencia Artificial Superinteligente)
Ver Inteligencia Artificial Superinteligente.
T
Token
En el contexto de la inteligencia artificial generativa, un token se refiere a una unidad mínima de procesamiento en los modelos de IA. Por ejemplo, la oración “Hola, ¿cómo estás?” tiene seis tokens: “Hola”, “,”, “¿”, “cómo”, “estás”, y «?». Los sistemas de IA generativa, como GPT-3, LaMDA, LLaMA, BLOOM, GPT-4 y otros, son entrenados en palabras o tokens de palabras (definición generada con herramientas de la IAGen y editada).
Transformer
Un transformer es una tecnología que permite a las computadoras entender y generar lenguaje humano de forma natural y fluida. Es como un traductor inteligente que puede convertir una frase en otra frase, pero también puede crear frases nuevas y originales sobre cualquier tema. Funciona con redes neuronales, que son modelos matemáticos que imitan el funcionamiento del cerebro humano. Usa una parte especial de las redes neuronales llamada atención, que le permite prestar atención a las palabras más importantes o relevantes de una frase, y así captar el sentido y el contexto de lo que se dice o se quiere decir. Es una tecnología muy avanzada y útil para muchas aplicaciones, como la traducción, la generación de textos, la búsqueda de información, la asistencia virtual, el entretenimiento y la educación(definición generada con herramientas de la IAGen y editada).
V
Ventana de Contexto (Context Window)
La ventana de contexto es el segmento de datos de entrada que el usuario introduce en el momento de la interacción, que los LLM utilizan para generar respuestas. Es como la «memoria a corto plazo» del modelo. A diferencia de la memoria humana, que puede recordar eventos o información del pasado sin recordatorios constantes, los LLM dependen completamente de esta ventana de contexto para cualquier información previa. Cuando un usuario interactúa con un LLM, planteando una pregunta o dando una instrucción, el modelo no «recuerda» interacciones pasadas. En cambio, procesa y responde al contexto inmediato proporcionado. Por lo tanto, si se omite un detalle o comando importante, el LLM no tiene forma de acceder a él a menos que esté dentro de su ventana de contexto actual (Fuente: Prompt Engineering Institute (2023), StatisticalorSentient?Understandingthe LLMMind -Part 1 -Memory)