Qué es: Arquitectura que combina un modelo de lenguaje con un sistema de recuperación de información, permitiendo al agente buscar información en fuentes internas antes de generar la respuesta.
Aplicación en banca: Permite responder con precisión utilizando bases de conocimiento propietarias como políticas internas, fichas de producto, FAQs o bases documentales legales.
Componentes técnicos:
Vector stores (ej. FAISS, Pinecone, Weaviate)
Embeddings (ej. OpenAI, Cohere, BGE)
Pipelines de búsqueda semántica (ej. Haystack, LangChain, LlamaIndex)