Os modelos de linguagem nao conhecem os dados privados da sua organizacao. O RAG resolve isto recuperando documentos relevantes e fornecendo-os ao modelo no momento da pergunta.
Como funciona
Os documentos sao divididos em fragmentos, convertidos em vetores e indexados. Na pergunta, recuperam-se os fragmentos mais relevantes e o modelo responde fundamentado neles, citando as fontes.
E mais fiavel que afinar um modelo quando a base de conhecimento muda com frequencia.