Retrieval Augmented Generation

Jacques Wainer

10-10-2023

Primeiro projeto

(em contraste com responder perguntas baseado em tabelas/banco de dados do SEADE)

Conceito central: embeddings

Embeddings: converte uma sentença (ou coisa parecida) em um vetor de números, de tal forma que o vetor contem/representa o conteúdo da sentença.

Em particular, sentenças com conteúdo parecido vão resultar em vetores perto um do outro.

Ideia central

variações

proposta de encaminhamento

Questões

Decisões de implementação

Fontes

Video

https://www.youtube.com/watch?v=Q-uEhJMu3ak

https://www.youtube.com/watch?v=T-D1OfcDW1M

Vector data bases

https://thenewstack.io/top-5-vector-database-solutions-for-your-ai-project/

https://byby.dev/vector-databases

Programas

https://github.com/Anil-matcha/ChatPDF

https://github.com/anis-marrouchi/chatpdf-gpt

https://python.langchain.com/docs/additional_resources/tutorials

https://python.langchain.com/docs/use_cases/question_answering/