📘 RAG com LangChain e OpenRouter

Este projeto implementa um sistema de RAG (Retrieval-Augmented Generation) utilizando LangChain, FAISS para indexação vetorial, embeddings do Hugging Face e modelos LLM via OpenRouter.

O objetivo é responder perguntas de forma contextualizada com base em um documento PDF.
Para demonstração, foi utilizado um PDF contendo receitas de bolos caseiros, servindo como exemplo de aplicação prática.

Interface do Projeto

⚙️ Funcionalidades

📂 Carregamento de documentos no formato PDF.
✂️ Divisão inteligente do texto em chunks com sobreposição para manter o contexto.
🧩 Geração de embeddings vetoriais utilizando modelos do Hugging Face.
🔎 Indexação com FAISS para busca semântica rápida e eficiente.
🤖 Integração com modelos LLM via OpenRouter.
✅ Respostas sempre baseadas no documento fornecido, evitando alucinações.

📂 Estrutura do Projeto

├── app.py              # Interface com Streamlit
├── rag.py              # Núcleo do RAG: carregamento, indexação e resposta
├── receitas_bolos.pdf  # Documento de referência
├── requirements.txt    # Dependências do projeto
└── README.md

🚀 Como Executar

1. Instale o Conda

Se ainda não tiver o Conda, você pode instalar o Miniconda (mais leve) ou o Anaconda.

Exemplo de instalação do Miniconda no Linux/macOS:

Baixe o instalador (Linux)

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh

Ou no macOS (Apple Silicon)

curl -LO https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-arm64.sh

Instale

bash Miniconda3-latest-*.sh

No Windows, basta baixar o instalador gráfico do site oficial e seguir os passos.

Depois da instalação, reinicie o terminal e verifique:

conda --version

⸻

Crie e ative o ambiente virtual

conda create -n rag-env python=3.12 -y
conda activate rag-env

⸻

Clone o repositório

git clone https://github.com/seu-usuario/seu-repo.git
cd seu-repo

⸻

Instale as dependências

pip install -r requirements.txt

⸻

Configure as variáveis de ambiente

Crie um arquivo .env na raiz do projeto:

OPENROUTER_API_KEY=sk-or-xxxxxxxxxxxxxxxxxxxxxxxx

⚠️ Lembre-se de criar a chave no OpenRouter. É gratuito, ótimo para testes rápidos.

⸻

Execute a aplicação

Rode interface Streamlit:

streamlit run app.py

⸻

🧠 Principais Componentes

🔑 Carregamento e indexação do PDF

loader = PyMuPDFLoader("receitas_bolos.pdf")
docs = loader.load()

splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
splits = splitter.split_documents(docs)

vectorstore = FAISS.from_documents(splits, embeddings)
retriever = vectorstore.as_retriever(search_kwargs={"k": 3})

🔎 Recuperação e resposta

def responder_pergunta(pergunta: str) -> str:
    docs = retriever.invoke(pergunta)
    contexto = "\n\n".join([d.page_content for d in docs])
    mensagens = prompt.format_messages(context=contexto, question=pergunta)
    resposta = llm.invoke(mensagens)
    return resposta.content

⸻

📚 Tecnologias Utilizadas

LangChain – Orquestração do fluxo RAG.
FAISS – Indexação e busca vetorial semântica.
Hugging Face Sentence Transformers – Criação de embeddings.
OpenRouter – Acesso a modelos LLM.
Streamlit – Interface interativa (opcional).
Conda – Gerenciamento de ambientes.

💡 Observações

As respostas são sempre extraídas do PDF fornecido.
Caso a pergunta não esteja relacionada ao documento, o modelo responde educadamente que não pode responder.
O modelo padrão é mistralai/mistral-7b-instruct:free, mas pode ser substituído por outros disponíveis no catálogo do OpenRouter.

⸻

Autor: Gabriel W. A. Matias

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
__pycache__		__pycache__
.gitignore		.gitignore
README.md		README.md
app.py		app.py
explicação do código.pdf		explicação do código.pdf
image.png		image.png
rag.py		rag.py
receitas_bolos.pdf		receitas_bolos.pdf
requirements.txt		requirements.txt
retrieve.png		retrieve.png
split.png		split.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

📘 RAG com LangChain e OpenRouter

Interface do Projeto

⚙️ Funcionalidades

📂 Estrutura do Projeto

🚀 Como Executar

1. Instale o Conda

Baixe o instalador (Linux)

Ou no macOS (Apple Silicon)

Instale

🧠 Principais Componentes

🔑 Carregamento e indexação do PDF

🔎 Recuperação e resposta

📚 Tecnologias Utilizadas

💡 Observações

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

ligia-ufpe/rag

Folders and files

Latest commit

History

Repository files navigation

📘 RAG com LangChain e OpenRouter

Interface do Projeto

⚙️ Funcionalidades

📂 Estrutura do Projeto

🚀 Como Executar

1. Instale o Conda

Baixe o instalador (Linux)

Ou no macOS (Apple Silicon)

Instale

🧠 Principais Componentes

🔑 Carregamento e indexação do PDF

🔎 Recuperação e resposta

📚 Tecnologias Utilizadas

💡 Observações

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages