Ferramenta automatizada para baixar currículos Lattes do CNPq com bypass de reCAPTCHA
Funcionalidades • Início Rápido • Instalação • Configuração • Uso • Licença
Idiomas: 🇺🇸 English • 🇪🇸 Español
- Visão Geral
- Sobre o Desenvolvedor
- Funcionalidades Principais
- Stack Tecnológico
- Início Rápido
- Instalação
- Configuração
- Uso
- Deploy como Serviço
- Estrutura do Projeto
- Licença
- Aviso Legal
O Baixador de Currículo Lattes CNPq é uma ferramenta automatizada projetada para baixar currículos da Plataforma Lattes do CNPq. O sistema ignora automaticamente a proteção reCAPTCHA usando o serviço 2Captcha, permitindo extração de currículos de forma eficiente e sem interrupções.
Principais capacidades:
- Resolução automática de reCAPTCHA com integração 2Captcha
- Interface web Flask para downloads fáceis de currículos
- Gerenciamento de cookies para controle de sessão
- Extração automática de currículos em XML
- Sistema de armazenamento local para arquivos baixados
- Script de linha de comando para processamento em lote
- Suporte a serviço systemd para deploy em produção
Perfeito para:
- Pesquisadores acadêmicos
- Departamentos de RH
- Projetos de coleta de dados
- Análise acadêmica
- Instituições de pesquisa
Desenvolvido por Rafael Vieira (TechBeme)
Desenvolvedor Full-Stack & Especialista em Automação
Especializado em web scraping, sistemas de automação, desenvolvimento de bots e soluções de bypass de reCAPTCHA.
- 🔍 Web Scraping & Extração de Dados
- 🤖 Desenvolvimento de Bots & Automação
- 🛡️ Soluções de Bypass de CAPTCHA
- 💻 Desenvolvimento Full-Stack (Python, Flask, Next.js, React)
- ⚡ Automação de Processos & Workflows
- 📊 Processamento & Análise de Dados
🇺🇸 English • 🇧🇷 Português • 🇪🇸 Español
Email: contact@techbe.me
- Resolução automática de reCAPTCHA usando API 2Captcha
- Alta taxa de sucesso com geração confiável de tokens
- Tratamento de erros e mecanismos de retry
- Interface web limpa e intuitiva baseada em Flask
- Status de download em tempo real
- Entrada de ID de currículo via formulário
- Servir arquivos automaticamente
- Armazenamento automático de arquivos locais na pasta
resumes/ - Cache de arquivos para evitar downloads duplicados
- Extração de currículos XML de arquivos ZIP
- Nomenclatura organizada de arquivos com ID Lattes
- Interface web com Flask (
run.py) - Script de linha de comando (
cnpq.py) - Interface web alternativa (
render.py) - Serviço systemd para deploy em produção
- Sistema de logging abrangente
- Rastreamento de informações de debug
- Relatórios de erros e monitoramento
- Python 3.7 ou superior
- Chave API 2Captcha (Obtenha uma aqui)
- ID Lattes do CNPq (número de 16 dígitos)
git clone https://github.com/TechBeme/cnpq.git
cd cnpqpip install -r requirements.txtCopie config.ini.example para config.ini e adicione suas credenciais:
[DEFAULT]
recaptcha_key = 6LeIxAcTAAAAAJcZVRqyHh71UMIEGNQ_MXjiZKhI
[TWOCAPTCHA]
API_KEY = sua_chave_api_2captcha_aquipython run.pyAcesse a aplicação em http://localhost:5000
# Clone o repositório
git clone https://github.com/TechBeme/cnpq.git
cd cnpq
# Crie um ambiente virtual (recomendado)
python -m venv venv
source venv/bin/activate # No Windows: venv\Scripts\activate
# Instale as dependências
pip install -r requirements.txt
# Configure
cp config.ini.example config.ini
# Edite config.ini com suas credenciais
# Execute
python run.py# Instale e configure como acima
# Então configure o serviço systemd
sudo cp cnpq.service /etc/systemd/system/
sudo systemctl daemon-reload
sudo systemctl enable cnpq
sudo systemctl start cnpq
sudo systemctl status cnpqCrie um arquivo config.ini baseado em config.ini.example:
[DEFAULT]
# Chave do site reCAPTCHA do CNPq (geralmente esta)
recaptcha_key = 6LeIxAcTAAAAAJcZVRqyHh71UMIEGNQ_MXjiZKhI
[TWOCAPTCHA]
# Sua chave API do 2Captcha
API_KEY = sua_chave_api_2captcha_aqui- Cadastre-se em 2Captcha
- Navegue até seu painel
- Copie sua chave API
- Cole no arquivo
config.ini
Os IDs Lattes são números de 16 dígitos encontrados nas URLs dos currículos Lattes do CNPq:
http://lattes.cnpq.br/1234567890123456
^^^^^^^^^^^^^^^^
ID Lattes
-
Inicie o servidor Flask:
python run.py
-
Abra seu navegador e vá para
http://localhost:5000 -
Digite o ID Lattes (16 dígitos)
-
Clique em "Download"
-
O arquivo XML será baixado automaticamente
Nota: Os arquivos baixados são armazenados na pasta resumes/ com o formato {id_lattes}.xml
Para downloads únicos sem a interface web:
python cnpq.pyNota: Edite o script para definir o ID Lattes desejado antes de executar.
Uma versão simplificada sem logging ou cache:
python render.pyO arquivo cnpq.service incluído permite executar a aplicação como um serviço systemd.
Instalação:
# Copie o arquivo de serviço
sudo cp cnpq.service /etc/systemd/system/
# Atualize os caminhos no arquivo de serviço se necessário
sudo nano /etc/systemd/system/cnpq.service
# Recarregue o systemd
sudo systemctl daemon-reload
# Habilite o serviço (iniciar no boot)
sudo systemctl enable cnpq
# Inicie o serviço
sudo systemctl start cnpq
# Verifique o status
sudo systemctl status cnpqComandos de Gerenciamento:
# Iniciar
sudo systemctl start cnpq
# Parar
sudo systemctl stop cnpq
# Reiniciar
sudo systemctl restart cnpq
# Ver logs
sudo journalctl -u cnpq -fcnpq/
├── cnpq.py # Script de linha de comando
├── run.py # Aplicação Flask principal com logging
├── render.py # Aplicação Flask alternativa
├── config.ini.example # Template de configuração
├── config.ini # Sua configuração (ignorada pelo git)
├── cnpq.service # Arquivo de serviço systemd
├── requirements.txt # Dependências Python
├── templates/
│ └── index.html # Template da interface web
├── resumes/ # Arquivos de currículo baixados
└── cnpq.log # Logs da aplicação
Licença Proprietária - Todos os Direitos Reservados
Copyright © 2026 Rafael Vieira (TechBeme)
- Sem uso comercial sem permissão explícita
- Sem modificações ou trabalhos derivados
- Sem distribuição ou sublicenciamento
- Sem engenharia reversa
- Sem hospedagem pública sem autorização
- Visualizar código-fonte para fins educacionais
- Executar para uso pessoal e de pesquisa não comercial
- Fork para estudo pessoal apenas (não para distribuição)
Para uso comercial, soluções white-label ou desenvolvimento personalizado:
Contato: contact@techbe.me
Esta ferramenta é fornecida apenas para fins educacionais e de pesquisa.
- Este projeto é independente e NÃO afiliado ao CNPq ou ao governo brasileiro
- Os usuários são responsáveis pela conformidade com os Termos de Serviço do CNPq
- Coleta apenas dados publicamente disponíveis
- Limitação de taxa integrada para respeitar recursos do servidor
- Os usuários devem cumprir as leis de proteção de dados aplicáveis (LGPD, GDPR, etc.)
- O desenvolvedor não é responsável pelo uso indevido desta ferramenta
Use com responsabilidade e ética.
Construído com:
- Flask - Framework web
- 2Captcha - Serviço de resolução de reCAPTCHA
- Requests - Biblioteca HTTP
- Gunicorn - Servidor HTTP WSGI
Desenvolvido por Rafael Vieira