🌀 ScrapingFlow

ScrapingFlow é uma API moderna e leve desenvolvida com FastAPI que permite realizar web scraping estruturado de páginas da web, com foco inicial em notícias de tecnologia. O projeto foi criado com o objetivo de oferecer uma base extensível para extração de dados HTML de forma eficiente, leve e compatível com serviços cloud como Azure App Service (sem necessidade de Docker).

🚀 Funcionalidades

📄 /scrape/page — Extrai o título, todos os parágrafos e links de qualquer página HTML.
📰 /scrape/news — Extrai o título e o corpo da matéria de notícias online.
🔤 Retorno em JSON estruturado e limpo.
⚡ Baseado em requests + BeautifulSoup (sem Selenium).
🌐 Compatível com deploy direto em nuvem (ex: Azure App Service, Heroku).

📦 Tecnologias usadas

FastAPI — Framework leve e rápido para APIs REST.
Pydantic — Validação de dados.
Requests — Requisições HTTP.
BeautifulSoup4 — Extração de conteúdo HTML.

⚙️ Como usar

1. Instale as dependências

pip install -r requirements.txt
Ou
pip install fastapi uvicorn requests beautifulsoup4 pydantic

### 2. Inicie o servidor
python -m uvicorn app.main:app --reload
Acesse:
http://localhost:8000/

### 3. Estrutura

ScrapingFlow/
├── app/
│   ├── main.py              # Entrypoint da API
│   ├── scrape_page.py       # Scraper genérico de páginas
│   └── scrape_news.py       # Scraper específico para notícias
├── requirements.txt
├── README.md
└── .gitignore

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
.github/workflows		.github/workflows
app		app
README.md		README.md
requirements.txt		requirements.txt
runtime.txt		runtime.txt
startup.txt		startup.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🌀 ScrapingFlow

🚀 Funcionalidades

📦 Tecnologias usadas

⚙️ Como usar

1. Instale as dependências

About

Uh oh!

Releases

Packages

Languages

rogerioLopesweb/ScrapingFlow

Folders and files

Latest commit

History

Repository files navigation

🌀 ScrapingFlow

🚀 Funcionalidades

📦 Tecnologias usadas

⚙️ Como usar

1. Instale as dependências

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages