Moscow Times News Parser

Небольшой скрипт на Python, который парсит свежие новости с раздела
https://www.moscowtimes.ru/news
и сохраняет их в текстовые файлы, сгруппированные по дате.

📌 Что делает скрипт

Открывает страницу новостей The Moscow Times
Извлекает:
- дату публикации
- время
- заголовок
- ссылку на новость
Группирует новости по дате (в формате ДД.ММ.ГГГГ)
Сохраняет их в текстовые файлы (./news/articles-<date>.txt)
Дублирует результат в консоль
Создаёт директорию ./news, если её нет

Скрипт работает на Playwright, запускает Chromium в headless-режиме.

🧰 Технологии

Python 3.10+
Playwright
Регулярные выражения
OS / filesystem API

📦 Установка

1) Создать окружение и установить зависимости через uv

# создать виртуальное окружение (опционально)
uv venv
source .venv/bin/activate

# установить Playwright
uv pip install playwright

# установить браузеры (Chromium)
playwright install chromium

Важно: playwright install ставит бинарники браузера — это не Python-зависимости, поэтому оно вызывается отдельно.

✅ Итоговый быстрый набор

git clone https://github.com/Fanzholl/Moscow_Times_Parser
cd Moscow_Times_Parser

uv venv
source .venv/bin/activate

uv pip install playwright
playwright install chromium

Moscow Times News Parser

A small Python script that scrapes fresh news from https://www.moscowtimes.ru/news and saves them into text files grouped by date.

📌 What the script does

Opens the Moscow Times news page
Extracts:
- publication date
- time
- title
- link
Groups news by date (DD.MM.YYYY)
Saves them to text files (./news/articles-<date>.txt)
Prints extracted data to console
Creates ./news directory if it does not exist

The script uses Playwright and runs Chromium in headless mode.

🧰 Tech Stack

Python 3.10+
Playwright
Regular expressions
OS / filesystem API

📦 Installation

1) Create a virtual environment & install dependencies via uv

# create virtual environment (optional)
uv venv
source .venv/bin/activate

# install Playwright
uv pip install playwright

# install browsers (Chromium)
playwright install chromium

Note: playwright install downloads browser binaries — it is not a Python dependency so it must be installed separately.

✅ Quick Setup

git clone https://github.com/Fanzholl/Moscow_Times_Parser
cd Moscow_Times_Parser

uv venv
source .venv/bin/activate

uv pip install playwright
playwright install chromium

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
.github/ISSUE_TEMPLATE		.github/ISSUE_TEMPLATE
.gitignore		.gitignore
.python-version		.python-version
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
SECURITY.md		SECURITY.md
main.py		main.py
pyproject.toml		pyproject.toml
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Moscow Times News Parser

📌 Что делает скрипт

🧰 Технологии

📦 Установка

1) Создать окружение и установить зависимости через uv

✅ Итоговый быстрый набор

Moscow Times News Parser

📌 What the script does

🧰 Tech Stack

📦 Installation

1) Create a virtual environment & install dependencies via uv

✅ Quick Setup

✈️ Telegram: blacksunder

📧 Mail: whiteparser@icloud.com

About

Uh oh!

Releases 1

Packages

Languages

License

Fanzholl/Moscow_Times_Parser

Folders and files

Latest commit

History

Repository files navigation

Moscow Times News Parser

📌 Что делает скрипт

🧰 Технологии

📦 Установка

1) Создать окружение и установить зависимости через uv

✅ Итоговый быстрый набор

Moscow Times News Parser

📌 What the script does

🧰 Tech Stack

📦 Installation

1) Create a virtual environment & install dependencies via uv

✅ Quick Setup

✈️ Telegram: blacksunder

📧 Mail: whiteparser@icloud.com

About

Topics

Resources

License

Code of conduct

Contributing

Security policy

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Languages

Packages