VisionExplainr

VisionExplainr is a starter project that explains what is happening in short videos using MediaPipe (pose + hands) and simple heuristics. It produces a timeline of events and human-friendly explanations, and can optionally use OpenAI to polish text and gTTS for audio narration.

Quick start

Create & activate venv:

python -m venv venv
source venv/bin/activate   # Windows: venv\Scripts\activate

Install requirements:
```
pip install -r requirements.txt
```
Add a short test video at example_inputs/sample_video.mp4 (<= 30s recommended).
Run app:
```
streamlit run app.py
```
(Optional) To enable OpenAI polishing, set OPENAI_API_KEY in your environment.

Notes

gTTS requires internet to synthesize audio.
MediaPipe works better with clear, well-lit videos.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
example_inputs		example_inputs
vision_explainr		vision_explainr
README.md		README.md
app.py		app.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

VisionExplainr

Quick start

Notes

About

Uh oh!

Releases

Packages

Languages

akhileshmanitiwari06/VisionExplainr

Folders and files

Latest commit

History

Repository files navigation

VisionExplainr

Quick start

Notes

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages