Gladia Realtime Demo

Live speech-to-text demo using Gladia's Realtime API V2 with speaker diarization.

🌐 Live Demo: https://gladia-realtime-demo.onrender.com/
Note: Access key required - contact the owner for access

Quick Start

Get API key: app.gladia.io
Clone & setup:

git clone https://github.com/Nelson-PROIA/gladia-realtime-demo
cd gladia-realtime-demo
pip install -r requirements.txt

Configure:

cp .env.example .env
# Edit .env with your settings:
# GLADIA_API_KEY=your_gladia_api_key
# SECRET_KEY=your_flask_secret_key
# ACCESS_KEY=your_demo_access_key (optional - for public deployment security)

Run:

python app.py
# Open http://localhost:8000

Code Structure

├── app.py                    # Flask web app (WebSocket + Gladia API)
├── cli.py                    # Minimal CLI demo (~200 lines)
├── static/
│   ├── index.html           # Main UI
│   ├── login.html           # Access control page
│   ├── app.js               # Frontend (audio capture + Socket.IO)
│   ├── style.css            # Main styling
│   └── login.css            # Login page styling
├── assets/
│   ├── gladia-logo.png      # Logo image
│   └── gladia-logo.ico      # Favicon
├── requirements.txt          # Web app dependencies
├── requirements-cli.txt      # CLI dependencies (includes PyAudio)
├── .env.example             # Environment variables template
└── README.md                # This file

How It Works

Browser captures microphone → Web Audio API (16kHz)
Frontend converts audio → WAV → base64 → Socket.IO
Flask receives audio → forwards to Gladia WebSocket
Gladia transcribes → returns JSON → displayed in UI

CLI Demo

Quick test without web interface:

pip install -r requirements-cli.txt  # Adds PyAudio
python cli.py

Configuration

Web App: Use the UI settings panel

Languages: Auto-detect or select specific languages
Code switching: Only available in auto-detect mode
Custom vocabulary: Boost recognition for specific terms

CLI: Edit create_session() in cli.py:

payload = {
    "language_config": {
        "languages": [],  # Auto-detect
        "code_switching": False
    },
    "realtime_processing": {
        "custom_vocabulary": True,
        "custom_vocabulary_config": {
            "vocabulary": ["Gladia", "API"]
        }
    }
}

Deployment

Render (recommended):

Push to GitHub
Connect repo to Render
Set environment variables: GLADIA_API_KEY
Deploy

API Reference

Gladia Docs: docs.gladia.io
Endpoint: POST https://api.gladia.io/v2/live
Audio format: WAV/PCM, 16kHz, mono
Languages: Multiple languages supported (auto-detect or specific)

Troubleshooting

No audio: Check microphone permissions
No transcription: Verify GLADIA_API_KEY in .env
Poor quality: Add custom vocabulary, reduce noise
CLI issues: Install PyAudio system dependencies

Built by: Nelson PROIA Powered by: Gladia

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Gladia Realtime Demo

Quick Start

Code Structure

How It Works

CLI Demo

Configuration

Deployment

API Reference

Troubleshooting

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
assets		assets
static		static
.env.example		.env.example
.gitignore		.gitignore
README.md		README.md
app.py		app.py
cli.py		cli.py
requirements-cli.txt		requirements-cli.txt
requirements.txt		requirements.txt

Nelson-PROIA/gladia-realtime-demo

Folders and files

Latest commit

History

Repository files navigation

Gladia Realtime Demo

Quick Start

Code Structure

How It Works

CLI Demo

Configuration

Deployment

API Reference

Troubleshooting

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages