Nepali Sign Language Characters Classification

A deep learning project for classifying Nepali Sign Language characters using TensorFlow. This project processes sign language images and converts them into TFRecord format for efficient training of neural networks.

For data collection information, see DATA_COLLECTION.md
For data processing information, see DATA_PROCESSING.md
For model training information, see MODEL_TRAINING.md
- For model training strategies, see TRAINING_STRATEGIES.md

Dataset

Download Link: Nepali Sign Language Character Dataset

The dataset contains images of Nepali Sign Language characters (0-35) with two background types:

Plain Background: Clean images with uniform backgrounds
Random Background: Images with varied, realistic backgrounds

Dataset Structure

data/
├── Plain Background/
│   ├── 0/ (Character '0' images)
│   ├── 1/ (Character '1' images)
│   ├── ...
│   └── 35/ (Character '35' images)
└── Random Background/
    ├── 0/ (Character '0' images)
    ├── 1/ (Character '1' images)
    ├── ...
    └── 35/ (Character '35' images)

Project Structure

nsl-classification/
├── data/                    # Raw dataset (Plain & Random Background)
├── tfrecords/               # Processed TFRecord files
│   ├── train.tfrecord       # Training data (70%)
│   ├── val.tfrecord         # Validation data (15%)
│   └── test.tfrecord        # Test data (15%)
├── tfrecord.py              # Data preprocessing script
├── nsl.ipynb                # Main training notebook
├── DATA_PREPARATION.md      # Detailed preprocessing documentation
├── pyproject.toml           # Project dependencies
└── README.md                # README

Features

36 Classes: Nepali Sign Language characters (0-35)
Dual Background Types: Plain and random backgrounds for robustness
TFRecord Format: Optimized binary format for fast training
Stratified Splitting: Balanced train/validation/test splits
Image Preprocessing: Standardized 256x256 pixel images
Progress Tracking: Visual progress bars during data processing

Requirements

Python ≥ 3.12
TensorFlow ≥ 2.20.0
scikit-learn ≥ 1.7.2
tqdm ≥ 4.67.1

Installation

Clone the repository:
```
git clone <repository-url>
cd nsl
```

Install dependencies:

uv sync

Or install manually:

uv add tensorflow scikit-learn tqdm

Usage

1. Data Preparation

Download the dataset from Kaggle
Extract the dataset to the data/ directory
Run the preprocessing script:
```
python3 tfrecord.py
```

This will:

Process all images from both background types
Resize images to 256×256 pixels
Create stratified train/validation/test splits (70%/15%/15%)
Generate optimized TFRecord files in the tfrecords/ directory
Display progress bars for each processing step

2. Model Training

Open and run the Jupyter notebook:

jupyter notebook nsl.ipynb

The notebook includes:

TFRecord loading and parsing
Data augmentation techniques
Model architecture definition
Training loop with validation
Performance evaluation

Data Processing Details

Image Preprocessing

Input: JPEG images of varying sizes
Output: 256×256 RGB images normalized to [0,1]
Format: TFRecord with image and label features

Data Splits

Training: 70% of data for model training
Validation: 15% for hyperparameter tuning
Test: 15% for final model evaluation
Stratification: Maintains class balance across all splits

TFRecord Benefits

Performance: 5-10x faster loading compared to individual image files
Storage: Compressed binary format reduces disk usage
Memory: Efficient batch processing for large datasets
Reproducibility: Consistent data splits across experiments

Model Architecture

The project uses TensorFlow/Keras for building convolutional neural networks suitable for image classification tasks. The notebook explores various architectures optimized for sign language recognition.

Contributing

Fork the repository
Create a feature branch (git checkout -b feature/amazing-feature)
Commit your changes (git commit -m 'Add amazing feature')
Push to the branch (git push origin feature/amazing-feature)
Open a Pull Request

License

This project is open source. Please check the dataset license on Kaggle for data usage terms.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.gitignore		.gitignore
.python-version		.python-version
DATA_COLLECTION.md		DATA_COLLECTION.md
DATA_PROCESSING.md		DATA_PROCESSING.md
LICENSE		LICENSE
README.md		README.md
TRAINING_STRATEGIES.md		TRAINING_STRATEGIES.md
data_collect.py		data_collect.py
nepali_sign_language.ipynb		nepali_sign_language.ipynb
pyproject.toml		pyproject.toml
tfrecord.py		tfrecord.py
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Nepali Sign Language Characters Classification

Dataset

Dataset Structure

Project Structure

Features

Requirements

Installation

Usage

1. Data Preparation

2. Model Training

Data Processing Details

Image Preprocessing

Data Splits

TFRecord Benefits

Model Architecture

Contributing

License

About

Uh oh!

Releases

Packages

Languages

License

Birat-Poudel/Nepali-Sign-Language-Characters-Classification

Folders and files

Latest commit

History

Repository files navigation

Nepali Sign Language Characters Classification

Dataset

Dataset Structure

Project Structure

Features

Requirements

Installation

Usage

1. Data Preparation

2. Model Training

Data Processing Details

Image Preprocessing

Data Splits

TFRecord Benefits

Model Architecture

Contributing

License

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages