Model Fine Tuning by rajeman · Pull Request #2048 · ed-donner/llm_engineering

rajeman · 2026-03-05T00:52:51Z

Week 6 Exercise — Emmanuel

Fine-tuning a model to predict a student's salary package (LPA) based on their academic and skill profile.

Overview

Uses the Student Placement Prediction dataset from Kaggle. The model is fine-tuned via OpenAI's API (GPT-4.1-nano) to predict salary in LPA (lakhs per annum) from student features.

Features & Target

Features: branch, college_tier, cgpa, coding_skills, aptitude_score, communication_skills, ml_knowledge
Target: salary_package_lpa

Pipeline

Load & clean — Download dataset via kagglehub, normalize columns, handle missing values
Split — Train (60%), validation (20%), test (20%)
Prepare JSONL — Format as user/assistant message pairs for OpenAI fine-tuning
Upload & fine-tune — Upload JSONL to OpenAI, create fine-tuning job (gpt-4.1-nano)
Evaluate — Custom evaluator on test set: MAE, RMSE, R², error trend chart, actual vs predicted scatter. Plots saved to plots/

model fine tuning

a0f5727

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Model Fine Tuning#2048

Model Fine Tuning#2048
rajeman wants to merge 1 commit intoed-donner:mainfrom
rajeman:emm-week-6

rajeman commented Mar 5, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

rajeman commented Mar 5, 2026

Week 6 Exercise — Emmanuel

Overview

Features & Target

Pipeline

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant