Aplikasi web berbasis Streamlit untuk memprediksi potensi dropout mahasiswa menggunakan Machine Learning (Random Forest).
- Prediksi Individu: Input data satu mahasiswa untuk prediksi real-time
- Prediksi Batch: Upload CSV untuk prediksi massal
- Visualisasi Hasil: Dashboard interaktif dengan metrik dan confidence score
- Download Template: Template CSV untuk memudahkan input data batch
- Informasi Model: Detail tentang model dan cara penggunaan
pip install -r requirements.txtPastikan file model_rf.bin ada di folder yang sama dengan app.py
streamlit run app.pyAplikasi akan terbuka di browser pada http://localhost:8501
Model membutuhkan data berikut:
- Usia saat mendaftar (15-80 tahun)
- Status beasiswa (Ya/Tidak)
- Status utang (Ya/Tidak)
- Status pembayaran UKT (Lancar/Tidak Lancar)
- SKS yang diambil (0-24)
- SKS yang lulus (0-24)
- IPS - Indeks Prestasi Semester (0-20)
- SKS yang diambil (0-24)
- SKS yang lulus (0-24)
- IPS - Indeks Prestasi Semester (0-20)
UasML2/
├── app.py # Aplikasi utama Streamlit
├── model_rf.bin # Model Random Forest
├── requirements.txt # Dependencies Python
└── README.md # Dokumentasi
- Download template CSV dari aplikasi
- Isi data mahasiswa sesuai kolom:
usia: Usia saat mendaftarbeasiswa: 0 (Tidak) atau 1 (Ya)utang: 0 (Tidak) atau 1 (Ya)bayar_ukt: 0 (Tidak Lancar) atau 1 (Lancar)sks1_enrolled: SKS diambil semester 1sks1_approved: SKS lulus semester 1nilai1: IPS semester 1sks2_enrolled: SKS diambil semester 2sks2_approved: SKS lulus semester 2nilai2: IPS semester 2
- Upload file CSV ke aplikasi
- Download hasil prediksi
Model menghasilkan 3 kemungkinan status:
- Dropout (0): Mahasiswa berpotensi dropout
- Enrolled (1): Mahasiswa masih aktif
- Graduate (2): Mahasiswa akan lulus
Setiap prediksi dilengkapi dengan:
- Status prediksi
- Confidence score (%)
- Rekomendasi tindakan (jika diperlukan)
- Pastikan file
model_rf.binada di folder yang sama denganapp.py
- Model ini dirancang untuk dataset dengan struktur fitur standar
- Jika terjadi error, sesuaikan mapping fitur di
app.pysesuai dengan model Anda
- Pastikan format CSV sesuai dengan template
- Periksa bahwa semua kolom yang diperlukan ada
- Pastikan tidak ada nilai kosong (NaN)
- Aplikasi ini menggunakan Random Forest Classifier
- Model di-load dengan
joblib - Skala nilai IPS: 0-20 (sesuaikan jika menggunakan skala 0-4)
- Untuk akurasi terbaik, pastikan data input lengkap dan valid