Business Intelligence Platform · Smart City Jawa Barat

Dashboard BI untuk
Analisis & Klasterisasi
Wilayah Jawa Barat

Platform Business Intelligence berbasis Smart City untuk menganalisis dan mengelompokkan 27 kabupaten/kota di Jawa Barat berdasarkan tingkat kejadian banjir dan jumlah produksi sampah menggunakan K-Means Clustering.

Business Intelligence · Semester 6 · 2025/2026

K-Means Clustering
ETL Pipeline
Smart City BI
Data-Driven
27
Kab/Kota
3
Cluster Risk
5+
Tahun Data
98.2%
Silhouette Score
Scroll to explore
About The Project

Latar Belakang & Konteks Masalah

Provinsi Jawa Barat menghadapi tantangan kompleks dalam pengelolaan lingkungan hidup di tengah pesatnya laju urbanisasi. Tingginya frekuensi kejadian banjir dan volume produksi sampah yang terus meningkat menuntut pendekatan strategis berbasis data untuk mendukung formulasi kebijakan yang proaktif dan terukur.

Konteks Penelitian

Platform ini dikembangkan sebagai bagian dari implementasi Business Intelligence dalam mendukung ekosistem Smart City Provinsi Jawa Barat, khususnya pada pilar Smart Environment dan Smart Governance.

Data yang digunakan bersumber dari Open Data Jawa Barat yang mencakup dua dimensi fundamental: rekapan historis kejadian bencana banjir dan volume penanganan sampah di wilayah kabupaten/kota di Provinsi Jawa Barat.

Melalui pendekatan analitik K-Means Clustering, metode machine learning unsupervised digunakan untuk mengelompokkan wilayah berdasarkan tingkat banjir dan volume sampah secara objektif. Hasil segmentasi ini membagi wilayah ke dalam kategori risiko Tinggi, Sedang, dan Rendah.

Dashboard ini dikembangkan untuk mendukung data-driven decision making dalam pengelolaan lingkungan di Provinsi Jawa Barat, memfasilitasi pemangku kepentingan dalam merumuskan strategi mitigasi risiko banjir dan optimalisasi pengelolaan sampah.

Tujuan Analisis

01

Mengidentifikasi wilayah prioritas untuk mitigasi risiko banjir dan pengelolaan sampah berdasarkan data historis.

02

Membangun model K-Means Clustering yang optimal untuk segmentasi wilayah berdasarkan profil kerawanan lingkungan.

03

Menyediakan Dashboard Business Intelligence interaktif yang komprehensif bagi pemangku kepentingan dan masyarakat.

04

Menghasilkan rekomendasi kebijakan berbasis data (data-driven) untuk alokasi sumber daya yang lebih presisi dan efisien.

05

Mendukung percepatan implementasi Smart Environment dan Smart Governance melalui tata kelola berbasis analitik cerdas.

Krisis Banjir

Jawa Barat mengalami ratusan kejadian banjir setiap tahun yang berdampak pada jutaan warga dan infrastruktur daerah.

Masalah Sampah

Produksi sampah yang terus meningkat di berbagai wilayah memperburuk kualitas lingkungan dan memicu risiko bencana.

K-Means Clustering

Metode machine learning unsupervised digunakan untuk mengelompokkan wilayah berdasarkan tingkat banjir dan volume sampah secara objektif.

Prioritas Penanganan

Mengidentifikasi wilayah dengan risiko tinggi agar pemerintah dapat mengalokasikan sumber daya mitigasi secara tepat sasaran.

Smart City Integration

Mengintegrasikan Dashboard Business Intelligence ke dalam ekosistem Smart City Jawa Barat untuk mendukung Smart Governance dan Smart Environment.

Data-Driven Policy

Menyediakan rekomendasi kebijakan berbasis data (data-driven decision making) yang terukur dan dapat diimplementasikan secara strategis.

Key Performance Indicators

Metrik Utama Analisis Data

Metrik utama digunakan untuk menggambarkan kondisi banjir, volume sampah, hasil clustering, dan kualitas model analisis data di Provinsi Jawa Barat.

0
Total Kejadian Banjir

Menampilkan total agregasi kejadian banjir dari dataset.

Data Historis
0 ton
Rata-rata Volume Sampah

Menampilkan volume rata-rata produksi sampah (ribu ton/tahun).

Produksi Sampah
0
Jumlah Cluster Risiko

3 Cluster Risiko (Rendah, Sedang, Tinggi).

K-Means Clustering
0%
Persentase Wilayah Risiko Tinggi

Menampilkan persentase wilayah yang masuk cluster risiko tinggi.

Cluster Risiko Tinggi
0 Tahun
Rentang Data

Data historis analisis dari tahun 2015 sampai dengan 2023.

Periode 2015–2023
0.0%
Silhouette Score

Metrik evaluasi untuk mengukur validitas model K-Means.

Evaluasi Clustering
Key Stakeholders

Pemangku Kepentingan Utama

Stakeholder utama berperan dalam mendukung pengambilan keputusan berbasis data untuk pengelolaan banjir dan sampah di Provinsi Jawa Barat.

DLH

Dinas Lingkungan Hidup

Pengelolaan Lingkungan

Bertanggung jawab atas pengelolaan lingkungan yang terintegrasi, pemantauan kualitas ekosistem, serta penanganan dan distribusi sampah berbasis data.

Pengelolaan sampah
Monitoring lingkungan
Distribusi sampah
BPBD

BPBD Jawa Barat

Mitigasi Risiko Banjir

Berperan aktif dalam kesiapsiagaan bencana dan mitigasi risiko banjir melalui identifikasi wilayah rawan secara komprehensif dan sistematis.

Mitigasi banjir
Wilayah rawan
Kesiapsiagaan bencana
Pemda

Pemerintah Daerah

Smart Governance

Fokus pada implementasi Smart Governance melalui pengambilan keputusan berbasis data untuk menetapkan prioritas wilayah dan koordinasi penanganan.

Pengambilan keputusan
Prioritas wilayah
Koordinasi penanganan
Bappeda

Bappeda / Perencana Kota

Pembangunan Berkelanjutan

Merumuskan kebijakan jangka panjang dan mengintegrasikan data lingkungan untuk mendukung perencanaan pembangunan berkelanjutan di Jawa Barat.

Perencanaan pembangunan berkelanjutan
Integrasi data lingkungan
Kebijakan jangka panjang
Akademisi

Masyarakat & Akademisi

Partisipasi Publik

Mendorong peningkatan edukasi lingkungan, mendukung penelitian lanjutan terkait Business Intelligence, dan memperkuat partisipasi publik.

Edukasi lingkungan
Penelitian lanjutan
Partisipasi publik
Business Questions

Pertanyaan Bisnis Utama

Pertanyaan bisnis digunakan untuk mengarahkan proses analisis data dan mendukung pengambilan keputusan berbasis data dalam pengelolaan banjir dan sampah di Provinsi Jawa Barat.

Konteks Analisis

Analisis dilakukan terhadap data kejadian banjir historis untuk mengidentifikasi wilayah dengan tingkat kerawanan tertinggi.

Insight Analisis

Distribusi data tidak merata (right skewed), di mana beberapa wilayah mencatat frekuensi banjir yang jauh lebih tinggi dibandingkan wilayah lainnya.

Konteks Analisis

Pemetaan sebaran wilayah menggunakan metode K-Means Clustering untuk melihat pengelompokan berdasarkan volume sampah dan frekuensi banjir.

Insight Analisis

Clustering menghasilkan 3 kategori risiko, namun secara spesifik terdapat wilayah dengan produksi sampah tinggi dan frekuensi kejadian banjir tinggi secara bersamaan.

Konteks Analisis

Evaluasi statistik untuk mengukur korelasi antara volume sampah dengan frekuensi kejadian banjir di tingkat kabupaten/kota.

Insight Analisis

Berdasarkan hasil analisis, hubungan antara produksi sampah dan kejadian banjir tergolong lemah, mengindikasikan faktor lain yang lebih dominan memicu banjir.

Konteks Analisis

Identifikasi wilayah yang memerlukan intervensi segera berdasarkan tingkat kerawanan lingkungan secara keseluruhan.

Insight Analisis

Wilayah risiko tinggi menjadi prioritas penanganan utama untuk mendukung efisiensi mitigasi bencana dan manajemen lingkungan dalam kerangka Smart Governance.

Konteks Analisis

Evaluasi pembentukan klaster menggunakan machine learning unsupervised dalam membentuk segmentasi yang objektif.

Insight Analisis

Metode K-Means Clustering menghasilkan 3 kategori risiko secara optimal, yang menunjukkan pemisahan klaster yang valid untuk pengambilan keputusan berbasis data.

Project Roadmap

Timeline Progress Project

Roadmap pengerjaan proyek selama 5 minggu mencakup seluruh tahapan Business Intelligence dari pemahaman bisnis hingga delivery dashboard.

Project Progress100% Complete
W1W2W3W4W5
Week 1

Business Understanding

Pemahaman mendalam tentang konteks bisnis, penetapan KPI, formulasi pertanyaan bisnis, dan pemilihan dataset yang relevan dari Open Data Jawa Barat.

Business Understanding
KPI Definition
Business Questions
Dataset Selection
Week 2

Exploratory Data Analysis

Eksplorasi mendalam data banjir dan sampah melalui analisis statistik deskriptif, visualisasi distribusi, dan identifikasi pola awal.

Statistical Analysis
Data Visualization
Distribution Analysis
Initial Insights
Week 3

ETL & Data Warehouse

Pembangunan pipeline ETL, pembersihan data, integrasi multi-source, dan perancangan skema Data Warehouse dengan model dimensional Star Schema.

ETL Pipeline
Data Cleaning
Star Schema Design
Fact & Dimension Tables
Week 4

K-Means Clustering

Implementasi algoritma K-Means, optimasi hyperparameter menggunakan Elbow Method, validasi dengan Silhouette Score, dan interpretasi hasil cluster.

Model Training
Elbow Method
Silhouette Analysis
Cluster Interpretation
Week 5

Dashboard & Insights

Pembangunan dashboard BI interaktif, narasi data storytelling berbasis cluster, dan perumusan rekomendasi kebijakan berbasis data untuk stakeholder.

BI Dashboard
Data Storytelling
Decision Making
Policy Recommendations
Exploratory Data Analysis

Eksplorasi Data Awal

Analisis statistik deskriptif dan visualisasi pola awal pada dataset banjir dan sampah Jawa Barat periode 2015–2023 sebelum dilakukan clustering.

Memuat data EDA...

Data Architecture

Data Warehouse & Star Schema

Arsitektur dimensional model dengan Star Schema untuk mengintegrasikan data banjir dan sampah dari multiple source ke dalam satu repositori analitik.

Star Schema Architecture
FACT TABLE
fact_banjir_sampah
id_waktu
id_wilayah
jml_banjir
vol_sampah
cluster_id
risk_score
DIM
Waktu
dim_waktu
id_waktu
tahun
bulan
kuartal
semester
DIM
Wilayah
dim_wilayah
id_wilayah
nama_kab_kota
provinsi
latitude
longitude
DIM
Cluster
dim_cluster
cluster_id
cluster_name
risk_level
centroid_x
centroid_y
DIM
Kategori
dim_kategori
id_kategori
jenis_bencana
tipe_sampah
unit_ukur
deskripsi
ETL Step
Extract
01
Open Data Jawa Barat API
02
CSV Bencana Banjir 2019–2023
03
CSV Produksi Sampah 2019–2023
04
Data Validasi BPS Jabar
ETL Step
Transform
01
Normalisasi nama kab/kota
02
Penanganan nilai kosong
03
Feature engineering K-Means
04
Standardisasi unit & format
ETL Step
Load
01
PostgreSQL Data Warehouse
02
Star Schema population
03
Cluster labeling & tagging
04
Dashboard data refresh
Machine Learning · Unsupervised Learning

K-Means Clustering Analysis

Implementasi algoritma K-Means Clustering untuk mengelompokkan 27 kabupaten/kota di Provinsi Jawa Barat ke dalam 3 klaster risiko berdasarkan frekuensi banjir dan volume timbulan sampah periode 2015–2023.

K-Means
Algorithm

Unsupervised learning · k=3 · random_state=42

3 Klaster
Optimal k

Risiko Rendah · Risiko Sedang · Risiko Tinggi

0.707
Silhouette Score

Kualitas clustering: Excellent

Distribusi Klaster Wilayah

Total 27 wilayah Provinsi Jawa Barat · Periode 2015–2023

4Risiko Tinggi
4Risiko Sedang
19Risiko Rendah

Visualisasi Cluster — Scatter Plot

Volume Sampah Kumulatif (X) vs Total Kejadian Banjir (Y) · 2015–2023

Risiko Tinggi
Risiko Sedang
Risiko Rendah
Risiko Tinggi
4

Wilayah dengan frekuensi banjir dan volume sampah tertinggi yang menjadi prioritas utama penanganan lingkungan dan mitigasi bencana.

Rata-rata Centroid (2015–2023)

Sampah: 1930k tonBanjir: 173 kejadian

Wilayah (4)

Kab. BANDUNGKab. BOGORKab. CIREBONKab. SUKABUMI
Risiko Sedang
4

Wilayah dengan tingkat risiko moderat yang memerlukan peningkatan kapasitas pengelolaan lingkungan dan program preventif berkala.

Rata-rata Centroid (2015–2023)

Sampah: 4750k tonBanjir: 54 kejadian

Wilayah (4)

Kota BANDUNGKota BEKASIKota BOGORKota DEPOK
Risiko Rendah
19

Wilayah dengan kondisi lingkungan relatif terkendali. Fokus pada pemeliharaan kapasitas dan pemantauan rutin.

Rata-rata Centroid (2015–2023)

Sampah: 795k tonBanjir: 47 kejadian

Wilayah (19)

Kab. BANDUNG BARATKab. BEKASIKab. CIAMISKab. CIANJURKab. GARUTKab. INDRAMAYUKab. KARAWANGKab. KUNINGAN+11 lainnya
Geospatial Visualization · Smart Environment

Peta Sebaran Interaktif

Visualisasi geospasial digunakan untuk menampilkan persebaran wilayah berdasarkan hasil clustering tingkat banjir dan volume sampah di Provinsi Jawa Barat.

19

Risiko Rendah

wilayah teridentifikasi

4

Risiko Sedang

wilayah teridentifikasi

4

Risiko Tinggi

wilayah teridentifikasi

Distribusi Klaster Wilayah

Algoritma K-Means Clustering (k=3) mengelompokkan 27 kabupaten/kota di Provinsi Jawa Barat berdasarkan dua variabel utama: frekuensi kejadian banjir dan volume timbulan sampah periode 2015–2023.

🟢 Risiko Rendah

Wilayah dengan frekuensi banjir dan volume sampah relatif rendah serta memerlukan pemantauan rutin.

🟡 Risiko Sedang

Wilayah dengan tingkat risiko moderat yang memerlukan peningkatan pengelolaan lingkungan dan monitoring berkala.

🔴 Risiko Tinggi

Wilayah dengan frekuensi banjir dan volume sampah tinggi sehingga menjadi prioritas penanganan lingkungan.

Relevansi Smart City

Peta sebaran ini mendukung dua dimensi Smart City dalam pengambilan keputusan berbasis data:

Smart Environment — pemantauan risiko lingkungan berbasis data spasial dan pengelolaan lingkungan yang berkelanjutan.

Smart Governance — mendukung perencanaan kebijakan pengelolaan banjir dan sampah berbasis analitik klaster wilayah.

Buka Peta Interaktif
Peta Sebaran Wilayah Berdasarkan Hasil Clustering

Memuat peta geospasial…

Klik marker untuk melihat detail wilayah berdasarkan hasil clustering metode K-Means (k=3) periode 2015–2023.

Interactive Dashboard

Dashboard BI Preview

Visualisasi interaktif hasil analisis banjir dan volume sampah di Provinsi Jawa Barat berdasarkan metode K-Means Clustering periode 2015–2023.

Loading Dashboard Data...

Insight Analisis

Insight Analisis Data

Merangkum temuan kunci dari Exploratory Data Analysis (EDA) dan pemodelan K-Means untuk mendukung pengambilan keputusan berbasis data yang objektif.

01
Data Insight

Kondisi Distribusi Data

Mayoritas Frekuensi Rendah

Sebagian besar wilayah kabupaten/kota di Jawa Barat mencatatkan jumlah kejadian banjir yang relatif rendah. Hal ini menunjukkan bahwa frekuensi banjir tinggi hanya terkonsentrasi pada wilayah tertentu.

Distribusi Right-Skewed

Analisis distribusi data memperlihatkan pola right-skewed (condong ke kanan), mengindikasikan adanya outlier di mana sebagian kecil wilayah menghasilkan volume sampah dan frekuensi banjir yang sangat ekstrem.

02
Data Insight

Hubungan Sampah & Banjir

Korelasi Non-Linear

Berdasarkan Exploratory Data Analysis (EDA), tidak ditemukan korelasi linear yang kuat secara langsung antara total produksi sampah dengan frekuensi kejadian banjir di berbagai wilayah.

Variabilitas Karakteristik Wilayah

Tingginya volume sampah di suatu wilayah tidak selalu berbanding lurus dengan tingginya angka banjir. Variabilitas ini sangat dipengaruhi oleh anomali geografis, infrastruktur drainase, dan tata ruang masing-masing daerah.

03
Data Insight

Segmentasi & Rekomendasi

Karakteristik 3 Klaster (K-Means)

Segmentasi menghasilkan Cluster 0 untuk Risiko Rendah (mendominasi), Cluster 1 untuk Risiko Sedang, dan Cluster 2 untuk Risiko Tinggi (seperti Kabupaten Bogor yang memiliki tingkat banjir tertinggi).

Mitigasi Bencana Terarah

Insight analisis ini menyarankan agar kebijakan pemerintah daerah difokuskan pada mitigasi bencana terarah dan perbaikan pengelolaan tata ruang kota berdasarkan segmentasi risiko secara objektif.

Interpretasi Hasil Clustering

Rekomendasi Berdasarkan Hasil Analisis

Rekomendasi dan interpretasi hasil digunakan untuk mendukung pengambilan keputusan berbasis data dalam pengelolaan banjir dan sampah di Provinsi Jawa Barat.

C0

Wilayah Risiko Rendah

Cluster 0

Merupakan wilayah yang relatif aman dari ancaman banjir ekstrem dan timbulan sampah sangat tinggi. Memerlukan pemantauan rutin dan monitoring kondisi lingkungan secara berkala untuk menjaga stabilitas.

Monitoring Rutin
C1

Wilayah Risiko Sedang

Cluster 1

Wilayah dengan tingkat kerawanan menengah. Fokus utama adalah pada peningkatan pengelolaan sampah, pengawasan produksi sampah, serta peningkatan kebersihan lingkungan untuk mencegah eskalasi risiko.

Pengawasan Sampah
C2

Wilayah Risiko Tinggi

Cluster 2

Menjadi prioritas utama penanganan banjir dari pemerintah. Memerlukan mitigasi lingkungan lebih lanjut serta membutuhkan perhatian khusus dalam pengelolaan infrastruktur drainase dan tata kelola sampah.

Prioritas Mitigasi
BI

Identifikasi Prioritas via Clustering

Metodologi

Metode K-Means Clustering membantu identifikasi wilayah prioritas secara objektif tanpa bias subjektif, memisahkan wilayah ke dalam segmen kerawanan yang berbeda untuk intervensi spesifik.

Objektivitas Data
SC

Mendukung Konsep Smart City

Platform BI

Visualisasi data dan dashboard interaktif ini mendukung perwujudan Smart Environment dan Smart Governance melalui pengambilan keputusan berbasis data (data-driven decision making).

Smart Governance

Contoh Representasi Klaster

Karakteristik wilayah berdasarkan hasil clustering

C2
Kabupaten BogorRisiko Tinggi
C2
Kota BandungRisiko Tinggi
C2
Kabupaten BekasiRisiko Tinggi
C1
Kota DepokRisiko Sedang
C1
Kabupaten CirebonRisiko Sedang
C0
Kabupaten MajalengkaRisiko Rendah
C0
Kota BanjarRisiko Rendah
Manfaat Analisis BI

Data-Driven Decision

Pengambilan keputusan didasarkan pada fakta data objektif.

Smart Environment

Mendukung pemantauan dan keberlanjutan lingkungan hidup.

Smart Governance

Peningkatan tata kelola pemerintahan berbasis teknologi informasi.

Pusat Data

Download Center

Pusat data digunakan untuk menyediakan dataset, hasil clustering, dan output ETL yang mendukung proses analisis dan visualisasi Business Intelligence.

Dataset Banjir dan Produksi Sampah Jawa Barat (2015–2023)

Dataset gabungan multi-source dari Open Data Jabar. Berisi data kejadian banjir dan volume sampah. Dataset digunakan untuk analisis Business Intelligence dan clustering wilayah. Dataset terdiri dari 243 baris dan 11 kolom.

CSV / XLSX243 Baris2015-2023

Hasil Analisis K-Means Clustering

Dataset hasil preprocessing dan clustering wilayah. Mengelompokkan wilayah ke dalam kategori: Risiko Rendah, Risiko Sedang, dan Risiko Tinggi. Digunakan untuk visualisasi dan analisis prioritas penanganan.

CSV3 KlasterHasil Analisis

Data Warehouse & Output ETL

Berisi hasil proses ETL dan struktur data warehouse. Meliputi: dim_waktu, dim_lokasi, fact_banjir_sampah. Digunakan sebagai sumber analisis dan visualisasi dashboard BI.

Data WarehouseStar SchemaOutput ETL

Sumber Referensi Resmi

Berikut adalah tautan sumber rujukan resmi yang digunakan sebagai dasar penyusunan dataset dan dashboard Business Intelligence ini:

  • Open Data JabarVolume Sampah yang Ditangani Berdasarkan Kabupaten/Kota di Jawa Barat
  • Open Data JabarJumlah Kejadian Bencana Banjir Berdasarkan Kabupaten/Kota di Jawa Barat