Rahasia Data Sampel BPJS Kesehatan: Tesis & Jurnal

Mahar Santoso

April 25, 2026 • 0 • menit membaca

Daftar Isi

The use of secondary data, particularly from Indonesia's National Health Insurance (BPJS Kesehatan), offers immense potential for public health research, theses, and dissertations. This comprehensive guide explores the structure of the BPJS Health Sample Data 2025, detailing its variables, data management using Stata, and data visualization using Tableau. By mastering these analytical tools, researchers can unlock valuable insights, streamlining the publication process in high-impact journals and generating innovative health research ideas without the constraints of extensive field data collection.

Data Sampel BPJS Kesehatan untuk Tesis, Disertasi, dan Jurnal 2026

Siapa sangka, banyak mahasiswa pascasarjana, kandidat doktor, dan peneliti di Indonesia saat ini bisa merampungkan tugas akhir mereka pada tahun 2025 hanya bermodalkan laptop di kedai kopi atau buat kopi dirumah pakai mesin Kris 125 ml Coffee Maker . Melalui rilisnya Data Sampel BPJS Kesehatan, kita memiliki akses ke jutaan baris rekam jejak jaminan kesehatan nasional yang bisa diolah menjadi Penelitian, Tesis, Disertasi, hingga menembus Jurnal internasional bereputasi. Daripada pusing memikirkan biaya survei primer dan sulitnya perizinan turun ke lapangan, memanfaatkan Data Sekunder ini adalah jalan pintas yang sangat saintifik dan valid untuk menemukan berbagai Ide Penelitian Kesehatan yang brilian.

Oleh karena itu, mari kita bedah bagaimana Anda bisa memanfaatkan Data Sampel BPJS Kesehatan layaknya seorang analis data profesional.

Apa Itu Data Sampel BPJS Kesehatan 2025 dan Bagaimana Cara Mendapatkannya?

Sederhananya, BPJS Kesehatan memiliki basis data triliunan baris transaksi kesehatan dari seluruh rakyat Indonesia. Tentu saja, data mentah sebesar itu sangat berat untuk diolah menggunakan komputer standar dan memiliki isu kerahasiaan pasien. Sebagai solusinya, BPJS Kesehatan bersama tim pakar akademisi merilis "Data Sampel".

Data Sampel adalah perwakilan (representasi) dari populasi sesungguhnya yang diambil menggunakan metode statistik stratified multistage random sampling. Artinya, tren, pola penyakit, dan beban biaya yang Anda temukan di data sampel ini bisa digeneralisasikan ke tingkat nasional. Rilis data sampel terus diperbarui, dan untuk versi terbaru yaitu versi keluaran 2025, data ini mencakup rekam jejak kepesertaan, kunjungan ke Fasilitas Kesehatan Tingkat Pertama (FKTP), hingga rujukan ke Fasilitas Kesehatan Rujukan Tingkat Lanjutan (FKRTL).

Untuk mendapatkannya, prosedurnya kini sangat transparan. Anda hanya perlu mengakses portal Data Sampel BPJS Kesehatan. Siapkan Pakta Integritas, lalu isi formulir permohonan data. Prosesnya cepat banget. Anda akan diberikan tautan unduhan data melalui email.

Mengapa Data Sekunder Ini Menjadi "Harta Karun" Akademik?

Keuntungan utama menggunakan Data Sekunder adalah efisiensi. Waktu yang biasanya dihabiskan berbulan-bulan untuk menyebar kuesioner kini bisa dialokasikan sepenuhnya untuk analisis mendalam. Selain itu, cakupan data ini berskala nasional.

Sebagai contoh praktis, saya pernah menggunakan data ini untuk menganalisis beban biaya penyakit. Anda bisa membaca selengkapnya pada publikasi saya tentang Cost of Illness: Stroke Patients with Medical Rehabilitation. Dari data BPJS, kita bisa melacak berapa biaya rata-rata per episode perawatan stroke dan dampaknya terhadap ketahanan dana JKN.

Di ranah kesehatan ibu dan anak, saya juga menggali fenomena persalinan melalui operasi caesar. Detailnya bisa Anda temukan di artikel blog saya mengenai Social Health Insurance Cesarean Delivery in Indonesia. Fenomena ini sangat menarik untuk diteliti karena trennya terus meningkat dan memiliki implikasi pembiayaan yang masif. Eksplorasi serupa juga saya terapkan pada isu malnutrisi, seperti yang terangkum dalam jurnal internasional Economic and Residential Differences in Nutritional Anemia Among Pregnant Women: Insights from Indonesia’s National Health Insurance Data.

Data Sampel Kontekstual Apa Saja yang Ada di BPJS Kesehatan 2025?

Selain merilis data "Universal" yang mencakup semua jenis penyakit secara acak, BPJS Kesehatan juga merilis Data Sampel Kontekstual. Data kontekstual ini ditarik secara khusus untuk kelompok diagnosis tertentu. Ini adalah ladang emas bagi Anda yang mencari Ide Penelitian Kesehatan spesifik.

Beberapa contoh data sampel kontekstual yang sangat relevan untuk diteliti meliputi:

Konteks Diabetes Mellitus (DM): Melacak pasien dari awal terdiagnosis DM, komplikasi yang terjadi (seperti gagal ginjal atau neuropati), hingga klaim obat kronisnya.
Konteks Tuberkulosis (TB): Mengamati pola kepatuhan berobat, drop out rate layanan, dan beban biaya rujukan TB resisten obat.
Konteks Maternal dan Neonatal: Sangat cocok untuk riset kebidanan, menganalisis layanan Antenatal Care (ANC), persalinan, hingga komplikasi bayi baru lahir.
Konteks COVID-19: Fokus pada kasus COVID-19.
Kontekstual Kesehatan Mental: Fokus pada kesehatan Mental di FKTP dan FKRTL

Data Sampel Kontekstual BPJS Kesehatan 2025

Memadukan data BPJS dengan dataset nasional lainnya juga sangat mungkin dan menghasilkan riset yang komprehensif. Misalnya, dalam penelitian kebijakan publik, saya pernah mengukur efek intervensi pemerintah dengan data IFLS dalam studi Dampak Program Bantuan Sosial sebagai Intervensi Gizi Sensitif terhadap Status Stunting pada Balita.

Dampak Program Bantuan Sosial sebagai Intervensi Gizi Sensitif terhadap Status Stunting pada Balita

Atau, ketika menyusun tesis S2 FKM UI saya, saya menggabungkan data ketersediaan tenaga kesehatan (SISDMK) dengan utilisasi layanan BPJS, yang bisa Anda baca di Analisis Beban Kerja Terapis Okupasional Menggunakan Data SISDMK dan Data Sampel BPJS Kesehatan Di Indonesia.

Membedah Variabel Data Sampel BPJS Kesehatan 2025

Jika Anda baru pertama kali melihat file .DTA / Format Stata dari BPJS Kesehatan, Anda mungkin akan terkejut melihat kode-kode aneh seperti PSTV01, FKP02, atau FKL15. Mari kita bedah struktur utamanya berdasarkan metadatanya agar Anda tidak tersesat.

1. Tabel Kepesertaan (File: Kepesertaan.DTA)

Ini adalah tabel demografi yang berisi profil peserta. Data ini berbentuk format Wide, artinya satu baris merepresentasikan satu individu yang unik.

PSTV01 (Nomor Peserta) & PSTV02 (Nomor Keluarga): Ini adalah Primary Key. Anda akan menggunakan PSTV01 untuk menggabungkan tabel demografi dengan tabel kunjungan kesehatan.
PSTV03 hingga PSTV06: Menunjukkan Tanggal Lahir, Hubungan Keluarga (Kepala keluarga, istri, anak), Jenis Kelamin, dan Status Perkawinan.
PSTV08 (Segmentasi Peserta): Sangat penting! Di sini Anda membedakan mana peserta PBI APBN (masyarakat miskin yang iurannya dibayar negara), PPU (Pekerja Penerima Upah / pegawai formal), PBPU (Pekerja mandiri), dll.
PSTV09 & PSTV10: Kode Provinsi dan Kabupaten/Kota tempat tinggal peserta.
PSTV15 (Bobot): Variabel krusial. Karena ini data sampel, bobot ini digunakan agar hasil analisis Anda merepresentasikan populasi nasional 270+ juta jiwa.
PSTV18 (Tahun Meninggal): Variabel yang sangat berguna jika Anda melakukan Survival Analysis atau analisis mortalitas.

2. Tabel FKTP (File: 2. fktpkapitasi.dta)

Mencatat riwayat kunjungan peserta ke Puskesmas, Klinik Pratama, atau Dokter Praktik Mandiri. Format tabel ini adalah Long, karena satu pasien bisa berkali-kali ke klinik dalam setahun.

FKP02 (ID Kunjungan): Identitas unik untuk setiap kedatangan.
FKP03 & FKP04: Tanggal datang dan tanggal pulang.
FKP14 & FKP14A: Ini adalah Kode Diagnosis menggunakan standar internasional ICD-10 (3 digit). Misalnya, jika pasien datang karena hipertensi, kodenya akan terekam di sini (I10).
FKP15A: Nama diagnosis dalam bentuk teks agar lebih mudah dibaca.
FKP16 hingga FKP20: Mencatat ke mana pasien ini dirujuk (jika puskesmas tidak sanggup menangani, dirujuk ke RS mana, tipe apa).

3. Tabel FKRTL (File: 3. fkrtl.dta)

Ini adalah primadona bagi peneliti klinis. Berisi data rujukan rumah sakit, baik rawat jalan tingkat lanjutan maupun rawat inap.

FKL02 (ID Kunjungan): Identifier kunjungan rumah sakit.
FKL08 (Jenis FKRTL): Membedakan apakah pasien dirawat di RS Kelas A, Kelas B, Kelas C, Kelas D, atau Klinik Utama.
FKL11 (Jenis Poli): Poli apa yang dituju? (Misal: Poli Penyakit Dalam, Poli Anak, Poli Syaraf).
FKL14 (Status Pulang): Menunjukkan outcome pasien. Apakah sembuh, dirujuk ke RS lain yang lebih tinggi, pulang paksa (APS), atau meninggal dunia.
FKL15 & FKL17: Kode diagnosis masuk dan diagnosis primer (ICD-10).
FKL29: Puskesmas/Klinik yang merujuk. Ini penting untuk melihat rantai sistem rujukan nasional.

4. Tabel Non-Kapitasi (File: 4. fktpnonkapitasi.dta)

Berisi tagihan layanan khusus di FKTP yang tidak di-cover oleh skema kapitasi bulanan, seperti biaya persalinan dasar oleh bidan, kacamata, atau pelayanan prolanis.

PNK16 (Nama Tindakan): Jenis pelayanan khusus yang diberikan.
PNK17 & PNK18: Biaya tagih (yang diajukan klinik) dan Biaya Verifikasi (yang disetujui untuk dibayar oleh BPJS). Ini adalah variabel utama untuk studi Farmakoekonomi atau Health Economics.

MANAJEMEN DATA – Format & Identifikasi

Sebelum melakukan analisis seksi seperti regresi atau pemodelan spasial, 80% waktu Anda akan dihabiskan untuk merapikan data (data cleaning). Data Sampel BPJS memiliki struktur relasional.

Konsep utamanya adalah membedakan format Wide dan Long. Data Kepesertaan adalah Wide (Satu ID = Satu Baris). Namun, data FKTP dan FKRTL adalah Long (Satu ID = Bisa banyak baris, tergantung berapa kali dia sakit). Jika Anda ingin menganalisis "Karakteristik demografi pasien stroke di RS", Anda tidak bisa hanya menggunakan tabel FKRTL. Mengapa? Karena tabel FKRTL tidak memiliki kolom umur, jenis kelamin, atau domisili asal. Anda harus menggabungkannya (merge) dengan tabel Kepesertaan.

MANAJEMEN DATA – Penggabungan Data Menggunakan Stata

Contoh syntax do file Stata untuk Data Sampel BPJS Kesehatan

Sebagai peneliti yang sering berhadapan dengan dataset jutaan observasi, saya sangat menyarankan menggunakan perangkat lunak yang tangguh seperti Stata. Excel akan langsung crash atau not responding jika Anda memaksanya membuka tabel FKRTL yang ukurannya bisa bergiga-giga.

Di Stata, proses penggabungan tabel Kepesertaan dan tabel FKRTL disebut One-to-Many merge (1:m). Karena satu peserta (di master dataset kepesertaan) bisa memiliki banyak kunjungan rujukan (di dataset FKRTL).

Berikut adalah pseudocode dan logika perintah di Stata untuk menggabungkan data tersebut:


    // 1. Buka dan rapikan data Master (Kepesertaan)
    use "Kepesertaan.dta", clear
    sort PSTV01 // Urutkan berdasarkan Nomor Peserta
    save "Kepesertaan_sorted.dta", replace

    // 2. Buka data Transaksi (FKRTL)
    use "FKRTL.dta", clear
    sort PSTV01 // Pastikan nama variabel kuncinya sama persis
    
    // 3. Eksekusi Penggabungan
    merge m:1 PSTV01 using "Kepesertaan_sorted.dta"

    // 4. Cek hasil penggabungan
    tab _merge
    // Keep data yang match di kedua tabel (biasanya _merge == 3)
    keep if _merge == 3
    drop _merge

Dengan kode sederhana di atas, kini setiap baris kunjungan rumah sakit telah dilengkapi dengan informasi usia, jenis kelamin, dan domisili peserta yang bersangkutan. Analisis Anda siap lepas landas!

Analisis Sampel Kompleks (Complex Survey Analysis) dengan Stata

Ini adalah kesalahan fatal yang sering dilakukan peneliti pemula: Menganalisis data sampel seolah-olah itu adalah data populasi biasa menggunakan regresi standar. Data BPJS tidak diambil secara acak sederhana (Simple Random Sampling). Desainnya menggunakan stratifikasi dan klaster di tingkat nasional.

Oleh karena itu, Anda wajib menggunakan perintah analisis survei (svy) di Stata. Jika tidak, perhitungan standard error Anda akan salah (terlalu kecil), yang berakibat pada nilai p-value yang menyesatkan (false positive).

Di Stata, kita harus mendeklarasikan desain survei menggunakan variabel Bobot (PSTV15). Berdasarkan petunjuk teknis metadata, Anda harus menentukan strata dan Primary Sampling Unit (PSU). Misalnya, kodenya akan terlihat seperti ini:


    // Deklarasi desain survei kompleks
    svyset PSU_variable [pweight=PSTV15], strata(Strata_variable)

    // Setelah dideklarasikan, semua analisis harus diawali dengan awalan svy:
    // Contoh: Menghitung proporsi penderita diabetes berdasarkan segmen BPJS
    svy: tabulate PSTV08 diabetes_status, row

    // Contoh: Regresi logistik prediksi kematian di RS
    svy: logistic status_meninggal i.umur i.jenis_kelamin i.tipe_rs

Dengan svyset, Anda menjamin bahwa hasil persentase atau rasio odds yang Anda dapatkan benar-benar valid dan merepresentasikan jutaan pengguna BPJS di lapangan, bukan sekadar data yang ada di laptop Anda.

Visualisasi Data Penelitian dengan Tableau

Stata adalah mesin yang luar biasa untuk melakukan kerja keras komputasi statistik. Namun, untuk menyampaikan hasil analisis tersebut kepada audiens (baik pembimbing tesis, penguji disertasi, atau pembuat kebijakan), tabel angka saja seringkali membosankan dan sulit dicerna.

Di sinilah keahlian visualisasi data menjadi nilai jual yang tak ternilai. Mengubah lautan angka di Stata menjadi dashboard interaktif adalah seni tersendiri. Saya selalu memindahkan hasil agregasi data dari Stata ke Tableau untuk dipresentasikan.

Tableau memungkinkan kita untuk memetakan sebaran geografis dari fasilitas kesehatan yang paling sering merujuk, atau membuat grafik deret waktu (time-series) yang memperlihatkan tren kenaikan penyakit pasca libur panjang. Jika Anda ingin melihat contoh nyata bagaimana saya menggunakan Tableau untuk menganalisis data fasilitas kesehatan, silakan mampir ke artikel saya: Tableau Software untuk Visualisasi Data Penelitianmu.

Salah satu karya spesifik saya menggunakan Data Sampel BPJS dan Tableau dapat Anda pelajari polanya pada proyek Dashboard Tren Peringkat Klaim BPJS Kesehatan Provinsi Bali Tahun 2017-2023. Dalam visualisasi tersebut, audiens dapat secara mandiri melakukan filter berdasarkan kabupaten atau jenis penyakit untuk melihat pergerakan biaya klaim dari tahun ke tahun.

Tidak hanya itu, menguasai Tableau juga memungkinkan Anda membangun portofolio riset digital yang solid. Anda bisa melihat berbagai eksplorasi visualisasi data kesehatan masyarakat yang telah saya rilis ke publik di galeri Kumpulan Visualisasi Data dengan Tableau.

Kesimpulan dan Langkah Selanjutnya

Memanfaatkan Data Sampel BPJS Kesehatan 2025 adalah langkah strategis, efisien, dan berdampak tinggi bagi siapa saja yang sedang berjuang menyelesaikan Tesis, Disertasi, atau mengejar publikasi Jurnal internasional. Dengan pemahaman yang kuat tentang struktur data, kemampuan manajemen data dan analisis sampel kompleks menggunakan Stata, serta keahlian menceritakan data (data storytelling) melalui Tableau, jalan Anda menuju gelar akademik dan sumbangsih nyata terhadap kebijakan kesehatan nasional akan terbuka lebar.

Anggaplah proses pengolahan data sekunder ini seperti berlatih maraton; Anda perlu konsistensi dalam menjaga cadence, mengukur detak jantung (memahami metodologi yang benar), dan menikmati setiap kilometernya (proses cleaning data). Tidak perlu panik jika menjumpai error saat merge data; itu adalah bagian dari proses kalibrasi ketajaman analisis Anda.

Punya Ide Penelitian Kesehatan yang brilian namun masih buntu di tahapan manajemen dan visualisasi data? Jangan biarkan ide bagus itu mengendap di draf proposal Anda.

Mari berdiskusi! Hubungi saya untuk Konsultasi Eksklusif Pengolahan Data Sampel BPJS Kesehatan, mulai dari meramu dataset di Stata hingga membangun Dashboard Tableau yang memukau penguji Anda.

Mahar Santoso Your Strategic Partner

Seorang profesional Think Tank di Kementerian Kesehatan RI dan lulusan Magister Kesehatan Masyarakat Universitas Indonesia. Aktif sebagai investor pasar modal sejak 2014 dan penggiat lari jarak jauh. Berfokus pada publikasi berbasis data riset yang objektif.