Jurnal EMASAINS Volume Vi Nomor 1 Maret Tahun 2019 P-ISSN 2302-2124 E-ISSN 2622 8688 Perbandingan Regresi B-Splines dan P-Splines pada Hubungan Indeks Pembangunan Manusia dan Persentase Penduduk Miskin Kabupaten/Kota di Indonesia Comparison of B-Splines and P-Splines Regression on the Relationship between Human Development Index and The Percentage of Poor Districts/Cities in Indonesia Rina Sri Kalsum Siregara,*. Yogo Aryo Jatmikob Badan Pusat Statistik Kabupaten Sleman. Yogyakarta Badan Pusat Statistik Republik Indonesia. Jakarta *Pos-el: rina. siregar@bps. Abstrak. Kemiskinan pada dasarnya merupakan manifestasi dari ketimpangan kesempatan yang dimiliki setiap manusia, yang terjadi akibat ketimpangan kapabilitas yang dimiliki. Pengukuran kemiskinan dengan menggunakan dimensi kapabilitas seperti pendidikan, kesehatan dan standar kualitas hidup, dapat menjadi acuan untuk mengidentifikasi karakteristik kemiskinan yang Salah satu ukuran yang memperhitungkan dimensi kapabilitas tersebut adalah Indeks Pembangunan Manusia (IPM). Mengetahui eratnya hubungan IPM dengan persentase penduduk miskin tersebut, pada penelitian ini dilakukan perbandingan metode regresi kuantil nonparametrik B-Splines dan P-Splinespada pemodelan hubungan IPM dan persentase penduduk miskin analisis menurut kabupaten/kota di Indonesia pada tahun 2017. Hasil analisis menunjukkan bahwa Sebaran data dengan fitting curve menggunakan regresi nonparametrik BSplines dan P-Splines menghasilkan kurva yang halus menjangkau seluruh sebaran data yang Perbandingan MSE model B-Splines dan P-splines diperoleh hasil bahwa model regresi Bsplines untuk variabel IPM dan persentase penduduk miskin memberikan nilai MSE paling kecil 1928378 sehingga merupakan model yang paling baik digunakan untuk menganalisis hubungan data IPM dan persentase penduduk miskin kabupaten/kota di Indonesia Tahun 2017. Kata-Kata Kunci: IPM, persentase penduduk miskin. B-splines. P-splines Abstract. Poverty is basically a manifestation of the opportunity imbalance that every human being has, which occurs due to the imbalance of capabilities possessed. Measuring poverty by using dimensions of capability such as education, health and quality of life standards, can be a reference for identifying the characteristics of actual poverty. One of the measuring that takes into account the capability dimensions is the Human Development Index (HDI). Knowing the close relationship between HDI and the percentage of poor people, in this study a comparison of B-Splines and P-Splines nonparametric quantile regression methods was used to modeling the relationship between HDI and the percentage of poor population according to districts or city in Indonesia in 2017. The results of the analysis showed that the distribution data with curve fittings using non-parametric regression B-Splines and P-Splines produce smooth curves reaching all existing data distributions. The comparison of MSE B-Splines and P-splines models showed that the B-splines regression model for the HDI variable and the percentage of poor people gave the smallest MSE value of 0. 1928378, so that it was the best model to analyze the relationship between HDI data and the percentage of poor people in district or city in Indonesia Key Words: HDI, the percentage of poor people. B-splines. P-splines Jurnal EMASAINS Volume Vi Nomor 1 Maret Tahun 2019 P-ISSN 2302-2124 E-ISSN 2622 8688 Dimensi umur panjang dan sehat diukur menggunakan indikator Angka Harapan Hidup (AHH) saat lahir. Sumber data yang digunakan adalah hasil Sensus Penduduk Tahun 2010 (SP2. Dimensi Harapan Lama Sekolah (HLS) dan Rerata Lama Sekolah (RLS). Angka HLS dihitung mencakup penduduk berusia 7 tahun ke atas, sedangkan RLS mencakup usia 25 tahun ke atas dengan sumber data yang digunakan adalah hasil Survei Sosial Ekonomi Nasional (SUSENAS). Dimensi Pendapatan Nasional Bruto (PNB) per Indikator ini di hitung berdasarkan pengeluaran per-kapita yang disesuaikan menggunakan data SUSENAS. Ketiga dimensi ini merupakan suatu formula yang kompleks dalam konteks pembangunan manusia yang dapat menggambarkan kapabilitas manusia secara umum dan dapat dibandingkan antar negara. Salah satu fokus SDGs yang pembangunan dan merupakan salah satu agenda prioritas dalam Nawacita adalah Agenda diantaranya dalam rangka mengatasi masalah kemiskinan (Hoelman, 2. Penanggulangan kemiskinan merupakan tujuan utama SDGs dapat dikonversikan Nawacita dituangkan dalam sasaran Rencana Pembangunan Jangka Menengah Nasional (RPJMN) tahun 2015-2019 berupa penurunan persentase penduduk miskin pada kisaran 5-6 persen dari jumlah penduduk (Bappenas, 2. PENDAHULUAN Sebagai salah satu Negara Sedang Berkembang (NSB). Indonesia mempunyai persoalan dalam masalah Kemiskinan pada dasarnya merupakan manifestasi dari ketimpangan kesempatan yang dimiliki setiap ketimpangan kapabilitas yang dimiliki. Pengukuran menggunakan dimensi kapabilitas seperti pendidikan, kesehatan dan standar kualitas hidup, dapat menjadi acuan untuk mengidentifikasi karakteristik (Harmawati, 2. Selanjutnya. Sen . , peraih Nobel Ekonomi 1998, kemiskinan seseorang bukan hanya dinilai dari kekurangan uang, melainkan juga dari ketidakmampuan untuk Salah memperhitungkan dimensi kapabilitas tersebut adalah Indeks Pembangunan Manusia (IPM). IPM merupakan suatu indeks komposit yang digunakan untuk dengan menggunakan 3 . dimensi, yaitu umur panjang dan sehat, pengetahuan, dan penghidupan yang Sedangkan indikator yang Indonesia menggambarkan ketiga dimensi tersebut dalam metode IPM terbaru adalah dimensi umur panjang menggunakan Angka Harapan Hidup saat lahir (AHH), dimensi pengetahuan menggunakan Harapan Lama Sekolah (HLS) dan Ratarata Lama Sekolah (RLS) serta penghidupan yang layak menggunakan pengeluaran per kapita. Nilai indeks setiap dimensi diperoleh dari perhitungan indikator-indikator penyusunnya, yaitu: Jurnal EMASAINS Volume Vi Nomor 1 Maret Tahun 2019 P-ISSN 2302-2124 E-ISSN 2622 8688 Beberapa penelitian pernah dilakukan untuk mengetahui hubungan IPM terhadap kemiskinan. Suliswanto . meneliti pengaruh Produk Domestik Bruto (PDB) dan IPM terhadap angka kemiskinan di Indonesia. Penelitian ini menggunakan data panel tahun 20062008. Hasil penelitian menemukan bahwa dengan = 5%, hanya IPM yang mempunyai pengaruh signifikan dalam mengurangi angka kemiskinan di Indonesia. Penelitian senada juga pernah dilakukan Subanidja dan Suharto . tentang penyebab kemiskinan di Indonesia. Penelitian menggunakan data panel tahun 20092012 di 33 propinsi di Indonesia dengan IPM. Produk Domestik Regional Bruto (PDRB), tingkat pendidikan, tingkat pengangguran. Upah Minimum Regional (UMR). Pinjaman Usaha Kecil (PUK) dan variabel Hasil penelitian menunjukkan bahwa IPM mempunyai pengaruh paling besar dan signifikan serta disarankan menjadi masukkan sebagai program yang strategis dalam menurunkan tingkat kemiskinan di Indonesia. Mengetahui pembangunan manusia (IPM) sebagai variabel prediktor terhadap persentase penduduk miskin sebagai variabel respon dapat menggunakan teknik analisis regresi. Berdasarkan data kabupaten/kota di Indonesia yang bervariasi dan banyak ditemukan data outlier, yang mengakibatkan diperlukan garis regresi dari berbagai kuantil agar diperoleh informasi lebih banyak mengenai hubungan kedua variabel. Analisis digunakan agar menghindari kesalahan prespesifikasi model yang dapat mengurangi akurasi dari estimator. Koenker Basset memperkenalkan regresi kuantil sebagai salah satu teknik yang bersifat robust. Pada Koenker. Ng, dan Portnoy . smoothing splines yang merupakan pencocokan kurva dengan menggunakan suatu pemulus . untuk suatu set fungsi splines. Selanjutnya. B-Splines yang merupakan sebuah metode yang kelemahan model splines pada saat orde yang tinggi menggunakan titik knots. dan P-Splines yang merupakan salah satu bentuk regresi splines yang memuat terhadap data dan kemulusan kurva. Dalam penelitian ini diterapkan perbandingan metode regresi kuantilBSplines dan P-Splines pada pemodelan hubungan IPM dan persentase penduduk miskin menurut kabupaten/kota di Indonesia. Adapun objek yang diteliti dalam penelitian ini adalah 510 kabupaten/kota dengan data yang digunakan tahun 2017. METODE PENELITIAN Sumber Data Data yang digunakan dalam penelitian bersumber dari Badan Pusat Statistik Indonesia (BPS), yang diunduh melalui website BPS . ttp://bps. Adapun data yang digunakan adalah data Indeks Pembangunan Manusia (IPM) dan data persentase penduduk miskin menurut Kabupaten/Kota pada Tahun 2017 dengan pengolahan data menggunakan Package R. Model Regresi Splines Metode regresi adalah suatu metode Jurnal EMASAINS Volume Vi Nomor 1 Maret Tahun 2019 P-ISSN 2302-2124 E-ISSN 2622 8688 memodelkan hubungan antara variabel respon Y dan variabel prediktor X (Mulyani. Andriyana, & Sudartianto. Secara umum hubungan antara Y dan X dapat ditulis menjadi persamaan . ycUycn = yco. cuycn ) yuAycn untuk yuA1 , yuA2 , yuA3 . A , yuAycu dan ya. uAycn ) = 0, dengan yco. cuycn )adalah suatu fungsi regresi yang belum diketahui dan ingin ditaksir, dan yuAycn adalah suatu variabel acak yang menggambarkan variasi Y di sekitar yco. cuycn ) (Hardle, 1. Penaksiran fungsi regresi dapat dilakukan dengan dua cara, yaitu secara parametrik dan non parametrik. Pada fungsi-fungsi regresi tersebut paramater regresi biasanya ditaksir dengan menggunakan metode least square dan maximum likelihood. Smoothing splines merupakan salah satu metode yang digunakan dalam analisis data non parametrik. Tujuannya adalah mendapatkan fungsi yang lebih halus untuk memperkecil keragaman dari data, sehingga ciri-ciri dari data akan tampak lebih jelas. Salah satu cara untuk mendapatkan fungsi yang cukup halus adalah dengan memberikan pemulus . Hastie dan Tibshirani . menjelaskan bahwa untuk mengestimasi fungsi splines adalah dengan meminimisasi persamaan . Ocycuycn=1. cycn Oe yce. cuycn ) ) yuI O0 . cu )2 yccycu . Splines dengan titik knots dapat kelemahan model splines pada saat orde yang tinggi. Namun, kesulitan dengan BSplines karena basis ini hanya dapat didefinisikan secara rekursif sehingga tidak dapat dievaluasi secara langsung (Eubank, 1. Metode yang digunakan dalam menaksir parameter B-Splines adalah Metode Kuadrat Terkecil (Ordinary Least Squar. didefinisikan secara rekursif. B-splines merupakan fungsi piecewise polynomial dengan support lokal untuk derajat polynomial tertentu. B-splines kej dengan derajat v berdasarkan knot sequentt0, . ,tuuntuk j=1,A,v u dinotasikan dengan formula rekursif dalam bentuk persamaan . ycuOeycyc yaAyc . yc ) = yaAyc . yc Oe . Oe ycuOeycyc 1 ycyc ycOe1 Oeycyc yaA . yc Oe . ycyc yc Oeycyc 1 yc 1 1 ycycnycoyca ycyc O ycu O ycyc 1 yaAyc . = { ycoycaycnycuycuycyca apabila B-splines dinormalisasi, maka OAycu: Ocyc yc yc=1 yaAyc . yc ) = 1 fungsi objektif regresi B-splines dapat ditulis dalam bentuk persamaan . yuC = ycaycyciycoycnycuyu {Ocycuycn=1. cUycn Oe Ocyco yc=1 yuyc yuyc. ) } sehingga, yce . cu ) bisa ditaksir melalui persamaan . cu ) OO Ocyco yc=1 yuyc yuyc. Ocycuycn=1. cycn Oe yce. cuycn ) ) merupakan jumlah kuadrat residual dengan ukuran pemulus yuI O0 . cu )2 yccycu yang disebut roughness penalty dan yuI sebagai parameter pemulus serta ycuycn adalah titik Model Regresi P-Splines Penalized Splines (P-Spline. merupakan salah satu bentuk regresi splines yang memuat fungsidengan memperhitungkan parameter penghalus. Metode optimasi yang digunakan adalah Penalized Least Square (PLS) sebuah metode yang memberikan komponen penghalus pada Model Regresi B-Splines Penaksir B-Splines adalah salah satu metode yang digunakan untuk menaksir kurva regresi nonparametrik. Model B104 Jurnal EMASAINS Volume Vi Nomor 1 Maret Tahun 2019 P-ISSN 2302-2124 E-ISSN 2622 8688 metode least square. PLS yaitu kriteria optimasi yang menggabungkan antara kecocokan terhadap data dan kemulusan Penduga fungsi yang mampu memetakan data dengan baik serta mempunyai ragam galat yang kecil. Fungsi objektif P-Splines dapat ditulis dalam bentuk persamaan . yuC = ycaycyciycoycnycuyu Ocycuycn=1. cUycn Oe Fitting Curve Regresi P-Splines Perbandingan Fitting Model Nonparametrik. Curve dari Regresi HASIL DAN PEMBAHASAN Pemodelan hubungan antara variabel IPM dan persentase penduduk miskin dapat dilakukan dengan menggunakan analisis regresi. Analisis regresi dimana data tidak diketahui prespesifikasi modelnya disebut regresi nonparametrik. Selanjutnya untuk menentukan motode yang cocok untuk menganalisis data, terlebih dahulu dilakukan plotting data dengan menggunakan scatterplot. Gambar 1 menunjukkan bahwa data menyebar dari kiri atas dan mengumpul di kanan bawah. Dari pola plot data pada Gambar 1, terlihat bahwa adanya outlier dan data mengikuti pola tertentu yang tidak diketahui fungsinya, sehingga sulit ditentukan prespesifikasi modelnya. Salah nonparametrik yang dapat dilakukan adalah pendekatan regresi splines(Wood, ycc yco Ocyco yc=1 yuyc yuyc. ) yuI Ocyc=ycc 1. yuyc ) . dengan, yuI > 0merupakan smoothing dan OIycc merupakan difference operator, yang artinya. OIycc yu1 = Ocyccyc=0(Oe. yc yu. Oey. ycc OO Ei Prosedur Penelitian Adapun prosedur yang diambil dalam proses penelitian ini meliputi berbagai tahapan, diantaranya sebagai berikut: Membuat scatter plot antara variabel prediktor (IPM) dan variabel respon . ersentase Selanjutnya menentukan spesifikasi model berdasarkan pola data yang diperoleh pada scatter plot. Fitting Curve Regresi Nonparametrik Fitting Curve Regresi B-Splines Gambar 1. Plotting IPM dan Persentase Penduduk Miskin Menurut Kabupaten/Kota Tahun 2017 Jurnal EMASAINS Volume Vi Nomor 1 Maret Tahun 2019 P-ISSN 2302-2124 E-ISSN 2622 8688 Selain itu, dari pola scatterplot data pada Gambar 2 terlihat diperlukan garis regresi dari berbagai kuantil untuk mendapatkan informasi lebih banyak untuk menggambarkan hubungan kedua Gambar 2. Scatterplot IPM dan Persentase Penduduk Miskin Menurut Kabupaten/Kota Tahun 2017 diperhatikan dalam membentuk model regresi B-Splines yaitu menentukan orde untuk model, banyaknya knot, dan lokasi penempatan knot. Knot merupakan titik perpaduan bersama dimana terdapat perubahan perilaku pola pada interval yang berlainan. Untuk memperoleh model B-splines yang optimal . maka perlu dipilih lokasi knot yang optimal pula. Kriteria yang digunakan dalam pemilihan knot yang optimal pada penelitian ini yaitu Generalized Cross Validation (GCV). Nilai GCV yang minimum dari model regresi B-Splines dengan beberapa ordo model dan titik Tabel Pemodelan Regresi B-Splines Regresi B-Splines adalah salah satu metode yang digunakan untuk menaksir kurva regresi nonparametrik. Model BSplines dengan titik knots digunakan untuk menyelesaikan kelemahan model splines pada saat orde yang tinggi, titik knot yang banyak atau knots yang terlalu dekat yangakan membentuk matriks dalam perhitungan yang hampir singular sehingga persamaan normal sulit Metode yang digunakan dalam menaksir parameter B-Splines adalah Metode Kuadrat Terkecil (Ordinary Least Squar. didefinisikan secara rekursif. Ada tiga kriteria yang harus Jurnal EMASAINS Volume Vi Nomor 1 Maret Tahun 2019 P-ISSN 2302-2124 E-ISSN 2622 8688 Tabel 1 Nilai GCV dan RSS dari Beberapa Titik Knot Degree/ Ordo Jumlah Knot *Sumber: Hasil Olah Knot Optimal GCV Tabel 1 menunjukkan pasangan nilai GCV dan RSS minimum diperoleh untuk jumlah knot sebanyak 4 pada ordo model 1 dan ordo model 2, serta knot sebanyak RSS 3 untuk ordo model 3. Oleh karena itu, akan dilakukan estimasi parameter untuk ketiga model tersebut. Hasil estimasi parameter ditampilkan pada Tabel 2. Tabel 2 Hasil Estimasi Parameter Model B-Splines Ordo Model Parameter Koefisien t-Statistik <2e-16* 1 04e-07* 4 62e-10* 5 49e-06* 2 0 48e-15 * 1 78e-08* 6 06e-15* 1 P-value Fstatistik Adj R2 Jurnal EMASAINS Volume Vi Nomor 1 Maret Tahun 2019 P-ISSN 2302-2124 E-ISSN 2622 8688 09e-07* 6 *Sumber: Hasil Olah Secara simultan . ji-F), ketiga persamaan signifikan pada tingkat signifikansi 5%. Namun,secara parsial . , model dengan ordo 1 memiliki parameter yang signifikan terbanyak dan nilaiAdj R2 terbesar dibandingkan kedua model lainnya. Model B-Splines terpilih untuk menggambarkanhubungan IPM dan persentase penduduk miskin pada penelitian ini adalah pada model ordo 1 dengan jumlah knotsebanyak 4 (Tabel mengusulkan menambahkan penalty . iffrerence penalt. pada koefisien yang berdekatan dengan B-splines. Secara simultan . ji-F), ketiga persamaan signifikan pada tingkat signifikansi 5%. Namun, secara parsial . , model dengan ordo 2 memiliki parameter yang signifikan terbanyak Adj dibandingkan kedua model lainnya. Model P-Splines menggambarkan hubungan IPM dan persentase penduduk miskin pada penelitian ini adalah model P-Splines ordo 2 dengan jumlah knot sebanyak 4 (Tabel . Pendugaan kurva regresi model B-Splines dan P-Splines dapat dilihat pada gambar berikut . ihat Gambar Pemodelan Regresi P-splines Model Penalized Splines adalah model dikembangkan dari model regresi Bsplines. Model B-splines cenderung overfit ketika jumlah knot meningkat. Oleh karena itu. Eilers dan Marx . Tabel 3 Hasil Estimasi Parameter Model P-Splines Ordo Model Parameter Koefisien t-Statistik P-value Fstatistik 3e-15* Adj R2 Jurnal EMASAINS Volume Vi Nomor 1 Maret Tahun 2019 *Sumber : Hasil Olah P-ISSN 2302-2124 E-ISSN 2622 8688 Berdasarkan Gambar 3, terlihat kurva yang dihasilkan model regresi P-splines memiliki kurva yang lebih halus B-Splines. Kemudian terlihat kurva yang dihasilkan 000131* 48. 34e-05* dari model regresi B-Splines walaupun cenderung kurang halus tetapi hampir menjangkau seluruh sebaran data yang Gambar 3. Perbandingan Plot Model B-Splines dan Model P-Splines Penelitian nonparametrik B-splines dan P-splines. Untuk memperoleh pendekatan terbaik Jurnal EMASAINS Volume Vi Nomor 1 Maret Tahun 2019 P-ISSN 2302-2124 E-ISSN 2622 8688 untuk mengestimasi fungsi regresi untuk variabel IPM dan persentase penduduk miskin dilakukan perbandingan nilai MSE antara metode regresi pada model B-Splines dan Model P-Splines. Semakin kecil MSE maka semakin baik model yang terbentuk. and Penalties. Statistical Science, 11. , 89-102. Eubank. Nonparametric Regression and Splines Smoothing. New York: Marcel Dekker. Hyrdle, . Applied nonparametric regression. London: Cambridge University Press. Harmawati. Warga Negara dan Masalah Kontemporer dalam Paradigma Pembangunan. Citizenship Jurnal Pancasila Kewarganegaraan, 6. , 71-78. Hastie. , & Tibshirani. Generalized Additive Models. London: Chapman and Hall. Hoelman. Panduan SDGs untuk Pemerintah Daerah (Kota dan Kabupate. Pemangku Kepentingan Daerah. Jakarta: InternationalNGO Forum Indonesia Development (INFID). http://bps. Koenker. , & Basset. JR. Regression Quantile. Econometrica, 46, 33-50. Koenker. Ng. , & Portnoy. Quantile Smoothing Splines. Biometric, 81. , 673-680. Mulyani. Andriyana. , & Sudartianto. Modeling the human development index and the percentage of poor people using quantile smoothing splines. AIP Conference Proceedings, 1827. Sen. Development as Development in PracticeOxford, 10. , 258-258. Subanidja. , & Suharto. The Dominants Factors in the Causes of Poverty Level Indonesia. Humanities and Social Sciences Review, 3. , 67-76. Suliswanto. Pengaruh Produk Domestik Bruto (PDB) dan Tabel 4 Perbandingan Nilai MSE MSE_BSplines MSE_PSplines . *Sumber : Hasil Olah Tabel 4 menunjukkan bahwa hubungan antara IPM dan persentase penduduk miskin yang memiliki akurasi tertinggi ditunjukkan dengan nilai MSE terkecil dicapai oleh Regresi B-splines dengan nilai MSE sebesar 0. SIMPULAN DAN SARAN Sebaran data dengan fitting curve menggunakan regresi nonparametrik BSplines dan P-Splines menghasilkan kurva yang halus menjangkau seluruh sebaran data yang ada. Selanjutnya, berdasarkan perbandingan MSE model B-Splines dan P-splines diperoleh hasil bahwa model regresi B-splines untuk variabel IPM dan persentase penduduk miskin memberikan nilai MSE paling kecil sebesar 0. 1928378 sehingga merupakan model yang paling baik DAFTAR RUJUKAN Bappenas. Rancangan Awal: Rencana Pembangunan Jangka Menengah Nasional (RPJMN) 20152019. Buku I: Agenda Pembangunan Nasional. Jakarta: Badan Perencanaan Pembangunan Nasional. Eilers. , & Marx. Flexible Smoothing with B-Splines Jurnal EMASAINS Volume Vi Nomor 1 Maret Tahun 2019 P-ISSN 2302-2124 E-ISSN 2622 8688 Indeks Pembangunan Manusia (IPM) Terhadap Angka Kemiskinan di Indonesia. Jurnal Ekonomi Pembangunan, 8. , 357-366. Wood. Generalized Additive Models: an Introduction with R. Boca Raton: Chapman & Hall/CRC.