961
Progresif: Jurnal Ilmiah Komputer Jl.
Ahmad Yani.
33,5 - Kampus STMIK Banjarbaru Loktabat Ae Banjarbaru (Tlp.
, e-mail: puslit.
stmikbjb@gmail.
e-ISSN: 2685-0877 p-ISSN: 0216-3284 Implementasi Algoritma Support Vector Regression dan Linear Regression Untuk Prediksi Harga Rumah Anggun Aulia Bastian1*.
Hanny Hikmayanti Handayani2.
Deden Wahiddin3.
Tatang Rohana4 Teknik Informatika.
Universitas Buana Perjuangan.
Karawang.
Indonesia *e-mail Corresponding Author: If20.
anggunbastian@mhs.
Abstract A house is one of the necessities of human life, but house prices tend to fluctuate every year.
This is one of the causes of prospective buyers having difficulty in determining the budget and making decisions to purchase a house.
So, it is necessary to conduct research to produce accurate house price predictions.
The purpose of this research is to determine the best algorithm between the Support Vector Regression and Linear Regression algorithms in predicting house Datasets are obtained from the results of scrapping on the house buying and selling This study uses a dataset from Telukjambe Timur Subdistrict with a total of 547 data with the parameters used are building area and land area and using a data division of 75:25.
The results of the RMSE and MAPE evaluation show that the Support Vector Regression Algorithm is superior to Linear Regression with an RMSE value of 234,257 and a MAPE value of 21%.
Keywords: House.
Price.
Prediction.
Algorithm.
Evaluation Abstrak Rumah merupakan salah satu kebutuhan hidup manusia, namun harga rumah pada setiap tahunnya cenderung mengalami fluktuasi.
Hal ini menjadi salahsatu penyebab calon pembeli kesulitan dalam menentukan budget dan mengambil keputusan untuk melakukan pembelian Sehingga, perlu dilakukan penelitian untuk menghasilkan prediksi harga rumah yang Adapun tujuan pada penelitian ini yaitu untuk menentukan Algoritma terbaik antara Algoritma Support Vector Regression dan Linear Regression dalam memprediksi harga rumah.
Dataset diperoleh dari hasil scrapping pada website jual beli rumah.
Penelitian ini menggunakan dataset dari Kecamatan Telukjambe Timur dengan jumlah sebanyak 547 data dengan parameter yang digunakan adalah luas bangunan dan luas tanah serta menggunakan pembagian data 75:25.
Adapun hasil dari evaluasi RMSE dan MAPE menunjukkan bahwa Algoritma Support Vector Regression lebih unggul dari Linear Regression dengan nilai RMSE 234.
257 dan nilai MAPE sebesar 21%.
Kata kunci: Rumah.
Harga.
Prediksi.
Algoritma.
Evaluasi Pendahuluan Rumah menjadi salahsatu kebutuhan hidup manusia sebagai tempat tinggal, tempat berlindung dan tempat beristirahat .
Seperti halnya investasi emas, kepemilikan rumah juga dianggap sebagai bentuk investasi yang potensial untuk jangka panjang.
Namun, seiring dengan berjalannya waktu, harga rumah pada setiap tahunnya cenderung mengalami fluktuasi.
Perubahan harga rumah dapat diukur dari beberapa aspek atau faktor pendukung yang dimiliki oleh rumah tersebut .
, .
Lokasi yang strategis, kondisi fisik rumah, termasuk usia rumah dan kualitas kontruksi menjadi faktor yang menyebabkan harga rumah mengalami fluktuasi.
Seperti saat ini, permintaan rumah di Kabupaten Karawang yang semakin meningkat serta sejalan dengan pertumbuhan penduduk yang terus berlanjut.
Urbanisasi dan migrasi penduduk dari luar kota merupakan salah satu penyebabnya.
Menurut data dari Badan Pusat Statistik (BPS) Kabupaten Karawang, populasi wilayah karawang mencapai 2.
882 jiwa pada tahun 2023 dengan tingkat pertumbuhan sebesar 0,42% .
Pertumbuhan penduduk juga berdampak pada kebutuhan masyarakat terhadap rumah yang layak sesuai dengan harga yang dapat dijangkau tergantung kebutuhan masing-masing .
Implementasi Algoritma Support Vector Regressiona.
Anggun Aulia Bastian 962 e-ISSN: 2685-0877 Ketika akan melakukan pembelian rumah, calon pembeli umumnya mempunyai kriteria untuk membeli rumah baik dari spesifikasi bangunan serta fasilitas yang sejalan dengan keterbatasan budget yang dimiliki .
, .
Fluktuasi pada harga rumah menyebabkan calon pembeli sulit dalam menentukan budget dalam melakukan pembelian rumah.
Sehingga, perlu dilakukan penelitian yang menghasilkan prediksi harga rumah secara akurat, hal ini diharapkan dapat memberikan acuan bagi calon pembeli dalam menentukan pilihan rumah yang sesuai dengan kebutuhan serta menyesuaikan budget yang telah ditentukan sebelumnya.
Prediksi adalah suatu metode dalam memperkirakan suatu nilai pada masa mendatang dengan mempertimbangkan data atau informasi pada masa lampau maupun pada masa sekarang .
Prediksi tidak harus menghasilkan nilai yang sesuai dengan apa yang sebenarnya terjadi, tetapi diupayakan untuk menghasilkan nilai yang seakurat mungkin dengan apa yang akan terjadi .
Dalam hal ini, nilai prediksi yang dihasilkan dapat dijadikan acuan untuk membuat suatu keputusan .
Algoritma Support Vector Regression merupakan model regresi dari pengembangan Algoritma Support Vector Machine (SVM) .
Pada kasus regresi.
Algoritma ini menghasilkan nilai dalam bentuk bilangan real .
atau sekuensial .
Pendekatan SVR digunakan untuk memprediksi karena memiliki kemampuan untuk mengatasi overfitting pada akurasi data training saat melakukan prediksi .
, .
Algoritma ini bertujuan untuk menemukan garis pemisah .
dengan mengukur margin atau jarak terdekatnya dari pola data.
Adapun Algoritma Linear Regression merupakan sebuah teknik untuk membuat prediksi berdasarkan hubungan antar variabel dependen .
dan variabel independent .
Terdapat dua jenis Algoritma Linear Regression diantaranya Simple Linear Regression dan Multiple Linear Regression.
Simple Linear Regression adalah hubungan antara satu variabel dependen dengan satu variabel independen, sedangkan Multiple Linear Regression adalah hubungan antar satu variabel dependen dengan dua atau lebih variabel independennya .
Berdasarkan latarbelakang yang telah dipaparkan, pada penelitian ini akan menggunakan Algoritma Support Vector Regression dan Linear Regression untuk prediksi harga Penelitian ini bertujuan untuk menentukan algoritma terbaik antara Algoritma Support Vector Regression dan Linear Regression untuk prediksi harga rumah di Kabupaten Karawang.
Tinjauan Pustaka Berdasarkan penelitian .
untuk prediksi harga rumah menggunakan Algoritma KNearest Neighbor dan Nayve Bayes.
Data diperoleh dari Kaggle dengan jumlah data sebanyak 601 dataset.
Hasil dari penelitian ini menunjukkan bahwa Algoritma KNN lebih baik dibandingkan nayve bayes dengan nilai akurasi 0,5714.
Namun.
Algoritma tersebut kurang bisa dalam melakukan prediksi yang dimana nilai MAPE mencapai 43,52 yang termasuk kategori AucukupAy.
Selanjutnya, pada penelitian .
dengan topik yang sama .
menggunakan Algoritma Random Forrest Regression dan Multiple Linear Regression.
Pada penelitian ini, dataset diperoleh dari website Kaggle.
com dengan jumlah sebanyak 1010 dataset dengan 7 variabel dengan pembagian data 80:20.
Hasil dari penelitian ini menunjukkan bahwa Algoritma Random Forrest Regression menghasilkan nilai akurasi yang tinggi yaitu 81,86%.
Kemudian, pada penelitian yang telah dilakukan .
menggunakan Algoritma Random Forest Regression untuk prediksi harga rumah.
Dataset diperoleh dari website Kaggle.
com dengan jumlah sebanyak 1001 dataset rumah di wilayah Jakarta Selatan.
Hasil dari penelitian ini memperoleh akurasi sebesar 75,10%.
Selanjutnya pada penelitian yang dilakukan .
dengan topik yang sama .
, .
menggunakan Algoritma Regresi Linier.
Random Forest Regression dan Gradient Boosted Trees Regression.
Dataset yang digunakan diperoleh dari dataset yang sama .
, .
dengan masingmasing memiliki 7 variabel.
Hasil prediksi menunjukkan bahwa Algoritma Random Forres Regression memiliki nilai error yang lebih kecil yaitu 0.
440Selanjutnya, pada penelitian .
untuk prediksi harga rumah daerah Jabodetabek dengan menggunakan Algoritma Multiple Linear Regression.
Dataset yang digunakan sebanyak 3553 data dengan pembagian data 80:20.
Hasil dari penelitian ini menghasilkan nilai akurasi 85%.
Setelah melakukan literatur review pada penelitian sebelumnya, penelitian ini terdapat beberapa kesamaan dengan penelitian sebelumnya salahsatunya yaitu mengimplementasikan Algoritma Support Vector Regression dan Linear Regression.
Adapun perbedaan dari penelitian sebelumnya yaitu pada penggunaan dataset, dalam penelitian ini dataset yang akan digunakan Progresif: Vol.
No.
Agustus 2024: 961-972 Progresif e-ISSN: 2685-0877 diperoleh dari hasil scraping dari website jual beli rumah daerah Karawang.
Selain itu, penelitian ini akan menerapkan tahap teknik preprocessing tambahan yaitu normalisasi data dan seleksi Hal ini diharapkan dapat prediksi yang lebih akurat.
Metodologi Pada penelitian ini terdiri dari beberapa prosedur diantaranya pengumpulan data, preprocessing, pembagian dataset, modeling dan evaluasi.
Adapun prosedur penelitian dapat dilihat pada gambar 1.
Gambar 1.
Prosedur Penelitian Pengumpulan data Dataset yang digunakan yaitu data rumah di Kabupaten Karawang yang diperoleh dari hasil scraping pada website rumah123.
com dan lamudi.
com yang merupakan sebuah website jual beli rumah di Indonesia.
Dengan melakukan teknik scraping, memungkinkan untuk mengumpulkan data dengan jumlah yang besar dan mendapatkan sumber data terkait variabel yang dibutuhkan.
Adapun data yang diperoleh dari hasil scraping sebanyak 1653 data dengan 9 Preprocessing Tahap preprocessing merupakan tahapan penting dalam pengolahan suatu data.
Preprocessing bertujuan untuk meningkatkan kualitas data agar dapat digunakan secara efektif.
Peprocessing dimulai dengan melakukan cleaning data yang terdiri dari drop variabel yang tidak Kemudian dilanjutkan dengan melakukan pemeriksaan missing value, duplikat data, outlier dan noise.
Setelah melakukan cleaning data, tahapan selanjutnya yaitu melakukan transformasi data.
Pada tahap ini digunakan untuk mengubah data objek menjadi integer dengan menggunakan teknik label encoder.
Selain itu, pada tahap ini juga melakukan perubahan data pada variabel price dengan cara setiap data dibagi menjadi satu juta, hal ini bertujuan untuk memudahkan dalam membaca data.
Kemudian pada tahap selanjutnya normalisasi data.
Tahap normalisasi pada penelitian ini menggunakan teknik MinMaxScaller.
Pembagian data Tahap selanjutnya yaitu pembagian dataset.
Penelitian ini akan menggunakan pembagian data 75% sebagai data latih dan 25% sebagai data uji.
Modeling Pada penelitian ini prediksi dilakukan menggunakan Algoritma Support Vector Regression dan Linear Regression.
Untuk mengimplementasikan Algoritma SVR menggunakan Implementasi Algoritma Support Vector Regressiona.
Anggun Aulia Bastian 964 e-ISSN: 2685-0877 high dimensional feature space atau disebut dengan kernel.
Berikut merupakan rumus untuk kasus non linear yang ditunjukkan pada persamaan .
= Ocycuycn.
caycn ycaycnO ) ya.
cuycn , yc.
Radial Basis Function merupakan salahsatu kernel yang sering digunakan dalam penelitian .
Berikut merupakan rumus pada kernel RBF yang ditunjukkan pada persamaan .
cu, y.
= O.
/2yua 2 a .
Selain Algoritma Support Vector Regression, penelitian ini juga mengimplementasikan Algoritma Linear Regression.
Pada penelitian ini akan menggunakan jenis Algoritma Multiple Linear Regression.
Berikut merupakan perhitungan dari Multiple Linear Regression yang ditunjukkan pada persamaan .
ycU = yca yca1 ycU1 yca2 ycU2 U ycaycu ycUycu a .
Evaluasi Setelah melakukan tahapan modeling, tahap selanjutnya yaitu melakukan evaluasi untuk menghitung tingkat akurasi antara nilai prediksi dan nilai aktual berdasarkan Algoritma yang Adapun pada penelitian akan menggunakan evalusasi Root Mean Squared Error (RMSE) dan Mean Absolute Percentage Error (MAPE).
Berikut merupakan perhitungan RMSE yang ditunjukkan pada persamaan .
2 a.
ycIycAycIya = Oo( ) Oc.
cycn Oe yc ycu Adapun perhitungan MAPE yang ditunjukkan pada persamaan .
ycAyaycEya = Ocycu ycn =.
ycuycnOeyceycn ycuycn ycu y 100 a.
RMSE merupakan perhitungan nilai kuadrat error atau selisih antara nilai aktual dan nilai prediksi, yang dimana jika nilai RMSE yang dihasilkan tinggi maka keakuratan prediksi model cenderung jauh dari nilai yang sebenarnya .
Adapun evaluasi MAPE biasanya digunakan untuk pengukuran presentase kesalahan antara nilai aktual dengan hasil prediksi.
Adapun skala akurasi pada evaluasi MAPE ditunjukkan pada tabel 1.
Tabel 1.
Akurasi Prediksi MAPE .
Presentase MAPE Kategori <10% Sangat baik <20 % Baik <50 % Cukup >50% Buruk Hasil dan Pembahasan Pengumpulan data Pengumpulan data dilakukan dengan teknik scraping dari website jual beli rumah yaitu com dan lamudi.
Dalam melakukan scraping data tools yang digunakan adalah Web Scraper extentions dari google chrome.
Data yang diperoleh dari hasil scraping sebanyak 1653 yang terdiri dari 9 variabel diantaranya years, title, addres, building_area, surface_area, bedroom, bathroom, area_parking dan price.
Berikut adalah dataset hasil scraping yang ditunjukkan pada gambar 2.
Progresif: Vol.
No.
Agustus 2024: 961-972 Progresif e-ISSN: 2685-0877 Gambar 2.
Dataset rumah Berdasarkan gambar 2, pada variabel address terdiri dari 29 kecamatan.
Namun, pada penelitian ini akan menggunakan satu kecamatan saja, hal ini dikarenakan pada dataset tersebut memiliki rentang harga yang terlalu jauh yang dapat menyebabkan hasil prediksi yang kurang Sebelum melakukan preprocessing, dataset dikelompokkan berdasarkan kecamatan, kemudian dilanjutkan dengan menghitung jumlah dataset pada masing-masing kecamatan.
Dari perhitungan tersebut, diperoleh bahwa kecamatan Telukjambe Timur memiliki jumlah data yang paling banyak.
Sehingga, penelitian ini akan menggunakan dataset dari kecamatan Telukjambe Timur.
Adapun jumlah dataset pada kecamatan Telukjambe Timur sebanyak 547 data.
Berikut merupakan data hasil dari pengelompokkan berdasarkan alamat yang ditunjukkan pada gambar Gambar 3.
Dataset rumah Kecamatan Telukjambe Timur Setelah proses tersebut, langkah selanjutnya yaitu melihat informasi dari dataset dengan menggunakan fungsi info().
Fungsi ini digunakan untuk melihat informasi dari dataset seperti jumlah kolom dan type data dari masing-masing variabel.
Berdasarkan dataset tersebut, terdapat type data integer sebanyak delapan kolom dan type data object sebanyak satu kolom.
Berikut merupakan informasi dataset yang ditunjukkan pada gambar 4.
Gambar 4.
Informasi dataset Preprocessing Pada tahap preprocessing terdiri dari beberapa langkah yaitu cleaning data, transformasi data, normalisasi data, dan seleksi fitur.
Cleaning data Pada tahap cleaning data terdiri dari beberapa langkah yaitu drop variabel yang tidak relevan, pemeriksaan missing value, pemeriksaan duplikat data dan pemeriksaan noise dan Tahap pertama yang dilakukan yaitu drop variabel yang tidak relevan.
Variabel yang akan di drop adalah variable title dan address.
Hasil drop variabel ditunjukkan pada gambar 5.
Implementasi Algoritma Support Vector Regressiona.
Anggun Aulia Bastian 966 e-ISSN: 2685-0877 Gambar 5.
Hasil drop variabel Setelah proses drop variabel, tahap selanjutnya yaitu pengecekan missing value dengan menggunakan fungsi isnull().
Pengecekan missing value dilakukan untuk mencari nilai kosong diantara data yang memiliki nilai.
Hasil dari penerapan missing value menunjukkan bahwa dataset yang digunakan tidak memiliki missing value.
Hasil pengecekan missing value ditunjukkan pada Tabel 2.
Hasil pemeriksaan missing value Surface_area Building_area area_parking Setelah melakukan proses pengecekan missing value, tahap selanjutnya yaitu pengecekan duplikat data dengan menggunakan fungsi duplicated().
Tahap ini bertujuan untuk mengetahui jumlah data dengan nilai yang sama.
Adapun source code dan hasil pengecekan duplikat data ditunjukkan pada gambar 6.
Gambar 6.
Source code dan hasil duplikat data Berdasarkan gambar 6.
menunjukkan bahwa dataset yang digunakan memiliki duplikat data dengan jumlah sebanyak 21 data.
Adapun langkah untuk menghapus duplikat data yaitu dengan menggunakan fungsi drop.
duplicated().
Pada tabel 3 menunjukkan jumlah data sebelum dan sesudah dilakukan penghapusan duplikat data.
Tabel 3.
Jumlah dataset sebelum dan sesudah pembersihan duplikat data Jumlah Data Awal:
Jumlah Data Bersih:
Tahap selanjutnya yaitu proses pemeriksaan data noise dan outlier.
Adapun visualisasi data noise dan outlier ditunjukkan pada gambar 7.
Progresif: Vol.
No.
Agustus 2024: 961-972 Progresif e-ISSN: 2685-0877 Gambar 7.
Data noise dan outlier Berdasarkan gambar 7.
Data yang digunakan terdapat data outlier.
Setelah mengetahui dataset yang digunakan memiliki outlier, langkah selanjutnya yaitu menghapus outlier pada baris dan kolom menggunakan teknik interquartile range (IQR).
Adapun proses menghapus outlier dilakukan dengan cara menghitung nilai Q1.
Q2 dan IQR.
Selanjutnya menentukan nilai batas atas dan batas bawah.
Jika nilai berada pada rentang batas atas dan bawah, maka data tersebut dianggap sebagai outlier.
Hasil dari penghapusan data outlier, dataset yang digunakan menjadi Adapun teknik yang digunakan untuk mendeteksi data noise yaitu dengan menggunakan teknik z-score.
Proses deteksi noise dilakukan dengan cara mengidentifikasi nilai rata-rata dengan menggunakan standar deviasi.
Setelah itu dilakukan perhitungan dengan menggunakan nilai ambang batas.
Jika hasil perhitungan berada diluar rentang ambang batas, maka data tersebut dianggap sebagai noise.
Berdasarkan penerapan teknik tersebut, terdapat 3 data yang dianggap sebagai data noise.
Kemudian dilakukan pembersihan data noise pada dataset, sehingga dataset berubah menjadi 354 data.
Transformasi Data Proses selanjutnya yaitu transformasi data, pada penelitian ini transformasi data digunakan untuk mengubah nilai yang terdapat pada variabel price dengan membagi data price dibagi dengan satu juta.
Hasilnya akan mengurangi nilai 0 sebanyak 6 karakter dari belakang.
Hal ini dilakukan agar data mudah untuk diolah dan hasilnya juga mudah dibaca.
Berikut merupakan data sebelum dan sesudah transformasi pada pada variabel price yang ditunjukkan pada tabel 4.
Tabel 4.
Data transfromasi variabel price Sebelum Sesudah .
Normalisasi data Tahap selanjutnya yaitu normalisasi data menggunakan teknik MinMaxScaler.
Teknik ini dilakukan dengan cara menghitung nilai minimum dan maximum di setiap kolom pada dataset.
Adapun hasil normalisasi akan menghasilkan nilai dengan batas range 0 sampai 1.
Pada tabel 5 menunjukkan hasil dari normalisasi menggunakan teknik MinMaxScaller.
Surface_ 0,176471 0,565706 0,565706 Tabel 5.
Data hasil normalisasi Implementasi Algoritma Support Vector Regressiona.
Anggun Aulia Bastian 968
e-ISSN: 2685-0877
0,176471
0,211765
0,176471
Seleksi Fitur Tahap selanjutnya yaitu seleksi fitur.
Teknik yang digunakan pada tahap ini yaitu correlation based fitur.
Proses yang dilakukan adalah menghitung nilai korelasi antar atribut dengan target.
Jika nilai korelasi mendekati angka 1 mengindikasikan adanya hubungan positif yang kuat antar atribut, sedangkan jika nilai korelasi mendekati 0, mengindikasikan bahwa tidak adanya hubungan antar atribut.
Berikut merupakan visualisasi dari seleksi fitur yang ditunjukkan pada gambar 8.
Gambar 8.
Visualisasi Korelasi antar atribut Berdasarkan gambar 8.
terdapat dua atribut yang memiliki korelasi yang tinggi dengan atribut price.
Adapun atribut tersebut antara lain surface_area .
dan building_area .
Sedangkan years (-0,.
, bedroom .
dan bathroom .
,33 dan area_parking bernilai .
yang artinya dataset tersebut memiliki nilai yang sama, sehingga tidak ada kolelasi yang dapat Oleh karena itu, atribut yang memiliki nilai korelasi dibawah 0,5 akan di drop.
Adapun fungsi yang digunakan untuk menghapus atribut yaitu fungsi drop().
Berikut merupakan atribut yang digunakan yaitu surface_area, building_area dan price.
Pembagian data Tahap selanjutnya yaitu melakukan pembagian data latih dan data uji.
Sebelum melakukan pembagian data, variabel pada dataset terlebih dahulu dibagi menjadi variabel X dan Berikut merupakan source code untuk membagi data ditunjukkan pada gambar 9.
Gambar 9.
Source Code pembagian data Berdasarkan gambar 9.
menjelaskan bahwa variabel X terdiri dari variabel surface_area, dan building_area.
Sedangkan, variabel y terdiri dari variabel price.
Variabel y juga disebut sebagai variabel target untuk melakukan prediksi.
Setelah dilakukan proses tersebut, tahap selanjutnya yaitu membagi dataset dengan menggunakan pembagian data 75:25.
Adapun hasil pembagian dataset ditunjukkan pada tabel 6.
Tabel 6.
Hasil pembagian data latih dan uji Data latih: 265 Data uji: 89 Progresif: Vol.
No.
Agustus 2024: 961-972 Progresif e-ISSN: 2685-0877 Modeling Algoritma Support Vector Regression Sebelum melakukan implementasi model, terlebih dahulu menentukan parameter optimal agar model dapat memprediksi secara akurat.
Berdasarkan penelitian .
bahwa Algoritma Support Vector Regression dengan menentukan parameter optimal menggunakan GridSearchCV mampu untuk memprediksi dataset dengan cukup akurat.
Sehingga pencarian parameter terbaik pada penelitian ini menggunakan GridSearchCV dengan parameter yang dicari C, gamma dan Adapun tahap awal untuk menentukan mencari parameter terbaik dengan menggunakan GridSearchCV perlu ditentukan nilai pada setiap parameter.
Berikut merupakan nilai dari setiap parameter untuk menemukan nilai parameter terbaik yang ditunjukkan pada tabel 7.
Tabel 7.
Nilai masing-masing parameter .
Parameter Nilai 1, 1, 10, 100 Gamma 01, 0.
1, 1, 10
Epsilon 001, 0.
01, 0.
1, 1, 10
Berdasarkan tabel 7.
Nilai parameter C.
Gamma dan Epsilon diperoleh dari penelitian yang telah dilakukan sebelumnya .
, .
Berdasarkan nilai parameter tersebut, pada penelitian ini diperoleh hasil nilai parameter yang paling optimal yaitu C= 100, gamma = 10, epsilon = 10.
Setelah mengetahui nilai terbaik dari masing-masing parameter, tahap selanjutnya yaitu implementasi Algoritma untuk memprediksi harga rumah yang berlokasi di Kabupaten Karawang menggunakan Support Vector Regression dengan menggunakan kernel RBF.
Pada menunjukkan hasil prediksi dengan menampilkan perbandingan antara data aktual dan data prediksi.
Tabel 8.
Nilai aktual dan prediksi Algoritma Support Vector Regression Index Aktual Prediksi Selisih Berdasarkan tabel 8.
Menunjukkan perbandingan antara nilai aktual dan nilai prediksi, terlihat selisih pada setiap dataset yang memiliki nilai yang beragam, seperti pada index 88 yang memiliki nilai selisih 7, kemudian terdapat selisih yang paling jauh yaitu pada index 87 yang memiliki nilai selisih mencapai (-.
Linear Regression Pada penelitian ini, jenis algoritma yang digunakan yaitu Multiple Linear Regression.
Untuk implementasi algoritma, model di inisialisasi dengan Aolin_reg = LinearRegression()Ao dan dilatih menggunakan data prediksi (X_trai.
dan data target .
_trai.
menggunakan Aolin_reg.
fit(X_train, y_trai.
Ao.
Setelah melakukan pemodelan algoritma, langkah selanjutnya yaitu menentukan persamaan Algoritma Multiple Linear Regression yang menghasilkan nilai koefisien .
dan intercept .
yang ditunjukkan pada gambar 10.
Implementasi Algoritma Support Vector Regressiona.
Anggun Aulia Bastian 970 e-ISSN: 2685-0877 Gambar 10.
Persamaan Linear Regression Berdasarkan gambar 10.
terdapat nilai intercept dan coefficient.
Nilai intercept merupakan nilai rata rata y, sedangkan nilai coef adalah bilangan yang melekat pada sebuah variabel, maka persamaannya dapat dituliskan sebagai berikut.
yc = 625.
ycu2 Dari persamaan diatas, perhitungan Algoritma Multiple Linear Regression menghasilkan prediksi harga rumah di Kabupaten Karawang.
Berikut merupakan hasil prediksi harga rumah di Kabupaten Karawang dengan menampilkan perbandingan harga aktual dengan harga prediksi yang ditunjukkan pada tabel 9.
Tabel 9.
Hasil nilai aktual dan prediksi Algoritma Linear Regression Index Aktual Prediksi Selisih Berdasarkan tabel 9.
menunjukkan perbandingan antara nilai aktual dan nilai prediksi, terlihat selisih pada setiap dataset yang memiliki nilai beragam, seperti pada index 1 yang memiliki nilai selisih 12, kemudian terdapat selisih yang paling jauh yaitu pada index 89 yang memiliki nilai selisih mencapai 319.
Evaluasi Tahap selanjutnya yaitu evaluasi model dari kedua Algoritma menggunakan RMSE dan MAPE.
Berikut merupakan hasil dari evaluasi menggunakan RMSE dan MAPE ditunjukkan pada Tabel 10.
Hasil Evaluasi RMSE dan MAPE
Algoritma
RMSE
MAPE
Support Vector Regression Linear Regression Berdasarkan tabel 10.
hasil RMSE digunakan untuk menghitung seberapa besar hasil prediksi dan aktual yang diperoleh dari perhitungan akar yang dikuadratkan yang kemudian dirata-ratakan.
Semakin mendekati angka 0 maka hasil prediksi sangat baik.
Berdasarkan tabel evaluasi pada kedua model algoritma menggunakan RMSE menghasilkan nilai 234.
257 untuk Algoritma Support Vector Regression dan 249.
086 untuk Algoritma Linear Regression, yang dimana hasil evaluasi algoritma menghasilkan selisih nilai prediksi dan nilai aktual yang cukup Sedangkan pada evaluasi menggunakan MAPE, pada Algoritma Support Vector Regression menghasilkan nilai 21% dan untuk Algoritma Linear Regression menghasilkan nilai sebesar 22%.
Dari hasil evaluasi RMSE dan MAPE dapat disimpulkan bahwa nilai evaluasi Algoritma Support Vector Regression lebih unggul dibandingkan Algoritma Linear Regression.
Progresif: Vol.
No.
Agustus 2024: 961-972 Progresif e-ISSN: 2685-0877 Pembahasan Penelitian ini memperkuat dari penelitian sebelumnya tentang prediksi harga rumah menggunakan Algoritma Support Vector Regression dan Linear Regression.
Berdasarkan penelitian sebelumnya menunjukan bahwa kedua Algoritma tersebut efektif dalam melakukan prediksi harga rumah dengan menghasilkan nilai prediksi yang bervariasi tergantung pada dataset dan tahapan yang digunakan.
Pada penelitian .
menunjukkan Algoritma SVR memiliki akurasi yang tinggi dibandingkan dengan Algoritma Linear Regression.
Adapun pada penelitian .
menunjukkan bahwa Algoritma Linear Regression menghasilkan nilai yang cukup baik untuk melakukan prediksi harga rumah.
Pada penelitian ini, pengujian dilakukan menggunakan Algoritma Support Vector Regression dan Linear Regression.
Penelitian ini menggunakan dataset hasil scraping pada website jual beli rumah.
Hasil dari penelitian ini menunjukkan bahwa Algoritma Support Vector Regression memiliki nilai error yang lebih rendah.
Hal ini mendukung temuan dari penelitian sebelumnya .
yang menunjukkan bahwa Algoritma SVR efektif dalam melakukan prediksi harga Dengan demikian, penelitian ini tidak hanya mendukung dari penelitian-penelitian sebelumnya, tetapi penelitian ini menerapkan teknik tambahan pada tahap preprocessing sehingga menghasilkan akurasi yang cukup baik.
Simpulan Berdasarkan hasil penelitian dengan menggunakan Algoritma Support Vector Regression dan Linear Regression, dapat disimpulkan bahwa untuk memprediksi harga rumah dengan menggunakan Algoritma Support Vector Regression lebih baik dibandingkan Algoritma Linear Regression.
Dapat dilihat hasil evaluasi dengan menggunakan RMSE dan MAPE menunjukkan Algoritma Support Vector Regression memiliki nilai error yang lebih kecil dibandingkan dengan Algoritma Linear Regression.
Adapun nilai RMSE yang diperoleh algoritma Support Vector Regression sebesar 252.
277, sedangkan pada algoritma Linear Regression diperoleh nilai RMSE sebesar 253.
Sedangkan, pada evaluasi menggunakan MAPE pada Algoritma Support Vector Regression menghasilkan nilai 21%, sedangkan pada Algoritma Linear Regression menghasilkan nilai 22%.
Berdasarkan hasil selisih nilai aktual dan nilai prediksi yang sangat beragam, diharapkan pada penelitian selanjutnya menggunakan data yang lebih banyak serta dengan menambahkan variabel-variabel independent yang relevan dan menggunakan Algoritma pembanding lainnya untuk mengetahui hasil yang lebih bagus serta pengujian lebih Daftar Referensi Muhammad.
Damayanti.
Zaki.
Muhayat, and R.
Wirawan.
AuAnalisis Prediksi Harga Rumah Sesuai Spesifikasi Menggunakan Multiple Linear Regression,Ay Jurnal Informatik, vol.
3, no.
17, pp.
238Ae245, 2021.
Haryanto.
Rahaningsih, and F.
Basysyar.
AuKomparasi Algoritma Machine Learning Dalam Memprediksi Harga Rumah,Ay JATI (Jurnal Mahasiswa Teknik Informatik.
, vol.
7, no.
1, pp.
533Ae539, 2023.
Putra and I.
Suhartana.
AuPerbandingan Akurasi Algoritma Regresi Linier.
Regresi Polinomial, dan Support Vector Regression Pada Model Sistem Prediksi Harga Rumah,Ay Jurnal Nasional Teknologi Informasi dan Aplikasinya (JNATIA), vol.
1, no.
1, pp.
147Ae154, 2022.
Statistik.
AuPenduduk.
Laju Pertumbuhan Penduduk per Tahun dan Distribusi Persentase Penduduk Menurut Kecamatan di Kabupaten Karawang,Ay BADAN PUSAT STATISTIK.
Accessed:
Jan.
[Onlin.
Available:
https://karawangkab.
id/statictable/2023/10/10/292/penduduk-laju-pertumbuhanpenduduk-per-tahun-dan-distribusi-persentase-penduduk-menurut-kecamatan-dikabupaten-karawang-2022.
Lestari and I.
Astuti.
AuPenerapan Random Forest Regression Untuk Memprediksi Harga Jual Rumah Dan Cosine Similarity Untuk Rekomendasi Rumah Pada Provinsi Jawa Barat,Ay Jurnal Ilmiah FIFO, vol.
14, no.
2, p.
Nov.
2022, doi:
22441/fifo.
Uswatun Hasanah.
Maula, and A.
Tholib.
AuAnalisis Prediksi Harga Rumah di Jabodetabek Menggunakan Multiple Linear Regression,Ay Jurnal Informatika Kaputama (JIK), vol.
7, no.
2, pp.
216Ae224, 2023.
Implementasi Algoritma Support Vector Regressiona.
Anggun Aulia Bastian 972 e-ISSN: 2685-0877 Siregar.
Faisal.
Cahyana, and B.
Priyatna.
AuPerbandingan Algoritme Klasifikasi Untuk Prediksi Cuaca,Ay Jurnal Accounting Information System (AIMS), vol.
3, no.
1, pp.
15Ae24, 2020.
Mulyana.
Aryanto, and M.
Aprilia.
AuPenerapan Metode Single Exponential Smoothing Untuk Prediksi Kasus Positif COVID 10 di Kabupaten Bengkalis,Ay Jurnal CoSciTech (Computer Science and Information Technolog.
, vol.
3, no.
3, pp.
415Ae421.
Dec.
doi: 10.
37859/coscitech.
Joya Arditna Br Bukit and R.
Kurniawan.
AuPrediksi Harga Tandan Buah Segar dengan Algoritma K-Nearest Neighbor,Ay Jurnal Sistem Komputer dan Informatika (JSON), 5, no.
1, pp.
92Ae101, 2023, doi: 10.
30865/json.
Ginting.
Sigiro.
Manurung, and J.
Sinurat.
AuPerbandingan Metode Algoritma Support Vector Regression dan Multiple Linear Regression Untuk Memprediksi Stok Obat,Ay Journal of Applied Technology and Informatics Indonesia, vol.
1, no.
2, pp.
29Ae34, 2021.
Putri.
Prasetijo, and D.
Eridani.
AuPerbandingan Kinerja Algoritme Nayve Bayes Dan K-Nearest Neighbor (Kn.
Untuk Prediksi Harga Rumah,Ay Transmisi: Jurnal Ilmiah Teknik Elektro, vol.
24, no.
4, pp.
162Ae171, 2022.
Rais.
Warjiyono.
Alfarobi.
Hadi, and W.
Kurniawan.
AuAnalisa Prediksi Harga Jual Rumah Menggunakan Algoritma Random Forest Machine Learning,Ay Jurnal Riset Sistem Informasi dan Teknologi Informasi (JURSISTEKNI), vol.
6, no.
2, pp.
416Ae 423, 2024.
Fitri.
AuAnalisis Perbandingan Metode Regresi Linier.
Random Forest Regression dan Gradient Boosted Trees Regression Method untuk Prediksi Harga Rumah,Ay Journal Of Applied Computer Science And Technology (JACOST), vol.
4, no.
1, pp.
2723Ae1453, 2023, doi: 10.
52158/jacost.
Sepri and A.
Fauzi.
AuPrediksi Harga Cabai Merah Menggunakan Support Vector Regression,Ay Computer Based Information System Journal, vol.
8, no.
2, pp.
1Ae5, 2020.
Ismafillah.
Rohana, and Y.
Cahyana.
AuImplementasi Model Support Vector Machine dan Logistic Regression Untuk Memprediksi Penyakit Stroke,Ay Jurnal Riset Kompute.
, 10, no.
1, pp.
2407Ae389, 2023, doi: 10.
30865/jurikom.
Vermaysha and N.
Nurmalitasari.
AuPrediksi Harga Rumah di Kabupaten Karanganyar Menggunakan Metode Regresi Linear,Ay in Prosiding Seminar Nasional Teknologi Informasi dan Bisnis, 2023, pp.
6Ae11.
Subiyanto.
Amanda.
Fachrian.
Rohim, and N.
Chamidah.
AuPeramalan Kasus Harian Monkeypox Dunia Berdasarkan Metode Support Vector Regression (SVR),Ay Jurnal Aplikasi Statistika & Komputasi Statistik, vol.
15, no.
1, pp.
27Ae 36, 2023.
Balivada.
Grant.
Zhang.
Ghosh.
Guha, and R.
Matamala.
AuA wireless underground sensor network field pilot for agriculture and ecology: Soil moisture mapping using signal attenuation,Ay Sensors, vol.
22, no.
10, p.
3913, 2022.
Progresif: Vol.
No.
Agustus 2024: 961-972