Institut Riset dan Publikasi Indonesia (IRPI) MALCOM: Indonesian Journal of Machine Learning and Computer Science Journal Homepage: https://journal. id/index. php/malcom Vol. 3 Iss. 2 October 2023, pp: 115-124 ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Application of Supervised Learning Algorithm for Music Listening Data Classification Penerapan Algoritma Supervised Learning untuk Klasifikasi Data Music Listening Eri Mardiani1*. Nur Rahmansyah2. Ira Kurniati3. Andy Setiawan4. Diah Widiastuti5. Muhammad Ridwan6. Muhammad Zidan Rosyid7. Ari Febriansyah8 Program Studi Informatika. FTKI. Universitas Nasional. Indonesia. Program Studi Animasi Politeknik Negeri Media Kreatif. Indonesia. Program Studi Bisnis Digital. Fakultas Ekonomi dan Bisnis. Institut Teknologi dan Bisnis Swadharma. Jakarta. Indonesia 4,6,7, 8 Program Studi Akuntansi. Fakultas Ekonomi dan Bisnis. Universitas Pembangunan Nasional Veteran Jakarta. Indonesia. Program Studi Teknik Mesin. Universitas Nasional. Indonesia Email: 1erimardiani1@gmail. com, 2nur_rahmansyah@polimedia. id, 3irakurniati4@gmail. andysetiawan2285@upnvj. id, 5diahwidiastuti712@gmail. com, 6muhammadridwann69@gmail. muhammadzidanrosyid@gmail. com, 8arfebrian123@gmail. Received Jun 30th 2023. Revised Aug 05th 2023. Accepted Sept 25th 2023 Corresponding Author: Eri Mardiani Abstract The development of information technology is increasing rapidly until now the latest technologies are being developed, the use of data as processing is now increasingly being applied to various fields, with the use of data technological developments can be carried out that can improve quality and efficiency, data processing can be applied in all fields and one one is in the field of music. Music has become a part of everyday human life. There are already many media that present various kinds of songs with various genres, starting from Pop. Jazz. Rock. R&B, and other genres. By using data mining to process data and analyze music data we can predict the diversity of music listening preferences and by using the Orange Data Mining application tools can help the public to find out what music is interested in by predicting it through several methods in orange tools, with the Naive Algorithm Bayes has a better level of accuracy. Keyword: Big Data. Data Mining. Music. Orange Tools Abstrak Perkembangan teknologi informasi semakin pesat hingga saat ini terus dikembangkan teknologi-teknologi terbaru, penggunaan data sebagai pengolahan kini semakin banyak diterapkan pada berbagai bidang, dengan penggunaan data dapat dilakukan perkembangan teknologi yang dapat meningkatkankan kualitas dan efisiensi, pengolahan data dapat diterapkan di semua bidang dan salah satunya adalah di bidang musik. Musik sudah menjadi bagian dari kehidupan manusia seharihari. Sudah banyak media-media yang menyajikan berbagai macam lagu dengan genre yang beragam pula mulai dari Pop. Jazz. Rock. R&B, dan genre-genre lainnya. Dengan menggunakan data mining untuk mengolah data maupun menganalisis data-data musik kita dapat memprediksi keanekaragaman preferensi mendengarkan musik dan dengan menggunakan tools aplikasi Orange Data Mining dapat membantu masyarakat untuk mengetahui musik apa saja yang diminat dengan memprediksi melalui beberapa metode dalam tools orange, dengan Algoritma Naive Bayes memiliki tingkat akurasi yang lebih baik. Kata Kunci: Big Data. Data Mining. Music. Orange Tools PENDAHULUAN Musik sudah menjadi bagian dari kehidupan manusia sehari-hari. Sudah banyak media-media yang menyajikan berbagai macam lagu dengan genre yang beragam pula mulai dari Pop. Jazz. Rock. R&B, dan DOI: https://doi. org/10. 57152/malcom. MALCOM-03. : 115-124 genre-genre lainnya . Dengan musik, emosi seseorang dapat terpengaruhi, sehingga dapat menjadi alat penenang, dan dapat membantu seseorang lebih rileks. Banyaknya penelitian yang meneliti tentang manfaat mendengarkan lagu pun turut menjadi pendorong manusia tidak lepas dari musik dalam melakukan Musik adalah seni yang terbuat dari kumpulan irama dan suara yang selaras serta harmonis. Dengan , musik seringkali menjadi cara seseorang untuk menenangkan diri dari kerasnya kehidupan. Oleh karena itu dibuat lah kumpulan data . tentang Music Listening Preferences Diversity . Kumpulan data ini dikumpulkan sebagai bagian dari proyek penelitian untuk mengungkap beragam pengalaman dan preferensi mendengarkan musik yang dimiliki individu berdasarkan faktor-faktor seperti jenis kelamin, ras, atau Berdasarkan data Music Listening Preferences Diversity yang olah menggunakan aplikasi orange pada Participan ID (X) dan What is your age (Y) mempengaruhi orang yang mendengarkan musik dengan pengetahuan sebelumnya tentang trek dan artist musik dengan titik tertinggi yaitu pada titik participad Id 86 dan Age prefer not to say, dan terendah pada participan Id 31. Age 18-24 years old. Sedangkan untuk orang yang mendengarkan musik dengan trek dan artis terkini atau sekarang titik tertingginya adalah participan Id 34 dan Age 55-64 years old dan terendah pada participan Id 3 dan Age 18-24 years old. Dan juga melihat penelitian mengenai genre musik seperti pada penelitian yang dilakukan menggunakan datamining mengenai dengan judul AuIdentifikasi Genre Musik dengan Menggunakan Metode Random ForestAy. penelitian tersebut sedikitnya memiliki tujuan yang sama yaitu untuk memahami genre musik apa yang minati . Metode yang tepat untuk digunakan untuk Identifikasi Genre Musik sehingga mengetahui metode apa yang pas untuk mengetahui orang yang mendengarkan musik dengan metode yang sesuai pada penelitian ini. Penelitian yang dilakukan oleh G. Mastrika Giri . telahmembangun sistem rekomendasi musik otomatis dengan metode Case-Based Reasoning(CBR)dengan menggunakan data listening history dan konteks pengguna. Metode CBR,memanfaatkan pengalaman sebelumnyauntuk memecahkan masalah baru, adalah cara yang efektif untuk mendukung pemecahan masalah. Teori ini menyatakan bahwa ketika pembelajar dihadapkan kompleks, mereka dapat menggunakan kasus-kasus sebelumnya untuk menginterpretasikan situasi baru dan memperoleh solusi . Permasalahan yang ditemui dalam penelitian sebelumnya yang dilakukan oleh G. Mastrika Giri . adalah nilai precision berdasarkan preferensi pengguna tidak tinggi, hanya 66%. Berdasarkan analisis hasil rekomendasi, terdapat banyak hasil rekomendasi yang tidak sesuai dengan genre yang biasa didengarkan atau artis favorit dari Maka dari itu diperlukan sebuah sistem rekomendasi yang bisa memberikan rekomendasi musik sesuai dengan artis yang disukai oleh pendengar. METODOLOGI PENELITIAN Ada banyak kemajuan teknologi yang tersedia dengan komputer. Komputer tidak hanya membantu kita dalam menyelesaikan pekerjaan, tetapi juga dapat menjadi alat yang menyenangkan dan berguna untuk digunakan. Untuk lebih memaksimalkan pekerjaan teknologi berbasis internet sangat mendukung pekerjaan secara online. Selain itu, dengan teknologi ineternet pekerjaan menjadi jauh lebih cepat dan lebih mudah selesai daripada penggunaan komputer tradisional. Perkembangan teknologi informasi sudah sedemikian pesat. Teknologi Internet menghubungkan ribuan jaringan komputer individual dan organisasi di seluruh dunia . Perkembangan zaman memberikan peningkatan data yang semakin banyak data yang dibutuhkan oleh setiap manusia . Dengan banyaknya data yang ada, maka semakin sulit juga untuk menganalisis data tersebut dengan cara manual. Oleh karena itu, manusia membutuhkan bantuan data mining untuk mengumpulkan informasi menarik dari data yang tersedia. Dengan menggunakan data mining maka akan mendapatkan penemuan pengetahuan yang menarik dari sejumlah besar data yang disimpan dalam basis data, gudang data . Big Data Analytics dapat menawarkan keuntungan besar bagi bisnis yang menggunakannya secara efektif, termasuk pengambilan keputusan yang lebih baik dan lebih cepat, lebih banyak kepuasan pelanggan, penemuan peluang baru, pengoptimalan proses, dan pembuatan barang dan layanan yang lebih baik . Studi Literatur Tentang Naive Bayes Algorithm for Sentiment analysis Windows PhoneStore Application Reviews dapat disimpulkan bahwa, menganalisa pengguna aplikasi Windows Phone Store dengan mengklasifikasikan review ke dalam kategori opini positif atau negative . Dataset digunakan untuk melihat dampak dari data categorical (Gender. Race/ethnicity. Parental level of education. Lunch, and Test preparation cours. terhadap data numeric . ilai matematika, membaca, dan menuli. Adapun penelitiann ini menggunakan 5 algoritma Data Mining dengan spesifikasi Teknik Klasifikasi . Penerapan Algoritma Supervised Learning untuk Klasifikasi. (Mardiani et al, 2. ISSN(P): 2797-2313 | ISSN(E): 2775-8575 K-Nearest Neighbor Algoritma K-Nearest Neighbor . -NN) merupakan sebuah model algoritma yang digunakan untuk melakukan klasifikasi terhadap objek yang berdasarkan dari data pembelajaran yang jaraknya paling dekat dengan objek tersebut . Ataupun dapat dipahami juga bahwa k-nearest neighbor adalah salah satu algoritma yang paling sederhana dan banyak digunakan. Titik data akan diklasifikasikan berdasarkan kesamaan kelompok tertentu dari titik data lain yang berdekatan. Sehingga, algoritma ini akan memberikan hasil yang kompetitif . Teorema K-NN dapat dilihat pada persamaan 1. yccycn = ocycuycn=1. cuycnyc Oe ycyyc )2 Keterangan . = Jarak sampel = Data sampel pengetahuan = Data input var ke-j = Jumlah sampel Nayve Bayes Salah satu metode data mining ialah klasifikasi Naive Bayes. Naive Bayes Classifier adalah metode klasifikasi yang berakar pada teorema Bayes. Naive bayes merupakan metode pengklasifikasian berdasarkan probabilitas sederhana dan dirancang agar dapat dipergunakan dengan asumsi antar variabel penjelas saling bebas . Pada algoritma ini pembelajaran lebih ditekankan pada pengestimasian probabilitas. tujuan dari metode Nayve Bayes adalah untuk menemukan probabilitas ketika kita mengetahui probabilitas tertentu lainnya. Hasil dari perhitungan data mining menggunakan metode klasifikasi Nayve Bayes akan makin berguna jika penyajiannya menarik dan dapat dipahami dengan baik oleh penerima data . Teorema Naive Bayes dapat ditunjukkan pada persamaan 2 . P(H|X) = Keterangan P(H|X) P(H) P(X|H) P(X) P(X|H). P(H) P(X) = Data dengan class yang belum diketahui = Hipotesis data merupakan suatu class spesifik = Probabilitas hiotesis H berdasar kondisi X (Posteriori Probabilita. = Probabilitas Hipotesis H (Prior Probabilita. = Probabilitas X berdasarkan kondisi hipotesis H = Probabilitas X Decision Tree Decision tree adalah algoritma machine learning yang menggunakan seperangkat aturan untuk membuat keputusan dengan struktur seperti pohon yang memodelkan kemungkinan hasil, biaya sumber daya, utilitas dan kemungkinan konsekuensi atau resiko. Konsepnya adalah dengan cara menyajikan algoritma dengan pernyataan bersyarat, yang meliputi cabang untuk mewakili langkah-langkah pengambilan keputusan yang dapat mengarah pada hasil yang menguntungkan. Klasifikasi ini menggunakan observasi pada node untuk menemukan target pada leaves. Decision Tree merupakan salah satu metode klasifikasi yang paling populer karena mudah untuk diinterpretasi oleh manusia dengan kemampuannya untuk mem-break down proses pengambilan keputusan yang kompleks menjadi lebih simple . Teorema Decision Tree ditunjukkan pada persamaan 3 . cI) = Ocycuycn=1 ycyycn O log 2 ycyycn Keterangan: = Himpunan kasus = Atribut = Jumlah patisi S = Proporsi dari Si terhadap S Ensemble Method Ensemble Method adalah algoritma dalam pembelajaran mesin . achine learnin. dimana algoritma ini sebagai pencarian solusi prediksi terbaik dibandingkan dengan algoritma yang lain karena metode ensemble ini menggunakan beberapa algoritma pembelajaran untuk pencapaian solusi prediksi yang lebih baik daripada MALCOM - Vol. 3 Iss. 2 October 2023, pp: 115-124 MALCOM-03. : 115-124 algoritma yang bisa diperoleh dari salah satu pembelajaran algoritma konstituen saja. Tidak seperti ensemble statistika dalam mekanika statistika biasanya selalu tak terbatas. Ensemble Pembelajaran hanya terdiri dari seperangkat model alternatif yang bersifat terbatas, namun biasanya memungkinkan untuk menjadi lebih banyak lagi struktur fleksibel yang ada diantara alternatif model itu sendiri. Evaluasi prediksi dari ensemble biasanya memerlukan banyak komputasi daripada evaluasi prediksi model tunggal . ingle mode. = OcycNyc=1 Oyyc Eayc . Keterangan: Ea. Oy F. = Pengklasifikasi dasar atau lemah = Tingkat pembelajaran . earning rat. = Hasil, berupa pengklasifikasi kuat atau akhir Linear Regression Linear regression merupakan salah satu algoritma yang memodelkan suatu persamaan untuk menghitung estimasi. Pada metode ini bertujuan untuk mencari pola pada nilai numerik, sehingga data yang dibutuhkan berupa data numerik agar dapat diolah dengan model algoritma ini. Linear regression memprediksi nilai data yang tidak diketahui dengan menggunakan nilai data lain yang terkait dan diketahui. Secara matematis memodelkan variabel yang tidak diketahui atau tergantung dan variabel yang dikenal atau independen sebagai persamaan linier. Teorema Linear Regression ditunjukkan pada persamaan 5 . Y = a bX Mengidentifikasi Atribut dan Label Keterangan: = Variabel terikat . = konstanta = koefisien regresi . besaran Respon yang ditimbulkan oleh variabel = Variabel tidak terikat (Independe. Tahapan Penelitian Data yang dikumpulkan untuk penelitian ini yaitu primer dan sekunder. Teknik pengumpulan data primer berasal dari studi literatur seperti buku maupun jurnal. Adapun Teknik pengumpulan data sekunder pada penelitian ini diperoleh dari media online maupun sumber Ae sumber lainnya. Studi pustaka akan digunakan oleh peneliti guna menjabarkan dan menganalisis data yang sudah dikumpulkan yang memiliki kaitan dengan penelitian ini . Pengumpulan Dataset Preprocessing data Klasifikasi data Evaluasi kinerja dan hasil Perbandingan metode Gambar 1. Tahapan Penelitian Tahapan pada penelitian ini terdiri dari 4 tahap yaitu pengumpulan dataset, pengujian data, proses prediksi, evaluasi kinerja dan hasil perbandingan metode . HASIL DAN PEMBAHASAN K-Nearest Neighbor Pada Data Sampler, menggunakan proporsi data sebesar 10% dari total data seperti pada tabel 1. Pada bagian Predictions dengan menggunakan model kNN, menunjukkan bahwa AUC sebesar 51,9%. CA sebesar 86,6%. F1 sebesar 80,4%. Precision sebesar 75,0%, dan Recall sebesar 86,6% . Hasil prediksi dengan menggunakan model kNN ini sudah cukup baik dengan persentase keseluruhan yang berada di atas 50%, dan dengan total rata-rata persentase sebesar 76,1%. Pada Confusion Matrix, dapat terlihat bahwa untuk data AoMy listening of the tracks and seeing of the artist nowAo data yang benar sebanyak 84 data, dan tidak ada data yang salah, sehingga persentase keberhasilan Penerapan Algoritma Supervised Learning untuk Klasifikasi. (Mardiani et al, 2. ISSN(P): 2797-2313 | ISSN(E): 2775-8575 data AoMy listening of the tracks and seeing of the artist nowAosebesar 100,0% . data benar dari 84 dat. Hasil Confusion Matrix, untuk data AoMy previous knowledge/familiarity with the tracks and the artistAo tidak ada data yang benar, sedangkan 13 data salah dan masuk ke data AoMy listening of the tracks and seeing of the artist nowAo, sehingga persentase keberhasilan data Enrolled sebesar 0,0% . data benar dari 13 dat. Tabel 1. Sampling Dataset Part What is Where are you from? What is the highest degree or Level of school you have Have your any formal . eyond the usual music lessons in Do you Djing ng any kind of Woul d you Your Do you Listen Electro Music? Within Electro Would e your taste as South America MasterAos degree . MA. MS, ME. Yes Female Europe Doctorate . PhD. EdD) Male Europe MasterAos degree . MA. MS, ME. Yes Male Europe Doctorate . PhD. EdD) Yes Male BachelorAos degree . BA. BS) Male MasterAos degree . MA. MS, ME. Yes Male BachelorAos degree . BA. BS) Yes Female North America MasterAos degree . MA. MS, ME. Male Europe Doctorate . PhD. EdD) Male South America BachelorAos degree . BA. BS) Yes Male Europe BachelorAos degree . BA. BS) Male I prefer not to North America Male Oceania Female Europe Female Europe Male Europe Yes Female I prefer not to Europe Male Male Europe Doctorate . PhD. EdD) Yes Male Europe Doctorate . PhD. EdD) Yes To which identity do you most (If not specify in "Other") According to the Fitzpatrick . ttps://en. org/wiki/ Fitzpatrick_scal How would you classify your skin type? Male South America High school degree or High school degree or MasterAos degree . MA. MS, ME. MasterAos degree . MA. MS, ME. MasterAos degree . MA. MS, ME. MasterAos degree . MA. MS, ME. MasterAos degree . MA. MS, ME. MALCOM - Vol. 3 Iss. 2 October 2023, pp: 115-124 MALCOM-03. : 115-124 Part What is To which identity do you most (If not specify in "Other") According to the Fitzpatrick . ttps://en. org/wiki/ Fitzpatrick_scal How would you classify your skin type? Where are you from? Female Europe Male Europe What is the highest degree or Level of school you have MasterAos degree . MA. MS, ME. MasterAos degree . MA. MS, ME. Have your any formal . eyond the usual music lessons in Do you Djing ng any kind of Woul d you Your Do you Listen Electro Music? Within Electro Would e your taste as Yes Yes Pada bagian Data Table yang terhubung dengan Data Sampler, menggunakan Data Train sebanyak 97 dengan adanya missing data . ata yang hilan. sebesar 2,5% seperti pada tabel 2. Tabel 2. Predictions Investigating Influencers of Variation in Music Preference According to the Fitzpatrick Participant What is your age? To which identity do you most Where are you My listening of the tracks now years old Male South America My listening of the tracks now years old Female Europe My listening of the tracks now I prefer not to say years old Male North America My listening of the tracks now years old Male Europe My listening of the tracks now years old Male Europe My listening of the tracks now years old Male Europe My listening of the tracks now years old Male South America My listening of the tracks now years old Female Europe My listening of the tracks now years old Male South America My listening of the tracks now years old Male Europe My listening of the tracks now My listening of the tracks now years old years old Male Asia Male South America My listening of the tracks now I prefer not to say years old Male Europe My listening of the tracks now years old Female Europe My listening of the tracks now I prefer not to say years old I prefer not to say Europe years old years old I prefer not to say I prefer not to say years old Male Europe Male Europe Male Europe Male Europe Male Europe My listening of the tracks now My listening of the tracks now My listening of the tracks now My listening of the tracks now My listening of the tracks now My listening of the tracks now My listening of the tracks now years old years old years old years old Europe What is the highest degree or Have your received any formal musical Do you engage in Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes MasterAos degree . MA. MS, ME. Doctorate . PhD. EdD) High school degree or MasterAos degree . MA. MS, ME. Doctorate . PhD. EdD) MasterAos degree . MA. MS, ME. Doctorate . PhD. EdD) MasterAos degree . MA. MS, ME. MasterAos degree . MA. MS, ME. MasterAos degree . MA. MS, ME. Doctorate . PhD. EdD) BachelorAos degree . BA. BS) MasterAos degree . MA. MS, ME. MasterAos degree . MA. MS, ME. MasterAos degree . MA. MS, ME. BachelorAos degree . BA. BS) Doctorate . PhD. EdD) MasterAos degree . MA. MS, ME. BachelorAos degree . BA. BS) BachelorAos degree . BA. BS) BachelorAos degree . BA. BS) High school degree or Penerapan Algoritma Supervised Learning untuk Klasifikasi. (Mardiani et al, 2. ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Investigating Influencers of Variation in Music Preference According to the Fitzpatrick Participant What is your age? To which identity do you most Where are you My listening of the tracks now years old Male Europe My listening of the tracks now years old Female Europe My listening of the tracks now years old Male Oceania What is the highest degree or High school degree or MasterAos degree . MA. MS, ME. MasterAos degree . MA. MS, ME. Have your received any formal musical Do you engage in Nayve Bayes Menggunakan data yang sama mencoba menggunakan Naive Bayes, untuk hasil Naive Bayes menunjukkan AUC 0. CA 0. F1 0. Precision 0. Recall 0. Artinya, tingkat presisi memprediksi listening of the tracks and seeiing of the artitst diatas 87 %. Menurut prediksi dan data aktual 42 orang akan mendengarkan musik sesuai dengan listening of the tracks and seeiing of the artitst now atau trek dan artis masa kini . rue positi. dan 15 orang akan mendengarkan dengan previous knowledge/familiarty with the tracks and the artis atau pengetahuan mengenai trek musik dan Menurut prediksi sebanyak 57 orang akan mendengarkan sesuai dengan pengalaman, sedangkan menurut fakta akan mendengarkan sesuai trek terkini . alse positi. dan menurut prediksi 1 orang akan mendengarkan musik sesuai dengan trek dan artis musik terkini, sedangkan menurut fakta akan mendengarkan musik dengan pengetahuan atau pengalaman sebelumnya mengenai trek . alse negati. Gambar 2. Hasil Prediksi Participan ID (X) dan What is your age (Y) mempengaruhi orang yang mendengarkan musik dengan pengetahuan sebelumnya tentang trek dan artist musik dengan titik tertinggi yaitu pada titik participad Id 86 dan Age prefer not to say, dan terendah pada participan Id 31. Age 18-24 years old. Sedangkan untuk orang yang mendengarkan musik dengan trek dan artis terkini atau sekarang titik tertingginya adalah participan Id 34 dan Age 55-64 years old dan terendah pada participan Id 3 dan Age 18-24 years old. Decision Tree dan Ensemble Method Dari 3 model algoritma yang ada Tree. Random Forest, dan AdaBoost maka model algoritma yang paling bagus dan baik adalah Random Forest karena dilihat dari AUC nya sebesar 0. 601 atau 60%. Model algoritma AdaBoost memiliki hasil 0. 597 atau 59% dan yang paling kecil adalah Model algoritma Tree yaitu 0,503 atau 50%. Karena Random Forest memiliki model algoritma yang paling bagus, maka ditampilkan hasilnya untuk Menurut prediksi dan data aktual 97 orang akan mendengerakan musik dengan trek dan artis terkini . rue positi. dan 2 orang akan mendengarkan musik dengan pengetahuan sebelumnya mengenai trek dan artisnya . rue negati. Sedangkan 2 orang menurut data prediksi akan medengarkan musik dengan pengetahuan sebelumnya mengenai trek dan artis terkini nyatanya orang tersebut mendengarkan musik dengan trek dan artis terkini . alse positi. dan 14 orang menurut prediksi mendengarkan musik dengan trek dan artis terkini sedangkan nyatanya orang tersebut mendengarkan musik melalui pengetahuan sebelumnya tentang trek dan artist tersebut. MALCOM - Vol. 3 Iss. 2 October 2023, pp: 115-124 MALCOM-03. : 115-124 Gambar 3. Hasil Scatter Plot Participan ID (X) dan Familliaty Score (Y) mempengaruhi listening of the tracks and seeiing of the artitst now dengan titik tertinggi . ,0,. dan terendah pada titik . ,0,. Variabel Participan ID (X) dan Familliaty Score (Y) mempengaruhi previous knowledge/familiarty with the tracks and the artis dengan titik tertinggi . ,1. dan terendahnya pada . ,0,. Gambar 4. Hasil Variabel Random Forest Variable Random Forest mempengaruhi cara mendengarkan musik dimana prediksi Random Forest untuk mendengarkan musik dengan listening of the tracks and seeiing of the artitst now sebanyak 97 orang dan melalui previous knowledge/familiarty with the tracks and the artis sebanyak 14 orang. Selain itu, prediksi Random Forest pada cara mendengarkan melalui previous knowledge/familiarty with the tracks and the artis sebanyak 2 orang dan 2 orang lagi melalui listening of the tracks and seeiing of the artitst now. Linear Regression Pada bagian select columns ini berisi untuk variabel apa yang bakal diuji dan juga targetnya apa. Pada bagian features dengan berbentuk numeric yaitu ada BOTH task 1. BOTH task 2. BOTH task 3. BOTH task 4. Familiarity Score. ARTIST Task 1 . ARTIST Task 2. ARTIST Task 3. ARTIST Task 4. TRACK Task 1. TRACK Task 2. TRACK Task 3. TRACK Task 4 , [Optiona. Do you often Listen to Electronic Music?, [Optiona. Within Electronic music. Would you describe your musical taste as varied?. Looking back at your choices. Which one did you weight the most: dengan targetnya yaitu Looking back at your choices. Indicate what influenced you the most . Pada bagian rank ini untuk melakukan pengurutan pada variabel dimana yang nilainya paling tinggi berada diatas dan variabel tersebut adalah Familiarity Score dan TRACK Task 1 dengan targetnya yaitu Looking back at your choices. Indicate what influenced you the most . Pada bagian correlations juga untuk mengurutkan variabel mana yang tertinggi dan variabel tersebut sama seperti pada bagian rank yaitu Familiarity Score dan TRACK Task 1 dengan targetnya yaitu Looking back at your choices. Indicate what influenced you the most . Penerapan Algoritma Supervised Learning untuk Klasifikasi. (Mardiani et al, 2. ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Pada bagian select columns yang baru, memilih 2 variabel saja yang dimana dari hasil paling tinggi saat pengecekan pada bagian rank dan correlations. mengambil variabel Familiarity Score dan TRACK Task 1 dengan targetnya yaitu Looking back at your choices. Indicate what influenced you the most . Pada Bagian Test and Score, pada gambar diatas menunjukkan bahwa R2 yang dihasilkan memiliki nilai yang rendah . Ada model MSE. RMSE. MAE merupakan nilai-nilai untuk menghitung bagaimana tingkat kekuatan regression. Jadi kita menggunakan model R2 dimana korelasinya antara variabel Familiarity Score dan TRACK Task 1 dengan targetnya yaitu Looking back at your choices. Indicate what influenced you the most . sebesar 0,063 atau sebesar 6,3%. Nilai tersebut membuktikan bahwa sebagian besar variabilitas dalam data tidak dapat dijelaskan oleh model dan tidak menjadi efektif dalam memprediksi variabel target pada data Gambar 5. Scatter Plot Dapat kita lihat pada gambar diatas yang dimana dibuka dari bagian Scatter plot dimana menunjukkan garis regresi dengan sumbu x Familiarity Score dan sumbu Y Looking back at your choices. Indicate what influenced you the most . sebagai target. Gambar diatas menunjukkan bahwa Familiarity score dapat mempengaruhi target karena hasilnya positif yaitu sebesar r = 0,27 . Artinya semakin tinggi familiarity score maka akan mempengaruhi Looking back at your choices. Indicate what influenced you the most . juga semakin tinggi. Dengan begitu maka ada hubungan positif antara variabel independen . dan Variabel dependen . tapi tidak dapat menentukan sebab akibat atau hubungan kausal antara keduanya. Berdasarkan penelitian pada dasarnya seseorang tidak hanya mendengarkan musik yang menjadi faktor utamanya, melainkan juga mengkonsumsi jenisAajenis musik lain, karena pendengar menyesuaikan musik yang di dengar sesuai dengan tren terkini, hanya beberapa yang berdasarkan pengalaman, sehingga musik yang mereka ketahui, berdasarkan dengan kondisi tren saat ini. Pemilihan musik untuk masyarakat global dipandang sebagai pengaruh media. Karena media massa yang saat ini dapat merambah ke berbagai penjuru dunia dan berbagai lapisan masyarakat dengan sangat mudah dan cepat merupakan wahana sosialisasi yang sangat efektif dan efisien untuk mengakrabkan musik dengan masyarakat. KESIMPULAN Berdasarkan dari hasil analisis dan pengujian data untuk memprediksi keanekaragaman preferensi mendengarkan musik yang menggunakan algoritma K-Nearest. Naive Bayes. Decision tree dan ensemble method serta linear regression maka dapat disimpulkan bahwa Algoritma Naive Bayes memiliki tingkat akurasi yang lebih baik dibandingkan algoritma lainnya dengan target Looking back at your choices. Indicate what influenced you the most . Rata rata nilai algoritma Naive Bayes dari lima algoritma lainnya yaitu sebesar kemudian K-Nearest memiliki nilai rata rata sebesar 76,1%. Diikuti dengan rata rata nilai decision tree dan ensemble method sebesar 56,7%, dan terakhir Linear regression yaitu 6,3% untuk nilai rata ratanya. REFERENSI