Journal of Informatics. Electrical and Electronics Engineering ISSN 2807-9507 (Media Onlin. Vol 2. No 4. June 2023 | Hal 107Oe112 https://djournals. com/jie DOI 10. 47065/jie. Pendekatan Violin Plot sebagai Pengenalan Pola untuk Interpretasi Data Penjualan Spare Part Komputer Furqoni Yudhistira1,*. Erlin Windia Ambarsari1. Frieyadie2 1 Fakultas Teknik dan Ilmu Komputer. Teknik Informatika. Universitas Indraprasta PGRI. DKI Jakarta. Indonesia Fakultas Teknologi Informasi. Sistem Informasi. Universitas Nusa Mandiri. DKI Jakarta. Indonesia Email: 1,*informatikakoe@gmail. com, 2erlinunindra@gmail. com, 3frieyadie@nusamandiri. Email Penulis Korespondensi: informatikakoe@gmail. AbstrakOePenelitian ini mengkaji penggunaan pemodelan visual dalam memahami pola penjualan spare part komputer di PT Prima Krida Solusindo. Penggunaan violin plot digunakan sebagai metode interpretasi data, dengan fokus pada distribusi data penjualan untuk mendapatkan pemahaman yang lebih mendalam tentang kebutuhan konsumen. Penelitian ini melibatkan 3893 sampel dengan delapan feature yang dianalisis. Hasil awal menunjukkan variasi yang luas dalam penjualan spare part komputer. Sebagai contoh, penjualan unit paling tinggi terjadi pada kuartal 1, namun volume penjualan cenderung rendah. Sebaliknya, penjualan pada kuartal 2 cenderung berfokus pada pembelian dengan volume yang relatif serupa. Selain itu, preferensi distribusi channel, segmentasi penjualan, subsegmentasi penjualan, dan jenis produk juga bervariasi dalam hal volume penjualan. Meskipun violin plot membantu dalam visualisasi distribusi data, penelitian ini juga menemukan bahwa metode ini memiliki keterbatasan, seperti penumpukan kategori yang mempersulit interpretasi. Dengan adanya tambahan plot lain dapat melakukan interpretasi yang lebih rinci. Kata Kunci: Pemodelan Visual. Violin Plot. Distribusi Data. Penjualan AbstractOeThis study examines the use of visual modeling in understanding the sales patterns of computer spare parts at PT Prima Krida Solusindo. The use of violin plots serves as a method for data interpretation, focusing on the distribution of sales data to gain a deeper understanding of customer needs. This study involves 3893 samples with eight features being analyzed. Initial results show a broad variation in the sales of computer spare parts. For example, the highest unit sales occur in the first quarter, but the sales volume tends to be low. Opposite, sales in the second quarter tend to focus on purchases with a relatively similar volume. In addition, preferences for distribution channels, sales segmentation, sub-segmentation, and product types also vary in sales volume. While the violin plot aids in visualizing data distribution, this study also found that this method has limitations, such as category overlapping, that complicate interpretation. The inclusion of additional plots can facilitate a more detailed interpretation. Keywords: Visual Modeling. Violin Plot. Data Distribution. Sales PENDAHULUAN Pemodelan pada dasarnya digunakan untuk memahami konteks yang relevan. Misalkan pada penelitian . menunjukkan adanya pengolahan data yang digambarkan dalam suatu relasi basis data. Kemudian, basis data dapat direalisasikan ke dalam diagram relasi . dan diagram venn . Ae. untuk menunjukkan relevansi dari data tersebut untuk setiap Oleh karena itu, dalam data science, pemodelan mempunyai fundamental untuk memvisualisasikan data dengan tujuan memahami data secara mendalam dan menjadi dasar pembuatan kesimpulan. Melalui pemodelan, dapat dilakukan identifikasi pola dan asosiasi dalam data serta memprediksikan data yang belum diamati. Visualisasi data, di sisi lain, dapat membantu memahami hasil pemodelan dengan cara intuitif dan mempermudah proses interpretasi. Visualisasi data dihasilkan berdasarkan distribusi kepadatan data, seperti . Ae. dimana proses ini dilakukan dengan cara pembobotan data berdasarkan atribut-atribut tertentu untuk memberikan nilai relatif pada setiap elemen data. Pembobotan ini bertujuan untuk mewakili prioritas, relevansi, atau pentingnya elemen data tertentu untuk keseluruhan Pembobotan dapat menentukan bagaimana pola data akan direpresentasikan dalam visualisasi, dan visualisasi data sendiri dapat membantu dalam identifikasi dan pemahaman pola data. Oleh karenanya, visualisasi data yang dibentuk dapat memberikan interpretasi yang lebih akurat dan informatif terhadap data tersebut. Kemudian, untuk melakukan interpretasi dari visualisasi data maka pada penelitian ini mengambil data penjualan spare part komputer dari PT Prima Krida Solusindo sebagai sampel. Data penjualan tersebut dilanjutkan dengan menemukan tren penjualan dengan menganalisis pola penjualan produk sehingga perusahaan dapat memahami produk mana yang paling dibutuhkan konsumen. Penggunaan visualisasi data dapat membantu pengambilan keputusan tentang produksi, pengelolaan persediaan, penetapan harga, dan strategi pemasaran kedepannya. Dalam menginterpretasikan penjualan, penelitian ini menggunakan pendekatan violin plot. Berbeda scatter plot . yang digunakan untuk mengamati korelasi antar dua variabel, violin plot untuk membandingkan distribusi data dari berbagai kategori. Berdasarkan penelitian . , violin plot efektif untuk meta-analisis desain eksperimental kasus tunggal, dengan kelebihan utama yaitu menjaga informasi data mentah, menggambarkan data dari berbagai desain dalam satu grafik, dan membandingkan distribusi skor dari berbagai fase eksperimental. Kemudian, dari penelitian . berfokus pada penggunaan berbagai metode visualisasi distribusi data seperti violin plot untuk menyampaikan informasi tentang ketidakpastian dan variasi. Violin plot diperkenalkan sebagai pengganti batang error untuk memvisualisasikan distribusi data, membantu mengurangi bias dalam interpretasi batang error. Dalam penelitian tersebut juga melibatkan studi untuk mengevaluasi pemahaman manusia terhadap violin plot, batang error, dan plot hasil hipotetis. Dengan kata lain, secara keseluruhan digunakan untuk mengkaji efektivitas metode visualisasi distribusi data dalam menyampaikan informasi dengan tepat. Pada penelitian . , violin plot menunjukkan sebaran sampel ideal mengenai pemahaman para responden psikologi terhadap statistik inferensial ketika mereka melakukan penelitian. JIe, 107 Journal of Informatics. Electrical and Electronics Engineering ISSN 2807-9507 (Media Onlin. Vol 2. No 4. June 2023 | Hal 107Oe112 https://djournals. com/jie DOI 10. 47065/jie. Dengan demikian, berdasarkan dari beberapa penelitian yang sudah dikemukakan, tampaknya belum ada penelitian yang khususnya menggunakan violin plot untuk memahami pola penjualan spare part komputer. Selain itu, penelitian sebelumnya lebih berfokus pada efektivitas visualisasi data secara umum dan belum banyak mengevaluasi dampak penggunaan visualisasi data terhadap pengambilan keputusan dalam penjualan ataupun pemasaran. Oleh karena itu, penelitian ini menggunakan violin plot dalam mengevaluasi penjualan spare part komputer untuk membantu perusahaan dalam mengidentifikasi produk yang paling dibutuhkan konsumen. Selanjutnya, tujuan dari penelitian ini adalah mengaplikasikan metode visualisasi data untuk memahami pola penjualan spare part komputer PT Prima Krida Solusindo. METODOLOGI PENELITIAN 1 Violin Plot Violin plot merupakan teknik visualisasi data yang menyajikan representasi komprehensif dari distribusi data, serta pengetahuan terkait distribusi kerapatan data . Teknik ini menggabungkan keunggulan dari box plot dan plot kepadatan, memberikan informasi lebih mendalam tentang data. Box plot, walaupun efisien dalam memberikan gambaran tentang nilai median, kuartil atas dan bawah, serta nilainilai ekstrem dari data, memiliki keterbatasan dalam menampilkan distribusi data secara rinci . Sementara itu, plot kepadatan, yang menampilkan visualisasi detail mengenai distribusi data, terkadang tidak cukup informatif dalam menampilkan statistik ringkasan. Dengan mengatasi kekurangan dari kedua jenis plot ini, violin plot menyediakan informasi yang lebih lengkap mengenai distribusi dan statistik ringkasan dalam satu visualisasi . Selain itu, violin plot juga membandingkan distribusi antara beberapa kategori data. Bentuk puncak, lembah, dan ekor dari violin plot dapat memberikan gambaran tentang kemiripan atau perbedaan antara kategori-kategori tersebut. Bentuk violin yang dihasilkan oleh plot ini mencerminkan distribusi data, dengan lebar violin di setiap titik sebanding dengan jumlah data pada titik tersebut. Pada dasarnya, langkah-langkah algoritma violin plot sebagai berikut: Menentukan data yang akan dianalisis. Data harus terbagi dalam kategori atau grup. Menghitung statistik deskriptif untuk setiap grup data, termasuk median, kuartil bawah, dan kuartil atas. Estimasi kepadatan kernel dari setiap grup data. Kepadatan kernel adalah teknik untuk memperkirakan fungsi kepadatan probabilitas dari suatu variabel acak . , . Fungsi tersebut memberikan penilaian terhadap kepadatan data di setiap titik. Membuat plot kepadatan untuk setiap grup data menggunakan estimasi kepadatan kernel yang telah dihitung. Menggabungkan plot kepadatan tersebut dengan box plot yang telah dihitung sebelumnya. Box plot akan berada di tengah-tengah dari AuviolinAy, dengan garis di box plot menunjukkan median dan kuartil atas dan bawah. Mengulangi langkah 4 dan 5 untuk setiap grup data. Menampilkan plot final, dengan setiap "violin" mewakili satu grup data. Lebar setiap "violin" menunjukkan kepadatan data pada titik tersebut. 2 Formula Membangun Violin Plot Membangun visualisasi data dengan violin plot mengikuti proses dua tahapan. Pertama, menghitung statistik deskriptif dari data, dan kedua, mengestimasi kepadatan kernel dari data tersebut. Kedua komponen ini kemudian digabungkan untuk membuat violin plot . 1 Statistik Deskriptif Statistik deskriptif melibatkan penghitungan nilai median, kuartil bawah (Q. , dan kuartil atas (Q. Untuk satu sampel data . CA, xCC, . , xC. yang telah diurutkan, median dirumuskan sebagai: ycA = { x [ ], jika n ganjil [ ] x[ . ) jika n genap Kuartil bawah dan atas (Q1 dan Q. dapat dihitung dengan cara yang sama dengan median, tetapi pada data yang telah dibagi menjadi dua bagian di median. Rentang interkuartil (IQR) didefinisikan sebagai Q3 - Q1 . 2 Estimasi Kepadatan Kernel Estimasi kepadatan kernel (KDE) digunakan untuk memperkirakan fungsi kepadatan probabilitas dari variabel KDE didefinisikan sebagai: ycu Oe ycuA yceC. cu ) = Ocya ( . ycuEa Ea di mana n adalah jumlah sampel, h adalah bandwidth. K adalah fungsi kernel, dan xA adalah sampel data. Fungsi kernel yang umum digunakan adalah fungsi Gaussian, tetapi bisa juga fungsi lain seperti Epanechnikov atau Rectangular (. Ae . JIe, 108 Journal of Informatics. Electrical and Electronics Engineering ISSN 2807-9507 (Media Onlin. Vol 2. No 4. June 2023 | Hal 107Oe112 https://djournals. com/jie DOI 10. 47065/jie. 3 Strip Plot dan Rug Plot Sebagai Pendukung Visualisasi Violin Plot Strip plot dan rug plot dapat sebagai pendukung informasi dalam violin plot dengan memberikan detail tambahan yang mungkin tidak terlihat dalam violin plot sendiri. 1 Strip Plot Strip plot menampilkan semua poin data pada suatu sumbu, biasanya dengan sedikit jitter . enggeseran acak keci. yang ditambahkan untuk membuat distribusi data lebih jelas. Sama halnya dengan box plot dan violin plot, strip plot dapat membandingkan distribusi data antara kategori yang berbeda . Strip plot dapat ditambahkan di atas violin plot untuk menunjukkan lokasi individu dari setiap titik data sehingga memberikan informasi tambahan tentang jumlah data, distribusi data, dan adanya pencilan. 2 Rug Plot Rug plot menampilkan garis kecil . pada setiap poin data di sepanjang sumbu x . Rug plot memberikan gambaran visual yang jelas tentang di mana data terkonsentrasi di sepanjang sumbu tersebut . Rug plot dapat ditambahkan di bawah . tau di sampin. violin plot untuk menunjukkan distribusi data di sepanjang sumbu. Oleh karena itu, rug plot dapat memberikan detail tambahan tentang distribusi data, khususnya pada area di mana data terkonsentrasi. HASIL DAN PEMBAHASAN Dalam penelitian ini, data diambil sebanyak 3893 instances . yang mana atribut yang dapat dianalisis sebanyak delapan features . , yaitu quarter, distribution channel, segment, sub segment, type, volume, sales no, dan order Pada gambar 1 merupakan statistik untuk setiap 8 features. Gambar 1. Statistik Dasar untuk Data Features Berdasarkan pada gambar 1, volume penjualan dilakukan dalam rentang minimal satu unit hingga maksimal 6000 unit, dengan nilai rata-rata sebesar 102,79 unit. Dalam setiap transaksi, penjualan lebih sering dilakukan dengan jumlah 10 unit. Meskipun demikian, informasi tersebut masih belum mewakili penjualan secara keseluruhan. Oleh karena itu, dilakukan pembangunan violin plot untuk menggambarkan distribusi penjualan spare part komputer secara detail. Dalam hal ini, untuk mengetahui besarnya penjualan unit yang dilakukan PT Prima Krida Solusindo dengan membandingkan volume penjualan terhadap quarter, distribution channel, segment, sub segment, dan type. JIe, 109 Journal of Informatics. Electrical and Electronics Engineering ISSN 2807-9507 (Media Onlin. Vol 2. No 4. June 2023 | Hal 107Oe112 https://djournals. com/jie DOI 10. 47065/jie. Gambar 2. Violin Plot Volume Terhadap Quarter Pada gambar 2 menunjukkan pola penjualan unit pada quarter 1 yang lebih tinggi di bawah rentang 1000 unit. Namun, penjualan di atas 1000 unit semakin sedikit. Dengan kata lain, terdapat banyak konsumen yang melakukan pembelian pada periode antara April hingga Juni. Akan tetapi, jumlah unit yang dipesan tidak terlalu besar. Selanjutnya, jika diperhatikan pada future Q2 (Juli hingga Septembe. , terlihat bahwa konsumen baru melakukan pemesanan unit, dan jumlah unit yang dipesan hampir sama dengan quarter 1. Gambar 3. Violin Plot Volume Terhadap Beberapa Feature JIe, 110 Journal of Informatics. Electrical and Electronics Engineering ISSN 2807-9507 (Media Onlin. Vol 2. No 4. June 2023 | Hal 107Oe112 https://djournals. com/jie DOI 10. 47065/jie. Untuk menganalisis data, dalam penelitian ini mengamati beberapa grafik feature untuk setiap kategori. Berikut ini adalah hasil pengamatan yang tergambar pada violin plot pada gambar 3: Distribution Channel Berdasarkan lebar violin plot, terlihat bahwa konsumen cenderung melakukan pembelian melalui key account Hal ini menunjukkan bahwa banyak pembelian dilakukan melalui mitra bisnis, meskipun dengan jumlah unit yang relatif kecil. Jumlah unit terbesar yang dibeli oleh satu konsumen berkisar antara 1000 hingga kurang dari Di sisi lain, jika melalui distributor, penjualan cenderung lebih tersebar dengan jumlah unit yang bervariasi hingga mencapai 6000 unit. Segment Pada kanal penjualan GAB, terlihat bahwa kanal tersebut menjual unit terbanyak dengan jumlah unit yang rata-rata Di sisi lain, jika melalui kanal penjualan CON (Consume. , data penjualan tersebar dengan jumlah unit yang Sub Segment Pembelian terbanyak dengan jumlah unit yang terkecil dilakukan oleh perusahaan asing kelas menengah (IA). Namun, pembelian dengan jumlah unit yang bervariasi terjadi pada perusahaan Top Seller dan Retail . imana Retail tersebut mampu menjual hingga 6000 uni. Type Jenis produk option yang banyak dipilih konsumen seperti docking laptop, power adaptor laptop, dan carrying cases menunjukkan penjualan dengan jumlah unit yang bervariasi. Berdasarkan analisis melalui violin plot memberikan informasi tentang pola penjualan unit, preferensi distribusi channel, segmentasi penjualan, sub segmentasi penjualan, dan jenis produk yang berbeda-beda dalam hal jumlah unit yang terjual. Oleh karena itu, pendekatan menggunakan violin plot dalam analisis pola penjualan spare part komputer dapat memberikan gambaran visual yang komprehensif tentang distribusi data. Namun, selama dilakukan penelitian ini ditemukan bahwa violin plot memiliki kelemahan dalam menampilkan banyak kategori yang tumpang tindih dan mungkin sulit membedakan perbedaan yang signifikan antara nilai ekstrim. Untuk meningkatkan interpretasi, tambahan plot seperti box plot, strip plot, dan rug plot dapat digunakan untuk memberikan informasi lebih rinci tentang distribusi dan pola Dalam kesimpulan, pendekatan menggunakan violin plot dalam pengenalan pola untuk interpretasi data penjualan spare part komputer dapat memberikan gambaran visual yang informatif. Namun, untuk analisis yang lebih mendalam, penggunaan tambahan plot seperti box plot, strip plot, dan rug plot dapat membantu memperkaya interpretasi data Dengan menyesuaikan penggunaan plot tambahan dengan kebutuhan analisis yang spesifik dan mempertimbangkan kompleksitas data yang ditampilkan. KESIMPULAN Penelitian ini, mencakup analisis terhadap 3893 sampel, memberikan sejumlah temuan penting terkait pola penjualan spare part komputer oleh PT Prima Krida Solusindo. Berdasarkan distribusi volume penjualan, penjualan unit tertinggi berada di bawah rentang 1000 unit, khususnya pada periode April hingga Juni. Selain itu, pola penjualan juga menunjukkan preferensi konsumen terhadap kanal penjualan tertentu dan produk jenis tertentu. Misalnya, pembelian melalui key account indirect menunjukkan jumlah penjualan unit yang relatif kecil, sementara melalui distributor, penjualan lebih tersebar dengan jumlah unit yang bervariasi hingga mencapai 6000 unit. Segmentasi penjualan juga memperlihatkan perbedaan, dengan kanal penjualan GAB menunjukkan penjualan unit yang rata-rata sama, sedangkan melalui kanal penjualan CON, data penjualan lebih bervariasi. Meskipun violin plot dapat memberikan gambaran visual yang informatif, penelitian ini juga menemukan bahwa violin plot memiliki kelemahan dalam menampilkan banyak kategori yang tumpang tindih. Oleh karena itu, disarankan untuk menggunakan plot tambahan seperti box plot, strip plot, dan rug plot untuk analisis yang lebih mendalam dan akurat. Pemahaman tentang pola penjualan ini penting untuk memaksimalkan efisiensi operasional dan strategi penjualan perusahaan, dan ditindaklanjuti dengan penelitian lebih lanjut yang menggunakan alat analisis data yang lebih beragam dan mendalam. REFERENCES