BALANCE : Economic. Business. Management, and Accounting Journal Vol. XVi No. 2 |Bulan Juli Tahun 2021 P-ISSN 1693-9352 | E-ISSN 2614-820x PREDIKSI SENTIMEN INVESTOR PASAR MODAL DI JEJARING SOSIAL MENGGUNAKAN TEXT MINING Aestikani Mahani . Hendro Margono2 Universitas Airlangga ABSTRACT The decline in optimism for capital market investors is one of the financial impacts on the business world that arose from the SARS-COVID19 pandemic. This event was reflected in a decrease in trading volume followed by a sharp drop in the JCI on the Indonesia Stock Exchange starting March 2020. Thus, a slowdown in the economic recovery resulting from the pandemic is reflected in investor sentiment in the capital market. On the one hand, the rapid development of the internet in Indonesia has triggered the investor's activities in the information searching prior buy and sell securities, mostly use online platforms, which contribute to influencing investor preferences and This study conducted a qualitative examination of the features/terms of stock investment in the capital market and collected them in a compact dictionary . Therefore, lexicon-based investor opinion extraction was extracted from Twitter, followed by the text sentiment analysis, and forming a classification model based on Naive Bayes and Decision Tree. This research output shows that the polarity of capital market investor sentiment is optimistic with the sentiment features that often appear, namely "cuan", "bearish," "serok", "copet", "untung", "cut loss", and "nyangkut. Meanwhile, the Decision Tree classification model provides better performance. Keywords : investor, lexicon, social network, stock exchange, text mining Correspondence to : aestikani. mahani-2019@feb. ABSTRAK Penurunan optimisme investor pasar modal adalah salah satu dampak keuangan pada dunia usaha yang timbul akibat pandemi SARS-COVID19. Hal ini tercermin dari turunnya volume perdagangan yang diikuti penurunan tajam IHSG di Bursa Efek Indonesia mulai Maret 2020. Sehingga kekhawatiran atas perlambatan pemulihan ekonomi sebagai dampak pandemi, tercermin dari sentimen investor di pasar modal. Di satu sisi, perkembangan internet di Indonesia yang pesat, memicu kecenderungan aktivitas investor dalam pencarian informasi sebelum membeli dan menjual surat berharga secara online, turut berkontribusi dalam mempengaruhi preferensi dan sentimen Penelitian ini menggali ekspektasi investor yang tercermin pada sentimen investasi, dimana pasar modal sebagai salah satu barometer penting perekonomian suatu negara. Kajian ini mengeksplorasi fitur/terms investasi saham yang kerap muncul di pasar modal dan mengumpulkannya dalam kamus leksikon. Kemudian, dilakukan ekstraksi opini investor berbasis leksikon yang digali dari jejaring sosial Twitter, dilanjutkan dengan tahap text mining yaitu menganalisis sentimen, dan membentuk model klasifikasi berbasis Naive Bayes dan Decision Tree. BALANCE : Economic. Business. Management, and Accounting Journal Vol. XVi No. 2 |Bulan Juli Tahun 2021 P-ISSN 1693-9352 | E-ISSN 2614-820x Keluaran penelitian ini menunjukkan bahwa polaritas sentimen investor pasar modal adalah positif dengan fitur sentimen yang sering muncul yaitu AucuanAy. AubearishAy. AuserokAy. AucopetAy. AuuntungAy, dan Aucut lossAy. Sedangkan model klasifikasi Decision Tree memberikan performansi akurasi yang kebih Kata Kunci : Analisis sentimen. Investor. Leksikon. Text mining. Twitter Riwayat Artikel: Received : 22 Januari 2021 Revised : 15 Februari 2021 Accepted : 25 Juni 2021 konteks yang lebih besar. Hasil kajian ini menunjukkan bahwa selain berpartisipasi pada komunitas virtual publik, mereka juga berpartisipasi pada jejaring sosial private yang memberi benefit berupa informasi dan pengetahuan baru. Kemudian text mining . kstraksi dan klasifikas. untuk menganalisis sentimen investor bursa efek China atas return saham dalam Index CSI 300 menunjukkan hasil bahwa terdapat faktor pengaruh akumulasi sentimen pada return harga saham (Shi, 2. Sedangkan efek penularan rumor dan meningkatnya risiko investor dalam disimulasikan menggunakan SCIR model dalam jaringan bi-layer berpasangan sehingga diketahui dampaknya baik secara global maupun lokal (Dong, 2. PENDAHULUAN Turunnya optimisme investor pasar modal adalah salah satu dampak keuangan pada dunia usaha yang timbul akibat pandemi CoVID-19. Hal ini tercermin dari turunnya volume perdagangan yang diikuti turunnya nilai IHSG di Bursa Efek Indonesia medio Maret 2020. Namun tidak hanya itu saja, kekhawatiran atas perlambatan pemulihan ekonomi sebagai dampak pandemi, akan tercermin dari persepsi dan opini investor atas pasar modal. Opini investor pada akhirnya akan membentuk gambaran harapan terhadap recovery roda perekonomian, dimana pasar modal adalah salah satu barometernya. Pola perilaku dan sentimen investor ini secara eksplisit maupun implisit dapat ditangkap dari posting di media sosial, mesin pencari, maupun forum investasi baik yang berbasis platform sekuritas atau cloud based group messaging application. Studi kualitatif dengan pendekatan grounded theory dilakukan oleh (Hridoy, 2. untuk mengeksplorasi bagaimana 26 online investor mencari dan menggunakan informasi, serta peranan jejaring sosial dalam BALANCE : Economic. Business. Management, and Accounting Journal Vol. XVi No. 2 |Bulan Juli Tahun 2021 P-ISSN 1693-9352 | E-ISSN 2614-820x Gambar 1. IHSG Bursa Efek Indonesia Terendah di Angka 3937,63 pada Tanggal 24 Maret 2020 keperilakuan investor membentuk portofolio berdasarkan aturan yang disebut teori portofolio keperilakuan . ehavioural portfolio Teori portofolio investasi menyatakan bahwa tingkat pengembalian yang diharapkan . xpected retur. dan risiko mencerminkan dua kondisi yang berbanding lurus. Hal ini menunjukkan bahwa semakin tinggi tingkat pengembalian yang diharapkan oleh seorang investor, maka semakin besar pula tingkat risiko yang akan dihadapinya. Karena adanya faktor risiko yang melekat dalam setiap unit expected return yang diharapkan, maka seorang investor perlu melakukan analisis secara komprehensif sebelum mengambil suatu keputusan investasi. Keempat, dalam teori keuangan standar, hasil yang diharapkan diukur dengan menggunakan model harga aset atau CAPM (Capital Assets Pricing Mode. , dalam hal ini risiko diukur dengan beta, dan risiko merupakan satu-satunya faktor penentu. Pada teori keuangan keperilakuan, hasil yang diharapkan diukur dengan menggunakan Behavioral Assets Pricing Model, dalam hal ini hasil yang diharapkan merupakan fungsi dari berbagai variabel keperilakuan investor. Dalam konsep keuangan keperilakuan, dikenal limited arbitrage dimana saham pada Keuangan Keperilakuan Menurut Statman . bahwa keuangan keperilakuan adalah sebuah pendekatan alternatif dari keuangan baku dengan beberapa perbedaan. Pertama,dalam teori keuangan standar manusia dianggap rasional, sedangkan dalam keperilakuan manusia dianggap AunormalAy, dalam arti manusia tidak sepenuhnya rasional. Manusia memiliki emosi dan mausia tidak dapat merencanakan sepenuhnya kapan menggunakan rasio, kapan mengunakan emosi dan kapan menggunakan keduanya secara bersama-sama Kedua, dalam teori keuangan standar diasumsikan bahwa pasar modal bersifat efisien . fficient market Sebaliknya keperilakuan pasar modal diasumsikan tidak efisien, meskipun diakui tidak mudah untuk ditaklukkan dan didahului. Harga saham emiten dimungkinkan menyimpang dari nilai fundamentalnya disebabkan oleh berbagai hal, termasuk berbagai variabel psikologisnya. Ketiga, menurut teori keuangan baku, investor diasumsikan akan membentuk bauran portofolio berdasarkan kriteria mean-variance Markowitz. Sebaliknya BALANCE : Economic. Business. Management, and Accounting Journal Vol. XVi No. 2 |Bulan Juli Tahun 2021 P-ISSN 1693-9352 | E-ISSN 2614-820x dasarnya mengandung risiko. Arbitrase menjadi terbatas karena dalam dunia investasi yang nyata, jika terjadi downtrend harga tidak akan kembali ke tingkat yang sesuai dengan nilai fundamentalnya seketika itu juga. Fakta akan limited arbitrage ini membuat asumsi pasar efisien menjadi sulit untuk dipenuhi dan keuangan keperilakuan menjadi semakin mampu menjelaskan realitas yang ada di Adanya sentimen investor di pasar modal mendukung teori limited arbitrage. Secara umum sentimen diartikan sebagai suasana hati . yang sedang dialami Sentimen inilah yang akan membentuk keyakinan, prediksi dan akhirnya permintaan para investor terhadap surat Dalam bahasan utama keuangan perilaku dan neurofinance berfokus pada bagaimana emosi masuk ke dalam persepsi risiko trader dan investor. Emosi memainkan peran kunci dalam mendorong pengambilan Emosi yang paling sering diidentifikasi sebagai kontribusi terhadap kerapuhan finansial dan kegembiraan irasional termasuk keserakahan, harapan dan ketakutan (Shefrin. Risiko merupakan sebagai bagian dari perasaan dan berpendapat bahwa risiko yang dirasakan trader dan investor selama transaksi keuangan mereka dapat dicirikan sebagai perasaan takut - dengan efek umpan balik dan mengintensifkan tanggapan ketakutan dan memicu kepanikan (Slovic & Kerjan, 2. Emosi lain akan mempengaruhi keputusan keuangan secara lebih luas, kegembiraan irasional yang dialami trader, yang biasa mencerminkan interaksi antara harapan dan keserakahan (Shiller, 2. Dari penelitian tersebut. Akerlof . mengidentifikasi bahwa ketika pembeli tidak memiliki informasi terkait spesifikasi produk dan hanya memiliki persepsi umum mengenai produk tersebut, maka pembeli . cenderung menilai semua produk di harga sama, meskipun produk high-end maupun low-end, sehingga merugikan penjual produk berkualitas tinggi. Spence . juga menemukan bahwa cost of signal pada berita buruk akan lebih tinggi dari pada berita baik dan perusahaan dengan isu buruk mengirimkan sinyal yang tidak kredibel. Hal tersebut memotivasi manajer untuk mengungkapkan informasi pribadi untuk mengurangi asimetri informasi dengan harapan dapat mengirimkan sinyal yang baik . ood new. tentang kinerja perusahaan ke pasar. Jika pengumuman informasi tersebut dianggap sebagai sinyal baik, maka investor akan tertarik untuk melakukan perdagangan saham, dengan demikian pasar akan bereaksi yang tercermin melalui perubahan dalam volume perdagangan saham maupun kenaikan harga saham (Suwardjono, 2. Berikut adalah model pengaruh sentimen investor yang akan digali dalam penelitian ini adalah: Gambar. Model Pengaruh Sentimen Investor Sumber : Data diolah Peneliti, 2021 Jejaring Sosial Media sosial atau disebut juga dengan jejaring sosial adalah sekumpulan aplikasi web, berdasarkan teknologi framework web 0 dan budaya, yang memungkinkan sejumlah orang terkoneksi serta berkolaborasi dengan orang maupun komunitas lain dengan menciptakan, menyusun, membuat, dan membagikan konten digital. Secara kolektif, penggunaan media sosial telah mengalihkan lokus kontrol untuk komunikasi publik dari organisasi besar menjadi organisasi yang dibagikan dengan pengguna individu. Tidak hanya organisasi saja yang menyiarkan satu pesan ke khalayak massa, sejumlah besar percakapan mungkin terjadi di antara BALANCE : Economic. Business. Management, and Accounting Journal Vol. XVi No. 2 |Bulan Juli Tahun 2021 P-ISSN 1693-9352 | E-ISSN 2614-820x sejumlah orang dan organisasi. (Turban, ke analisis yang dilakukan pada kata kunci tertentu dengan menambahkan fitur/kata kunci yang berlawanan atau spesifik. (Makhabel, 2. Sehingga model sederhana yang dapat digunakan untuk memahami text sentiment analysis ini adalah: Data dan Text Mining Data mining adalah proses penggunaan berbagai alat analisis data untuk menemukan data dalam semua bentuk dan jenisnya yang dapat digunakan untuk membuat prediksi yang valid (Han, 2. Data mining mampu menjawab pertanyaan tentang masa lalu . pa yang telah terjad. dengan mengekstrak dan Untuk memanfaatkannya dan mengambil pelajaran dari hasil sebelumnya dalam pengambilan keputusan, masa kini . pa yang terjad. dengan mengekstraksi data baru saat ini tersedia dan membandingkannya dengan data lama dan menganalisanya, dan masa depan . pa yang mungkin terjad. seperti meramalkan suatu kejadian yang akan datang sebagai akibat adanya data yang terus diulang dengan menganalisis data yang tersedia Analisis dan penggalian informasi dari data dan identifikasi hubungan 'tersembunyi' dalam kumpulan data besar. Hal ini akan memungkinkan informasi yang sebelumnya tersembunyi dan tidak terekspos sekarang menjadi terekspos. Sehingga memberikan lebih banyak dukungan dalam proses pengambilan keputusan (Nemati H. Sumber : (Makhabel, 2. Tujuan dari analisis opini yaitu untuk mengklasifikasikan atau mengukur polaritas dokumen dalam kumpulan besar data atau Skema warna, seperti dicontohkan pada Gambar 2, dapat dipilih berdasarkan spektrum ukuran polaritas, dan warna yang berbeda, seperti merah dan hijau, dapat digunakan untuk memisahkan sentimen. Angka ini ini memberikan awan kata . terpisah untuk sentimen positif dan negatif, dengan positif dalam warna hijau dan negatif dengan warna merah. Jika sentimen netral juga disertakan, itu bisa diplot dalam warna kuning untuk mengikuti tema lampu lalu lintas (Anandarajan, 2. Menampilkan berdampingan memungkinkan pembaca melihat gambaran besar dari analisis. penggunaan word cloud dapat dibuat secara umum atau disesuaikan sesuai pilihan peneliti. Misalnya, kita dapat membuat word cloud untuk ulasan online. Beberapa contoh penggunaan analisis sentimen secara luas yaitu pada strategi pemasaran, pengukuran RoI pengembangan produk, dan perbaikan layanan Sentiment analysis Analisis sentimen sering juga disebut dengan opinion mining atau content analysis teks/serangkaian kata yang mengandung nada emosi yang diterapkan untuk memperoleh pemahaman tentang sikap, opini, pendapat, dan emosi yang diungkapkan dalam percakapan online. Umumnya, sentimen yang terekam dikategorikan menjadi 3 yaitu sentimen positif, sentimen negatif, dan netral. Untuk mengumpulkan data, peneliti harus . kata kunci atau fitur yang ditentukan secara manual. Ini disebut target. Analis mungkin ingin menambahkan konteks BALANCE : Economic. Business. Management, and Accounting Journal Vol. XVi No. 2 |Bulan Juli Tahun 2021 P-ISSN 1693-9352 | E-ISSN 2614-820x Penarikan Tweet & identifikasi terms Pengumpulan dan justifikasi polaritas sentimen istilah investasi saham Identifikasi metadata Leksikon Investasi Saham Data pre-processing Gambar. Contoh Word Cloud dari Polaritas Opini Positif dan Negatif Tokenisasi. Transform case. Stop words & Stemming Sumber : (Anandarajan, 2. Ekstraksi Sentimen TF/ IDF Data Splitting Beberapa metode yang digunakan untuk menganalisis sentimen yaitu metode rule-based menggunakan SentiwordNet dan metode Machine Learning. Algoritma klasifikasi akan melakukan klasifikasi atas learning data dengan cara menganalisis training data. Pendekatan ini terdari beberapa metode yang banyak dipakai oleh peneliti yaitu : Support Vector Machine (SVM). Naive Bayes, dan Decision Tree. Secara sederhana, algoritma Naive Bayes mengasumsikan bahwa keberadaan fitur tertentu dalam kelas tidak terkait dengan keberadaan fitur lainnya. Algoritma Decision Tree berfungsi seperti diagram alir, memisahkan titik data menjadi dua kategori serupa sekaligus dari "batang pohon" ke "cabang", ke "daun", di mana kategorinya menjadi lebih mirip. Menciptakan kategori dalam kategori, memungkinkan klasifikasi organik dengan pengawasan manusia terbatas. Data Training Cross validation (Naive Bayes & Decision Tre. Data Testing Analisis akurasi hasil prediksi dan polaritas sentimen Gambar. Tahapan Identifikasi Sentimen. Ekstraksi, dan Klasifikasi Sentimen Sumber : Data diolah Peneliti, 2021 Pada tahap persiapan data dilakukan scraping data tweet dari jejaring sosial Twitter menggunakan RapidMiner API. Kemudian raw data disimpan dalam file excel serta mengidentifikasi atribut dan label metadata. Secara paralel, dilakukan sampling justifikasi polaritas sentimen secara kualitatif, dengan mengambil sampel 32 tweet untuk dinilai oleh 100 responden investor dan trader aktif. Kemudian terms/fitur investasi saham sebagai bahan pembuatan Hasil keluaran ini berupa leksikon dan nilai polaritas kemudian disimpan dalam CSV. Berikut ini adalah diagram operasi pengambilan raw data : METODE PENELITIAN Pengumpulan Data Berikut adalah diagram alur proses Sentiment analysis yang akan dibahas dalam penelitian ini dimulai dari data scraping di jejaring sosial Twitter periode MaretDesember 2020, tahap menghimpun fitur sentimen dalam sebuah leksikon, ekstraksi sentimen berbasis leksikon, hingga klasifikasi BALANCE : Economic. Business. Management, and Accounting Journal Vol. XVi No. 2 |Bulan Juli Tahun 2021 P-ISSN 1693-9352 | E-ISSN 2614-820x Gambar. Alur Operasi Scraping Raw Data berupa Tweet stemwords . sal mula kata untuk kata yang berimbuha. , dan filterisasi sentimen terms yang terhimpun dalam leksikon. Proses ini dilakukan baik pada data training maupun pada data testing. Pre-processing. Transformasi, dan Ekstraksi Kemudian pada data yang sudah ditransformasi diberi pelabelan untuk membuat data training dengan memberi label klasifikasi berisi nilai dan kelas sentimen AupositifAy. AunetralAy dan AunegatifAy. Hasil keluaran dari proses ini disimpan format Excel. Kemudian datapreprocessing meliput tokenisasi . emisahan kata per kata dalam 1 twee. , transform case . enyeragamkan huruf besar dan keci. , eliminasi stopwords . ata umum yang tidak bermakna seperti kata penghubung, kata keterangan dan tanda bac. , filterisasi BALANCE : Economic. Business. Management, and Accounting Journal Vol. XVi No. 2 |Bulan Juli Tahun 2021 P-ISSN 1693-9352 | E-ISSN 2614-820x Gambar. Tahap Data Pra-processing pada RapidMiner Sumber : Data diolah Peneliti, 2021 Berikut ini contoh hasil pemrosesan teks dari tahap data pre-processing : Gambar. Contoh Hasil Data Pre-Processing Sumber : Data dioleh Peneliti, 2021 klasifikasi sentimen menggunakan algoritma Naive Bayes dan Decision Tree. Perbedaan dari kedua jenis metode klasifikasi ini adalah identifier/classifier. Nayve Bayes mengasumsikan bahwa fitur . memiliki nilai yang independen pada posisi fitur. Decision Tree berfungsi seperti diagram alir, memisahkan titik data menjadi dua kategori serupa sekaligus dari "batang pohon" Klasifikasi dan Analisis Sentimen Setelah data dibersihkan dalam preprocessing, langkah selanjutnya adalah ekstraksi sentimen dan melakukan proses klasifikasi atas testing data menggunakan training data set. Untuk itu dialokasikan 32 training data. Sentimen diekstraksi menggunakan leksikon yang diunggah ke dalam proses/operasi AuExtract SentimentAy. Secara paralel, dilakukan proses BALANCE : Economic. Business. Management, and Accounting Journal Vol. XVi No. 2 |Bulan Juli Tahun 2021 P-ISSN 1693-9352 | E-ISSN 2614-820x ke "cabang", ke "daun", di mana kategorinya menjadi lebih mirip. Ini menciptakan kategori dalam kategori, memungkinkan klasifikasi organik dengan pengawasan manusia terbatas. Proses ini melibatkan pengulangan setiap subset yang diperoleh secara rekursif, yang dikenal sebagai partisi rekursif (Han, 2. Proses rekursi dilakukan jika subset pada node memiliki nilai yang identik dari variabel target, atau jika tahap pembagian tidak lagi menghasilkan nilai dan menambahkannya ke PEMBAHASAN Hasil penelitian untuk menjawab rumusan masalah penelitian dibagi menjadi 2 aspek yaitu: ekstraksi sentimen dan klasifikasi tweet pada testing data. Secara global, model analisis sentimen investor yang berupa proses utama di RapidMiner adalah sebagai berikut : Gambar. Model Analisis Sentimen Investor dan Proses Klasifikasi Sumber : Data diolah Peneliti, 2021 Menghimpun istilah investasi saham ke dalam leksikon dan identifikasi nilai polaritas. Leksikon investasi saham sebagaimana diteliti sebelumnya (Prayogi, 2. disempurnakan dengan identifikasi polaritas menggunakan metode kualitatif tematik dan penambahan istilah yang belum teridentifikasi. Berikut adalah 35 istilah investasi yang terhimpun dalam leksikon: BALANCE : Economic. Business. Management, and Accounting Journal Vol. XVi No. 2 |Bulan Juli Tahun 2021 P-ISSN 1693-9352 | E-ISSN 2614-820x TABEL 1. Fitur Sentimen Investor dan Polaritas dalam Leksikon Diketahui sentimen positif adalah dominan dengan proporsi sebesar 55,77%, sedangkan sentimen paling kecil dengan proporsi 16,98%. Frekuensi fitur sentimen ini juga diperkuat pada grafik wordcloud sebagai berikut dimana istilah AuCuanAy. AubearishAy, . AuserokAy. AucopetAy. AuuntungAy, dan Aucut lossAy . memiliki frekuensi kemunculan paling besar : Gambar. Wordcloud Ekstraksi Sentimen Sumber : Data diolah Peneliti, 2021 Frekuensi fitur sentimen yang sering muncul adalah : TABEL 2. Hasil Ekstraksi Fitur Sentimen yang Sering Muncul Sumber : Diolah Peneliti, 2021 Ekstraksi sentimen dan klasifikasi kelas pada testing data. Berikut ini adalah hasil ekstraksi sentimen : No. Fitur Fitur Sentimen Terms Frequent Fraksi Cuan Bearish Serok Copet Untung Cutloss Sumber : Data diolah Peneliti, 2021 Berikut ini adalah hasil klasifikasi sentimen menggunakan metode Naive Bayes dan Decision Tree : Gambar. Hasil Klasifikasi Sentimen pada Data Testing BALANCE : Economic. Business. Management, and Accounting Journal Vol. XVi No. 2 |Bulan Juli Tahun 2021 P-ISSN 1693-9352 | E-ISSN 2614-820x TABEL 3. Nilai Akurasi Klasifikasi untuk Setiap Kelas Sentimen Kelas Label Parameter Nayve Bayes Decision Tree Prediksi Kelas Positif Akurasi Presisi Recall Prediksi Kelas Negatif Akurasi Presisi Recall Akurasi Presisi Recall Prediksi kelas S entimen Netral positif yang ditunjukkan adalah sebagai harapan bahwa kondisi akan perekonomian akan pulih kembali. Aktivitas investasi juga dipandang investor sebagai opportunity bahwa akan diperoleh return of investment setelah kondisi bearish terlewati. Perbandingan Akurasi M etode Perbandingan Presisi M etode Perbandingan Recall M etode DAFTAR PUSTAKA