Detail Karya Ilmiah
-
SENTIMENT ANALYSIS TWEETS KEBIJAKAN PUBLIK BERBAHASA INDONESIA DENGAN METODE PRINCIPAL COMPONENT ANALYSIS DAN EXPECTATION MAXIMIZATIONPenulis : Benik UcistaDosen Pembimbing I : Mulaab, S.Si., M.Kom.Dosen Pembimbing II :Moch. Kautsar Sophan, S.Kom., M.MT.Abstraksi
Sentiment analysis dalam penelitian ini merupakan riset komputasional dari opini yang diekspresikan secara tekstual, untuk selanjutnya diklasifikasikan kedalam kelas sentimen positif dan negatif. Dimana data opini diakses dari media sosial twitter berdasarkan query kebijakan publik dalam bahasa Indonesia. Dalam sentiment analysis, tingginya dimensi dari fitur yang digunakan dalam menggambarkan teks, membutuhkan adanya Principal Component Analysis sebagai reduksi dimensi. Principal Component Analysis merupakan strategi yang bertujuan meningkatkan kinerja komputasi. Sedangkan metode Expectation Maximization adalah metode pengembangan Naive Bayes yang digunakan sebagai classifier. Dalam pengklasifikasiannya, metode Expectation Maximization menentukan opini ke dalam kelas positif dan negatif dengan cara clustering. Expectation Maximization sendiri dapat menangani atribut numerik dan nominal. Penelitian ini menggunakan 400 tweets tekstual. Dengan hasil klasifikasi Expectation Maximization yang dibandingkan dengan data hasil asli yang merupakan data yang sudah didapatkan kelas sentimennya dari database mySQL. Dalam hasil penelitian didapatkan dari skenario terbaik dan metode berhasil mengklasifikasikan tweets dengan nilai Precission sebanyak 70.8%, Recall sebanyak 100%, dan Accuracy sebanyak 79.4%. Kata Kunci : Sentiment analysis, query, Principal Component Analysis , Expectation Maximization, Naïve Bayes, classifier,clustering.
AbstractionSentiment analysis in this study is a computational study of the opinions expressed textually, for further classified into classes of positive and negative sentiment. Where data is accessed opinion of social media twitter query based public policy in Indonesian. In sentiment analysis, the high dimensionality of the features used to describe the text, requires the existence of Principal Component Analysis as a dimension reduction. Principal Component Analysis is a strategy that aims to improve computing performance. While the Expectation Maximization method is a method of development which is used as a Naive Bayes classifier. In the classification, Expectation Maximization method of determining opinion into positive and negative class by means of clustering. Expectation Maximization can handle numeric and nominal attributes. This study used 400 tweets textual. With Expectation Maximization classification results are compared to original result data is the data that has been obtained class sentiments of the MySQL database. In the results, the best scenario and methods successfully classify tweets with precision value of 70.8%, Recall of 100%, and Accuracy of 79.4%. Keywords: Sentiment analysis, query, Principal Component Analysis , Expectation Maximization, Naïve Bayes, classifier, clustering.