Optimasi Particle Swarm Optimization Sebagai Seleksi Fitur Pada Analisis Sentimen Review Hotel Berbahasa Indonesia Menggunakan Algoritma Naive Bayes

Tanggal

2017-07-21

Penulis

Abstraksi

Saat ini  pengunjung    yang menulis  review  untuk
berbagi pengalaman secara  online  terus meningkat.  Setiap
pengunjung perlu untuk membuat keputusan saat berlibur
sebelum memesan hotel untuk menginap, biasanya menbaca
hasil review dari pengunjung sebelumnya, tentunya
membutuhkan waktu yang cukup lama  apabila membaca
review tersebut secara keseluruhan namun, jika hanya sedikit
review yang dibaca, informasi yang didapatkan akan bias.
Analisa sentimen bertujuan untuk mengatasi masalah ini
dengan secara otomatis mengelompokkan review pengguna
menjadi opini positif atau negatif . Pengklasifikasi Naïve Bayes
adalah teknik  machine learning yang populer untuk klasifikasi
teks, karena sangat sederhana, efisien dan memiliki performa
yang baik pada banyak domain. Namun, Naïve Bayes memiliki
kekurangan yaitu sangat sensitif pada fitur yang terlalu banyak,
yang mengakibatkan akurasi klasifikasi menjadi rendah. Oleh
karena itu, dalam penelitian ini digunakan metode pemilihan
fitur, yaitu  Particle Swarm Optimization  agar bisa
meningkatkan akurasi pengklasifikasi Naïve Bayes. Penelitian
ini menghasilkan klasifikasi teks dalam bentuk review positif
atau review negatif dari review hotel yang diambil dari situs
www. Tripadvisor.com.Pengukuran berdasarkan akurasi Naive
Bayes sebelum dan sesudah penambahan  metode pemilihan
fitur. Evaluasi dilakukan menggunakan 10  fold cross
validation. Sedangkan pengukuran akurasi diukur dengan
confusion matrix  dan kurva ROC. Hasil penelitian
menunjukkan peningkatan akurasi Naïve Bayes dari 90.50%
menjadi 96.92%

Kata Kunci: Analisa Sentimen, Review Hotel, Naïve Bayes, Particle Swarm Optimization, Klasifikasi teks, pemilihan fitur.

URI
http://ejournal.bsi.ac.id/ejurnal/index.php/jtk/article/view/1922/1509

Bidang ilmu
Data Mining

References

  1. Basari, A. S. H., et al. “Opinion Mining of Movie
    Review using Hybrid Method of Support
    Vector Machine and Particle Swarm
    Optimization.”  Procedia Engineering, 53,
    (2013.): 453-462. doi:10.1016/j.proeng.
    2013.02.059.
  2. Bramer, Max.  Principles of Data Mining. London: Springer, 2007.
  3. Charjan, Miss Dipti S. and Mukesh A. Pun . “Pattern Discovery For Text Mining Using Pattern Taxonomy.” International Journal (2013).
  4. Chen, J., et al. “Feature selection for text classification with  Naïve Bayes.”  Expert Systems with Applications, 36, no 3 pp. (2009): 5432– 5435.
  5. Duan, W, et al. “Mining Online User-Genenrated Content : Using Sentimen Analisis Technique to Study Hotel Quality.” (2013).
  6. Gencosman, B. C., H. C. Ozmutlu and S. Ozmutlu. “Character n-gram application for automatic new topic identification.”  Information Processing and Management, 50,  (2014): 821-856. doi:10.1016/j.ipm.2014.06.005.
  7. Gorunescu, F.  Data Mining: Concepts, Models and Techniques. Berlin:: Springer, 2011.
  8. Haddi, E., X. Liu and Y. Shi. “The Role of Text Pre-processing in Sentiment Analysis.”  Procedia Computer Science, 17,  (2013): 26-32. doi:10.1016/j.procs.2013.05.005.
  9. Han, J. and M. Kamber.  Data Mining Concepts and Techniques. 2007.Intan, R. and A. Defeng.  Subject Based Search Engine Menggunakan TF-IDF dan Jaccard’s Coefficient,. Surabaya: Universitas Kristen Petra, 2006.
  10. Kontopoulos, E., et al. “Ontology-based sentiment analysis of twitter post.”  Expert Systems with Applications, 40  (2013): 4065-4074. doi:10.1016/j.eswa.2013.01.001.
  11. Liu, B. “Sentiment Analysis and Opinion Mining.” Synthesis Lectures on Human Language Technologies, 5 (May), (2012): 1–167.
  12. Lu, Y , et al. “Improved particle swarm optimization algorithm and its application in text feature selection.”  Applied Soft Computing, 35,  (2015): 629–636.
  13. Maimon , O. and L. Rokach.  Data Mining and Knowledge Discovery Handbook, Second.Boston: MA: Springer US, 2010.
  14. Markopoulos, G, et al. “Sentiment Analysis of Hotel Reviews in Greek: A Comparison of Unigram Features.” Springer Proceeding in Business and Economics  (2015): DOI 10.1007/978-3-319-15859-4_3.
  15. Medhat, W., A. Hassan and H. Korashy. “Sentiment analysis algorithms and applications: A survey.”  Ain Shams Engineering Journal, 5(4), pp. (2014): 1093–1113.
  16. Robertson,  S. “Understanding Inverse Document Frequency: On Theoritical Arguments for IDF.” Journal of Documentation; 2004; 60, 5; ABI/INFORM Global. (2014).
  17. Suardika, I. G. “Sentiment Analysis System And Correlation Analysis On Hospitality In Bali.” Journal Of Theoretical and Applied Information Technology (Vol.84. No.1). (2016).
  18. Taylor, E. M., et al. “Indentifying Customer Preferences about Tourism Products using an Aspect-Based Opinion Mining Approach.”  Procedia Computer Science, 22,  (2013): 182-191. doi:10.1016/j.procs.2013.09.094.
  19. Witten, H. I., E. Frank and M. A. Hall.  Data Mining Practical Machine. 2011.
  20. Zhang, Z., Q. Ye and Y. Li. “Sentiment classification of Internet restaurant reviews written in Cantonese.”  Expert Systems with Applications, 38(6),  (2011): 7674–7682. doi:10.1016/j.eswa.2010.12.147.
  21. Zhao, M., et al. “Feature selection and parameter optimization for support vector machines: A new approach based on genetic algorithm with feature chromosomes.”  Expert Systems with Applications, 38(5),  (2011): 5197–5204. doi:10.1016/j.eswa.2010.10.041.