Perkembangan dunia perfilman yang sudah sangat pesat berdampak kepada para penikmat film yang membutuhkan film-film yang mempunyai kualitas gambar, suara, alur cerita dan nilai positif yang tergandung didalamnya. Hal itu didasarkan agar para penikmat film tetap antusias dalam mengikuti film-film yang terbaru. Agar dunia perfilman berkembang secara terus menerus dibutuhkannya sebuah penilaian yang berasal dari masyarakat dan khususnya para penikmat film itu sendiri. Penilaian ini digunakan untuk mengetahui jenis film apa yang diinginkan. Maka dari itu dibutuhkan sebuah analisa untuk mengetahui minat dari penikmat film dengan menganalisis rating suatu film. Penelitian ini bertujuan untuk memprediksi tingkat kepopularitasan film yang ada di Indonesia selama 10 tahun terakhir. Hasil yang didapatkan menggunakan algoritma decision tree menunjukan 454 judul film popular dan 102 judul film tidak popular dengan nilai accuracy sebesar 76,45% dengan precision sebesar 82,78% dan recall sebesar 88,68%, naive bayes menunjukan 446 judul film popular dan 110 judul film tidak popular dengan nilai accuracy sebesar 83,29% dengan precision sebesar 87,83% dan recall sebesar 91,24% dan K-Nearest Neighbors menunjukan 443 judul film popular dan 113 judul film tidak popular dengan nilai accuracy sebesar 80,95% dengan precision sebesar 86,92% dan recall sebesar 88,90%. Hasil evaluasi dengan ROC curve menunjukan nilai AUC menggunakan model naive bayes sebesar 0,836 model K-Nearest Neighbors sebesar 0,818 dan model decision tree sebesar 0,767. Dari ketiga model yang digunakan dua diantaranya termasuk kedalam klasifikasi Good classification yaitu model algoritma naive bayes dan k-nearest neighbors, dikarenakan memiliki nilai AUC diantara 0,80 – 0,90. Sedangkan model algoritma decision tree termasuk kedalam klasifikasi Fair classification, memiliki nilai AUC diantara 0,70 - 0,80.
Ahmed, M., Jahangir, M., Afzal, H., Majeed, A., & Siddiqi, I. (2015a). Using crowd-source based features from social media and conventional features to predict the movies popularity. Proceedings - 2015 IEEE International Conference on Smart City, SmartCity 2015,Stainable Computing and Communic, (March 2016), 273–278. https://doi.org/10.1109/SmartCity.2015.83.
Alfisahrin, S. N. (2014). Komparasi Algoritma C4.5, Naive Bayes dan Neural Network Untuk Memprediksi Penyakit Jantung. Jakarta : Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri.
Apala, K. R., Jose, M., Motnam, S., Chan, C., Liszka, K. J., & Gregorio, F. De. (2013). Prediction of Movies Box Office Performance Using Social Media. IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining, (July), 1209–1214. https://doi.org/10.1145/2492517.2500232.
Bellazzi, R., & Zupanb, B. (2008). Predictive Data Mining In Clinical Medicine: Current Issue And Guidelines. International Journal Of Medical Informatics, 81–97.
Bhave, A., Kulkarni, H., Biramane, V., & Kosamkar, P. (2015). Role of different factors in predicting movie success. 2015 International Conference on Pervasive Computing (ICPC), 00(c), 1–4. https://doi.org/10.1109/PERVASIVE.2015.7087152.
Budi, S. (2017). Text Mining Untuk Analisis Sentimen Review Film Menggunakan Algoritma K-Means. Techno.COM, 16(1), 1–8.
Chandani, V., Wahono, R. S., & Purwanto, . (2015). Komparasi Algoritma Klasifikasi Machine Learning Dan Feature Selection pada Analisis Sentimen Review Film. Journal of Intelligent Systems, 1(1), 55–59. Retrieved from http://journal.ilmukomputer.org/index.php/jis/article/view/10.
Gorunescu, F. (2011). Data Mining : Concepts, Models and Techniques. Chennai:Springer.
Gumilar, D., Pudjiantoro, T. H., & Yuniarti, R. (2017). Prediksi Kepopuleran Lagu Berdasarkan Tangga Lagu Billboard Menggunakan Decision Tree Dan K-Means. Prosiding SNATIF Ke -4 Tahun 2017, 187–192. https://doi.org/10.1007/s12664-012-0191-3.
Irfansyah, P. (2016). Kajian Komparasi Penerapan Algoritma Data Mining (C4.5, Bayesian Classifier Dan Neural Network) Dalam Menentukan Promosi Jabatan. Prosiding Seminar Nasional, 53–67.
Iskandar, D., & Suprapto, Y. . (2015). Perbandingan Akurasi Klasifikasi Tingkat.
Kemiskinan Antara Algoritma C45 dan Naive Bayes. Ilmiah NERO, 2(1), 37–43.
Jangid, B. M., Jadhav, C. K., Dhokate, S. M., Jadhav, G. M., & Bhandari, G. M. (2017). Movies Popularity Prediction Using Social Media and Conventional Features, (i), 5794–5798. https://doi.org/10.15680/IJIRSET.2017.0604192.
Latif, M. H., & Afzal, H. (2016). Prediction of Movies popularity Using Machine Learning Techniques. IJCSNS International Journal of Computer Science and Network Security, 16(8), 127–131. Retrieved from http://paper.ijcsns.org/07_book/201608/20160820.pdf.
McLeon, R. G. P. S. (2008). Sistem Informasi Manajemen. Salemba Empat.
Murnawan, & Sinaga, A. (2017). Implementasi Sentiment Analysis untuk Menentukan Tingkat Popularitas Tujuan Wisata. Prosiding Seminar Nasional Teknologi Dan Rekayasa Informasi Tahun 2017, (November), 12–18.
Retrieved from http://sentrin.filkom.ub.ac.id/event/sentrin17/jurnal/pimplementasi-sentiment-analysis-untuk-menentukan-tingkat-popularitas-tujuan-wisata-p/99e80f3.
Nugroho, Y. S., & Emiliyawati, N. (2017). Sistem Klasifikasi Variabel Tingkat Penerimaan Konsumen Terhadap Mobil Menggunakan Metode Random Foresrt. Jurnal Teknik Elektro, 9 (1).
Nugroho, Y. S., & Pratiwi, R. W. (2016). Prediksi Rating Film Menggunakan Metode Naïve Bayes. Jurnal Teknik Elektro (ISSN 1411-0059), 8(2), 60–63.
Nuraeni, N. (2017). Penentuan Calon Pegawai di PTPN 12 Kota Blater Tempurejo Jember dengan Metode Naive Bayes. Seminar Nasional Teknologi Informasi Dan Multimetida, 61–66.
Nuraeni, N. (2017). Penentuan Kelayakan Kredit Dengan Algoritma Naïve Bayes Classifier : Studi Kasus Bank Mayapada Mitra Usaha Cabang PGC. Jurnal Teknik Komputer AMIK BSI, III(1), 9–15. https://doi.org/ISSN. 2442 - 2436.
Pristiyanti, R. I., Fauzi, M. A., & Muflikhah, L. (2017). Sentiment Analysis Peringkasan Review Film Menggunakan Metode Information Gain dan K-Nearest Neighbor, 2(3), 1179–1186.
Ridwan, M., Suyono, H., & Sarosa, M. (2013). Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes Classifier. Eeccis, 7(1), 59–64. https://doi.org/10.1038/hdy.2009.180.
Utami, L. A. (2017). Melalui Komparasi Algoritma Support Vector Machine Dan K-Nearest Neighbor Berbasis Paerticle Swarm Optimization, 13((1)), 103– 112.
Vercillis, C. (2009). Business Intelligence: Data Mining and Optimization for Decision Making.
Wisudawati, J., Adiwijaya, & Faraby, S. Al. (2017). Klasifikasi Sentimen pada Movie Review dengan Metode Multinomial Naïve Bayes. E-Proceeding of Engineering, 4(2), 2978–2988. Retrieved from http://libraryeproceeding.telkomuniversity.ac.id/index.php/engineering/articl e/view/1384.
Witten, I. H., Frank, E., & Hall, M. A. (2011). Data Mining Practical Machine Learning Tools And Techniques. Burlington, Usa: Morgan Kaufmann Publishes.
Yulietha, I. M., Faraby, S. Al, & Adiwijaya. (2017). Klasifikasi Sentimen Review Film Menggunakan Algoritma Support Vector Machine. E-Proceeding of Engineering, 4(3), 4740–4750. Retrieved from http://libraryeproceeding.telkomuniversity.ac.id/index.php/engineering/articl e/view/5401.