Kecelakaan lalu lintas merupakan suatu peristiwa yang tidak dapat diprediksi dengan pasti dan dapat mengakibatkan korban jiwa, korban luka ringan, korban luka berat atau kerugian materil seperti benda berharga. Permasalahan ini terjadi di seluruh dunia, tidak terkecuali Australia Selatan yang merupakan salah satu wilayah di Australia. Tercatat bahwa wilayah tersebut memiliki total kecelakaan yang memakan korban 4.953 pada tahun 2018. Oleh karena itu, dibutuhkan analisis untuk mengantisipasi kecelakaan agar tidak terulang kembali kejadian dengan faktor yang sama. Salah satu solusi untuk permasalahan ini yaitu diperlukan metode klasifikasi untuk mengelompokkan faktor-faktor yang mempengaruhi kecelakaan lalu lintas. Metode klasifikasi yang digunakan sebagai pengolah data adalah metode Decision Tree. Metode pada permasalahan ketidakseimbangan kelas menggunakan metode Synthetic MinorityOver-sampling Technique (SMOTE). Untuk proses dalam meningkatkan evaluasi pada penelitian ini menggunakan proses Knowledge Discovery in Database (KDD). Pengujian dilakukan dengan tiga desain model yaitu Split Validation Decision Tree dan SMOTE diperoleh akurasi 69.23%. Pengujian menggunakan Cross Validation Decision Tree dan SMOTE diperoleh akurasi 63.56%. Pengujian menggunakan Decision Tree dan SMOTE Split Data diperoleh akurasi 71.12% dengan perbandingan 1:9. Sehingga, setelah ketiga desain model tersebut dibandingkan, maka Decision Tree dan SMOTE Split Data mendapatkan akurasi yang paling baik. Selain itu diperoleh pula presisi 89.71% (3:7) dan area under curve (AUC) sebesar 0.773 (1:9). Penelitian ini masuk kedalam kategori fair classification (cukup).
the G. of S. A. The Department of Planning, Transport and Infrastructure, “Road Crashes in South Australia Statistical Summary of Road Crashes & Casualties in 2018,” 2018. [Online]. Available: https://www.dpti.sa.gov.au/towardszerotogether/road_crash_facts/sa_crashes#reports. [Accessed: 20-Apr-2020].
A. D. Saputra, “Studi Tingkat Kecelakaan Lalu Lintas Jalan di Indonesia Berdasarkan Data KNKT (Komite Nasional Keselamatan Transportasi) dari Tahun 2007-2016,” War. Penelit. Perhub., 2018.
WHO, “Road traffic injuries,” 2020. [Online]. Available: https://www.who.int/news-room/fact-sheets/detail/road-traffic-injuries. [Accessed: 20-May-2020].
Y. Mardi, “Data Mining : Klasifikasi Menggunakan Algoritma C4.5,” J. Edik Inform., 2017.
K. Fatmawati and A. P. Windarto, “Data Mining: Penerapan Rapidminer Dengan K-Means Cluster Pada Daerah Terjangkit Demam Berdarah Dengue (DBD) Berdasarkan Provinsi,” Comput. Eng. Sci. Syst. J., 2018.
R. L. Hasanah, M. Hasan, W. E. Pangesti, F. F. Wati, and W. Gata, “Klasifikasi Penerima Dana Bantuan Desa Menggunakan Metode KNN (K-Nearest Neighbor),” J. Techno Nusa Mandiri, 2019.
A. B. E. D. Ahmed and I. S. Elaraby, “Data Mining: A prediction for performance improvement using classification,” World J. Comput. Appl. Technol., 2014.
F. Dwi Meliani Achmad, Budanis, Slamat, “Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree,” J. IPTEK, 2012.
A. Shiddiq, R. K. Niswatin, and I. N. Farida, “Ahmad Shiddiq Analisa Kepuasan Konsumen Menggunakan Klasifikasi Decision Tree Di Restoran Dapur Solo (Cabang Kediri),” Gener. J., 2018.
A. N. Kasanah, M. Muladi, and U. Pujianto, “Penerapan Teknik SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Objektivitas Berita Online Menggunakan Algoritma KNN,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), 2019.
A. Bisri and R. Rachmatika, “Integrasi Gradient Boosted Trees dengan SMOTE dan Bagging untuk Deteksi Kelulusan Mahasiswa,” J. Nas. Tek. Elektro dan Teknol. Inf., 2019.
S. Kumar and D. Toshniwal, “A data mining approach to characterize road accident locations,” J. Mod. Transp., 2016.
M. Taamneh, S. Taamneh, and S. Alkheder, “Clustering-based classification of road traffic accidents using hierarchical clustering and artificial neural networks,” Int. J. Inj. Contr. Saf. Promot., 2017.
M. A. Raihan, M. Hossain, and T. Hasan, “Data mining in road crash analysis: the context of developing countries,” Int. J. Inj. Contr. Saf. Promot., 2018.
R. Fitria, W. Nengsih, and D. H. Qudsi, “Implementasi Algoritma FP-Growth Dalam Penentuan Pola Hubungan Kecelakaan Lalu Lintas,” J. Sist. Inf., 2017.
Y. Castro and Y. J. Kim, “Data mining on road safety: Factor assessment on vehicle accidents using classification models,” Int. J. Crashworthiness, 2016.
W. W. Fitriah and M. Mashuri, “Faktor-Faktor yang Mempengaruhi Keparahan Korban Kecelakaan Lalu Lintas di Kota Surabaya dengan Pendekatan Bagging Regresi Logistik Ordinal,” J. Sains dan Seni ITS, 2012.
C. Silvia, Y. Wilandari, and A. Hoyyi, “Ketepatan Klasifikasi Tingkat Keparahan Korban Kecelakaan Lalu Lintas Menggunakan Metode Reresi Logistik Ordinal dan Fuzzy K-Nearest Neighbor In Every Class,” None, 2015.
L. Susiana, I. T. Utami, and J. Junaidi, “Penerapan Metode Boosting Pada Cart Untuk Mengklasifikasikan Korban Kecelakaan Lalu Lintas Di Kota Palu,” Nat. Sci. J. Sci. Technol., 2019.
P. Ristoski and H. Paulheim, “Semantic Web in data mining and knowledge discovery: A comprehensive survey,” Journal of Web Semantics. 2016.
F. Syukmana et al., “Predicting Relegation Clubs in Italian Serie A with Method based C4.5 Decision Tree Algorithm,” in Journal of Physics: Conference Series, 2020.
A. Muzakir and R. A. Wulandari, “Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree,” Sci. J. Informatics, 2016.
the G. of S. A. The Department of Planning, Transport and Infrastructure, “2018_DATA_SA_Crash,” 2018. [Online]. Available: https://data.sa.gov.au/data/dataset/road-crash-data/resource/45ceb7e8-59bd-4492-b107-8379752ea597. [Accessed: 11-Apr-2020].