ANALISIS FAKTOR-FAKTOR YANG MEMENGARUHI KEPUTUSAN PEMBELIAN PAKET WISATA MENGGUNAKAN MODEL KLASIFIKASI DECISION TREES, RANDOM FOREST DAN K-NEAREST NEIGHBOURS
Abstract
Saat ini industri pariwisata dunia sedang mengalami perkembangan yang sangat pesat. Industri pariwisata tumbuh semakin ramai dengan berbagai macam penawaran produk dan paket wisata yang menggiurkan. Oleh karena itu penelitian untuk mengetahui dan memprediksi perilaku wisatawan diperlukan agar penawaran dan promosi paket wisata bisa sesuai dan tepat sasaran. Model klasifikasi adalah salah satu model yang bisa dipergunakan untuk memprediksi bagaimana perilaku orang yang melakukan pembelian paket wisata menggunakan dataset yang diperoleh dari Kaggle dan diolah menggunakan Phyton. Pengolahan data, pemodelan, dan evaluasi dilakukan untuk mengetahui Perilaku kunjungan dan preferensi properti menggunakan beberapa algoritma klasifikasi seperti Decision Trees, Random Forest, dan KNN (K-Nearest Neighbors). Evaluasi model dilakukan menggunakan metrik evaluasi klasifikasi. Hasil eksperimen menunjukkan model KNN memiliki performa yang baik dalam mengklasifikasikan pelanggan berdasarkan peluang pembelian paket wisata baru. Namun, presisi dan recall masih bisa ditingkatkan untuk meningkatkan keakuratan prediksi. Random Forest Regressor menghasilkan Mean Absolute Error (MAE) 0.05, Root Mean Squared Error (RMSE) 0.16 dan R-squared score (R2 score) 0.3. Nilai MAE yang rendah menunjukkan bahwa model ini mampu memberikan prediksi yang mendekati nilai sebenarnya. Namun, RMSE yang cukup tinggi menandakan bahwa terdapat variasi yang besar antara prediksi dan nilai sebenarnya. R2 score yang rendah juga menunjukkan bahwa model belum mampu menjelaskan variasi yang signifikan dalam data. Model Decision Tree Classifier memiliki akurasi yang cukup tinggi dengan skor di atas 0.96 pada kedua set data train dan test. Namun, skor precision, recall, dan F1-score masih relatif rendah, menunjukkan bahwa model masih bisa diperbaiki untuk meningkatkan kemampuannya dalam mengklasifikasikan data dengan benar. Sedangkan model Decision Tree Regressor memiliki MAE yang rendah, RMSE dan R2 score yang kurang memuaskan, menandakan bahwa model belum cukup baik dalam menjelaskan variasi dalam data.
References
Achary, S. (2021). Holiday Package Prediction. Diakses dari: https://www.kaggle.com/susant4learning/holiday-package-purchase-prediction
Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5-32.
Defiyanti, S., & Jajuli, M. (2015). Integrasi metode klasifikasi dan clustering dalam data mining. Konferensi Nasional Informatika (KNIF), 10(15), 39-44.
Dina, J. M. S. A. F. (2021). Penerapan Metode Klasifikasi Decision Tree Untuk Memprediksi Kelulusan Tepat Waktu. Journal of Industrial Engineering and Technology, 2(1), 1-14.
Garwal, S. (2014). Data mining: Data mining concepts and techniques. Proceedings International Conference on Machine Intelligence Research and Advancement, ICMIRA.
Indrawati, A. (2021). Penerapan Teknik Kombinasi Oversampling Dan Undersampling Untuk Mengatasi Permasalahan Imbalanced Dataset. JIKO (Jurnal Informatika dan Komputer), 4(1), 38-43.
Liaw, A., & Wiener, M. (2002). Classification and regression by randomForest. R news, 2(3), 18-22.
Siahaan, V., & Sianipar, R. H. (2019). Konsep dan Implementasi Pemrograman Python. SPARTA PUBLISHING.
Wang, H. (2002). Nearest neighbours without k: a classification formalism based on probability. Faculty of Informatics, University of Ulster.
Wibawa, A. P., Guntur, M., Purnama, A., Akbar, M. F., & Dwiyanto, F. A. (2018). Metode-metode klasifikasi. In Prosiding Seminar Ilmu Komputer dan Teknologi Informasi (Vol. 3, No. 1).
Yuda, O. W., & Tuti, D. (2022). Penerapan Penerapan Data Mining Untuk Klasifikasi Kelulusan Mahasiswa Tepat Waktu Menggunakan Metode Random Forest. SATIN-Sains Dan Teknologi Informasi, 8(2), 122-131.