DETEKSI ANOMALI PADA LOG SISTEM WEB SERVER MENGGUNAKAN ISOLATION FOREST ANOMALY DETECTION IN WEB SERVER SYSTEM LOGS USING ISOLATION FOREST
Abstract
ABSTRAK
Deteksi anomali pada Log sistem web server merupakan langkah penting dalam memastikan keamanan dan kinerja optimal dari sistem tersebut. Penelitian ini menggunakan model Isolation Forest untuk mendeteksi anomali pada Log sistem web server Apache yang dikumpulkan selama dua bulan, dengan total 10.041 entri Log yang dianalisis. Model ini dirancang untuk mengidentifikasi entri yang tidak biasa berdasarkan fitur size dari respons HTTP. Hasil penelitian menunjukkan bahwa model Isolation Forest berhasil mengidentifikasi 499 entri sebagai anomali, yang mencakup sekitar 5% dari total dataset. Evaluasi kinerja model menggunakan Stratified K-Fold Cross-Validation menghasilkan mean score sebesar -0.3802 dengan standard deviation sebesar 0.0023, yang menunjukkan konsistensi dan stabilitas deteksi anomali di berbagai bagian dataset. Anomali yang terdeteksi cenderung berkaitan dengan ukuran respons yang sangat besar atau status HTTP yang menunjukkan kesalahan, seperti 404 (Not Found). Berdasarkan pola anomali yang terdeteksi, penelitian ini merekomendasikan untuk melakukan audit mendalam terhadap konfigurasi server, terutama untuk mengidentifikasi dan memperbaiki kesalahan yang mungkin menyebabkan ukuran respons yang tidak biasa. Selain itu, disarankan untuk memonitor aktivitas dari IP yang mencurigakan secara lebih ketat, guna mencegah potensi serangan yang dapat merusak integritas dan kinerja server. Penelitian ini menunjukkan bahwa Isolation Forest adalah alat yang efektif untuk deteksi anomali dalam Log sistem web server dan dapat digunakan sebagai bagian dari strategi pemantauan keamanan yang lebih luas.
Kata kunci : Deteksi Anomali, Log Sistem, Isolation Forest, Keamanan Server
ABSTRACT
Anomaly detection in web server Log systems is a critical step in ensuring the security and optimal performance of such systems. This study employs the Isolation Forest model to detect anomalies in the Apache web server Log system, collected over two months, with a total of 10,041 Log entries analyzed. The model is designed to identify unusual entries based on the size feature of the HTTP response. The results show that the Isolation Forest model successfully identified 499 entries as anomalies, accounting for approximately 5% of the total dataset. The model's performance was evaluated using Stratified K-Fold Cross-Validation, yielding a mean score of -0.3802 with a standard deviation of 0.0023, indicating consistency and stability in anomaly detection across different parts of the dataset. The detected anomalies are primarily related to unusually large response sizes or HTTP status codes indicating errors, such as 404 (Not Found). Based on the detected anomaly patterns, this study recommends conducting a thorough audit of the server configuration, particularly to identify and correct issues that may cause unusual response sizes. Additionally, it is advised to monitor suspicious IP activity more closely to prevent potential attacks that could compromise the server's integrity and performance. This research demonstrates that the Isolation Forest is an effective tool for anomaly detection in web server Log systems and can be used as part of a broader security monitoring strategy.
Keywords: Anomaly Detection, System Log , Isolation Forest, Server Security
References
DAFTAR PUSTAKA
A. Y. Chandra, “Analisis performansi antara apache & nginx web server dalam menangani client request,” Jurnal Sistem Dan Informatika (JSI), vol. 14, no. 1, hlm. 48–56, 2019.
R. Ramadhan, J. Latuny, dan S. J. Litiloly, “Perancangan Pengamanan Server Apache Menggunakan Firewall Iptables Dan Fail2ban,” J. ISOMETRI, vol. 1, no. 1, hlm. 9–15, 2022.
B. Wijaya dan A. Pratama, “Deteksi Penyusupan Pada Server Menggunakan Metode Intrusion Detection System (Ids) Berbasis Snort,” Jurnal Sisfokom (Sistem Informasi Dan Komputer), vol. 9, no. 1, hlm. 97–101, 2020.
L. Decker, D. Leite, L. Giommi, dan D. Bonacorsi, “Real-time anomaly detection in data centers for log-based predictive maintenance using an evolving fuzzy-rule-based approach,” dalam 2020 IEEE International Conference on Fuzzy Systems (FUZZ-IEEE), 2020, hlm. 1–8.
J. Lesouple, C. Baudoin, M. Spigai, dan J.-Y. Tourneret, “Generalized isolation forest for anomaly detection,” Pattern Recognit Lett, vol. 149, hlm. 109–119, 2021.
M. Carletti, M. Terzi, dan G. A. Susto, “Interpretable anomaly detection with diffi: Depth-based feature importance of isolation forest,” Eng Appl Artif Intell, vol. 119, hlm. 105730, 2023.
D. Ridhwanullah, “Pemodelan Topik pada Cuitan tentang Penyakit Tropis di Indonesia dengan Metode Latent Dirichlet Allocation,” 2022.
H. Chen, H. Ma, X. Chu, dan D. Xue, “Anomaly detection and critical attributes identification for products with multiple operating conditions based on isolation forest,” Advanced Engineering Informatics, vol. 46, hlm. 101139, 2020.
M. T. R. Laskar dkk., “Extending isolation forest for anomaly detection in big data via K-means,” ACM Transactions on Cyber-Physical Systems (TCPS), vol. 5, no. 4, hlm. 1–26, 2021.
C. Li, L. Guo, H. Gao, dan Y. Li, “Similarity-measured isolation forest: Anomaly detection method for machine monitoring data,” IEEE Trans Instrum Meas, vol. 70, hlm. 1–12, 2021.
Refbacks
- There are currently no refbacks.
Copyright (c) 2024 Jurnal Aplikasi Bisnis dan Komputer
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.