SISTEM PERINGATAN DINI UNTUK DETEKSI AKTIVITAS AI BERBAHAYA BERBASIS MACHINE LEARNING
DOI:
https://doi.org/10.36595/misi.v9i1.1869Keywords:
Kecerdasan Buatan, Machine Learning, Klasifikasi Teks, Sistem Peringatan Dini, Support Vector MachineAbstract
Perkembangan teknologi kecerdasan buatan (AI) telah memberikan banyak manfaat di berbagai sektor, namun juga menimbulkan risiko keamanan akibat potensi penyalahgunaan sistem AI. Penelitian ini mengusulkan sistem peringatan dini berbasis machine learning untuk mendeteksi aktivitas AI berbahaya secara proaktif melalui prompt berbasis teks. Sistem ini menerapkan pendekatan klasifikasi teks menggunakan algoritma Logistic Regression, Linear Support Vector Classifier (SVC), dan Random Forest dengan ekstraksi fitur TF-IDF. Hasil pengujian menunjukkan bahwa seluruh model menghasilkan performa yang kuat dengan tingkat akurasi di atas 95%. Model Random Forest menunjukkan performa tertinggi dengan akurasi sebesar 95,64% dan nilai ROC-AUC 95,64%, sementara Linear SVC dan Logistic Regression memberikan hasil yang stabil dan kompetitif. Temuan ini menunjukkan bahwa sistem yang diusulkan efektif sebagai mekanisme peringatan dini dalam mendeteksi prompt AI berbahaya sebelum terjadi eskalasi ancaman.
Downloads
References
[1] Y. Dong et al., “Safeguarding Large Language Models: A Survey,” 2024, doi: 10.1007/s10462-025-11389-2.
[2] K.-H. Hung, C.-Y. Ko, A. Rawat, I.-H. Chung, W. H. Hsu, and P.-Y. Chen, “Attention Tracker: Detecting Prompt Injection Attacks in LLMs,” pp. 2309–2322, 2025, doi: 10.18653/v1/2025.findings-naacl.123.
[3] F. Arifin and H. D. Surjono, “DETEKSI MALWARE ADVERSARIAL PADA JARINGAN IoT?: TINJAUAN SISTEMATIS MODEL AI DAN STRATEGI SERANGAN ADVERSARIAL MALWARE DETECTION IN IoT NETWORKS?: A SYSTEMATIC REVIEW OF AI MODELS AND ATTACK STRATEGIES,” vol. 18, no. 2, pp. 1–11, 2025.
[4] M. D. Desriansyah, I. U. Sari, and Z. Zulfahmi, “Analisis Efektivitas Algoritma Machine Learning dalam Deteksi Hoaks: Pada Berita Digital Berbahasa Indonesia,” J. Sist. Inf. Dan Inform., vol. 3, no. 2, pp. 63–69, 2025, doi: 10.47233/jiska.v3i1.2024.
[5] P. Chyan et al., Pengantar Machine Learning PT. MIFANDI MANDIRI DIGITAL, vol. 1. 2024. [Online]. Available: http://jurnal.mifandimandiri.com/index.php/penerbitmmd/article/view/38
[6] A. K. Dewi, N. F. Rahmadani, R. Syahputri, and L. Rahma, “Deteksi Berita Hoax pada Platform X Menggunakan Pendekatan Text Mining dan Algoritma Machine Learning,” Data Sci. Indones., vol. 5, no. 1, pp. 33–46, 2025, [Online]. Available: https://jurnal.itscience.org/index.php/dsi/index
[7] M. Y. Ridho and E. Yulianti, “From Text to Truth: Leveraging IndoBERT and Machine Learning Models for Hoax Detection in Indonesian News,” J. Ilm. Tek. Elektro Komput. dan Inform., vol. 10, no. 3, pp. 544–555, 2024, doi: 10.26555/jiteki.v10i3.29450.
[8] T. A. Roshinta, E. Kumala, and I. F. Dinata, “Sistem Deteksi Berita Hoax Berbahasa Indonesia Bidang Kesehatan,” Remik, vol. 7, no. 2, pp. 1167–1173, 2023, doi: 10.33395/remik.v7i2.12369.
[9] D. Rahmawati, Tjahjanto, and A. R. Ruli, “Literature Review?: Implementasi Teknologi Artificial Intelligence dalam Sistem Keamanan Kota di Ibu Kota Nusantara (IKN),” J. Sist. Inf. dan Apl., vol. 2, no. 2, pp. 24–30, 2024.
[10] N. H. Sinaga, D. Irmayani, and M. N. S. Hasibuan, “Mengoptimalkan Keamanan Jaringan Memanfaatkan Kecerdasan,” J. Ilmu Komput. dan Sist. Inf. (JIKOMSI, vol. 7, no. 2, pp. 364–369, 2024, [Online]. Available: https://ejournal.sisfokomtek.org/index.php/jikom
[11] Celvine Adi Putra, Rianda Pratama, and Tata Sutabri, “Analisis Manfaat Machine Learning Pada Next-Generation Firewall Sophos Xg 330 Dalam Mengatasi Serangan Sql Injection,” J. Manaj. Inform. dan Sist. Inf., vol. 6, no. 2, pp. 197–204, 2023, doi: 10.36595/misi.v6i2.886.
[12] D. Gosmar, D. A. Dahl, and D. Gosmar, “Prompt Injection Detection and Mitigation via AI Multi-Agent NLP Frameworks,” 2025, [Online]. Available: http://arxiv.org/abs/2503.11517
[13] A. Purnomo, A. Kurniasih, A. Nuarminah, and S. Hartati, “Peran Artificial Intelligence dalam Deteksi Dini Ancaman Keamanan Jaringan,” J. Minfo Polgan, vol. 13, no. 2, pp. 2044–2048, 2024, doi: 10.33395/jmp.v13i2.14356.
[14] R. Nursiaga, N. Mulyana, H. Sanjaya, G. Santoso, U. Teknologi, and M. Jakarta, “Model Jaringan Neural Untuk Deteksi Anomali Pada Sistem Keamanan(SIBER): Rancangan, Implementasi, dan Analisis,” JAREKOMJurnal Jar. dan Rekayasa Komput., vol. 1, no. 01, pp. 1–11, 2025, [Online]. Available: https://doi.org/10.9020/jarekom.v1i1.
[15] M. B. M. Amin et al., “Deteksi Spam Berbahasa Indonesia Berbasis Teks Menggunakan Model Bert,” J. Teknol. Inf. dan Ilmu Komput., vol. 11, no. 6, pp. 1291–1302, 2024, doi: 10.25126/jtiik.2024118121.
[16] A. R. C and Y. Lukito, “Deteksi Komentar Spam Bahasa Indonesia Pada Instagram Menggunakan Naive Bayes,” Ultim. J. Tek. Inform., vol. 9, no. 1, pp. 50–58, 2017, doi: 10.31937/ti.v9i1.564.
[17] R. Adrian, Musaddam, M. Ikhsan, and M. R. Pahlevi. B, “Detection of Hoax News Using TF-IDF Vectorizer and Multinomial Naïve Bayes and Passive Aggressive,” Media J. Gen. Comput. Sci., vol. 1, no. 2, pp. 54–61, 2024, doi: 10.62205/mjgcs.v1i2.24.
[18] O. Gupta, M. De La Cuadra Lozano, A. Busalim, R. R Jaiswal, and K. Quille, “Harmful Prompt Classification for Large Language Models,” ACM Int. Conf. Proceeding Ser., pp. 8–14, 2024, doi: 10.1145/3701268.3701271
Downloads
Published
How to Cite
Issue
Section
License
Semua tulisan pada jurnal ini menjadi tanggungjawab penuh penulis.










