In the previous post (Part 1), we introduced the concept and necessity of cyber threat prediction by combining LLM and RAG. Building on this foundation, this article takes a step further by presenting a method for integrating XAI-derived attack detection evidence with RAG to enable more precise cyber threat analysis and prediction. In particular, we explain how XAI results can be effectively utilized through semantic token reconstruction, and how this approach allows the LLM to interpret attack flows and predict subsequent attack stages.
[태그:] 인공지능
앞선 1탄에서는 LLM과 RAG를 결합한 사이버 위협 예측의 개념과 필요성에 대해 살펴보았습니다. 본 글에서는 이러한 개념을 기반으로 한 단계 더 나아가, XAI를 통해 도출된 공격 탐지 근거 정보를 RAG와 결합하여 보다 정교한 사이버 위협 분석 및 예측을 수행하는 방법을 소개합니다. 특히 의미 단위 기반 토큰 재구성을 통해 XAI 결과를 효과적으로 활용하고, 이를 기반으로 LLM이 공격 흐름을 해석하고 향후 공격 단계를 예측할 수 있도록 하는 접근 방식을 설명합니다.
Recent cyber attacks have evolved beyond single techniques, adopting multi-stage, high-speed, and tactical approaches that clearly expose the limitations of existing defense systems. This article examines why traditional, simple pattern-based threat prediction is insufficient in this changed environment and introduces a proactive cyber threat prediction approach combining LLM and RAG as a solution to overcome these limitations. This article serves as the first part for conceptual understanding. In the upcoming series, we will provide a step-by-step explanation covering the actual architecture design and implementation process.
최근 사이버 공격은 단일 기법에 머무르지 않고 다단계·고속·전술적 방식으로 진화하며 기존 대응 체계의 한계를 분명히 드러내고 있습니다. 본 글에서는 이러한 변화된 환경 속에서 기존의 단순 패턴 기반 위협 예측이 왜 충분하지 않은지 살펴보고, 이를 극복하기 위한 방안으로 LLM과 RAG를 결합한 선제적 사이버 위협 예측 접근법을 소개하고자 합니다. 이번 글은 개념 이해를 위한 첫 번째 편으로, 이어지는 연재에서는 실제 아키텍처 설계와 구현 과정까지 단계적으로 설명해 드릴 예정입니다.
디지털 전환 속도에 발맞춰 사이버 공격도 고도화되고 있는 오늘날, 정형화된 통계 정보만으로는 네트워크 위협을 탐지하는 데 한계가 있습니다. 이에 KAIST 사이버보안연구센터는 네트워크의 통계 정보와 비정형 페이로드 데이터를 동시에 분석하는 하이브리드 탐지 모델을 제안하며, 이를 위한 전처리 체계를 구축했습니다. 본 글에서는 네트워크 트래픽의 원천 데이터인 pcap 파일을 기반으로 CICFlowMeter를 활용한 정형 피처 추출, 커스텀 디코딩을 통한 페이로드 정제, 그리고 프로토콜 자동 식별까지 탐지 모델의 기반이 되는 전처리 과정 전반을 상세히 소개합니다.
AI 기술은 챗봇, 안면 인식, 자율주행, 의료 지원 등 다양한 분야에 적용되며 빠르게 발전하고 있습니다. 하지만 의사 결정 과정이 불투명하기 때문에 흔히 ‘블랙박스’ 문제라고 불리는 AI의 결정을 완전히 신뢰하기 어려운 경우가 많습니다. 바로 이 부분에서 설명 가능한 AI(XAI)가 등장하여 AI의 결정을 설명하는 데 도움을 줍니다.
ChatGPT의 눈부신 성공으로 촉발된 초거대 언어 모델(Large Language Model) 및 생성형 인공지능(Generative Artificial Intelligence) 개발 경쟁은 전세계 유수의 기업들이 앞다투어 초거대 언어 모델 기반 서비스를 공개하는 원동력으로 작용하고 있습니다. 그렇지만 초거대 언어 모델은 여타의 기술과 같이 완벽하지 않으며, 이에 따른 보안 위협이 존재합니다. 본 글에서는 초거대 언어 모델이 지니는 보안 위협과 그를 완화하고자 활용될 수 있는 설명가능한 기술에 대해 몇 가지 예시를 통해 살펴봅니다.
최근 인공지능 기술은 뛰어난 발전과 함께 다양한 분야에서 널리 활용되고 있지만, 반면 예상치 못한 문제점을 발생시켜 보안 중요성 또한 주의 깊게 살펴봐야 합니다. 이번 글은 인공지능에는 어떤 보안 취약점이 존재하며, 이를 방어 및 보완하는 방법에 대하여 살펴보도록 하겠습니다.
지난 “AI 보안팀의 딥러닝 경진대회 : 개요 및 소감”에 이어서 이번 글은 어떻게 딥러닝 모델을 설계했는지 등 기술적인 내용으로 작성하였습니다. 이후 처음 도전하는 초보자에게 많은 도움을 드리는 이야기를 하고자 합니다.
저희 AI 보안팀은 데이터 사이언스 경진대회 플랫폼인 DACON에서 열린 산업제어시스템 보안위협 탐지 AI 경진대회에 참가하여 5등의 수상하였습니다. 대회에 참가하면서 느낀 점에 대하여 가감하게 나타내면서 추가로 딥러닝을 학습하는 초보 개발자에게 도움을 주는 이야기를 하고자 합니다.







