LLM & RAG based Cyber Threat Prediction Part. 2 (RAG-XAI Collaboration)

In the previous post (Part 1), we introduced the concept and necessity of cyber threat prediction by combining LLM and RAG. Building on this foundation, this article takes a step further by presenting a method for integrating XAI-derived attack detection evidence with RAG to enable more precise cyber threat analysis and prediction. In particular, we explain how XAI results can be effectively utilized through semantic token reconstruction, and how this approach allows the LLM to interpret attack flows and predict subsequent attack stages.

LLM 및 RAG 기반 사이버 위협 예측 2탄 (RAG와 XAI 콜라보)

앞선 1탄에서는 LLM과 RAG를 결합한 사이버 위협 예측의 개념과 필요성에 대해 살펴보았습니다. 본 글에서는 이러한 개념을 기반으로 한 단계 더 나아가, XAI를 통해 도출된 공격 탐지 근거 정보를 RAG와 결합하여 보다 정교한 사이버 위협 분석 및 예측을 수행하는 방법을 소개합니다. 특히 의미 단위 기반 토큰 재구성을 통해 XAI 결과를 효과적으로 활용하고, 이를 기반으로 LLM이 공격 흐름을 해석하고 향후 공격 단계를 예측할 수 있도록 하는 접근 방식을 설명합니다.

LLM & RAG based Cyber Threat Prediction Part. 1 (Understanding)

Recent cyber attacks have evolved beyond single techniques, adopting multi-stage, high-speed, and tactical approaches that clearly expose the limitations of existing defense systems. This article examines why traditional, simple pattern-based threat prediction is insufficient in this changed environment and introduces a proactive cyber threat prediction approach combining LLM and RAG as a solution to overcome these limitations. This article serves as the first part for conceptual understanding. In the upcoming series, we will provide a step-by-step explanation covering the actual architecture design and implementation process.

LLM 및 RAG 기반 사이버 위협 예측 1탄 (이해하기)

최근 사이버 공격은 단일 기법에 머무르지 않고 다단계·고속·전술적 방식으로 진화하며 기존 대응 체계의 한계를 분명히 드러내고 있습니다. 본 글에서는 이러한 변화된 환경 속에서 기존의 단순 패턴 기반 위협 예측이 왜 충분하지 않은지 살펴보고, 이를 극복하기 위한 방안으로 LLM과 RAG를 결합한 선제적 사이버 위협 예측 접근법을 소개하고자 합니다. 이번 글은 개념 이해를 위한 첫 번째 편으로, 이어지는 연재에서는 실제 아키텍처 설계와 구현 과정까지 단계적으로 설명해 드릴 예정입니다.

네트워크 사이버위협 탐지 모델 만들기 (1) – 전처리의 모든 것

디지털 전환 속도에 발맞춰 사이버 공격도 고도화되고 있는 오늘날, 정형화된 통계 정보만으로는 네트워크 위협을 탐지하는 데 한계가 있습니다. 이에 KAIST 사이버보안연구센터는 네트워크의 통계 정보와 비정형 페이로드 데이터를 동시에 분석하는 하이브리드 탐지 모델을 제안하며, 이를 위한 전처리 체계를 구축했습니다. 본 글에서는 네트워크 트래픽의 원천 데이터인 pcap 파일을 기반으로 CICFlowMeter를 활용한 정형 피처 추출, 커스텀 디코딩을 통한 페이로드 정제, 그리고 프로토콜 자동 식별까지 탐지 모델의 기반이 되는 전처리 과정 전반을 상세히 소개합니다.

복잡한 인공지능 모델을 이해해 보자 (XAI 활용기)

AI 기술은 챗봇, 안면 인식, 자율주행, 의료 지원 등 다양한 분야에 적용되며 빠르게 발전하고 있습니다. 하지만 의사 결정 과정이 불투명하기 때문에 흔히 ‘블랙박스’ 문제라고 불리는 AI의 결정을 완전히 신뢰하기 어려운 경우가 많습니다. 바로 이 부분에서 설명 가능한 AI(XAI)가 등장하여 AI의 결정을 설명하는 데 도움을 줍니다.

초거대 언어 모델의 보안 위협과 설명가능한 인공지능의 역할

ChatGPT의 눈부신 성공으로 촉발된 초거대 언어 모델(Large Language Model) 및 생성형 인공지능(Generative Artificial Intelligence) 개발 경쟁은 전세계 유수의 기업들이 앞다투어 초거대 언어 모델 기반 서비스를 공개하는 원동력으로 작용하고 있습니다. 그렇지만 초거대 언어 모델은 여타의 기술과 같이 완벽하지 않으며, 이에 따른 보안 위협이 존재합니다. 본 글에서는 초거대 언어 모델이 지니는 보안 위협과 그를 완화하고자 활용될 수 있는 설명가능한 기술에 대해 몇 가지 예시를 통해 살펴봅니다.

“인공지능 보안 취약점” 어떻게 안전하게 방어 및 보완할 수 있을까?

최근 인공지능 기술은 뛰어난 발전과 함께 다양한 분야에서 널리 활용되고 있지만, 반면 예상치 못한 문제점을 발생시켜 보안 중요성 또한 주의 깊게 살펴봐야 합니다. 이번 글은 인공지능에는 어떤 보안 취약점이 존재하며, 이를 방어 및 보완하는 방법에 대하여 살펴보도록 하겠습니다.