In the previous post (Part 1), we introduced the concept and necessity of cyber threat prediction by combining LLM and RAG. Building on this foundation, this article takes a step further by presenting a method for integrating XAI-derived attack detection evidence with RAG to enable more precise cyber threat analysis and prediction. In particular, we explain how XAI results can be effectively utilized through semantic token reconstruction, and how this approach allows the LLM to interpret attack flows and predict subsequent attack stages.
[글쓴이:] 박 상류
앞선 1탄에서는 LLM과 RAG를 결합한 사이버 위협 예측의 개념과 필요성에 대해 살펴보았습니다. 본 글에서는 이러한 개념을 기반으로 한 단계 더 나아가, XAI를 통해 도출된 공격 탐지 근거 정보를 RAG와 결합하여 보다 정교한 사이버 위협 분석 및 예측을 수행하는 방법을 소개합니다. 특히 의미 단위 기반 토큰 재구성을 통해 XAI 결과를 효과적으로 활용하고, 이를 기반으로 LLM이 공격 흐름을 해석하고 향후 공격 단계를 예측할 수 있도록 하는 접근 방식을 설명합니다.
Recent cyber attacks have evolved beyond single techniques, adopting multi-stage, high-speed, and tactical approaches that clearly expose the limitations of existing defense systems. This article examines why traditional, simple pattern-based threat prediction is insufficient in this changed environment and introduces a proactive cyber threat prediction approach combining LLM and RAG as a solution to overcome these limitations. This article serves as the first part for conceptual understanding. In the upcoming series, we will provide a step-by-step explanation covering the actual architecture design and implementation process.
최근 사이버 공격은 단일 기법에 머무르지 않고 다단계·고속·전술적 방식으로 진화하며 기존 대응 체계의 한계를 분명히 드러내고 있습니다. 본 글에서는 이러한 변화된 환경 속에서 기존의 단순 패턴 기반 위협 예측이 왜 충분하지 않은지 살펴보고, 이를 극복하기 위한 방안으로 LLM과 RAG를 결합한 선제적 사이버 위협 예측 접근법을 소개하고자 합니다. 이번 글은 개념 이해를 위한 첫 번째 편으로, 이어지는 연재에서는 실제 아키텍처 설계와 구현 과정까지 단계적으로 설명해 드릴 예정입니다.
생성형 인공지능은 다양한 분야에서 활용 가능성이 빠르게 확장되고 있으며, 그 활용 방법 또한 날로 진화하고 있습니다. 그중 앞선 블로그에서 소개드렸던 생성형 인공지능을 활용한 코드 취약점 탐지에 대하여 이번 블로그에서는 실제 코드 취약점 데이터의 전처리 및 프롬프트화 그리고 생성형 모델을 학습하고 활용하는 방법을 소개해 드리겠습니다. 또한 이렇게 학습된 모델의 실제 취약점 탐지 성능을 확인해 보도록 하겠습니다.
현재 생성형 언어모델은 그 활용 범위가 단순히 자연어 분야에 국한하지 않고 나날이 넓어지고 있는 연구 주제 중 하나입니다. 그중 하나인 생성형 인공지능을 활용한 소스코드 취약점 탐지는 자동으로 소스코드 내의 취약점 탐지를 통해 사전에 외부로의 공격으로부터 방어할 수 있도록 하는 연구입니다. 본 글에서는 코드를 이해하는 언어모델을 통한 연구는 무엇이 있는지 알아보고, 그 중 하나인 소스코드 취약점 탐지는 구별형 언어모델과 생성형 언어모델로 나뉘어 어떤 방식으로 모델을 구축하고 탐지하는지 알아보겠습니다.
인터넷 기술의 고도화와 스마트폰의 보편화로 나날이 증가하는 유해사이트는 커다란 사회적 문제로 대두되고 있습니다. 이번 글에서는 유해사이트의 군집화를 통한 조직적으로 운영되고 있는 유해사이트의 현황에 대해 살펴보고, 동일 조직의 유해사이트는 어떤 특징점들이 있는지 알아보겠습니다.



