LLM & RAG based Cyber Threat Prediction Part. 1 (Understanding)

Recent cyber attacks have evolved beyond single techniques, adopting multi-stage, high-speed, and tactical approaches that clearly expose the limitations of existing defense systems. This article examines why traditional, simple pattern-based threat prediction is insufficient in this changed environment and introduces a proactive cyber threat prediction approach combining LLM and RAG as a solution to overcome these limitations. This article serves as the first part for conceptual understanding. In the upcoming series, we will provide a step-by-step explanation covering the actual architecture design and implementation process.

LLM 및 RAG 기반 사이버 위협 예측 1탄 (이해하기)

최근 사이버 공격은 단일 기법에 머무르지 않고 다단계·고속·전술적 방식으로 진화하며 기존 대응 체계의 한계를 분명히 드러내고 있습니다. 본 글에서는 이러한 변화된 환경 속에서 기존의 단순 패턴 기반 위협 예측이 왜 충분하지 않은지 살펴보고, 이를 극복하기 위한 방안으로 LLM과 RAG를 결합한 선제적 사이버 위협 예측 접근법을 소개하고자 합니다. 이번 글은 개념 이해를 위한 첫 번째 편으로, 이어지는 연재에서는 실제 아키텍처 설계와 구현 과정까지 단계적으로 설명해 드릴 예정입니다.

소스코드를 이해하여 취약점을 탐지하는 언어모델(구현 및 검증)

생성형 인공지능은 다양한 분야에서 활용 가능성이 빠르게 확장되고 있으며, 그 활용 방법 또한 날로 진화하고 있습니다. 그중 앞선 블로그에서 소개드렸던 생성형 인공지능을 활용한 코드 취약점 탐지에 대하여 이번 블로그에서는 실제 코드 취약점 데이터의 전처리 및 프롬프트화 그리고 생성형 모델을 학습하고 활용하는 방법을 소개해 드리겠습니다. 또한 이렇게 학습된 모델의 실제 취약점 탐지 성능을 확인해 보도록 하겠습니다.

소스 코드를 이해하여 취약점을 탐지하는 언어모델

현재 생성형 언어모델은 그 활용 범위가 단순히 자연어 분야에 국한하지 않고 나날이 넓어지고 있는 연구 주제 중 하나입니다. 그중 하나인 생성형 인공지능을 활용한 소스코드 취약점 탐지는 자동으로 소스코드 내의 취약점 탐지를 통해 사전에 외부로의 공격으로부터 방어할 수 있도록 하는 연구입니다. 본 글에서는 코드를 이해하는 언어모델을 통한 연구는 무엇이 있는지 알아보고, 그 중 하나인 소스코드 취약점 탐지는 구별형 언어모델과 생성형 언어모델로 나뉘어 어떤 방식으로 모델을 구축하고 탐지하는지 알아보겠습니다.

유해사이트 군집화를 통한 유해사이트 조직적 운영 특징 분석

인터넷 기술의 고도화와 스마트폰의 보편화로 나날이 증가하는 유해사이트는 커다란 사회적 문제로 대두되고 있습니다. 이번 글에서는 유해사이트의 군집화를 통한 조직적으로 운영되고 있는 유해사이트의 현황에 대해 살펴보고, 동일 조직의 유해사이트는 어떤 특징점들이 있는지 알아보겠습니다.