2024년 안티바이러스 기능 및 성능 분석 1부

– 생성형 AI 기반 변종 악성코드 vs 안티바이러스 –

2023년 1월 첫 안티바이러스 제품에 대한 기능 및 성능 분석 연구를 진행한 이래 두 번째 안티바이러스의 기능 및 성능 분석 연구를 진행하게 되었습니다. 안티바이러스 정의와 필요성에 대한 설명은 지난 안티바이러스 기능 및 성능 분석 1 글로 대체하고, 테스트 대상 안티바이러스 제품의 선정 과정과 효과적인 기능 및 성능 분석을 위한 새로운 접근 방법에 대해 간략히 설명드리고자 합니다.

기능 및 성능 분석을 위한 안티바이러스 선정

안티바이러스는 각 제조사별 탐지 기술의 노하우와 기업이 추구하는 보안 철학을 바탕으로 제품화 된 만큼 제조사 및 제조 국가에 따라 다양한 안티바이러스 제품이 존재합니다. 본 기능 및 성능 분석 연구는 이러한 여러 안티바이러스 중 비즈니스에 특화된 제품을 제외하고, 일반 사용자 즉, 개인 사용자를 위한 무료(일부 유료 포함) 버전의 안티바이러스 대상으로 기능 및 성능 분석을 진행하고자 합니다. 따라서 본 연구에서는 안티바이러스 제품의 인지도와 기 수립된 테스트 평가 항목을 바탕으로 15개의 안티바이러스를 선정하였으며, 이 제품들 중 정밀 비교를 통해 비교 평가가 가능한 10개를 재선정하여 새롭게 계획된 기능 및 성능 분석을 진행합니다.

그림 1. 다양한 안티바이러스 제품(일부) 현황

인공지능으로 악성코드를 만들 수 있다고!?

최근 ChatGPT로 인해 생성형 AI가 큰 화두로 떠올랐습니다. 생성형 AI는 사람이 만든 콘텐츠, 데이터 또는 결과물을 모방하거나 유사하게 새로운 콘텐츠 등 결과물을 재생성 하는데 특화된 인공지능 기술을 말하며, 생성형 AI 시스템은 기존 AI 학습 모델과 마찬가지로 대규모 데이터셋에서 패턴과 구조를 학습한 후 이 정보를 사용하여 학습 데이터와 유사하지만 복제품이 아닌 새로운 데이터를 생성할 수 있습니다. 이러한 기반을 통해 생성 알고리즘에 따라 이미지, 텍스트, 오디오, 동영상 등 다양한 유형의 콘텐츠를 생성할 수 있습니다.

그림 2. 생성형 AI를 활용한 다양한 유형의 생성 콘텐츠 현황

이렇게 다재다능한 생성형 AI는 악성코드 또한 생성해 낼 수 있는데요, 생성을 위한 알고리즘으로 GAN(Generative Adversarial Networks) 및 강화학습(Reinforcement Learning) 등을 사용하며, 이러한 알고리즘으로 생성된 악성코드는 기존 안티바이러스를 회피할 수 있다고 보고되고 있어 보안 문제의 심각성을 더하고 있습니다. 그렇다면 안티바이러스가 생성형 AI를 통해 생성된 변종 악성코드를 과연 잘 탐지할 수 있을지 또는 어느 정도로 탐지할 수 있는지 궁금해 하지 않을 수 없겠지요? 이 궁금증은 저희 연구팀에서 시원하게 해결해 드리도록 하겠습니다. 이번 기능 및 성능 분석 연구에서는 기존의 테스트(2023년 1월, 1차) 방법 이외에도 다양한 악성코드 샘플군과 생성형 AI를 이용하여 만들어진 변종 악성코드를 활용하여 안티바이러스 제품의 기능 및 성능을 분석하고자 합니다.

글을 마치며

본 포스팅에서는 테스트 대상의 안티바이러스 제품 선정 과정과 기능 및 분석 연구의 접근 방법에 대해 간략히 설명드렸습니다. 저희 연구팀은 최근 이슈가되고 있는 생성형 AI를 악용하여 발생할 수 있는 새로운 보안 위협을 알아보고자 본 시험 방법을 고안하였습니다. 다음 포스팅(2부)에서는 새롭게 추가된 다양한 테스트 방법과 생성형 AI 기반 변종 악성코드를 이용하여 10개의 안티바이러스 제품에 대한 기능 및 성능 분석 후 그 결과를 공유 드리도록 하겠습니다.

참고문헌

[1] https://csrc.kaist.ac.kr/blog/2023/01/27/안티바이러스-기능-및-성능-분석-1부/
[2] https://m.boannews.com/html/detail.html?idx=126180
[3] Ebrahimi, Mohammadreza, et al. “Binary black-box evasion attacks against deep learning-based static malware detectors with adversarial byte-level language model.” arXiv preprint arXiv:2012.07994 (2020).
[4] https://www.redhat.com/ko/topics/ai/what-is-generative-ai
[5] https://aws.amazon.com/ko/what-is/generative-ai/
[6] https://namu.wiki/w/생성형%20인공지능
[7] https://www.hani.co.kr/arti/economy/it/1095748.html
[8] https://www.aitimes.com/news/articleView.html?idxno=150073
[9] https://www.etnews.com/20231215000212
[10] https://www.neebal.com/blog/generative-ai-vs.-predictive-ai-unraveling-the-distinctions-and-applications

2 명이 이 글에 공감합니다.