학습데이터 증강을 통한 효율적인 사이버 위협 탐지

2022년 SiteLock의 Security Report에 따르면 높은 위험성의 악성코드가 점점 더 증가하고 있다고 발표하였고, 이러한 위험성의 악성코드는 데이터를 훔치고, 고객정보를 삭제하는 행위등 브랜드 평판에 큰 타격을 주고있습니다. 이러한 악성코드를 해결하기 위해 전통적인 방식의 시그니쳐 기반 탐지 방식을 많이 사용하였으나 여러 한계점이 존재하여 AI를 활용한 탐지 연구가 진행되고 있습니다. 그러나 늘어나는 악성코드의 비해 실제 악성코드 데이터를 구하기는 어려워 효율적인 AI 모델을 생성하기가 어렵습니다. 이런 문제를 해결하기 위한 방법 중 하나는 데이터 증강방법으로 본 포스팅에서는 데이터 증강 기법들의 종류와 실제 HWP 악성코드에 적용했던 데이터 증강 연구를 소개하겠습니다.