최근 빅데이터와 AI 기술의 발전으로 다양한 산업에서 텍스트 데이터 활용이 증가하고 있으며, 데이터 속에 있는 개인정보와 민감정보 보호가 중요한 과제로 대두되고 있습니다. 텍스트 데이터는 문맥적 해석을 통해 숨겨진 정보가 유추될 수 있어, 이를 보호하기 위해 자연어 처리 기술이 활용될 수 있으며, 특히 BERT와 같은 언어모델을 활용하면 단순 키워드 매칭을 넘어 문맥을 인식해 민감정보를 효과적으로 식별할 수 있습니다. 본 포스팅에서는 BERT-CRF 기반 개체명 인식 모델을 활용한 개인정보 식별 방안을 소개해드리겠습니다.
[태그:] 가명처리
데이터 3법 시행 이후 가명처리 솔루션에 대한 관심이 대두되고 있습니다. 해당 포스팅에서는 개인정보 활용을 위해 사용되는 가명처리 방법과 가명처리라는 용어가 왜 생겨났는지에 대해 알아 보고 개인정보를 효율적으로 활용하기 위해 가명처리 솔루션을 어떻게 사용하는지, 그리고 가명처리 솔루션에서 어떤 점이 중요한지 가이드라인을 기반으로 솔루션을 평가하고 분석해 각 솔루션에 대한 특장점을 알아 보도록 하겠습니다.

