Page 12 - KAIST GSIS 2023 Vol.09
P. 12
KAIST 정보보호대학원 손수엘 교수 연구팀은 소셜 네트워크상의 가짜 계정을 효과
적으로 탐지하는 기술을 개발하여 데이터 마이닝 분야 최우수 국제 학술대회인 ACM
02 Web Conference (WWW) 2023에 논문을 게재하였다. Sybil 공격은 많은 수의 가짜
계정 (Sybil 계정)을 생성하여 웹 서비스 상에서 가짜 뉴스를 퍼트리거나, 상품 리뷰
를 조작하는 등의 악의적 행위를 하는 공격을 의미한다. 따라서 이러한 Sybil 계정을
사전에 탐지하는 것은 웹 서비스의 신뢰 확보를 위해 매우 중요한 문제이다. 이 문제
를 해결하기 위해 많은 연구자가 집합적 분류 기반의 방식을 사용하여 왔다. 예를 들
RICC: 어, 방어자는 소셜 네트워크의 각 계정을 노드, 계정 사이의 팔로잉 (following) 여부
를 간선으로 하는 그래프 구조를 준비한 다음, 일부 계정의 악성 여부(훈련용 데이터)
Robust Collective 를 토대로 나머지 계정의 악성 여부를 추론하기 위한 집합적 분류 기반의 모델을 학
Classification of 습시킬 수 있다.
Sybil Accounts 하지만 최근 일부 연구에서 집합적 분류 기반의 탐지를 우회하기 위한 적대적 공격
이 수행된 그래프에서는 기존의 집합적 분류 기법이 Sybil 계정을 정확하게 탐지할
수 없다는 사실을 보고하였다. 따라서 본 연구에서는 이러한 적대적 공격에도 불구하
고 높은 정확도로 Sybil 계정을 탐지할 수 있는 개선된 집합적 분류 기법인 RICC (Ro-
bust Collective Classification of Sybil Accounts)을 제안하였다. 공격자의 목표는
공격 비용을 절약하기 위해 최소한으로 그래프 구조를 변형하는 것과 집합적 분류 모
델이 Sybil 노드를 정상 노드로 분류하도록 하는 것이다. 이러한 공격 목표를 가장 효
과적으로 달성하기 위해서, 공격자는 Sybil 노드를 훈련용 데이터에 속하는 정상 노
드에 연결하게 된다. 즉, 공격의 성능은 분류 모델이 사용하는 훈련용 데이터에 높은
의존성을 갖게 되고, 모델의 Sybil 계정에 대한 예측 결과는 학습에 사용하는 훈련용
데이터에 따라 크게 달라진다. 이러한 관찰 결과를 기반으로, RICC은 그림 1에서 보
는 것과 같이 무작위로 추출된 훈련용 데이터를 사용하더라도 집합적 분류 모델이 늘
안정적인 예측을 할 수 있도록 모델을 점진적으로 초기화하는 것을 목표로 한다. 이
경우, 공격자의 전략이 무산되기 때문에 분류 모델이 Sybil 노드를 정확하게 탐지할
수 있게 된다. 이러한 방식을 통하여 RICC은 네 종류의 데이터 셋에서 두 가지 방식의
최신 집합적 분류 기법이 탐지 못 하는 Sybil 계정을 높은 정확도로 찾아낼 수 있었다.
그림 1 ▶ RICC 시스템의 개요
12 Graduate School Of Information Security 13