다중 레이블 데이터 분류를 위한 상호 정보 척도를 이용한 특징 선별 기법
Using Mutual Information for Selecting Features in Multi-label Classification

초록

최근 많은 응용에서 다중 레이블 데이터가 발생하고 있다. 하지만 이 데이터는 기존 기계 학습, 데이터 마이닝 분야의 방법 적용이 어렵다. 그 이유는 크게 두 가지로 기존 방법들이 단일 레이블 데이터에 초점을 맞추고 있다는 것과 다중 레이블 데이터의 특성을 반영하지 못하고 있다는 것이다. 대부분의 특징 선별 기법은 단일 레이블 데이터에 초점을 맞추고 있기 때문에 다중 레이블 데이터에는 기존 특징 선별 기법들을 적용할 수 없다. 다중 레이블 데이터에 특징 선별 기법을 적용하기 위해서 다중 레이블 데이터를 단일 레이블 데이터로 전환하는 방법들이 사용된다. 하지만 레이블 변환은 데이터 고유의 특성을 반영하지 못하고 정보 손실을 가져올 수 있다. 본 논문은 레이블과 레이블 사이의 연관성을 고려하여 다중 레이블 데이터에 바로 적용할 수 있는 특징 선별 기법을 제안한다. 제안하는 방법의 우수성을 보이기 위해 클래스 분류 실험을 하였다. 이를 통해 기존 특징 선별 기법들에 비해서 제안하는 기법의 성능이 우수하다는 것을 보였다.

키워드

Feature SelectionMulti-label DataClassificationMutual Information특징 선별 기법다중레이블 데이터클래스 분류상호 정보 척도
제목
다중 레이블 데이터 분류를 위한 상호 정보 척도를 이용한 특징 선별 기법
제목 (타언어)
Using Mutual Information for Selecting Features in Multi-label Classification
저자
임현기김대원
발행일
2012-10
저널명
정보과학회논문지 : 소프트웨어 및 응용
39
10
페이지
806 ~ 811