닫기
Loading..

전자정보연구정보센터 ICT 융합 전문연구정보의 집대성

학술대회 프로시딩

홈 홈 > 연구문헌 > 학술대회 프로시딩 > 한국정보과학회 학술대회 > 2016년 동계학술발표회

2016년 동계학술발표회

Current Result Document : 158 / 658 이전건 이전건   다음건 다음건

한글제목(Korean Title) lexrankr: LexRank 기반 한국어 다중 문서 요약
영문제목(English Title) lexrankr: LexRank based Korean multi-document summarization
저자(Author) 설진석   이상구   Jinseok Seol   Sang-goo Lee  
원문수록처(Citation) VOL 43 NO. 02 PP. 0458 ~ 0460 (2016. 12)
한글내용
(Korean Abstract)
본 논문에선 LexRank 알고리즘을 한국어에 적합하도록 구현한 파이썬 패키지 lexrankr에 대해 기술한다. LexRank 알고리즘은 TextRank와 비슷하게, 문서 내의 각 문장들을 노드로, 문장들 간 유사도를 간선의 값으로 그래프를 만든 후 PageRank를 적용해서 중요한 문장을 추출해내는 추출 기반 문서 요약 알고리즘이다. 본 논문에선 LexRank 알고리즘을 비롯한 추출 기반 문서 요약 방법론들을 적용하여 한국어에 적합하도록 파이썬 패키지로써 구현한 방법을 자세히 기술한다. 긴 문서를 주제별로 요약하기 위해 새로운 유사도 함수를 제안하며, 원하는 축약 정도를 맞추기 위한 클러스터 탐색 방법 역시 제안한다. 편리하게 사용할 수 있도록 패키지화 되어있으며, 오픈소스의 형태로 개발되었다.
영문내용
(English Abstract)
키워드(Keyword)   
원문 PDF 다운로드