닫기
Loading..

Please wait....

Post-Conference

전자정보연구정보센터에서 제공하는 Post-Conference 입니다.
각 Conference의 발표 논문들에 대하여 저자와의 질의 응답이 가능합니다.
전자정보연구정보센터 회원뿐만 아니라 비회원도 자유롭게 이용할 수 있습니다.

Post-Conference

홈 홈 > EIRIC 광장 > Post-Conference

한국정보과학회 제43회 정기총회 및 동계학술발표회

  • 일시 : 2016년 12월 21일(수) ~ 23일(금)
  • 장소 : 강원도 보광휘닉스파크

전자정보연구정보센터에서 제공하는
한국정보과학회 제43회 정기총회 및 동계학술발표회 Post-Conference 입니다.
Conference 발표 논문들에 대하여 저자와의 질의 응답이 가능합니다.
전자정보연구정보센터 회원뿐만 아니라 비회원도 관심분야와 각각의 논문들을 검색하여 글을 등록하고
자유로운 토론을 할 수 있습니다.

(본 게시판에서는 의견 및 댓글 작성시 실명이 아닌 닉네임으로도 글등록이 가능합니다.
단, 게시판 목적과 다른 내용이거나 욕설 및 비속어, 타인 비방, 음란, 광고성 글은 경고 없이 삭제될 수 있습니다.)

논문분야 언어공학 구분 포스터
논문제목 lexrankr: LexRank 기반 한국어 다중 문서 요약
저자 설진석, 이상구 논문파일 Download

본 논문에선 LexRank 알고리즘을 한국어에 적합하도록 구현한 파이썬 패키지 lexrankr에 대해 기술한다. LexRank 알고리즘은 TextRank와 비슷하게, 문서 내의 각 문장들을 노드로, 문장들 간 유사도를 간선의 값으로 그래프를 만든 후 PageRank를 적용해서 중요한 문장을 추출해내는 추출 기반 문서 요약 알고리즘이다. 본 논문에선 LexRank 알고리즘을 비롯한 추출 기반 문서 요약 방법론들을 적용하여 한국어에 적합하도록 파이썬 패키지로써 구현한 방법을 자세히 기술한다. 긴 문서를 주제별로 요약하기 위해 새로운 유사도 함수를 제안하며, 원하는 축약 정도를 맞추기 위한 클러스터 탐색 방법 역시 제안한다. 편리하게 사용할 수 있도록 패키지화 되어있으며, 오픈소스의 형태로 개발되었다.

댓글(0)


* 작성자는 실명이 아닌 닉네임 형태로 자유롭게 입력하셔도 무방합니다.
* 이메일주소는 비공개 처리됩니다. 다만, 저자와의 질의응답시 필요할 수 있으니 정확한 이메일을 기재해 주시기 바랍니다.