본문 바로가기

유용한API

[오픈API] 특정단어 출현빈도를 파악하기 위해 사용한 형태소분석기 오픈API (데모 지원)

매일매일 뉴스에서 많이 언급된 단어를 추출해서 출현빈도가 높은 단어 목록과, 해당 단어와 관련된 뉴스기사 Top5를 보여주는 서비스를 개발하려고 했습니다. 

 

이 서비스를 개발하려면 뉴스기사에서 유용한 단어를 뽑아내는게 중요했기 때문에 형태소분석기를 알아봤고, 그 중 형태소분석기(언어분석기술) API를 무료로 제공하는 곳을 알게되었습니다. 

 

한국전자통신연구원(ETRI)에서 제공하는 언어기술분석 API

http://aiopen.etri.re.kr/service_introduce.php

 

공공 인공지능 오픈 API·DATA 서비스 포털

과학기술정보통신부의 R&D 과제를 통해 개발한 다양한 인공지능 기술 및 데이터를 누구나 사용할 수 있도록 제공

aiopen.etri.re.kr

 

다른 형태소분석기도 사용해봤는데 jar형태로 직접 설치해서 사용하는건 out of memory가 뜨더군요. (호스팅 서버가 용량이 작은거라서..ㅋㅋㅋ) 

아무튼 용량도 많이 잡아먹고, 단어사전을 수시로 업데이트해줘야 하는 문제가 있더라고요. 

특히 형태소분석에서 중요한게 얼마나 유용한 단어를 추출할 수 있느냐 거든요. 

ETRI에서 제공하는 API는 단순 형태소분석 뿐만 아니라 개체명 인식 API도 제공하더군요. 전 이 기능을 이용해서 좀 더 유용한 단어를 추출할 수 있었습니다. 

개체명 인식 API는 인명, 지명, 기관명 등과 같은 개체명을 인식하는 기술로, 특정 개체를 표현하는 단어에 대한 의미 정보를 제공합니다. 

 

API 사용신청을 하면 관리자가 내용 확인 후 승인처리하면서 키를 발급해줍니다. 

전 개인적인 목적으로 신청했더니 관리자가 메일로 API 활용목적을 묻더라고요. 개발하려는 서비스를 설명했더니 바로 승인해줬습니다. 

 

제한사항으로는 하루 5000건 까지 가능하고, 1회 사용시 입력은 1만글자 이하만 가능합니다. 

 

모든 API에 대해서 데모 기능도 제공하고 있고, 개발가이드도 자세히 나와있어서 적용하기 편리했습니다. 

 

 

다양한 API를 제공하고 있으니 나중에 다른 API를 활용한 서비스도 추가로 개발해봐야겠어요 ㅎㅎ

(언어분석기술, 어휘관계분석기술, 질의응답기술, 음성인식 기술, 발음평가기술, 객체인식 기술, 대화처리 기술)

http://aiopen.etri.re.kr/service_list.php

 

해당 API를 활용해서 개발한 서비스 입니다. 

이슈 키워드를 찾는게 쉽지 않은거 같네요. ㅎㅎㅎ 너무 일반적인 키워드는 불용어에 추가해서 이슈키워드 산정시 제외하도록 처리했어요. 

http://www.keyword-insight.com/kwrd/issueKwrdNews.do

 

키워드 인사이트 - 분야별 이슈 키워드와 뉴스기사 Top5

키워드 인사이트의 분야별 이슈 키워드와 뉴스기사 Top5는 매일 다양한 뉴스매체에서 다룬 기사들을 분석해서 많이 언급된 키워드를 추출하고, 해당 키워드와 관련된 뉴스기사 Top5를 보여주는 서비스입니다.

www.keyword-insight.com