네이버, 복잡한 장문 음성인식기술 ‘네스트’ 공개

2020.04.13 20:02:00 5면

음성 받아쓰기 특화 엔진 적용
동영상 자막제작 등 활용 가능

네이버가 음성인식 엔진 ‘네스트(NEST·Neural End-to-end Speech Transcriber)’를 13일 공개했다.

네스트는 음성 받아쓰기에 특화된 엔진을 적용해 복잡하고 다양한 장문의 음성 표현을 정확하게 인식하고 문자로 변환한다.

또한, 대량의 정제된 데이터를 사전에 학습하지 않고도 예상치 못한 표현에 대해 정확한 음성인식이 가능하다. 음향 정보와 언어 정보를 별도로 학습하는 기존의 모델링 방식을 통합 모델링 방식(end-to-end)으로 개선해 학습에 필요한 데이터의 양과 시간은 기존의 10분의 1 수준으로 줄이고 인식 정확도는 높였다.

네스트는 전화로 신종 코로나바이러스 감염증(코로나19) 능동 감시자를 확인하는 ‘클로바 케어콜’ 서비스에 적용했으며, 지난 1월에는 뉴스 자동자막 서비스에 도입된 바 있다.

일반 사용자는 클로바 스피치 홈페이지에서 네스트 기술을 무료로 체험해볼 수 있다. 하반기 일본어를 시작으로 영어·중국어 등 다양한 언어를 지원할 계획이다.

한익상 리더는 “동영상 및 오디오 콘텐츠의 자막 제작이나 아카이빙, 고객센터의 통화 데이터 관리 등 다양한 분야에서 활용 가치가 높을 것”이라고 말했다.

/오재우기자 asd132@

 

오재우 기자 asd132@kgnews.co.kr
저작권자 © 경기신문 무단전재 및 재배포 금지


경기도 용인시 기흥구 흥덕4로 15번길 3-11 (영덕동 1111-2) 경기신문사 | 대표전화 : 031) 268-8114 | 팩스 : 031) 268-8393 | 청소년보호책임자 : 엄순엽 법인명 : ㈜경기신문사 | 제호 : 경기신문 | 등록번호 : 경기 가 00006 | 등록일 : 2002-04-06 | 발행일 : 2002-04-06 | 발행인·편집인 : 김대훈 | ISSN 2635-9790 경기신문 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재와 복사, 배포 등을 금합니다. Copyright © 2020 경기신문. All rights reserved. mail to webmaster@kgnews.co.kr