인터뷰 음성 파일을 텍스트로 변환해주는 3가지 툴

기자들이 가장 기다리는 기술 가운데 하나가 음성 파일을 텍스트로 전환시켜주는 툴일 겁니다. 1~2시간의 인터뷰를 녹음하고 나면 이를 텍스트로 풀어내는데 정말 많은 노동이 투입돼야 합니다. 통상 녹음 시간의 1.5~2배 가량의 시간이 소요되죠. 저널리즘의 핵심 가치를 생산하는 작업은 아니지만, 그것을 위한 사전 작업으로서 ‘녹음 풀기’는 반드시 수행돼야 할 전처리 작업에 해당됩니다.

그렇지 않아도 바쁜 기자들에게 ‘인터뷰 녹음 풀기’는 한없이 번거로운 작업입니다. 누군가가 대신해줄 수 있다면 사례금이라도 지급하고 싶어지죠. Speech To Text라는 기술영역이 언론사이 편집국에 하루빨리 도입되길 희망하는 마음은 다들 비슷할 겁니다.

완벽하지 않지만 이를 도와주는 몇 가지 무료 툴들이 있습니다. 간단히 소개를 드려보려고 합니다.

네이버의 클로바 노트

네이버의 클로바 노트는 11월19일 정식으로 공개된 음성 기록 툴입니다. 구두로 진행되는 소규모 회의 등을 자동으로 텍스트화 해주는 도구입니다. 아시다시피 회의록 정리만큼 귀찮은 일도 없죠. 그걸 자동화해 준다고 볼 수 있을 겁니다.

기자들에겐 이 툴이 녹음 파일을 푸는 용도로 충분히 활용될 수 있습니다. 인터뷰 등을 위해 녹음된 mp3 파일 등을 업로드하면 자동으로 녹취록을 만들어줍니다. 최대 90분 분량까지 무료로 서비스합니다.

정확도는 아직 만족스럽지 않습니다. 영어+한국어가 혼합된 파일을 업로드했더니 품질은 그리 높지 않았습니다. 하지만 한국어로만 녹음된 파일이라면 일정 수준의 품질을 보장받을 수는 있을 듯합니다. 완벽하진 않더라도 초보수준의 녹음 풀기 용도로는 나쁘지 않다는 것이 저의 개인적인 평가입니다.

구글의 핀포인트

구글의 핀포인트는 탐사 기자들을 위해 개발된 대용량 문서 분석 툴입니다. 녹음 파일로 문서로 간주해 녹음을 풀어주는 기능을 제공하고 있습니다. 풀어주는데 그치지 않고 이 녹음된 발언에서 인물, 지역, 조직 정보를 자동 추출해 줍니다. 탐사보도 기자를 돕기 위해 제작된 만큼 이러한 편의기능들이 돋보인다고 할 수 있습니다.

치명적인 단점이 있습니다. 한국어 인식이 안된다는 겁니다. 다만 외국인과의 인터뷰를 풀어야 한다면 이 툴을 활용해 볼 것을 추천해 드립니다. 특히 영어권 취재원과의 인터뷰 업무가 적잖은 특파원이라면 이 툴을 분명 유용하게 사용해 보실 수 있을 겁니다.

구글 문서의 보이스 타이핑

구글 문서에 보이스 타이핑이라는 훌륭한 메뉴가 포함돼 있다는 사실을 아는 이는 많지 않습니다. 구글 문서의 ‘도구’ 메뉴 아래에 보면 ‘음성 입력’ 항목을 확인하실 수 있을 겁니다. 단, 크롬 브라우저에서만 작동합니다.

사용법은 간단합니다. 음성 입력을 활성화한 뒤 마이크를 켜놓으면 자동으로 받아적습니다. 말이 빠른 경우엔 약간의 뒤처짐 현상이 발생하긴 하지만 웬만한 용도로 쓰기엔 그렇게 나쁘진 않습니다.

대신 음성 파일을 업로드 하는 기능은 제공하지 않습니다. 노트북을 사용하는 경우라면 인터뷰 도중 노트북을 켜놓고, 음성 입력을 활성화하면서 사용해보실 수는 있을 겁니다. 다소 불편하긴 하지만 여러분들의 노동을 제법 덜어준다는 측면에선 도움이 될 수도 있을 겁니다.

여러분들에게 유익한 정보였기를 바랍니다.