[이코노믹데일리] 얼마 전 한 여당 의원이 통화녹음을 금지하는 법안을 발의하겠다고 해 논란을 산 적이 있다. 당연하게도 즉각적인 반발이 나왔다. 업무상과 개인상 이유로 통화녹음을 필수로 사용하는 사람들이 적지 않아서다. 전화하는 일이 잦은 기자에게도 통화녹음은 사실상 필수다. 누군가는 '마지막 방어권'이라고까지 한다.
굳이 방어권이라는 거창한 이름을 쓰지 않더라도 했던 말과 들었던 말을 기억하려고 할 때 통화녹음은 유용한 기능이다. 기자의 경우 취재를 하고 나서 업계 관계자나 전문가 멘트를 글로 옮기는 일이 잦다.
기자는 '눈으로 보는 통화'를 표방하는 애플리케이션(앱) '비토(VITO)'를 지난해 7월부터 6개월간 사용해봤다. 편의기능이 추가되겠거니 하고 설치한 앱이었지만 이제는 일상생활이나 업무생활에서 필수재가 됐다.
비토 개발사인 리턴제로(대표 이참솔)는 독자적인 인공지능(AI) 음성인식 엔진을 기반으로 통화녹음 내용을 텍스트로 변환해주는 앱을 개발해 2021년 4월 선보였다. 출시 2년도 되지 않아 누적 다운로드 수 97만 건, 누적 처리 동화 건수 2억 건을 돌파했다. 초창기에는 음성인식이 제대로 되지 않는다거나 글자 변환 결과가 마음에 들지 않는 경우가 많았다. 리턴제로는 끊임없는 기술 고도화와 업데이트로 단점을 보완했다. 이같은 보완 및 개선 작업은 현재진행형이라고 한다.
기능을 하나씩 살펴보면 △통화녹음 내용을 글자로 변환해주는 점 △변환한 글자를 검색할 수 있는 점 △문장 단위로 생성된 글자를 누르면 해당 부분의 통화녹음을 다시 재생할 수 있는 점 △전화를 받을 때 이전 통화 내용을 조회할 수 있는 점 △통화녹음 및 변환 글자를 PC 등으로 전송할 수 있는 점 등이다.
먼저 통화녹음 내용을 텍스트로 변환해주는 것은 간단하지만 강력한 기능이다. 리턴제로는 "한국어 음성인식 모델은 자유발화 대화체 데이터를 분석해 인식하는 기술"이라며 "대화에서 목소리 특징을 찾아 말하는 사람을 구분하고 분리해 마치 메신저 대화를 나눈 것처럼 통화를 눈으로 볼 수 있다"고 설명한다.
또 변환한 글자를 검색할 수 있는 점도 편리하다. 예를 들어 업무상 미팅을 전화로 예약했는데 내용이 생각나지 않는 경우 이를 검색할 수 있다. 전화 통화 중 "예약"이라는 말을 인식한 경우 해당 통화를 모두 보여준다. 마치 카카오톡처럼 글자로 재구성된 통화 글자를 문장별로 누르면 해당 부분 음성까지 들려주는 점도 편리하다.
가끔 음성인식이 제대로 되지 않아 다시 들어야 하는 경우가 있어서다. 개선을 통해 인식률이 좋아지기도 하고 이용자가 직접 변환된 글자를 수정할 수도 있다.
초기에는 없다가 새롭게 생긴 기능도 있다. 통화녹음 음성과 변환 글자를 웹주소로 만들어 PC 등에서 접속할 수 있는 기능이다. 이 기능을 이용한 뒤로는 취재를 위해 통화하면서 키보드 자판을 두드린다거나 하는 일이 없어졌다. 비밀번호까지 자동 생성된 웹주소에 들어가 변환된 글자 중 필요한 부분만 따서 기사에 인용하면 됐기 때문이다.
리턴제로 측은 "비토는 현재 일반 직장인은 물론, 금융, 보험, 부동산, 영업, 법무, 세무, 언론, 공무원 등 각계 전문가들의 안전하고 정확한 통화 기록을 돕고있다"고 설명했다.
물로 아쉬운 점도 있다. 비토는 그동안 고객 경험 확대를 표방하며 서비스를 전면 무료로 제공했지만 오는 15일 '유료 멤버십'으로 전환된다. 이참솔 리턴제로 최고경영자(CEO)는 지난달 12일 유료 서비스 전환을 이용자들에 알리며 "비토는 매일 8만시간 이상의 통화를 받아적고 있어 인공지능(AI)과 서버를 운영하려면 비싼 비용이 든다"며 "(유료 전환 이후에도) 반드시 써야 하는 유용한 앱, 지불한 돈이 아깝지 않은 서비스로 만들겠다"고 약속했다.
한편 리턴제로는 오는 14일까지 기존 고객들이 더 합리적인 가격에 사용할 수 있도록 '얼리버드 특가'를 제공한다는 방침이다. 유료 멤버십이 시작되면 무료 고객은 하루에 2건 글자 변환만이 가능하게 된다. 월 2만5000원·1년 20만원 유료 고객에게는 통화녹음 자동 글자 변환과 300기가바이트(GB) 클라우드 등 기존 서비스에 추가된 기능을 사용할 수 있다.