검색결과 총 9건
-
-
SK브로드밴드, AI 기술로 지역채널 뉴스 제작 혁신
[이코노믹데일리] SK브로드밴드는 SK텔레콤과 협력하여 개발한 AI 방송 제작 솔루션을 4일부터 자사의 지역채널 ‘ch B tv’ 뉴스 제작에 활용하고 있다고 5일 밝혔다. 이번 솔루션은 SK브로드밴드의 방송 전문가들과 SK텔레콤의 AI 기술이 결합되어 개발되었으며, 인터넷이 있는 환경에서 누구나 간편하게 뉴스 제작을 할 수 있다. 사용자는 AI 기자, 음성, 템플릿, 배경 음악(BGM) 등을 선택하고 기사 내용을 입력하기만 하면, 기존에 45분 소요되던 뉴스 제작이 4분 만에 완료된다. 이는 제작 시간과 공간의 제약을 획기적으로 줄여준다. 특히 이 솔루션은 긴급 재난이나 재해 발생 시 신속하게 현장 상황을 전달할 수 있어 뉴스 경쟁력과 시청자 만족도를 높일 것으로 기대된다. SK브로드밴드는 이 AI 솔루션을 통해 뉴스 제작 시간을 크게 단축시키면서도 방송 품질을 한층 향상시킬 수 있을 것으로 보고 있다. AI 방송 제작 솔루션은 SK브로드밴드 케이블방송사업단의 PD, 기자, 기술 감독 등 방송 전문가들의 경험과 SK텔레콤의 최첨단 AI 기술을 결합해 개발되었다. 이 솔루션은 AI 기술을 방송 제작 과정 전반에 맞춤형으로 적용하여 방송의 품질과 효율성을 크게 향상시키는 것으로 평가받고 있다. 선택한 기자의 목소리와 말투를 그대로 재현하는 음성 합성 기술과, 기자가 직접 기사를 읽는 것처럼 보이게 하는 립싱크 기술이 포함되어 있다. SK브로드밴드는 솔루션의 내부 안정화를 마친 후, 상용화하여 외부 기관에 판매하는 방안도 검토하고 있다. 김혁 SK브로드밴드 케이블방송사업 담당은 “AI 방송 제작 솔루션은 기존의 제작 방식을 넘어서 AI를 활용한 효율적인 방송 제작을 가능하게 할 것”이라며, “앞으로 방송 제작의 모든 영역에 AI를 적용하여 효율성을 높이고, 혁신적인 방송 콘텐츠를 제공함으로써 빠르게 변화하는 미디어 환경에 대응하겠다”고 밝혔다.
2024-09-05 11:44:00
-
네이버, 하이퍼클로바X로 이미지·음성 처리 기술 공개
[이코노믹데일리] 네이버가 오는 27일 자사의 대화형 AI 에이전트 클로바X(CLOVA X)에 시각 정보 처리 기능을 새롭게 추가한다고 발표했다. 이번 업데이트로 사용자는 클로바X 대화창에 이미지를 업로드하고, 해당 이미지에서 추출된 정보를 바탕으로 AI와 대화를 나눌 수 있게 된다. 네이버는 하이퍼클로바X(HyperCLOVA X)를 텍스트뿐만 아니라 이미지와 음성까지 동시에 처리할 수 있는 '멀티모달(Multimodal)' AI로 고도화하며, 생성형 AI 기술의 경쟁력을 강화하고 있다. 이번 업데이트를 통해 클로바X는 사진 속 상황을 묘사하거나, 표·그래프 등 복잡한 이미지 정보를 분석하는 능력을 갖추게 된다. 예를 들어, 사용자가 업로드한 수학 도형 문제를 AI가 이해하고, 풀이하는 것도 가능해진다. 이러한 기능 확장은 클로바X의 활용 범위를 넓혀, 개인의 생산성을 크게 향상시킬 것으로 기대된다. 네이버는 하이퍼클로바X의 우수한 문서 처리 및 문자 인식 기술과 다양한 지식을 갖춘 거대 언어 모델(LLM)을 결합해 보다 정확하고 신뢰성 있는 서비스를 제공할 계획이다. 네이버는 이미 대한민국 초·중·고등학교 검정고시 문제 1,480개를 AI에 이미지 형태로 입력해 84%의 정답률을 기록하며, 오픈AI GPT-4의 78%를 능가하는 성과를 보였다. 네이버는 또한 20일, 자사 기술 블로그를 통해 하이퍼클로바X 기반의 음성 멀티모달 기술도 공개했다. 기존 음성 인식과 음성 합성 기술을 뛰어넘어, LLM의 문맥 이해 능력을 활용한 자연스러운 대화가 가능해졌다. 이 기술은 발음 정확도와 감정 표현까지 더해져 사용자와의 대화 경험을 더욱 향상시킨다. 네이버는 이미 클로바노트, 클로바 케어콜, 클로바더빙 등 다양한 음성 AI 서비스로 기술력을 입증했으며, 이번 멀티모달 LLM 기술로 더 편리하고 진보된 서비스를 제공할 계획이다. 실시간 음성 번역, 언어 학습, 상담 등 여러 분야에서 활용 가능성을 제시한 바 있다. 성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "하이퍼클로바X는 이미지와 음성까지 이해하는 거대 시각 언어 모델로 발전하고 있다"며 "이를 통해 네이버의 다양한 서비스에 새로운 사용자 가치를 창출하고, 기업용 AI 솔루션으로도 제공할 것"이라고 밝혔다. 한편, 네이버는 하이퍼클로바X의 멀티모달 기능을 고도화하는 과정에서도 'AI 안전성'을 최우선으로 고려하고 있다. 네이버는 지난 6월 발표한 '네이버 ASF(AI Safety Framework)'를 바탕으로 AI 시스템의 잠재적 위험을 평가하고, 특히 음성 AI 기술의 경우 다각적인 검토를 통해 안전한 서비스를 제공할 계획이다.
2024-08-22 08:29:54
-
국내 최대 전자책 플랫폼 밀리의서재, AI TTS 기능으로 '책 읽는 즐거움' 새롭게 선사
[이코노믹데일리] 국내 최대 전자책 플랫폼 밀리의서재(대표 박현진)가 AI TTS(Text To Speech) 기능을 도입하며 새로운 독서 경험을 선사한다고 11일 밝혔다. 밀리의서재 AI TTS는 고품질, 안정성, 다양성을 핵심 가치로 한다. 다양한 음성 샘플을 학습해 실제 사람의 억양, 발음, 미세한 호흡까지 모방하는 고품질 AI 음성 합성 기술을 적용했다. 특히 사람 수준으로 읽어주는 듯한 자연스러운 발화로 오랜 시간 들어도 노이즈 없이 편안한 독서가 가능하다. 또한 온라인뿐만 아니라 오프라인 환경에서도 실시간으로 들을 수 있는 안정성과 4가지 AI 보이스를 제공해 독자가 취향에 맞춰 선택할 수 있도록 다양성을 추구했다. 새롭게 도입된 AI TTS는 밀리의서재가 보유한 18만권의 콘텐츠에 적용된다. 베스트셀러부터 월 1천권 이상의 신간에 적용될 뿐만 아니라 소설, 에세이, 시, 자기계발, 경제경영 등 기존에 서비스하고 있는 다양한 카테고리의 도서에도 적용된다. AI TTS는 기존 TTS와 동일한 방식으로 이용이 가능하며, 뷰어 내 재생 버튼을 클릭하면 AI TTS로 바로 들을 수 있다. 밀리의서재는 이번 AI TTS 서비스를 안정적으로 제공하기 위해 인공지능 전문기업 셀바스AI(대표 곽민철)의 온디바이스 AI 음성합성 솔루션 ‘Selvy deepTTS On-Device’를 적용했다. 해당 솔루션은 자연스러운 음성과 정확한 발음, 적절한 끊어 읽기 기능을 제공해 이어폰과 헤드폰을 착용한 상태에서 장시간 청취해도 편안한 음성을 제공하는 고품질 AI 보이스이다. 방은혜 밀리의서재 AI 서비스 본부 본부장은 “AI TTS 기능 도입은 밀리의서재가 그려 나갈 ‘큰 그림’의 시작에 불과하다”라며 “책의 가치에 집중한 새로운 독서 경험 확장과 생태계 구축을 지속해 나갈 것”이라고 말했다. 한편 밀리의서재는 AI 기술을 적극 활용하여 책을 고르고, 읽고, 곱씹는 모든 독서 과정에 새로운 바람을 일으키고 있다. 지난해에는 KT AI 기술을 활용해 아나운서 AI 보이스 오디오북과 AI 오브제북을 선보였다. 최근에는 AI 페르소나 챗봇, AI 스마트 키워드 서비스 등을 출시하며 주목받고 있다. 이번에 도입된 AI TTS 기능은 안드로이드 버전에서 사용할 수 있으며 연내 iOS 버전이 출시될 계획이다.
2024-07-11 10:38:58
-
-
-
SK텔레콤, 에이닷 골프로 골프 중계 시청 경험 혁신… "생성형 AI로 시청 커버리지 대폭 확대"
[이코노믹데일리] SK텔레콤(대표이사 유영상)은 13일, 생성형 AI를 기반으로 골프 중계 해설 및 영상 콘텐츠 등을 제공하는 '에이닷 골프' 서비스를 오는 16~19일 열리는 'SK텔레콤 오픈 2024' 대회부터 선보인다고 밝혔다. 진화한 에이닷 골프의 가장 큰 특징은 'AI 캐스터'다. 이용자는 에이닷 중계 화면을 보며 샷 성공 확률, 골프 상식, 날씨 등 생성형 AI가 데이터 기반으로 실시간 작성하는 정보를 전달받게 된다. 예를 들어, 15번 홀 티샷을 준비 중인 A 선수가 화면에 등장하면 'A 선수는 작년 이 대회 15번 홀에서 버디를 기록했는데요. 또 다시 버디를 잡을 확률은 47% 입니다' 같은 예측 정보가 중계창에 뜨는 식이다. 날씨 등 상황에 맞는 골프 상식이나 '꿀팁'을 제공하는 'AI 트리비아'도 제공된다. AI가 선수들의 주요 경기 장면을 편집해 실시간으로 제공하는 'AI 하이라이트'도 주목되는 기능이다. 에이닷 골프에서 제공하는 스코어카드와 연동, 이용자들은 각 홀 별 주요 경기 장면을 놓치지 않고 볼 수 있다. 특히 이번 'SK텔레콤 오픈 2024'에는 16, 17, 18번 홀에 마스터스의 '아멘 코너'처럼 '에이닷 코너'를 만들었다. 출전선수 144명 전원이 플레이하는 장면을 촬영, 국내 최초로 전 선수 하이라이트를 제공할 계획이다. 이용자들이 '에이닷 코너' 경기 장면을 메인 중계 화면과 동시에 볼 수 있도록, 에이닷 골프에서는 2개 채널 동시 생중계를 진행한다. 이 밖에 선수들의 티샷·퍼팅·어프로치 등을 세로형의 짧은 영상인 숏폼 형태로 제작한 'AI 숏츠', 선수들의 스윙을 슬로 모션으로 추출해 재생하는 'AI 스윙' 등을 통해 이용자들이 다채로운 형식의 골프 콘텐츠를 즐길 수 있게 한다. 작년 대회에서 첫 선을 보인 'AI 최경주'는 올해 한층 성장했다. 지난해 SKT는 자체 음성합성 기술과 딥브레인 AI의 페이스 스왑 기술을 활용해 레전드 골퍼 최경주의 AI 버전을 선보인 바 있다. 'SK텔레콤 오픈 2024'에서는 대회 주요 장면이나 샷에 대해 AI가 자동 생성한 스크립트를 'AI 최경주'의 음성으로 내보내 시청 재미를 더할 예정이다. 'AI 최경주'는 TV 중계에도 특별 해설위원으로 등장, 리더보드를 설명하고 코스를 소개하는 등 기존 해설진과 호흡을 맞춘다. 대회 현장에 마련된 갤러리 플라자에서도 'AI 최경주'의 활약이 이어진다. 골프존 GDR 기술을 연동한 'AI휴먼 원포인트 레슨'에 레슨 프로로 나서 갤러리들의 스윙과 타구 분석 결과를 전달해준다. 'SK텔레콤 오픈'은 매 대회마다 SKT가 보유한 다양한 ICT 기술을 골프 대회에 적용, 기술과 스포츠의 융합을 선보이며 주목받고 있다. 올해 'SK텔레콤 오픈 2024'에서는 '에이닷 골프' 서비스를 통해 AI 캐스터, AI 하이라이트, 에이닷 코너, AI 숏츠, AI 스윙 등 다채로운 AI 콘텐츠를 선보이며 기술과 스포츠의 융합을 한 단계 더 진화시켰다. 김희섭 SK텔레콤 커뮤니케이션 담당(부사장)은 "골프 팬들이 생성형 AI를 활용한 골프 콘텐츠를 통해 다채로운 경험을 하도록 준비했다"며 "향후 개인 맞춤형 콘텐츠를 확대하는 등 AI 기술 기반의 새로운 시도를 이어 나갈 것"이라고 말했다.
2024-05-13 09:11:43
-
내 목소리가 캐릭터 음성으로 바뀐다...AI 음성 변환 '수퍼톤 시프트' 오픈 베타 출시
[이코노믹데일리] 인공지능(AI) 기술로 개인의 목소리를 원하는 캐릭터 목소리로 실시간 변환해주는 서비스가 등장했다. 하이브 자회사인 AI 오디오 기업 수퍼톤은 15일, 게임, 영화, 애니메이션 등 다양한 콘텐츠 제작에 활용 가능한 AI 기반 실시간 음성 변환 서비스 '수퍼톤 시프트'(이하 시프트)의 글로벌 오픈 베타를 시작했다고 밝혔다. 콘텐츠 제작자의 창작을 지원하고 업무 편의성을 높이기 위해 개발된 시프트는 사용자가 10개의 캐릭터 음성 중 원하는 목소리를 선택하면, 사용자가 발화하는 즉시 선택한 캐릭터 목소리로 실시간으로 변환해주는 서비스다. 수퍼톤은 지난해 11월 부산 벡스코에서 열린 국제 게임 전시회 ‘지스타2023’의 B2B 부스에 참가해 시프트를 처음 선보이며 국내외 주요 미디어의 관심을 끌었다. 시프트는 △자연스러운 음성 발화 스타일 △실시간 수준으로 음성변환 속도 단축 △ 단 10초 만에 사용자 목소리를 캐릭터로 커스텀하는 기능 등 3가지 핵심 기능을 통해 차별화된 경쟁력을 갖추고 있다. 시프트는 실제 사람의 발화에 가깝게 자연스럽고 섬세한 음성을 구현하는 것이 특징이다. 수퍼톤 자체 개발한 음성 합성 파운데이션 모델 낸시(NANSY)를 기반으로 사용자의 목소리를 음색, 발음, 음고, 강세 등 4가지 구성 요소로 빠르게 분석하여 사용자와 캐릭터 목소리를 실시간 변환한다. 이를 통해 기계적인 느낌 없이 실제 사람의 목소리와 가까운 자연스럽고 섬세한 음성을 구현한다. 또 음성이 출력돼 청자에게 도달하는 지연 시간을 47ms(밀리 세컨드)까지 단축시켜 끊김 없이 자연스럽게 소통할 수 있도록 한다. 이는 세계적으로도 뛰어난 수준이다. 사용자 편의성도 대폭 높였다. 사용자가 10초 가량의 샘플 대본을 읽는면 바로 사용자가 선택한 캐릭터 목소리로 음성 변환이 시작된다. 또한, 사용자는 자신의 취향이나 목적에 맞게 음성을 자유롭게 생성할 수 있도록 사용자와 캐릭터 음성 간의 혼합 비율, 감정 표현 정도, 음의 높낮이 등을 섬세하게 조절할 수 있는 기술 도구를 제공한다. 이처럼 시프트는 콘텐츠 제작자들에게 다양한 활용 가능성을 제시한다. 버튜버나 스트리머, 팟캐스터들은 개성 있는 목소리로 시청자들에게 색다른 경험을 제공하고, 게이머와 코스튬 플레이어들은 게임 캐릭터 목소리로 타 유저들과 음성 채팅을 즐기며 게임 몰입감을 높일 수 있다. 이교구 수퍼톤 대표는 "시프트는 제작사와 크리에이터들이 손쉽게 사용할 수 있도록 다양한 의견을 수집하는 것이 이번 오픈 베타의 가장 큰 목적"이라며 "정식 출시 버전에는 목소리 샘플을 확대하고 콘텐츠 제작에 유용한 기능들을 추가 탑재하는 등 시프트가 최적의 목소리 창작 도구로 널리 사용될 수 있도록 노력하겠다"고 말했다.
2024-04-15 15:47:31
-