검색결과 총 2건
-
알리바바 클라우드, 엣지 기기용 멀티모달 AI 'Qwen2.5-Omni-7B' 공개
[이코노믹데일리] 알리바바 그룹의 디지털 기술 및 인텔리전스 핵심 부문인 알리바바 클라우드가 최신 멀티모달 인공지능(AI) 모델 'Qwen2.5-Omni-7B'를 31일 새롭게 선보였다. Qwen2.5-Omni-7B 모델은 텍스트, 이미지, 음성, 영상 등 여러 유형의 입력 데이터를 동시에 이해하고 처리할 수 있는 엔드투엔드(end-to-end) 방식으로 개발되었다. 사용자의 다양한 입력에 대해 실시간 텍스트 응답은 물론, 자연스러운 음성 답변까지 생성 가능하다. 특히 70억 개(7B)의 상대적으로 적은 파라미터로 구성된 경량 모델임에도 불구하고 성능 저하 없이 강력한 멀티모달 처리 능력을 구현한 점이 특징이다. 이러한 컴팩트한 설계와 고성능의 조합은 지능형 음성 애플리케이션과 같이 실제 환경에서 민첩하고 비용 효율적으로 작동해야 하는 AI 에이전트 개발에 유리하다. 예를 들어 시각 장애인이 주변 환경을 실시간 음성 설명으로 인지하도록 돕거나 동영상 속 재료를 분석해 요리법을 단계별로 안내하는 등의 서비스 구현이 가능하다. 알리바바 클라우드는 Qwen2.5-Omni-7B 모델을 오픈소스 커뮤니티에 공개했다. 현재 허깅페이스(Hugging Face)와 깃허브(GitHub)를 통해 누구나 접근할 수 있으며 자체 플랫폼인 큐원 챗(Qwen Chat)과 모델스코프(ModelScope)에서도 이용 가능하다. 이번 모델의 우수한 성능은 혁신적인 아키텍처 설계에 기반한다. 텍스트 생성(Thinker)과 음성 합성(Talker) 기능을 분리하여 모달 간 간섭을 최소화한 'Thinker-Talker 아키텍처', 비디오와 오디오 입력을 효과적으로 동기화하여 일관된 콘텐츠 생성을 돕는 'TMRoPE' 위치 임베딩 기술 그리고 끊김 없는 음성 상호작용을 위해 지연 시간을 줄인 '블록와이즈 스트리밍 처리' 기술 등이 적용되었다. Qwen2.5-Omni-7B는 이미지-텍스트, 영상-텍스트, 영상-음성 등 다양한 조합의 방대한 데이터셋으로 사전 학습되어 여러 종류의 작업에서 강력한 성능을 발휘한다. 특히 시각, 청각, 텍스트 정보를 복합적으로 이해하고 추론하는 능력을 평가하는 OmniBench 벤치마크 등 멀티모달 처리 능력이 중요한 평가에서도 최고 수준의 성능을 기록했다. 또한 인컨텍스트 러닝(ICL)과 강화학습(RL)을 통해 문맥에 맞는 음성 이해 및 생성 능력을 향상시키고 음성 응답 시 발음 오류나 부자연스러운 끊김 현상을 크게 줄여 안정성을 높였다. 한편 알리바바 클라우드는 지난해 9월 Qwen2.5 시리즈를 처음 선보인 이후 올해 1월에는 'Qwen2.5-Max'를 출시하여 챗봇 아레나에서 7위를 기록하는 등 우수한 성능을 입증한 바 있다. 시각 이해 모델 'Qwen2.5-VL', 장문 처리 모델 'Qwen2.5-1M' 등도 오픈소스로 공개하며 Qwen 모델 라인업을 지속적으로 확장하고 있다.
2025-03-31 15:54:50
-
알리바바, AI 암 탐지 기술로 '세상 바꾸는 기업' 8위 선정
[이코노믹데일리] 알리바바 그룹이 혁신적인 AI 기반 암 탐지 기술로 세계적 주목을 받고 있다. 포춘지는 최근 발표한 '2024 세상을 바꾸는 기업' 리스트에서 알리바바를 8위로 선정했다. 이는 상위 10개 기업 중 유일한 중국 기업이다. 포춘지가 선정한 '세상을 바꾸는 기업'은 250개 후보 중 52개 기업을 최종 선정했다. 이들 기업은 혁신과 사회 문제 해결, 수익성을 동시에 달성한 것으로 평가받았다. 매트 하이머 포춘지 편집장은 "이들 기업은 자본주의의 창의적 동력으로 사회 문제를 해결하고 있다"고 밝혔다. 알리바바의 핵심 기술은 그룹 산하 연구소인 다모 아카데미가 개발한 'PANDA'다. 이 AI 도구는 비조영 CT 스캔으로 췌장암과 전암병변을 탐지한다. 네이처 메디슨에 발표된 연구에 따르면 PANDA는 영상의학과 전문의보다 34.1% 높은 정확도로 이상을 감지한다. 러 루 다모 아카데미 의료 AI 팀 책임자는 "초기 발견부터 정밀 진단까지 AI로 암 치료 전 과정을 지원하는 것이 목표"라고 말했다. 그는 "알리바바의 클라우드 솔루션이 의료 서비스 접근성 향상에 기여할 것"이라고 덧붙였다. PANDA는 현재 췌장암, 식도암, 폐암, 유방암, 간암, 위암, 대장암 등 7가지 주요 암종을 단일 CT 스캔으로 조기 발견하는 데 성과를 보이고 있다. 올해 초 중국 저장성 리수이시의 병원들이 이 기술을 도입해 실제 환자 검진에 활용하기 시작했다. 이 기술의 장점은 비조영 CT 스캔을 사용한다는 점이다. 비조영 CT는 조영 CT에 비해 방사선 노출이 적고 전 세계적으로 더 널리 사용되는 효율적인 의료 영상 기술이다. 이를 통해 더 많은 환자들이 저비용으로 정확한 암 검진을 받을 수 있게 될 전망이다. 다모 아카데미는 의료 AI 기술의 글로벌 확산을 위해 세계보건기구(WHO) 디지털 헬스 협력 센터와 파트너십을 맺었다. 이를 통해 개발도상국에서의 디지털 헬스케어 발전을 지원할 계획이다. 이 파트너십은 디지털 헬스, 인공지능, 산업 개발 분야에서 연구를 수행하고 국제 기구를 지원할 예정이다. 알리바바의 이번 성과는 AI 기술이 의료 분야에서 가져올 혁신적 변화를 보여주는 사례로 평가받고 있다. 특히 전문 의료 서비스가 부족하거나 의료 비용이 비싼 지역의 환자들에게 큰 도움이 될 것으로 기대된다. 러 루 책임자는 "지속적인 기술 개발과 병원 간 전략적 파트너십을 통해 의료 서비스의 접근성, 포괄성, 정확도, 가성비, 효율 등을 모두 향상시켜 나갈 것"이라고 강조했다. 한편 알리바바의 의료 AI 기술이 글로벌 헬스케어 시스템에 미칠 영향에 관심이 모아지고 있다. 이번 포춘지 선정을 계기로, 알리바바의 혁신적인 기술이 더 많은 국가와 지역에서 활용될 수 있을지 주목된다.
2024-10-11 10:29:37