이코노믹데일리 - 정확한 뉴스와 깊이 있는 분석
금융
산업
생활경제
IT
건설
피플
국제
이슈
문화
딥인사이트
검색
패밀리 사이트
아주일보
베트남
회원서비스
로그인
회원가입
지면보기
네이버블로그
2026.01.28 수요일
맑음
서울 -4˚C
맑음
부산 -0˚C
맑음
대구 -1˚C
맑음
인천 -4˚C
맑음
광주 1˚C
맑음
대전 -2˚C
흐림
울산 2˚C
맑음
강릉 -1˚C
맑음
제주 3˚C
검색
검색 버튼
검색
'추론 모델'
검색결과
기간검색
1주일
1개월
6개월
직접입력
시작 날짜
~
마지막 날짜
검색영역
제목
내용
제목+내용
키워드
기자명
전체
검색어
검색
검색
검색결과 총
4
건
中 딥시크, 엔비디아 최신 칩 '블랙웰' 밀수해 신규 AI 모델 개발
[이코노믹데일리] 중국의 인공지능(AI) 기업 딥시크가 미국의 강력한 수출 통제망을 뚫고 엔비디아의 최신 칩을 밀반입해 차세대 모델 개발에 착수했다. 동남아시아에 위장 데이터센터를 설립하고 장비를 분해해 들여오는 치밀한 수법을 동원한 것으로 드러났다. 10일(현지시간) 미국 IT 전문매체 디인포메이션은 딥시크가 엔비디아의 최신 아키텍처 ‘블랙웰’ 기반 그래픽처리장치(GPU) 수천 개를 확보해 새 모델을 개발 중이라고 보도했다. 딥시크는 구매가 허용된 제3국을 경유하는 우회 수입로를 활용해 지난 2년간 엔비디아 칩을 지속적으로 확보해 온 것으로 알려졌다. 이들의 확보 과정은 첩보 작전을 방불케 한다. 우선 동남아시아 등지에 중국계가 아닌 것처럼 위장한 ‘유령 데이터센터’를 확보해 공식 판매처로부터 칩을 조달했다. 엔비디아나 델 등 제조사 직원들이 현장에 파견돼 장비를 점검하고 수출 규정 준수 여부를 확인할 때는 정상적으로 운영되는 척하다가 검사가 끝나면 즉시 서버를 분해했다. 이후 부품 단위로 쪼개 허위 신고를 통해 중국 세관을 통과시켰고 이를 다시 재조립해 중국 본토 데이터센터에 설치하는 방식을 썼다. 미국 정부의 제재가 무색해지는 대목이다. 도널드 트럼프 미국 대통령은 최근 구형 칩인 ‘H200’의 중국 수출은 허용했지만 최신 칩인 ‘블랙웰’과 차세대 ‘루빈’은 여전히 금지 품목으로 묶어뒀다. 엔비디아 대변인은 “우리와 파트너사를 속이려 건설했다가 해체하는 유령 데이터센터의 실체나 제보를 접한 적이 없다”면서도 “접수되는 모든 제보를 추적해 밀반출을 막겠다”고 밝혔다. 엔비디아는 이와 별개로 자사 칩의 위치를 추적할 수 있는 소프트웨어 기능을 개발해 밀반입 차단에 나선 상태다. 딥시크는 이렇게 확보한 칩을 활용해 ‘희소 주의(Sparse Attention)’ 기술을 적용한 신규 모델 개발에 속도를 내고 있다. 이 기술은 질문에 답할 때 모델 전체가 아닌 일부만 활용해 추론 비용을 획기적으로 낮출 수 있지만 모델 크기가 커지면서 기술적 난관에 봉착한 것으로 전해진다. 딥시크 내부 직원들은 내년 2월 설 연휴 전까지 차세대 모델 출시를 희망하고 있으나 량원펑 창업자는 일정보다 성능 완성을 최우선으로 주문하며 마감일을 확정하지 않고 있다. 딥시크는 앞서 오픈소스 추론 모델 ‘R1’을 출시해 전 세계 AI 업계에 기술적 충격을 안긴 바 있다.
2025-12-11 08:06:54
중국 '키미-K2' 도발에 美 빅테크 총반격…GPT-5.1·제미나이3 잇따라 출격
[이코노믹데일리] 중국의 AI 스타트업 문샷AI가 쏘아 올린 '키미-K2-씽킹'이 전 세계 AI 업계를 강타하며 제2의 '딥시크 모먼트'를 재현하고 있다. 중국의 최신 모델이 벤치마크에서 미국의 선두 주자들을 압도하자 오픈AI와 구글, xAI 등 미국 빅테크들이 일제히 차세대 모델을 쏟아내며 진화에 나서는 등 미·중 AI 기술 패권 전쟁이 최고조로 치닫고 있다. 20일 업계에 따르면 이번 격전의 방아쇠는 지난 6일 문샷AI가 공개한 오픈소스 추론 모델 '키미-K2-씽킹(Kimi-K2-Thinking)'이 당겼다. 이 모델은 특정 분야에서 인간 전문가 수준을 평가하는 HLE(Human Level Evaluation) 테스트에서 44.9점을 기록하며 오픈AI의 'GPT-5'(41.7점)와 앤트로픽의 '클로드 소넷 4.5'(32점)를 제치고 1위에 오르는 이변을 연출했다. 웹 검색 능력을 평가하는 '브라우즈콤프'에서도 60.2점을 받아 GPT-5(54.9점)를 따돌렸다. 미국 빅테크들은 즉각적인 반격에 나섰다. 오픈AI는 키미-K2 출시 일주일 만인 13일 수학과 코딩 성능을 대폭 강화한 'GPT-5.1'을 공개하며 맞불을 놨다. 이어 일론 머스크의 xAI가 17일 심층 사고 기능을 탑재한 '그록 4.1'을 내놓으며 잠시 벤치마크 상위권을 탈환했으나 곧바로 구글이 차세대 모델 '제미나이3(Gemini 3)'를 출시하며 판을 다시 뒤집었다. 제미나이3는 HLE 벤치마크에서 37.4점을 기록, GPT-5.1과 클로드 소넷 4.5를 앞서며 현존 최고 성능임을 과시했다. 이번 사태가 '딥시크 모먼트'로 불리는 이유는 단순히 성능 때문만이 아니다. 중국 AI 모델들이 보여주는 압도적인 '비용 효율성'이 미국 빅테크들에 실질적인 공포감을 주고 있기 때문이다. CNBC 등 외신에 따르면 문샷AI의 모델 훈련 비용은 약 460만 달러(약 67억원) 수준으로 추정된다. 이는 수억 달러를 쏟아부어야 하는 미국 모델들에 비해 파괴적인 가격 경쟁력을 갖춘 것이다. 실제로 또 다른 중국 AI 기업 딥시크는 18일(현지시간) 학술지 네이처에 게재한 논문을 통해 자사 모델 'R1'의 훈련 비용이 불과 29만 4000달러(약 4억원)였다고 밝혔다. 이는 오픈AI가 2023년 공개한 기초 모델 훈련 비용(1억달러 이상)의 0.3% 수준에 불과하다. 중국이 저렴한 비용으로 미국 최상위 모델에 근접하거나 능가하는 성능을 뽑아내면서 '자본력'으로 기술 격차를 유지해 온 미국의 우위가 흔들리고 있다는 분석이 나온다. 미·중 간의 기술 격차 축소는 수치로도 증명된다. 스탠퍼드대 인간중심AI연구소(HAI) 보고서에 따르면 2024년 1월 103점에 달했던 미·중 최상위 모델 간 성능 격차는 올해 2월 23점까지 좁혀졌다. MMLU(대규모 다중 작업 언어 이해) 벤치마크 격차는 2023년 20%포인트에서 2024년 말 0.3%포인트로 사실상 사라졌다. 업계 관계자는 "중국 모델들이 오픈소스와 효율성을 무기로 미국의 턱밑까지 추격했다"며 "미국 빅테크들이 성능뿐만 아니라 비용 구조 혁신 없이는 주도권을 장담하기 어려운 국면에 진입했다"고 진단했다.
2025-11-20 08:24:37
오픈AI, 추론·일반 모델 통합한 'GPT-5' 공개…"박사급 전문가와 대화하는 느낌"
[이코노믹데일리] 생성형 인공지능(AI) 챗GPT의 개발사 오픈AI가 최신 AI 모델 ‘GPT-5’를 7일(현지시간) 공개했다. 이번 GPT-5는 기존의 일반 대화형 모델과 추론 전문 모델을 하나로 통합해 이용자들이 더 단순하고 강력한 AI를 경험할 수 있도록 한 것이 특징이다. GPT-5는 플래그십 모델인 ‘GPT-4o’와 추론 모델 ‘o3’를 한 단계 업그레이드해 통합한 버전이다. 이에 따라 앞으로 이용자들은 원하는 답을 얻기 위해 일반 모델이나 추론 모델을 별도로 선택할 필요가 없어진다. 이는 지난 2월 샘 올트먼 CEO가 “제품군을 더욱 단순화하겠다”고 밝힌 계획의 첫 결과물이다. 올트먼 CEO는 GPT-5를 “범용인공지능(AGI)을 향한 중요한 진전”이라 평가하며 성능에 대한 강한 자신감을 내비쳤다. 그는 “GPT-5를 직접 사용해본 후 GPT-4로 돌아가는 것은 정말 힘들었다”며 “마치 아이폰이 저해상도 픽셀 화면에서 레티나 디스플레이로 넘어갔을 때처럼 다시 예전으로 돌아가고 싶지 않은 기분”이라고 설명했다. 이어 “GPT-3가 고등학생, GPT-4가 대학생과 대화하는 느낌이었다면 이제 GPT-5는 박사급 전문가와 대화하는 느낌”이라고 덧붙였다. 오픈AI에 따르면 GPT-5는 수학, 과학, 코딩 등 주요 벤치마크 테스트에서 역대 최고 성능을 기록했으며 AI의 고질적인 문제였던 환각(할루시네이션) 현상도 현저히 줄었다. 속도 역시 크게 향상돼 이전 추론 모델보다 훨씬 빠르게 답변을 제공한다. 한층 정확하고 자연스러운 대화는 물론 코딩과 글쓰기 등 창의적인 작업에서도 뛰어난 성능을 보인다. 사전 브리핑에서는 GPT-5의 강력한 성능을 보여주는 시연도 진행됐다. 챗GPT에 ‘영어를 사용하는 파트너가 프랑스어를 쉽게 배울 수 있는 웹사이트를 만들어 달라’고 요청하자 몇 분 만에 교육용 게임까지 포함된 웹사이트를 뚝딱 만들어냈다. 이는 숙련된 소프트웨어 개발자에게도 최소 몇 시간이 걸리는 작업이다. 주목할 점은 GPT-5가 유료 이용자뿐만 아니라 무료 이용자를 포함한 모든 챗GPT 이용자에게 제공된다는 사실이다. 닉 털리 오픈AI 제품 책임자는 “기술의 혜택이 모두에게 돌아가도록 하겠다는 우리의 미션을 실천하는 방식”이라고 강조했다.
2025-08-08 08:01:08
카카오, 자체 개발 언어모델 연이어 공개하며 기술 경쟁력 강화'
[이코노믹데일리] 카카오가 지난 24일 자체 개발한 고성능 인공지능(AI) 모델을 연이어 공개하며 국내 AI 기술 패권 경쟁에 박차를 가하고 있다. 지난 5월 언어 모델 4종을 선보인 지 불과 두 달 만에 이미지와 텍스트를 동시에 이해하는 경량 멀티모달 모델과 국내 최초의 '전문가 혼합(MoE)' 모델을 오픈소스로 공개하며 독자적인 기술 개발 역량을 입증했다. 이번 행보는 단순한 기술력 입증을 넘어 국내 AI 생태계의 자립과 성장을 견인하려는 카카오의 전략적 의지를 명확히 보여준다. 카카오의 AI 전략은 명확한 논리적 흐름을 보인다. 1단계는 기반 기술 확보다. 지난해부터 '카나나(Kanana)' 라인업을 꾸준히 공개하며 자체 AI 모델의 성능을 입증해 왔다. 2단계는 기술 고도화 및 효율화이다. 이번에 공개한 멀티모달 모델과 MoE 모델이 바로 그 결과물이다. 단순히 크고 강력한 모델을 넘어 특정 목적에 최적화되고 비용 효율적인 모델을 개발하여 실용성을 극대화했다. 마지막 3단계는 생태계 주도권 확보이다. 상업적 활용까지 가능한 아파치 2.0 라이선스를 적용 공개함으로써 국내 스타트업과 개발자들이 카카오의 기술을 발판 삼아 새로운 서비스를 만들 수 있는 토양을 제공하고 있다. ◆ 경량화와 고성능, 두 마리 토끼 잡은 멀티모달 모델...국내 최초 MoE 모델 공개 이번에 공개된 '카나나-1.5-v-3b'는 텍스트는 물론 이미지 정보까지 처리하는 멀티모달 언어 모델이다. 카카오가 개발 초기부터 모든 단계를 자체 기술로 구축한 '카나나 1.5'를 기반으로 확장다. 특히 주목할 점은 경량 모델임에도 불구하고 글로벌 빅테크의 최신 모델과 견줄 만한 성능을 확보했다는 것이다. 이미지에 포함된 한국어와 영어 문서를 이해하는 능력은 글로벌 멀티모달 모델인 GPT-4o에 필적하는 수준을 보였다. 국내 공개된 비슷한 크기의 모델과 비교한 각종 성능 평가(벤치마크)에서도 최고 점수를 기록하며 기술적 우위를 증명했다. 이러한 성능 향상의 비결은 '지식 증류(Knowledge Distillation)' 기술에 있다. 이는 고성능의 대형 모델(스승 모델)이 가진 정교한 지식과 예측 패턴을 상대적으로 작은 모델(제자 모델)에 전수하는 학습 방식이다. 이를 통해 '카나나-1.5-v-3b'는 가벼운 몸집에도 불구하고 대형 모델에 버금가는 정확도와 언어 이해 능력을 갖추게 됐다. 덕분에 이미지 검색이나 콘텐츠 분류처럼 실시간 반응과 효율성이 중요한 분야에서 폭넓게 활용될 수 있다. 가령, 청계천 사진을 보여주며 "이곳이 어디인지 설명해 주세요"라고 질문하면 "이 사진은 서울 청계천을 배경으로 하고 있습니다"와 같이 국내 지역에 대한 높은 이해도를 바탕으로 정확한 답변을 제공한다. 카카오는 이날 국내 최초로 MoE(Mixture of Experts, 전문가 혼합) 구조의 언어 모델 '카나나-1.5-15.7b-a3b'도 오픈소스로 함께 공개했다. MoE는 AI 모델 개발의 최신 트렌드로 비용 효율성과 성능을 동시에 확보하는 혁신적인 아키텍처로 평가받고 있다. 기존의 일반적인 '밀집(Dense)' 모델이 문제 해결을 위해 모든 파라미터(매개변수)를 동원하는 것과 달리, MoE 모델은 입력된 데이터의 특성에 맞춰 일부 전문가(Expert) 모델만 선별적으로 활성화하는 구조다. '카나나-1.5-15.7b-a3b'는 전체 15.7B(157억)개의 파라미터 중 실제 연산에는 약 3B(30억)개만 사용한다. 이는 8기통 엔진을 가졌지만 평소 주행에는 2~3개의 실린더만 사용해 연비를 극대화하는 자동차에 비유할 수 있다. 카카오는 기존에 개발한 3B 규모의 모델을 재활용해 전문가 레이어로 변환하는 '업사이클링(Upcycling)' 방식을 적용해 개발 시간과 비용을 획기적으로 줄였다. 그 결과 3B 파라미터만으로 8B급 모델과 동등하거나 그 이상의 성능을 구현하는 데 성공했다. 이러한 고효율 구조는 제한된 자원으로 고성능 AI 인프라를 구축하려는 기업이나 연구자들에게 실용적인 대안이 될 전망이다. ◆ 기술 자립 너머 생태계 리더십으로…카카오의 미래 전망 카카오의 이번 동시 오픈소스 공개는 기술적 성과 그 이상의 의미를 담고 있다. 정부가 추진하는 '독자 AI 파운데이션 모델 프로젝트'의 참여 기업으로서 국가 AI 경쟁력 강화에 기여하겠다는 의지를 분명히 한 것이다. 김병학 카카오 카나나 성과리더는 "이번 오픈소스 공개는 비용 효율성과 성능이라는 유의미한 기술 개발의 성과를 거둔 것으로 단순한 모델 아키텍처의 진보를 넘어 서비스 적용과 기술 자립이라는 두 가지 측면의 목표에 부합하는 결과물"이라고 말했다. 그의 말처럼 카카오는 이제 AI가 인간처럼 사고하고 행동하는 데 필수적인 추론 모델 개발에 집중하며 하반기 중 관련 성과를 공개할 계획이다. 이번 카카오의 행보는 자체 개발한 고효율·고성능 모델을 아낌없이 공개하며 기술적 리더십을 확보하는 동시에 국내 개발자들이 자유롭게 활용할 수 있는 생태계를 조성하고 있다. 이는 글로벌 빅테크에 대한 기술 종속을 벗어나 대한민국이 AI 기술 강국으로 도약하는 데 중요한 밑거름이 될 것이다.
2025-07-29 06:05:00
처음
이전
1
다음
끝
많이 본 뉴스
1
넥슨 '메이플키우기', 확률·잠수함 패치 논란…회복되는 넥슨 신뢰 '흔들'
2
넥슨, '메이플키우기' 어빌리티 오류 무공지 대처… 강대현·김정욱 공동 대표 사과
3
대한항공 등 한진그룹 5개 항공사, 26일부터 기내 보조배터리 '사용 금지'
4
삼성·SK, 29일 동시 실적발표... 'HBM4' 주도권 놓고 정면 승부
5
인라이플, AI 광고 플랫폼 '모비온 4.0' 출시... "데이터 가독성 혁신"
6
AI 안경, 스마트폰 이후를 노리다…번역·비서·검색 품은 차세대 웨어러블
7
SK하이닉스, 장중 '80만원' 돌파... MS '마이아 200' 단독 공급 호재
8
2000조원 몸값 스페이스X IPO 임박설…국내 산업도 촉각
영상
Youtube 바로가기
오피니언
[편집인 칼럼] 군을 정리하는 권력, 권력을 준비하는 군