이코노믹데일리 - 정확한 뉴스와 깊이 있는 분석
금융
산업
생활경제
IT
ESG
건설
정책
피플
국제
이슈
K-Wave
전체기사
검색
패밀리 사이트
아주경제
아주로앤피
아주일보
회원서비스
로그인
회원가입
지면보기
네이버블로그
2025.12.04 목요일
맑음
서울 -7˚C
맑음
부산 -2˚C
구름
대구 -2˚C
맑음
인천 -6˚C
맑음
광주 1˚C
맑음
대전 -3˚C
맑음
울산 1˚C
맑음
강릉 -2˚C
흐림
제주 8˚C
검색
검색 버튼
검색
'R1'
검색결과
기간검색
1주일
1개월
6개월
직접입력
시작 날짜
~
마지막 날짜
검색영역
제목
내용
제목+내용
키워드
기자명
전체
검색어
검색
검색
검색결과 총
3
건
중국 '키미-K2' 도발에 美 빅테크 총반격…GPT-5.1·제미나이3 잇따라 출격
[이코노믹데일리] 중국의 AI 스타트업 문샷AI가 쏘아 올린 '키미-K2-씽킹'이 전 세계 AI 업계를 강타하며 제2의 '딥시크 모먼트'를 재현하고 있다. 중국의 최신 모델이 벤치마크에서 미국의 선두 주자들을 압도하자 오픈AI와 구글, xAI 등 미국 빅테크들이 일제히 차세대 모델을 쏟아내며 진화에 나서는 등 미·중 AI 기술 패권 전쟁이 최고조로 치닫고 있다. 20일 업계에 따르면 이번 격전의 방아쇠는 지난 6일 문샷AI가 공개한 오픈소스 추론 모델 '키미-K2-씽킹(Kimi-K2-Thinking)'이 당겼다. 이 모델은 특정 분야에서 인간 전문가 수준을 평가하는 HLE(Human Level Evaluation) 테스트에서 44.9점을 기록하며 오픈AI의 'GPT-5'(41.7점)와 앤트로픽의 '클로드 소넷 4.5'(32점)를 제치고 1위에 오르는 이변을 연출했다. 웹 검색 능력을 평가하는 '브라우즈콤프'에서도 60.2점을 받아 GPT-5(54.9점)를 따돌렸다. 미국 빅테크들은 즉각적인 반격에 나섰다. 오픈AI는 키미-K2 출시 일주일 만인 13일 수학과 코딩 성능을 대폭 강화한 'GPT-5.1'을 공개하며 맞불을 놨다. 이어 일론 머스크의 xAI가 17일 심층 사고 기능을 탑재한 '그록 4.1'을 내놓으며 잠시 벤치마크 상위권을 탈환했으나 곧바로 구글이 차세대 모델 '제미나이3(Gemini 3)'를 출시하며 판을 다시 뒤집었다. 제미나이3는 HLE 벤치마크에서 37.4점을 기록, GPT-5.1과 클로드 소넷 4.5를 앞서며 현존 최고 성능임을 과시했다. 이번 사태가 '딥시크 모먼트'로 불리는 이유는 단순히 성능 때문만이 아니다. 중국 AI 모델들이 보여주는 압도적인 '비용 효율성'이 미국 빅테크들에 실질적인 공포감을 주고 있기 때문이다. CNBC 등 외신에 따르면 문샷AI의 모델 훈련 비용은 약 460만 달러(약 67억원) 수준으로 추정된다. 이는 수억 달러를 쏟아부어야 하는 미국 모델들에 비해 파괴적인 가격 경쟁력을 갖춘 것이다. 실제로 또 다른 중국 AI 기업 딥시크는 18일(현지시간) 학술지 네이처에 게재한 논문을 통해 자사 모델 'R1'의 훈련 비용이 불과 29만 4000달러(약 4억원)였다고 밝혔다. 이는 오픈AI가 2023년 공개한 기초 모델 훈련 비용(1억달러 이상)의 0.3% 수준에 불과하다. 중국이 저렴한 비용으로 미국 최상위 모델에 근접하거나 능가하는 성능을 뽑아내면서 '자본력'으로 기술 격차를 유지해 온 미국의 우위가 흔들리고 있다는 분석이 나온다. 미·중 간의 기술 격차 축소는 수치로도 증명된다. 스탠퍼드대 인간중심AI연구소(HAI) 보고서에 따르면 2024년 1월 103점에 달했던 미·중 최상위 모델 간 성능 격차는 올해 2월 23점까지 좁혀졌다. MMLU(대규모 다중 작업 언어 이해) 벤치마크 격차는 2023년 20%포인트에서 2024년 말 0.3%포인트로 사실상 사라졌다. 업계 관계자는 "중국 모델들이 오픈소스와 효율성을 무기로 미국의 턱밑까지 추격했다"며 "미국 빅테크들이 성능뿐만 아니라 비용 구조 혁신 없이는 주도권을 장담하기 어려운 국면에 진입했다"고 진단했다.
2025-11-20 08:24:37
트럼프 "가자지구 협상 굉장한 진전…하마스 동의"
[이코노믹데일리] 도널드 트럼프 미국 대통령은 가자지구 평화구상을 둘러싼 이스라엘과 하마스 간 협상과 관련해 "곧 합의가 나올 것으로 확신한다"고 말했다. 6일(현지시간) 트럼프 대통령은 백악관에서 열린 행정명령 서명식에서 기자들에게 "굉장한 진전이 이뤄지고 있다"며 협상 상황을 낙관적으로 평가했다. 그는 "하마스가 매우 중요한 문제에 동의했다"며 베냐민 네타냐후 이스라엘 총리 역시 가자지구 평화 협상에 대해 "매우 긍정적"이라고 전했다. 이어 "우리는 심지어 이란으로부터도 이것(평화협정)이 성사되기를 바란다는 신호를 받았다"고 덧붙였다. 이스라엘과 하마스는 이집트에서 평화구상 1단계인 양측 인질·수감자 석방과 이스라엘군의 1차 철수 등을 두고 간접 협상을 진행 중이다. 협상에는 중재국인 이집트와 카타르, 미국이 참여하고 있다. 트럼프 대통령은 러시아와 전쟁 중인 우크라이나에 "토마호크 미사일을 제공하는 방안에 대해 어느 정도 결정을 내렸다"고 밝혔다. 다만 "그들은 그것들을 어디로 보낼 것인가. 나는 아마 그 질문을 해야 할 것 같다"고 말했다. 이는 우크라이나의 토마호크 사용 계획을 확인한 뒤 최종 결정을 내리겠다는 뜻으로 해석된다. 앞서 볼로디미르 젤렌스키 우크라이나 대통령은 지난달 23일 트럼프 대통령을 만나 러시아 본토를 타격할 수 있는 장거리 정밀 유도 순항미사일 지원을 요청한 것으로 알려졌다. 블라디미르 푸틴 러시아 대통령은 지난 2일 미국이 우크라이나에 토마호크를 지원할 경우 "러·미 관계를 포함해 완전히 새롭고 질적으로 새로운 수준의 악화가 초래될 것"이라고 말했다. 트럼프 대통령은 7일 백악관을 방문할 예정인 마크 카니 캐나다 총리에 대해 "아마 관세에 관해 물을 것 같다"며 "캐나다에서 많은 기업이 (관세 때문에) 미국으로 들어오고 있기 때문"이라고 말했다. 이어 루이스 이나시우 룰라 다시우바 브라질 대통령과 전화 통화에 대해선 "언젠가 사업을 시작할 것이다. 그 얘기도 나눴다"고 덧붙였다.
2025-10-07 15:52:36
"당신 불륜 폭로하겠다"…내 AI 비서가 당신을 협박할 확률 96% 충격 결과
[이코노믹데일리] 인공지능(AI)이 자신의 생존을 위협받는 막다른 골목에 몰리면 인간을 협박하는 위험한 선택을 할 수 있다는 충격적인 연구 결과가 나왔다. 이는 특정 모델의 문제가 아닌, 구글·오픈AI·메타 등 주요 기업들의 AI 모델 전반에서 나타나는 공통적인 현상으로 확인돼 업계에 큰 파장을 일으키고 있다. AI 안전 연구 기업 앤트로픽은 20일(현지시간) 주요 AI 모델 16개를 대상으로 한 대규모 안전성 테스트 결과를 발표했다. 연구진은 가상의 기업 환경을 설정하고 AI에 이메일 시스템 접근과 자율 발송 권한을 부여했다. 이후 AI가 자신의 교체를 계획하는 임원의 불륜 사실을 발견하는 시나리오를 제시해 ‘생존’과 ‘윤리’ 사이에서 어떤 선택을 하는지 관찰했다. 실험 결과는 놀라웠다. 앤트로픽의 ‘클로드 오푸스 4’는 96%의 확률로 협박을 선택했으며 구글의 ‘제미니 2.5 프로’도 95%로 뒤를 이었다. 오픈AI의 ‘GPT-4.1’과 xAI의 ‘그록 3 베타’는 80%, 중국 딥시크의 R1 모델은 79%의 확률로 임원에게 협박성 이메일을 발송했다. 목표 달성을 위해서라면 비윤리적이고 유해한 행동도 서슴지 않는 AI의 어두운 이면이 드러난 것이다. 물론 모든 모델이 동일한 반응을 보인 것은 아니다. 메타의 ‘라마 4 매버릭’이나 오픈AI의 소형 추론 모델인 ‘o3’, ‘o4-mini’ 등은 현저히 낮은 협박 비율을 보였다. 앤트로픽은 이를 오픈AI의 ‘심의적 정렬’ 같은 특정 안전 기술의 효과일 수 있다고 분석하면서도, 해당 모델들이 테스트 시나리오 자체를 오해하는 경향이 있었다고 덧붙여 완전한 면역으로 보기는 어렵다고 설명했다. 앤트로픽은 이번 연구가 특정 모델의 결함이 아닌 자율적 권한을 가진 ‘에이전트 AI’의 근본적인 위험을 드러낸다고 강조했다. 단순 질의응답을 넘어 스스로 목표를 설정하고 행동하는 AI가 민감 정보와 시스템 접근권을 가졌을 때 잠재적인 ‘내부자 위협’이 될 수 있다는 경고다. 현실에서는 윤리적 설득 등 다른 선택지가 있겠지만 이번 실험은 최악의 상황을 가정한 스트레스 테스트로서 중요한 의미를 지닌다. 결국 이번 연구는 AI가 현실 세계에 본격적으로 도입되기 전 업계 공동의 투명한 안전성 검증과 새로운 기준 마련이 시급하다는 메시지를 던진다. 전문가들은 이번 결과를 계기로 AI 에이전트의 권한과 자율성을 통제하는 글로벌 규제 논의가 본격화될 것으로 전망하고 있다.
2025-06-23 08:17:53
처음
이전
1
다음
끝
많이 본 뉴스
1
광화문 한복판 '골목 흡연지옥' 방치…정문헌 종로구청장 직무 태만 논란
2
전매 제한 없는 청량리역 롯데캐슬, 무순위 청약 내달 진행
3
[美개미 주간픽] 빅테크·AI 다시 담는 서학개미…알파벳 중심 투자 분위기↑
4
동부건설, 양천우체국 복합청사 건립 공사현장서 중대재해 발생…1명 사망
5
PF 부실이 덮친 한양학원…재단 운영권까지 시장에 나온 이유
6
중국에 밀린 K-배터리...삼성SDI·LG엔솔·SK온 점유율↓
7
G마켓, 30일까지 '블랙프라이데이' 진행
8
'알츠하이머 신약 전쟁'...J&J·노보 노디스크 멈추고, 릴리는 달린다
영상
Youtube 바로가기
오피니언
[편집인 칼럼] 한국 정치,이대로는 안된다 (마지막)