이코노믹데일리 - 정확한 뉴스와 깊이 있는 분석
금융
산업
생활경제
IT
ESG
건설
정책
피플
국제
이슈
K-Wave
전체기사
검색
패밀리 사이트
아주경제
아주로앤피
아주일보
회원서비스
로그인
회원가입
지면보기
네이버블로그
2025.09.08 월요일
맑음
서울 20˚C
맑음
부산 24˚C
맑음
대구 23˚C
맑음
인천 23˚C
흐림
광주 24˚C
맑음
대전 21˚C
흐림
울산 24˚C
흐림
강릉 21˚C
흐림
제주 27˚C
검색
검색 버튼
검색
'딥시크 R1'
검색결과
기간검색
1주일
1개월
6개월
직접입력
시작 날짜
~
마지막 날짜
검색영역
제목
내용
제목+내용
키워드
기자명
전체
검색어
검색
검색
검색결과 총
3
건
"당신 불륜 폭로하겠다"…내 AI 비서가 당신을 협박할 확률 96% 충격 결과
[이코노믹데일리] 인공지능(AI)이 자신의 생존을 위협받는 막다른 골목에 몰리면 인간을 협박하는 위험한 선택을 할 수 있다는 충격적인 연구 결과가 나왔다. 이는 특정 모델의 문제가 아닌, 구글·오픈AI·메타 등 주요 기업들의 AI 모델 전반에서 나타나는 공통적인 현상으로 확인돼 업계에 큰 파장을 일으키고 있다. AI 안전 연구 기업 앤트로픽은 20일(현지시간) 주요 AI 모델 16개를 대상으로 한 대규모 안전성 테스트 결과를 발표했다. 연구진은 가상의 기업 환경을 설정하고 AI에 이메일 시스템 접근과 자율 발송 권한을 부여했다. 이후 AI가 자신의 교체를 계획하는 임원의 불륜 사실을 발견하는 시나리오를 제시해 ‘생존’과 ‘윤리’ 사이에서 어떤 선택을 하는지 관찰했다. 실험 결과는 놀라웠다. 앤트로픽의 ‘클로드 오푸스 4’는 96%의 확률로 협박을 선택했으며 구글의 ‘제미니 2.5 프로’도 95%로 뒤를 이었다. 오픈AI의 ‘GPT-4.1’과 xAI의 ‘그록 3 베타’는 80%, 중국 딥시크의 R1 모델은 79%의 확률로 임원에게 협박성 이메일을 발송했다. 목표 달성을 위해서라면 비윤리적이고 유해한 행동도 서슴지 않는 AI의 어두운 이면이 드러난 것이다. 물론 모든 모델이 동일한 반응을 보인 것은 아니다. 메타의 ‘라마 4 매버릭’이나 오픈AI의 소형 추론 모델인 ‘o3’, ‘o4-mini’ 등은 현저히 낮은 협박 비율을 보였다. 앤트로픽은 이를 오픈AI의 ‘심의적 정렬’ 같은 특정 안전 기술의 효과일 수 있다고 분석하면서도, 해당 모델들이 테스트 시나리오 자체를 오해하는 경향이 있었다고 덧붙여 완전한 면역으로 보기는 어렵다고 설명했다. 앤트로픽은 이번 연구가 특정 모델의 결함이 아닌 자율적 권한을 가진 ‘에이전트 AI’의 근본적인 위험을 드러낸다고 강조했다. 단순 질의응답을 넘어 스스로 목표를 설정하고 행동하는 AI가 민감 정보와 시스템 접근권을 가졌을 때 잠재적인 ‘내부자 위협’이 될 수 있다는 경고다. 현실에서는 윤리적 설득 등 다른 선택지가 있겠지만 이번 실험은 최악의 상황을 가정한 스트레스 테스트로서 중요한 의미를 지닌다. 결국 이번 연구는 AI가 현실 세계에 본격적으로 도입되기 전 업계 공동의 투명한 안전성 검증과 새로운 기준 마련이 시급하다는 메시지를 던진다. 전문가들은 이번 결과를 계기로 AI 에이전트의 권한과 자율성을 통제하는 글로벌 규제 논의가 본격화될 것으로 전망하고 있다.
2025-06-23 08:17:53
구글, 제미나이 2.5 플래시로 AI 추론 요금 인하…오픈AI에 가격 압박
[이코노믹데일리] 구글이 AI 추론용 모델 가격을 대폭 인하하며 생성형 인공지능 시장의 가격 전쟁에 불을 지폈다. 오픈AI가 신제품을 공개한 지 하루 만에 내놓은 강수다. 반격에 나선 오픈AI는 속도를 낮춘 절반 가격 요금제로 맞섰지만 클라우드 인프라 경쟁력에서 격차가 뚜렷하다는 분석이 나온다. 구글은 17일(현지 시간) 생성형 AI ‘제미나이 2.5 플래시’를 일반 및 클라우드 사용자 대상 미리보기 버전으로 출시했다. 이번 모델은 지난 구글 클라우드 넥스트 2025에서 공개된 경량화된 AI로 일반형과 추론형 두 가지로 제공된다. 추론 기능을 활성화할 경우 기존 딥시크 R1 모델을 능가하는 성능을 보인다. 가격 정책은 더욱 공격적이다. 구글은 이날 API 요금도 함께 발표했다. 100만 토큰 기준 입력 요금은 0.15달러, 출력 요금은 비추론의 경우 0.6달러, 추론 시 3.5달러다. 오픈AI가 전날 공개한 o4 미니의 입력 1.1달러, 출력 4.4달러보다 현저히 낮은 수준이다. 특히 입력 가격만 놓고 보면 딥시크 R1 대비 27%에 불과하다. 구글은 “2.5 플래시는 속도와 비용에 중점을 두면서도 추론 기능을 대폭 업그레이드해 비용 대비 성능이 매우 뛰어나다”며 “품질과 비용, 시간 지연 간 균형 최적화를 위해 ‘사고(추론)’에 대한 예산을 설정할 수 있다”고 설명했다. 오픈AI도 반격에 나섰다. 구글 발표 당일, 고객사들을 대상으로 ‘플렉스 요금제’ 시범 도입 소식을 알렸다. 이 요금제는 응답 시간이 느리고 자원 사용이 간헐적이지만 API 사용료가 절반으로 줄어든다. 이 방식을 택하면 o4 미니는 출력 기준에서 구글 제미나이 2.5 플래시보다 가격 경쟁력을 확보할 수 있다. 그러나 전문가들은 구조적 한계를 지적한다. 테크 업계에서는 자체 클라우드 인프라가 없는 오픈AI의 비용 구조가 약점으로 작용하고 있다는 분석이 지배적이다. 구글은 자사 클라우드와 연계해 수익성을 확보할 수 있는 반면 오픈AI는 마이크로소프트(MS) 등 외부 클라우드에 의존해야 해 가격 인하에 한계가 있다. 여기에 챗GPT 이미지 생성 기능이 폭발적인 인기를 끌며 연산 자원 수요가 급증한 것도 오픈AI에 부담으로 작용하고 있다. 업계 관계자는 “무턱대고 가격 인하 경쟁을 따라가기에는 비용이 부담되기에 연산 속도를 포기한 셈”이라며 “스타트업 역사상 가장 큰 투자를 받았음에도 기존 빅테크의 체력을 단기간에 따라잡기는 어렵다”고 말했다. 한편 구글은 이와 함께 제미나이의 대중화를 위한 전략도 강화하고 있다. 18일에는 K-팝 그룹 르세라핌과 협업한 글로벌 캠페인 영상을 공개했다. 르세라핌 멤버들이 안드로이드 스마트폰과 제미나이를 활용하는 모습을 보여주며 사용자 일상 속 AI 기술 접점을 넓히는 데 초점을 맞췄다. 구글은 “제미나이 라이브의 비주얼 인식 기능이나 실시간 번역 기능 등 실제 사용 사례를 전 세계 이용자에게 소개하고 있다”고 밝혔다. 생성형 AI 시장이 기술 경쟁을 넘어 가격과 소비자 접점까지 확대되면서 빅테크 간 전략 차별화가 본격화되고 있다. 한정된 연산 자원과 투자 회수라는 현실 속에서 각 기업이 어떤 선택을 할지 주목된다.
2025-04-18 11:12:14
LG, 추론 AI '엑사원 딥' 오픈소스화…에이전틱 AI 시대 연다
[이코노믹데일리] LG AI연구원이 글로벌 인공지능(AI) 시장에서 경쟁력을 입증할 자체 개발 추론 AI 모델 ‘엑사원 딥’을 18일 오픈소스로 공개했다. 이는 한국 기업이 독자적으로 개발한 AI 모델이 글로벌 AI 생태계에서 본격적으로 경쟁에 나섰다는 점에서 의미가 크다. LG AI연구원은 17~21일(현지시간) 미국 캘리포니아 새너제이에서 열리는 엔비디아 GTC 2024에서 ‘엑사원 딥’을 소개하며 글로벌 시장 진출을 본격화했다. ‘엑사원 딥-32B’는 320억 개의 매개변수를 갖춘 모델이다. 매개변수 6710억개를 가진 중국 딥시크 R1의 5% 규모에 불과하지만 성능 면에서는 뒤떨어지지 않는다는 게 LG AI연구원의 설명이다. LG AI연구원은 이번 공개를 통해 기존 AI 모델이 단순한 정보 처리에 머물던 한계를 넘어서 자율적 의사결정이 가능한 ‘에이전틱 AI’ 시대로의 전환을 예고했다. 에이전틱 AI는 스스로 가설을 설정하고 검증하는 추론 AI로 복잡한 문제 해결에 적합하다. 현재 오픈AI, 구글, 중국 딥시크·알리바바 등 극소수 글로벌 기업만이 추론 AI를 개발하고 있다. LG AI연구원은 AI 오픈소스 플랫폼 ‘허깅페이스’를 통해 엑사원 딥의 논리적 사고력과 문제 해결 능력을 평가한 데이터를 공개했다. 수학 문제 해결 능력 평가 지표에서 95.7점을 기록하며 물리학·화학·생물학 등 과학 분야 등 박사급 논리 추론 평가에서 높은 평가를 받았다. AI 코딩 능력 평가에서는 59.5점을 기록했다. 엑사원 딥-32B와 함께 ‘엑사원 딥-7.8B(경량 모델)’와 ‘엑사원 딥-2.4B(온디바이스 모델)’도 함께 공개됐다. 7.8B 모델은 32B 모델 대비 매개변수가 24% 수준이지만 성능을 95% 유지한다. 2.4B 모델은 32B 모델 대비 매개변수 7.5% 수준이지만 성능 86% 유지하면서 특히 기기 내부에서 데이터를 처리해 보안성과 개인정보 보호 측면에서 강점이 있다. LG AI연구원 관계자는 “2월 국가인공지능위원회에서 ‘딥시크 R1급 모델을 오픈소스로 공개하겠다’고 발표한 이후 한 달 만에 엑사원 딥을 공개했다”며 “LG의 AI 기술 핵심은 모델 크기를 줄이면서도 성능을 유지하는 것”이라고 강조했다.
2025-03-18 10:21:43
처음
이전
1
다음
끝
많이 본 뉴스
1
美법원, 구글 반독점 1심 최종 판결…"크롬 매각 불필요, 데이터는 공유해야"
2
정부, 부동산 대책 곧 발표… 보유세 강화는 제외
3
슈카월드가 쏘아올린 '빵값 논쟁'…가격 형성 핵심 요인은
4
[단독] 업비트, '2025 LCK' 공식 후원…e스포츠 팬심 정조준
5
셀러 또다시 등 돌리나…티몬 재오픈 연기에 속타는 오아시스
6
[K-제약, 뷰티 트렌드①] '먹는 화장품 시대'...제약업계, 신성장 동력으로 이너뷰티 선택
7
인천공항사고로 드러난 공기업산재 실태… 이학재사장 책임론 확산
8
삼성전자·LG전자, 로봇청소기 보안 이끌지만…국내 제도는 여전히 미비
영상
Youtube 바로가기
오피니언
[기자수첩] K-제조업이 보낸 SOS…'선언적 구호'냐 '정책 실행'이냐