검색결과 총 7건
-
-
-
오픈AI, '역대 최대' GPT-4.5 공개… "환각 줄이고 공감 능력 높였다"
[이코노믹데일리] 생성형 인공지능(AI) 챗GPT 개발사 오픈AI가 최신 AI 모델 GPT-4.5를 ‘리서치 프리뷰(research preview)’ 방식으로 27일(현지시간) 공개하며 차세대 AI 모델 경쟁에 본격적인 시동을 걸었다. 리서치 프리뷰는 특정 사용자 그룹을 대상으로 제한적으로 공개하여 테스트를 진행하고 피드백을 수집하는 단계를 의미한다. GPT-4.5는 지난해 5월 첫 선을 보인 GPT-4o의 후속 모델이자 오픈AI가 개발하는 마지막 비(非)추론 모델이다. 오픈AI는 GPT-5부터 추론 모델과 일반 모델을 통합할 계획이라고 밝혀 GPT-4.5는 기존 모델의 성능을 극대화한 최종 버전의 의미를 갖는다. 샘 올트먼 오픈AI 최고경영자(CEO)는 지난 12일 소셜미디어(SNS)를 통해 GPT-4.5 출시를 예고하며 “수주 내 출시 예정이며 우리가 개발하는 사고의 사슬(chain-of-thought)이 아닌 마지막 모델이 될 것”이라고 밝힌 바 있다. ‘사고의 사슬’은 AI가 답변을 도출하는 과정에서 중간 사고 과정을 거치는 추론 방식을 의미하며 GPT-4.5는 이러한 추론 과정을 거치지 않는 마지막 모델이라는 점을 강조한 것이다. 오픈AI는 GPT-4.5에 대해 “지금까지 개발된 대화형 모델 중 가장 크고 강력하다”고 자평하며 “패턴 인식 및 연관성 파악 능력이 향상되었으며 논리적 추론 없이도 창의적인 통찰력을 생성하는 능력이 강화되었다”고 설명했다. 특히 감성지능(EQ) 향상에 주목하며, “사용자 의도에 대한 이해도가 높아져 더욱 사람과 유사한 자연스러운 대화가 가능하다”고 강조했다. 오픈AI는 GPT-4.5가 글쓰기 능력 향상, 프로그래밍 및 실용적인 문제 해결 등 다양한 분야에서 유용하게 활용될 것으로 기대하며 생성형 AI의 주요 문제점으로 지적되는 ‘환각(hallucination, 할루시네이션)’ 현상 또한 감소할 것으로 전망했다. 환각은 AI가 사실과 다른 정보를 생성하거나 맥락에 맞지 않는 부정확한 정보를 제시하는 오류 현상을 의미한다. GPT-4.5는 최신 정보 검색 기능, 파일 및 이미지 업로드 지원, 캔버스 기반 글쓰기 및 코딩 작업 등 다양한 신규 기능을 제공한다. 오픈AI는 GPT-4.5와 직전 모델인 GPT-4o, 그리고 최근 출시된 추론 모델 o3-미니의 성능을 비교 분석한 결과도 공개했다. 비교 결과, 간단한 질문에 대한 답변 정확도는 GPT-4.5가 62.5%로 GPT-4o(38.6%), o3-미니(15.0%)를 크게 앞섰으며 환각 발생률 역시 GPT-4.5가 37.1%로 GPT-4o(59.8%), o3-미니(80.3%)에 비해 현저히 낮은 수치를 기록했다. AI 모델 벤치마크 테스트에서도 GPT-4.5는 수학, 과학, 언어, 멀티모달 등 4개 전 부문에서 GPT-4o를 능가하는 성능을 입증했다. o3-미니와 비교했을 때는 언어 및 멀티모달 분야에서 우위를 보였으나 과학 및 수학 분야에서는 다소 낮은 성능을 나타냈다. 특히 감성적인 측면에서 GPT-4.5의 향상된 능력이 두드러진다. “시험에 떨어져 힘든 시간을 보내고 있다”는 사용자의 감정적인 질문에 대해 GPT-4o는 “정말 안타깝다. 도움이 될 만한 몇 가지를 생각해 볼 수 있을 것 같다”는 다소 형식적인 답변을 제시했다. 반면 o3-미니는 “많이 지치고 답답한 기분일 것 같다. 시험 결과에 영향을 준 요인이 무엇이었는지 스스로 질문해 볼 수 있다”는 다소 분석적인 답변을 내놓았다. GPT-4.5는 “아이고 정말 안타깝다. 시험에 실패하면 많이 속상하고 낙담할 수 있지만 그것이 당신의 능력이나 가치를 결정하는 것은 아니다. 무슨 일이 있었는지 이야기하고 싶은지 아니면 기분 전환이 필요한지 어떤 것이든 내가 여기 있겠다”라며 사용자의 감정을 공감하고 위로하는 더욱 인간적인 답변을 제시했다. 한편 GPT-4.5는 월 200달러 요금제의 챗GPT 프로 사용자에게 우선적으로 제공될 예정이다. 오픈AI는 “GPT-4.5는 상당한 컴퓨팅 자원을 필요로 한다”면서도 “더 넓은 지식, 더 강력한 직관, 더 높은 EQ와 같은 GPT-4.5의 고유한 강점을 미래 모델을 통해 모든 사용자에게 제공하기 위해 적극적으로 노력할 것”이라고 밝혔다.
2025-02-28 08:34:17
-
-
오픈AI, AI 연구 비서 '딥 리서치' 공개...챗GPT, 차세대 연구 혁신 이끈다
[이코노믹데일리] 오픈AI가 마치 전문 연구원처럼 심층적인 분석과 보고서 작성을 돕는 새로운 챗GPT 에이전트 기능, '딥 리서치(Deep Research)'를 3일 전격 공개했다. '딥 리서치'는 복잡한 질문에 대해 최대 30분 동안 수백 개의 웹사이트를 탐색, 분석, 종합하여 연구자 수준의 보고서를 제공하는 혁신적인 기능이다. 오픈AI는 이날 오전 일본 도쿄에서 진행된 생방송을 통해 '딥 리서치'의 기능과 데모를 시연했다. '딥 리서치'는 단계별 조사가 필요한 복잡한 작업에 특화된 기능으로 추론에 강점을 가진 'o3' 모델을 기반으로 방대한 양의 텍스트와 이미지를 분석하여 최적화된 답변을 제공한다. 오픈AI는 "사용자를 대신해 독립적으로 작업을 수행할 수 있는 차세대 에이전트"라며 "'딥 리서치'는 사용자의 명령에 따라 수백 개의 온라인 소스를 찾아 분석하고 종합하여 리서치 애널리스트 수준의 종합 보고서를 작성한다"고 설명했다. 특히 '딥 리서치'는 5~30분의 시간을 들여 필요한 답변을 제공하도록 설계되어 기존 챗GPT와 차별화된 심층 분석 능력을 보여준다. 이날 공개된 데모에서는 "선진국 상위 10개국과 개발도상국 상위 10개국의 지난 10년간 모바일 보급률 추이와 iOS 및 안드로이드 도입률, 국가별로 새로운 언어 학습에 대한 관심 수준을 분석해달라"는 복잡한 질문에 '딥 리서치'가 스탯카운터, 스태티스타 등 다양한 통계 조사 기관을 인용, 표 형태로 정리하여 답변을 제공했다. 또한 "챗GPT의 새로운 iOS 번역 애플리케이션(앱)을 출시할 경우 어느 시장을 먼저 공략해야 할지 추천해달라"는 질문에는 "일본, 미국, 영국, 캐나다, 호주가 우선순위"라고 제안하며 전략 수립에도 도움을 줄 수 있음을 보여주었다. '딥 리서치'는 AI 모델의 가장 까다로운 벤치마크 중 하나로 평가받는 스케일AI의 '인류의 마지막 시험'에서 26.6%의 정확도를 기록, 'o1'(9.1%), 'o3-미니'(13.0%)는 물론 9.4%를 기록한 '딥시크-R1'을 크게 앞섰다. 특히 화학, 인문학과 사회과학, 수학 분야에서 'o1' 대비 가장 큰 성능 향상을 보였다. '딥 리서치' 기능은 현재 월 200달러 요금제인 챗GPT 프로 이용자를 대상으로 서비스되고 있으며 향후 챗GPT 플러스와 비즈니스 요금제 이용자에게도 확대될 예정이다. 한편 구글도 자사 AI 서비스인 '제미나이 어드밴스드' 이용자를 대상으로 유사한 기능의 '딥 리서치'를 지난해 12월 공개한 바 있어 AI 기반 리서치 에이전트 시장 경쟁이 더욱 치열해질 것으로 전망된다. 이번 '딥 리서치' 공개는 샘 올트먼 오픈AI CEO의 일본 방문 중에 이루어졌으며 이전 발표와 달리 오픈AI 일본 지사에서 라이브가 진행되었다. 올트먼 CEO는 손정의 소프트뱅크그룹 회장과의 만남, 이시바 시게루 일본 총리 면담 후 한국, 인도, 독일을 차례로 방문할 예정이다. 특히 한국에서는 4일 오전 오픈AI 개발자 행사인 '빌더 랩(Builder Lab)'을 열고 AI 스타트업 등 국내 개발자 100여 명을 대상으로 워크숍을 진행할 계획이다. 이번 '딥 리서치' 출시는 최근 중국 AI 스타트업 '딥시크'의 부상에 대한 견제 의도도 있는 것으로 해석된다. 샘 올트먼 CEO는 "딥시크가 좋은 모델을 개발했다"면서도 "새로운 건 아니다"라며 견제하는 모습을 보였고 이번 성능 평가 비교표에 딥시크를 포함시킨 것은 주요 경쟁 상대로 의식한 것으로 보인다. 업계 일각에서는 오픈AI가 딥시크와의 기술 경쟁력 우위를 강조하기 위해 '딥 리서치'를 선보였다고 분석하고 있다.
2025-02-03 13:26:05
-
-