오픈AI, AI 연구 비서 '딥 리서치' 공개...챗GPT, 차세대 연구 혁신 이끈다

"최대 30분 심층 분석"...웹 검색부터 보고서 작성까지, 연구자급 AI 에이전트 등장

고난도 AI 평가서 'o3 미니' 압도, 딥시크 R1과 비교 우위...유료 사용자 대상 서비스

OpenAI 사진REUTERS 연합뉴스 — OpenAI [사진=REUTERS 연합뉴스]

[이코노믹데일리] 오픈AI가 마치 전문 연구원처럼 심층적인 분석과 보고서 작성을 돕는 새로운 챗GPT 에이전트 기능, '딥 리서치(Deep Research)'를 3일 전격 공개했다. '딥 리서치'는 복잡한 질문에 대해 최대 30분 동안 수백 개의 웹사이트를 탐색, 분석, 종합하여 연구자 수준의 보고서를 제공하는 혁신적인 기능이다.

오픈AI는 이날 오전 일본 도쿄에서 진행된 생방송을 통해 '딥 리서치'의 기능과 데모를 시연했다. '딥 리서치'는 단계별 조사가 필요한 복잡한 작업에 특화된 기능으로 추론에 강점을 가진 'o3' 모델을 기반으로 방대한 양의 텍스트와 이미지를 분석하여 최적화된 답변을 제공한다.

오픈AI는 "사용자를 대신해 독립적으로 작업을 수행할 수 있는 차세대 에이전트"라며 "'딥 리서치'는 사용자의 명령에 따라 수백 개의 온라인 소스를 찾아 분석하고 종합하여 리서치 애널리스트 수준의 종합 보고서를 작성한다"고 설명했다. 특히 '딥 리서치'는 5~30분의 시간을 들여 필요한 답변을 제공하도록 설계되어 기존 챗GPT와 차별화된 심층 분석 능력을 보여준다.

오픈AI 딥 리서치 사진오픈AI 블로그 — 오픈AI 딥 리서치 [사진=오픈AI 블로그]

이날 공개된 데모에서는 "선진국 상위 10개국과 개발도상국 상위 10개국의 지난 10년간 모바일 보급률 추이와 iOS 및 안드로이드 도입률, 국가별로 새로운 언어 학습에 대한 관심 수준을 분석해달라"는 복잡한 질문에 '딥 리서치'가 스탯카운터, 스태티스타 등 다양한 통계 조사 기관을 인용, 표 형태로 정리하여 답변을 제공했다. 또한 "챗GPT의 새로운 iOS 번역 애플리케이션(앱)을 출시할 경우 어느 시장을 먼저 공략해야 할지 추천해달라"는 질문에는 "일본, 미국, 영국, 캐나다, 호주가 우선순위"라고 제안하며 전략 수립에도 도움을 줄 수 있음을 보여주었다.

'딥 리서치'는 AI 모델의 가장 까다로운 벤치마크 중 하나로 평가받는 스케일AI의 '인류의 마지막 시험'에서 26.6%의 정확도를 기록, 'o1'(9.1%), 'o3-미니'(13.0%)는 물론 9.4%를 기록한 '딥시크-R1'을 크게 앞섰다. 특히 화학, 인문학과 사회과학, 수학 분야에서 'o1' 대비 가장 큰 성능 향상을 보였다.

'딥 리서치' 기능은 현재 월 200달러 요금제인 챗GPT 프로 이용자를 대상으로 서비스되고 있으며 향후 챗GPT 플러스와 비즈니스 요금제 이용자에게도 확대될 예정이다. 한편 구글도 자사 AI 서비스인 '제미나이 어드밴스드' 이용자를 대상으로 유사한 기능의 '딥 리서치'를 지난해 12월 공개한 바 있어 AI 기반 리서치 에이전트 시장 경쟁이 더욱 치열해질 것으로 전망된다.

이번 '딥 리서치' 공개는 샘 올트먼 오픈AI CEO의 일본 방문 중에 이루어졌으며 이전 발표와 달리 오픈AI 일본 지사에서 라이브가 진행되었다. 올트먼 CEO는 손정의 소프트뱅크그룹 회장과의 만남, 이시바 시게루 일본 총리 면담 후 한국, 인도, 독일을 차례로 방문할 예정이다. 특히 한국에서는 4일 오전 오픈AI 개발자 행사인 '빌더 랩(Builder Lab)'을 열고 AI 스타트업 등 국내 개발자 100여 명을 대상으로 워크숍을 진행할 계획이다.

이번 '딥 리서치' 출시는 최근 중국 AI 스타트업 '딥시크'의 부상에 대한 견제 의도도 있는 것으로 해석된다. 샘 올트먼 CEO는 "딥시크가 좋은 모델을 개발했다"면서도 "새로운 건 아니다"라며 견제하는 모습을 보였고 이번 성능 평가 비교표에 딥시크를 포함시킨 것은 주요 경쟁 상대로 의식한 것으로 보인다. 업계 일각에서는 오픈AI가 딥시크와의 기술 경쟁력 우위를 강조하기 위해 '딥 리서치'를 선보였다고 분석하고 있다.