오픈AI는 이날 오전 일본 도쿄에서 진행된 생방송을 통해 '딥 리서치'의 기능과 데모를 시연했다. '딥 리서치'는 단계별 조사가 필요한 복잡한 작업에 특화된 기능으로 추론에 강점을 가진 'o3' 모델을 기반으로 방대한 양의 텍스트와 이미지를 분석하여 최적화된 답변을 제공한다.
오픈AI는 "사용자를 대신해 독립적으로 작업을 수행할 수 있는 차세대 에이전트"라며 "'딥 리서치'는 사용자의 명령에 따라 수백 개의 온라인 소스를 찾아 분석하고 종합하여 리서치 애널리스트 수준의 종합 보고서를 작성한다"고 설명했다. 특히 '딥 리서치'는 5~30분의 시간을 들여 필요한 답변을 제공하도록 설계되어 기존 챗GPT와 차별화된 심층 분석 능력을 보여준다.
'딥 리서치'는 AI 모델의 가장 까다로운 벤치마크 중 하나로 평가받는 스케일AI의 '인류의 마지막 시험'에서 26.6%의 정확도를 기록, 'o1'(9.1%), 'o3-미니'(13.0%)는 물론 9.4%를 기록한 '딥시크-R1'을 크게 앞섰다. 특히 화학, 인문학과 사회과학, 수학 분야에서 'o1' 대비 가장 큰 성능 향상을 보였다.
'딥 리서치' 기능은 현재 월 200달러 요금제인 챗GPT 프로 이용자를 대상으로 서비스되고 있으며 향후 챗GPT 플러스와 비즈니스 요금제 이용자에게도 확대될 예정이다. 한편 구글도 자사 AI 서비스인 '제미나이 어드밴스드' 이용자를 대상으로 유사한 기능의 '딥 리서치'를 지난해 12월 공개한 바 있어 AI 기반 리서치 에이전트 시장 경쟁이 더욱 치열해질 것으로 전망된다.
이번 '딥 리서치' 공개는 샘 올트먼 오픈AI CEO의 일본 방문 중에 이루어졌으며 이전 발표와 달리 오픈AI 일본 지사에서 라이브가 진행되었다. 올트먼 CEO는 손정의 소프트뱅크그룹 회장과의 만남, 이시바 시게루 일본 총리 면담 후 한국, 인도, 독일을 차례로 방문할 예정이다. 특히 한국에서는 4일 오전 오픈AI 개발자 행사인 '빌더 랩(Builder Lab)'을 열고 AI 스타트업 등 국내 개발자 100여 명을 대상으로 워크숍을 진행할 계획이다.
이번 '딥 리서치' 출시는 최근 중국 AI 스타트업 '딥시크'의 부상에 대한 견제 의도도 있는 것으로 해석된다. 샘 올트먼 CEO는 "딥시크가 좋은 모델을 개발했다"면서도 "새로운 건 아니다"라며 견제하는 모습을 보였고 이번 성능 평가 비교표에 딥시크를 포함시킨 것은 주요 경쟁 상대로 의식한 것으로 보인다. 업계 일각에서는 오픈AI가 딥시크와의 기술 경쟁력 우위를 강조하기 위해 '딥 리서치'를 선보였다고 분석하고 있다.