검색결과 총 7건
-
카카오모빌리티, 자율주행 AI 학습 데이터셋 공개…국내 생태계 활성화 '기여'
[이코노믹데일리] 카카오모빌리티가 과학기술정보통신부, 자율주행기술개발혁신사업단과 협력하여 구축한 ‘AI 학습용 자율주행 데이터셋’을 한국전자통신연구원 ‘AI 나눔’에 공개하며 국내 자율주행 연구 생태계 조성에 적극 나선다고 28일 밝혔다. 이번 데이터셋 공개는 카카오모빌리티가 레벨4 자율주행 기술 개발을 목표로 참여한 과기정통부 국책과제 <자율주행 기술개발 혁신사업>의 일환으로 진행됐다. 카카오모빌리티는 이 사업을 통해 차량, 엣지-인프라, 지능 학습을 융합한 자율주행 데이터 생성, 관리, 배포 자동화 기술 개발을 완료했으며 국내 도로 환경에서 수집된 비식별화된 AI 학습용 데이터셋을 무상으로 공개하여 국내 자율주행 연구 활성화에 기여하고자 한다. 그동안 자율주행 분야 연구를 수행하는 중소기업, 학계, 연구기관 등에서는 고가의 센서 장비와 데이터 수집 비용 부담으로 자체적인 데이터 확보에 어려움을 겪어왔다. 기존에 공개된 데이터셋 역시 해외 환경이나 특정 조건에 편중되어 국내 실정에 맞는 연구 개발에 한계가 있었다. 이에 카카오모빌리티는 국내 도로 환경에 최적화된 자율주행 AI 모델 개발을 지원하기 위해 이번 데이터셋을 공개했다. 데이터셋은 국내 주요 도로에 설치된 라이다, 카메라 센서 기반 엣지-인프라와 카카오모빌리티 자율주행차를 통해 수집되었으며 사람, 차량, 자전거와 같은 3D 동적 객체와 신호등, 표지판 등 2D 정적 객체를 포함하여 총 10가지 유형 15만 건으로 구성됐다. 특히 이번 데이터셋은 도로 종류(고속도로, 국도, 지하차도, 터널 등), 시간대(주간, 야간), 날씨(맑음, 강우, 안개 등) 등 31개 이상의 다양한 환경 조건에서 수집되었다는 특징을 갖는다. 또한 라이다 센서로 취득한 포인트클라우드 좌표값과 함께 사람, 사물 등 객체의 속성을 세밀하게 구분하는 Pointcloud segmentation 데이터까지 포함되어 있어 실제 자율주행 기술 연구에 유용하게 활용될 수 있을 것으로 기대된다. 실제로 ETRI는 공개된 데이터셋을 자율주행 차량에 학습시킨 결과, 3D 동적 객체 검출 AI 성능이 약 5~8%, 신호등 인식 AI 성능이 약 2% 향상되는 것을 확인하며 데이터의 신뢰성을 입증했다. 특히 도심 야간 교통 혼잡 상황이나 보행자 신호등과 같이 데이터 확보가 어려운 희소 환경에서의 AI 성능 향상이 두드러졌다. 이는 데이터셋이 실제 자율주행 환경에서 AI 객체 인식 및 판단 성능 향상에 기여할 수 있음을 시사한다. 카카오모빌리티는 데이터셋 공개에 앞서 지난해 8월 과기정통부가 주최한 ‘제1회 자율주행 인공지능 챌린지’에 데이터셋 일부를 활용하여 참가자들에게 자율주행 AI 데이터 활용 역량 강화 기회를 제공하기도 했다. 당시 챌린지를 통해 데이터셋의 활용 가능성을 확인하고 자율주행 기술 개발 촉진에 대한 기대감을 높였다. 정부는 2027년 융합형 레벨4+ 자율주행 상용화 기반 구축을 목표로 <자율주행 기술개발 혁신사업>을 추진하고 있으며 카카오모빌리티는 과기정통부, IITP, KADIF의 지원을 받아 본 사업 과제를 수행하고 있다. 이번 데이터셋 공개는 정부의 자율주행 기술 상용화 목표 달성에도 기여할 것으로 전망된다. 장성욱 카카오모빌리티 미래이동연구소장은 “이번 데이터셋 공개가 국내 자율주행 기술 상용화와 발전에 기여하는 초석이 되기를 바란다”며 “앞으로도 다양한 공공 및 민간 기업과의 협력을 통해 자율주행 기술 혁신과 공공 데이터 활용 확대를 위해 노력하겠다”고 밝혔다. 정광복 KADIF 단장은 “미래의 석유라고 불리는 융합형 자율주행 학습 데이터셋 15만 건을 공개하게 되어 기쁘다”며 “이번 데이터 공개가 학계와 스타트업 성장의 발판이 되고, 나아가 국내 AI 자율주행 기술 고도화에 크게 기여할 수 있기를 기대한다”고 덧붙였다.
2025-02-28 16:25:45
-
LG AI연구원, 프랑스 'AI 행동 정상회의'서 윤리적 AI 비전 제시
[이코노믹데일리] LG연구원이 지난 10일(현지시간)부터 이틀간 프랑스 파리 그랑 팔레에서 열리는 'AI 행동 정상회의'에 참여하고 데이터 컴플라이언스 에이전트 개발 및 윤리 책무성 보고서를 발간하는 등 윤리적인 인공지능(AI) 사용 환경을 만들기 위해 노력을 기울이고 있다고 12일 밝혔다. AI 행동 정상회의는 세계 100여개 국가 정상과 기업, 학계 주요 인사들이 참여해 AI의 잠재성과 위험을 논의하는 자리다. LG AI연구원은 이번 정상회의에 참여해 각국 고위 관계자들에게 데이터의 신뢰성을 높이는 AI 기술을 소개하고 지속 가능한 AI 개발을 위한 기업의 역할에 대해 토의했다. LG AI연구원은 이날 회의에서 유네스코(UNESCO)와 함께 '세상을 위한 AI'를 주제로 책임감 있는 AI거버넌스를 위한 국제 협력 방안을 논의하고 우수 사례를 공유하는 행사도 진행했다. 이 행사에는 가브리엘라 라모스 유네스코 인문사회과학 사무총장보를 비롯한 각국 장관, 기업 대표, 정책 입안자 등 300여명이 참석했다. 연구원 측은 이날 파리 행사장에서 톰슨 로이터 재단, 맥거번 재단을 비롯한 고위 관계자들과 공공·민간·시민사회 협력 강화 방안에 대해서도 논의했다. 또한 지난해에 이어 LG AI 윤리원칙의 이행 성과를 담은 윤리 책무성 보고서를 발간하고, AI 모델이 학습하는 데이터의 위험을 자동으로 분류하고 위험 등급을 평가하는 '데이터 컴플라이언스 에이전트'를 개발해 데이터 사용의 투명성과 책임성을 높였다. 배경훈 LG AI연구원장은 보고서 서문에서 "AI 기술이 사회에 미치는 영향력이 커질수록 책무성이 더욱 중요해진다"며 "모든 연구개발 과제에 윤리 영향 평가를 의무화해 신뢰할 수 있는 AI 개발의 토대를 마련했다"고 전했다. LG AI연구원은 연구개발 과정에서 발생할 수 있는 잠재적 위험을 사전에 파악하고 개선하기 위해 진행 중인 모든 과제를 대상으로 윤리 영향 평가를 의무화했다. 이를 통해 70개 과제에서 229건의 잠재적 위험을 식별해 개선했다. LG AI연구원에 따르면 ‘데이터 컴플라이언스 에이전트’ 프로그램을 통해 실제 학습 데이터셋의 라이선스, 저작권, 개인정보 보호 등 법적 안정적을 검토한 결과 법률 전문가와 비교해 정확도는 26%, 속도는 45배 가량 높았고 비용은 0.1% 수준으로 낮았다. 구광모 LG대표는 올해 신년사에서 "AI와 같은 첨단 기술을 일상에서 편리하게 사용할 수 있게 만들어, 소중한 시간을 즐겁고 의미 있는 쓰는 새로운 라이프 스타일을 만들어 나가겠다"고 강조했다.
2025-02-12 14:34:10
-
-
-
오픈AI, '12 Days of OpenAI' 12일간의 혁신...AI의 새 시대 열다
[이코노믹데일리] 오픈AI가 연말 시즌을 맞아 '12 Days of OpenAI'라는 특별 이벤트를 통해 전 세계 기술 커뮤니티의 이목을 끌고 있다. 지난 5일(현지시간)부터 시작된 이번 이벤트는 12일 동안 매일 새로운 발표와 기술 업데이트를 선보이는 라이브스트림 형식으로 진행된다. AI 기술의 현재와 미래를 조망할 수 있는 중요한 이벤트로 업계 전문가들과 일반 사용자 모두의 관심을 한 몸에 받고 있다. 이번 이벤트는 단순히 제품과 기술을 소개하는 데 그치지 않고, 오픈AI가 추구하는 AI 기술의 방향성과 비전을 공유하는 자리로 기획됐다. 특히 “12일, 12개의 라이브스트림, 크고 작은 새로운 것들”이라는 슬로건에서 알 수 있듯 다양한 규모와 성격의 발표가 포함되어 있다. 이를 통해 기술적 깊이와 폭을 모두 아우르며 AI의 실질적 응용 가능성을 탐구한다는 점에서 기대를 모으고 있다. 현재까지 공개된 첫째 날과 둘째 날의 주요 발표는 AI의 성능과 활용 범위를 크게 확장시키는 내용으로 구성되었다. 첫날은 새로운 AI 모델과 프리미엄 구독 서비스 출시로 화제를 모았으며 둘째 날은 AI를 특정 도메인에 맞춰 최적화할 수 있는 강화 미세 조정 기술을 공개하며 기술적 진보를 강조했다. 이번 행사는 OpenAI가 AI 기술을 통해 어떤 방향으로 나아가고자 하는지 명확히 보여주는 중요한 이벤트로 평가받고 있다. ◆ Day 1 새로운 표준, 챗GPT Pro와 'o1' 모델의 등장 행사의 시작을 알린 첫날 오픈AI는 AI 기술의 새로운 이정표를 제시하며 시장을 깜짝 놀라게 했다. 그 중심에는 새로운 AI 모델 'o1'의 정식 출시와 고급 구독 서비스 '챗GPT Pro'가 있었다. o1 모델은 단순한 업데이트가 아닌 AI 기술의 획기적인 도약으로 평가받고 있다. 오픈AI가 공개한 벤치마크 결과에 따르면 이 모델은 수학 경시대회(AIME 2024)에서 83.3%, 코딩 대회(CodeForces)에서 89.0%라는 놀라운 정확도를 기록했다. 이는 이전 버전인 GPT-4o를 크게 능가하는 수치로 AI가 더 깊이 있고 정밀한 추론 능력을 제공할 수 있음을 보여준다. 이 모델은 응답 속도를 50% 향상시키고 오류율을 34% 낮추며 더욱 실용적이고 신뢰성 높은 AI를 구현했다. 특히 복잡한 문제 상황에서는 더 깊은 분석과 사고 과정을 거치며 일상적이고 간단한 질문에는 빠르게 응답하도록 설계됐다. 월 200달러(약 26만원)의 고가 요금제로 제공되는 챗GPT Pro는 전문가 수준의 사용자들에게 초점을 맞췄다. 이 요금제는 모든 모델의 무제한 사용과 고급 음성 모드와 같은 기능을 제공하며 전문가들에게 맞춤형 솔루션을 제안한다. 일반 사용자에게는 기존 '챗GPT Plus' 요금제가 적합하다는 점을 고려했을 때 챗GPT Pro는 연구자, 개발자, 그리고 고급 비즈니스 사용자를 겨냥한 전략적 선택으로 보인다. 오픈AI는 이 서비스를 통해 AI의 전문성과 상업적 가능성을 동시에 확장하고 있다. ◆ Day 2 강화 미세 조정의 가능성 둘째 날에는 마크 첸(Mark Chen) 연구 부문 수석 부사장이 나서 AI 모델의 잠재력을 더욱 끌어올릴 수 있는 강화 미세 조정 기술(Reinforcement Fine-Tuning)을 발표했다. 이날 발표는 기술적 깊이를 더하며 AI의 전문성과 실용성을 확장하는 데 중점을 두었다. AI가 단순히 데이터 기반의 정형화된 응답을 제공하는 것을 넘어 특정 도메인에서 독보적인 성능을 발휘할 수 있음을 시사하며 기술 혁신의 새로운 가능성을 열었다는 평가를 받고 있다. 강화 미세 조정은 AI 모델을 특정 작업에 맞게 세부적으로 조정하여 사용자가 원하는 수준의 전문성을 구현하는 기술이다. 이는 마치 특정 스포츠나 게임에 특화된 전문가를 양성하는 과정과 유사하다. 알파고가 바둑이라는 특정 도메인에서 최고수가 되었듯 OpenAI 모델도 강화 미세 조정을 통해 의료, 법률, 엔지니어링 등 다양한 분야에서 특화된 전문가의 역할을 수행할 수 있다. 마크 첸은 발표에서 “강화 미세 조정은 사용자가 단순한 데이터 입력을 넘어 모델의 학습 방향을 정의하고 개선할 수 있는 도구를 제공한다”며 이 기술의 실용적 가치를 강조했다. 오픈AI가 발표한 강화 미세 조정의 학습 과정은 간결하면서도 강력한 효과를 제공하는 것으로 평가받고 있다. 이번 발표에서 공개된 4단계 프로세스는 사용자가 AI를 특정 작업에 최적화하는 데 필요한 실질적 가이드를 제시한다. 첫 번째 단계는 학습 데이터셋 준비다. 사용자는 모델 학습에 필요한 데이터를 JsonL 파일 형식으로 구성해야 한다. JsonL은 데이터 구조화와 처리 속도를 높여주는 형식으로 AI 모델 훈련에 적합하다. 두 번째는 검증 데이터셋 준비다. 학습 데이터와 겹치지 않는 새로운 데이터를 별도로 구성해 모델의 학습 성과를 검증한다. 오픈AI는 데이터 중복을 방지함으로써 단순한 데이터 암기가 아니라 추론 능력을 배양하는 데 초점을 맞췄다. 세 번째는 평가 시스템 설정이다. 모델이 생성한 출력물과 정답 데이터를 비교하여 점수를 부여하는 방식으로 점수는 0에서 1 사이로 책정된다. 오픈AI는 사용자의 요구에 맞는 다양한 평가 시스템을 제공하며 향후 사용자 정의 평가 시스템도 지원할 계획이다. 마지막 단계는 학습 실행이다. 사용자는 AI 모델을 선택한 후 하이퍼파라미터를 설정하고 학습을 시작한다. 기본값으로도 실행이 가능하며 학습 완료까지 몇 시간에서 며칠 정도가 소요된다. 이러한 접근법은 AI가 단순한 지식을 넘어 새로운 지식을 창출하고 복잡한 문제를 해결하는 데 효과적으로 작용할 수 있음을 보여준다. 강화 미세 조정 기술은 특정 산업에서 전문가 수준의 AI를 구현할 가능성을 열어준다. 예를 들어 유전자 데이터 분석, 희귀 병리학 연구 혹은 특정 산업의 생산 공정 최적화 등에서 강력한 도구로 활용될 수 있다. 현재는 일부 신청자들에게 제한적으로 제공되고 있으며 2025년 초에 정식 출시될 예정이다. ◆ 다가올 발표와 오픈AI의 비전 그리고 비디오 AI와 SantaGPT의 등장 '12 Days of OpenAI'는 단 두 개의 발표만으로도 AI 기술이 얼마나 빠르게 발전하고 있는지를 보여준다. 앞으로의 발표에서는 AI의 새로운 가능성을 엿볼 수 있는 혁신적인 기술들이 대거 공개될 것으로 보인다. 전문가들은 비디오 생성 AI 'SORA'가 이번 행사에서 발표될 가능성을 제기하고 있다. 또한 챗GPT의 음성 모드 버튼이 눈송이 아이콘으로 바뀐 사례가 발견되면서 산타 목소리를 구현한 'SantaGPT' 출시 소문이 돌고 있다. 샘 알트만 오픈AI CEO가 이번 이벤트와 함께 "메리 크리스마스"라는 메시지를 전한 만큼 이러한 소문이 현실화될 가능성도 크다. 오픈AI의 '12 Days of OpenAI'는 단순히 새로운 기술 발표에 그치지 않는다. 이번 행사는 AI가 어떻게 우리의 삶을 변화시키고 산업과 연구에서 새로운 가능성을 열어줄 수 있는지를 보여주는 중요한 이정표다. 멀티모달 기능, 강화 미세 조정, 그리고 전문가용 AI 솔루션 등 오픈AI의 비전은 AI를 더 효율적이고 포괄적인 도구로 만드는 데 초점을 맞추고 있다. 이러한 기술 발전은 AI가 단순히 질문에 답하는 수준을 넘어 인간과 협력해 복잡한 문제를 해결할 수 있는 진정한 동반자로 자리 잡는 데 기여할 것이다.
2024-12-12 05:00:00
-
카카오, '카나나' AI 모델 공개…글로벌 AI 시장에서 한국어 우위 강조
[이코노믹데일리] 카카오는 23일 경기도 용인에서 열린 '이프카카오 2024' 행사에서 자사의 새로운 생성형 AI 모델 시리즈인 '카나나(Kanana)'를 공개했다. '카나나'는 카카오가 지금까지 개발한 다양한 인공지능(AI) 기술을 통합한 모델로 특히 한국어 처리 능력에서 글로벌 경쟁 모델을 크게 능가하는 성과를 보였다. 카카오는 이를 통해 국내 시장을 넘어 글로벌 AI 시장에서 경쟁력을 강화할 계획이다. 김병학 카나나알파 성과리더는 이날 발표에서 “카나나 모델은 한국어 처리 능력이 매우 뛰어나 글로벌 AI 시장에서도 중요한 경쟁력을 확보할 수 있을 것”이라고 말했다. 특히 그는 "카나나 모델은 GPT-4.0, 라마 3.1 등 세계적인 AI 모델과 비교해도 경쟁력을 갖추고 있으며 한국어 성능에서는 압도적인 성능을 보이고 있다"고 강조했다. 카카오는 이번 발표에서 ‘카나나’ 브랜드를 중심으로 다양한 AI 기술을 하나의 통합 플랫폼으로 제공할 것이라고 밝혔다. 이 통합 모델은 언어모델, 비주얼 생성모델, 음성모델, 멀티모달 언어모델 등 다양한 기능을 포괄하며 이를 통해 사용자들에게 보다 일관되고 고도화된 AI 경험을 제공할 계획이다. ◆ 카나나 모델 라인업, 언어모델부터 비디오 생성까지 카카오는 '카나나' 모델을 통해 다양한 목적에 맞는 AI 서비스를 제공할 예정이다. 이번에 공개된 카나나 시리즈는 크게 언어모델, 멀티모달 언어모델, 비주얼 생성모델, 음성모델 등으로 구분된다. 언어모델은 처리 용량에 따라 △카나나 나노(초경량 언어모델) △카나나 에센스(중소형 언어모델) △카나나 플래그(고성능 초거대 언어모델)로 세분화된다. 이를 통해 각기 다른 서비스 환경에 맞춘 맞춤형 AI 서비스를 제공할 수 있으며 서비스 목적에 맞게 성능과 비용 효율성을 최적화할 수 있다. 멀티모달 언어모델은 다양한 데이터를 통합적으로 처리할 수 있는 능력을 갖추고 있다. 이 모델은 △오디오 언어모델(카나나-a) △이미지/비디오 언어모델(카나나-v) △통합 멀티모달 언어모델(카나나-o)로 구성된다. 김병학 성과리더는 "카나나-o 모델은 텍스트뿐만 아니라 이미지, 오디오, 영상 데이터를 통합적으로 처리할 수 있으며 한국어에서는 세계적으로 가장 뛰어난 성능을 보였다"고 말했다. 비주얼 생성 모델인 '키네마'는 사용자가 텍스트 입력이나 이미지를 기반으로 영상 콘텐츠를 제작할 수 있는 AI 기술이다. 특히 카메라 움직임이나 캐릭터의 움직임을 마우스 조작만으로 제어할 수 있어 비디오 콘텐츠 제작 과정이 훨씬 간단해질 전망이다. '콜라주'는 개인화된 이미지 생성을 지원하는 모델로 다양한 콘텐츠 제작에 활용될 수 있다. 음성모델은 음성 인식과 음성 합성 두 가지로 구분된다. 음성 인식 모델인 '카브'와 음성 합성 모델인 '캐스트'는 자연스러운 음성 상호작용을 지원한다. 이 기술을 통해 카카오는 다양한 서비스에서 AI 기반 음성 인식과 합성 기능을 적용할 예정이다. 카나나 모델의 가장 큰 강점은 한국어 처리에서 세계 최고 수준의 성능을 보인다는 점이다. 김병학 성과리더는 "카나나 에센스 모델은 글로벌 성능을 가진 유사한 모델들과 비교했을 때 평균적으로 동등하거나 더 우수한 성능을 보였으며 한국어 성능에서는 특히 월등했다"고 강조했다. 카카오는 자체적으로 구축한 고품질의 한국어 데이터셋을 기반으로 모델을 학습시켜 한국어 처리에 있어 강력한 경쟁력을 확보했다. 또한 저작권과 개인정보 이슈를 해결한 투명한 학습 과정을 거쳐 데이터의 신뢰성 또한 높였다. 이를 바탕으로 카카나는 한국뿐 아니라 글로벌 AI 시장에서도 경쟁력을 갖출 것으로 기대된다. ◆ AI 기술 가속화...엔비디아와의 협력 강화 카카오는 글로벌 반도체 기업 엔비디아와 협력해 AI 기술 개발을 가속화하고 있다. 엔비디아는 카카오의 AI 모델 개발 조직인 '카나나 알파'와 협력하여 AI 모델을 제작하고 있으며 '카나나 엑스'와는 인프라 협업을 진행하고 있다. 엔비디아의 최신 그래픽 처리 장치(GPU)인 GH200은 카나나 모델의 효율적인 추론을 돕고 있다. 타이 맥커처 엔비디아 수석 부사장은 "카카오는 엔비디아와의 협력을 통해 더 빠르고 효율적으로 AI 기술을 도입할 수 있을 것"이라며 "우리는 한국을 넘어 글로벌 AI 생태계를 확장할 계획"이라고 밝혔다. 카카오는 이번 협력을 통해 AI 네이티브 컴퍼니로의 전환을 가속화하고 글로벌 시장에서도 더 큰 경쟁력을 확보해 나갈 것으로 예상된다. 한편 카카오는 '카나나' 모델을 자사의 주요 서비스에 적극적으로 적용할 예정이다. 특히 카카오톡의 AI 대화 요약 기능, 톡채널의 AI 매니저 등 사용자와의 상호작용을 개선하는 서비스에 AI 기술을 적용할 계획이다. 이를 통해 사용자는 더욱 자연스럽고 지능적인 AI 서비스를 경험할 수 있을 것이다. 김병학 리더는 "카나나 모델은 단순히 기술력을 과시하는 데 그치지 않고 실제 사용자 문제를 해결하는 실용적인 서비스를 제공할 것"이라고 밝혔다. 그는 이어서 "카카오는 AI 네이티브 컴퍼니로 전환해 AI를 기반으로 모든 비즈니스 활동을 혁신하고 내외부 생산성을 극대화할 것"이라고 강조했다.
2024-10-23 14:50:23
-