이코노믹데일리 - 정확한 뉴스와 깊이 있는 분석
금융
산업
생활경제
IT
ESG
건설
피플
국제
이슈
K-Wave
전체기사
검색
패밀리 사이트
아주경제
아주일보
회원서비스
로그인
회원가입
지면보기
네이버블로그
2024.11.22 금요일
맑음
서울 3˚C
맑음
부산 12˚C
구름
대구 7˚C
맑음
인천 6˚C
흐림
광주 7˚C
맑음
대전 6˚C
흐림
울산 8˚C
맑음
강릉 7˚C
구름
제주 13˚C
검색
검색 버튼
검색
'한국어 AI'
검색결과
기간검색
1주일
1개월
6개월
직접입력
시작 날짜
~
마지막 날짜
검색영역
제목
내용
제목+내용
키워드
기자명
전체
검색어
검색
검색
검색결과 총
1
건
카카오, AI 언어모델 성능 평가 새 기준…국내 IT사 최초
[이코노믹데일리] 카카오가 인공지능(AI) 언어모델과 외부 애플리케이션(앱) 간 연동 성능을 평가하는 체계를 마련하며 AI 기술 생태계 활성화에 나섰다. 카카오는 AI 언어모델의 펑션콜(함수 호출) 성능을 평가할 수 있는 데이터셋(정보의 묶음) '펑션 챗 벤치(FunctionChat-Bench)'를 구축하고 이를 오픈소스(공개 코드)로 내놨다고 27일 밝혔다. 펑션콜이란 인간의 언어를 이해하는 도구인 AI 언어모델이 자체적으로 수행할 수 없는 동작을 지시하거나 미리 학습하지 않은 정보를 외부에서 불러오는 연동 기술이다. 예를 들어 음성인식 프로그램이 일기예보를 알려줄 때 외부 애플리케이션(앱)에서 기상 정보를 가져오는데 이때 필요한 기술이 펑션콜이다. 이 때문에 펑션콜은 언어모델 기반 서비스 구현에 필수적인 요소로 언어모델이 가진 한계를 해결해 AI가 학습하지 못한 정보까지 사용자에게 제공하도록 돕는 역할을 한다. 카카오는 펑션콜 기술 고도화를 위해 국내 정보기술(IT) 기업 최초로 한국어 대화 환경에서 성능을 다면적으로 평가할 수 있는 데이터셋을 갖췄다. 기존 펑션콜 성능 평가 데이터셋은 대부분 해외에서 구축돼 영어가 기반이다. 따라서 한국어 언어모델 성능을 평가하기 어려웠다. 데이터셋은 △프로그램 작동 명령인 함수의 이름과 인자를 얼마나 정확하게 추출하는지 △함수 호출 결과를 얼마나 정확하게 전달하는지 △누락된 정보를 인지해 추가할 수 있는지 △호출 가능한 함수와의 관련성을 감지할 수 있는지 등을 평가하는 항목으로 구성됐다. 다른 데이터셋이 주로 언어모델의 함수 호출 메시지 생성에 초점이 맞춰진 데 반해 카카오의 펑션 챗 벤치는 함수 호출 전후로 요구되는 다양한 성능을 평가 영역에 포함했다. 카카오는 한국어 AI 언어모델의 생태계 활성화와 개방적 AI 개발 환경을 조성하기 위해 펑션 챗 벤치를 오픈소스 커뮤니티 '깃허브'에 게재했다. 카카오는 향후 펑션 챗 벤치의 규모를 키우고 영어 버전을 추가하는 등 사용 범위를 확장한다는 계획이다. 카카오의 AI 전담 조직인 '카나나 알파'를 이끄는 김병학 성과리더는 "이번 펑션 챗 벤치 구축과 오픈소스 공개는 한국어 기반 AI 생태계 확대에 기여할 것"이라며 "펑션콜 기술의 성능 평가 토대를 처음으로 마련한 만큼 데이터셋 활용성을 꾸준히 높이려 노력하겠다"고 말했다.
2024-09-27 15:21:43
처음
이전
1
다음
끝
많이 본 뉴스
1
T1, '제우스'와 계약 종료…'제오페구케' 3년 역사에 마침표
2
'전기 먹는 하마' 용인 반도체 클러스터···SMR이 '해결사' 될 수 있을까?
3
1세대 화장품 기지개 켜는데…네이처리퍼블릭 '뒷걸음질'
4
'기후깡패' 트럼프 당선 이후 기후변화 둘러싸고 흔들리는 국제사회
5
[종합] 현대차 울산 공장 연구원 3명 사망…"원인 규명 조속히"
6
'4만전자' 반도체 경쟁력 하락… 외국인 투자자 "'지배구조 리스크'가 키웠다"
7
지스타 2024, 4일간의 대장정 성료…새로운 방향성 제시하며 성황리에 막 내려
8
[지스타 2024] 하이브IM, 지스타 2024 첫 무대…신작 아키텍트로 새로운 경험 선사
영상
Youtube 바로가기
오피니언
[데스크칼럼] AI 시대, 개발자의 미래와 생존 전략