[이코노믹데일리] 과학기술정보통신부는 6일, KAIST PIM 반도체 연구센터와 인공지능 반도체 대학원 유회준 교수 연구팀이 직경 4.5mm 크기 반도체 칩으로 초거대 언어모델 기반 생성형 AI를 구동하는 기술을 세계 최초로 개발했다고 밝혔다. 이번 연구 성과는 모바일 장치 등 에너지 제약이 높은 환경에서도 정확하게 거대 언어모델을 구동할 수 있는 가능성을 열었으며, AI 반도체 생태계에 혁신을 가져올 것으로 기대된다.
연구팀은 400밀리와트(㎿) 초저전력을 소모하면서 0.4초 초고속으로 거대 언어 모델을 처리할 수 있는 인공지능 반도체 '상보형-트랜스포머'를 개발했다. 기존 GPU 기반 시스템은 250㎿의 높은 전력을 소모하며 GPT 등 거대 언어 모델을 구동했다. 이번 연구는 칩 크기와 전력 소모를 크게 줄여 AI 반도체의 상용화 가능성을 높였다.
특히 이번 연구는 인간 뇌의 동작을 모방하는 뉴로모픽 컴퓨팅 기술인 스파이킹 신경망을 활용해 트랜스포머 동작을 구현했다는 점에서 기술적 가치가 높다. 기존 뉴로모픽 컴퓨팅 기술은 정확도가 낮아 간단한 이미지 분류 작업만 가능했지만, 연구팀은 이를 개선하여 CNN과 동일 수준의 정확도를 달성하고 다양한 응용 분야에 적용할 수 있는 상보형-심층신경망(C-DNN)을 제안했다.
상보형-심층신경망 기술은 심층 인공 신경망(DNN)과 스파이킹 신경망(SNN)을 혼합하여 입력 데이터 크기에 따라 서로 다른 신경망에 할당해 전력을 최소화하는 기술이다. 이 기술을 거대 언어 모델에 적용함으로써 초저전력·고성능의 온디바이스 AI 구현이 가능하다는 것을 실제로 입증했다는 점에서 의의가 크다. 연구팀은 "이번 연구 성과는 모바일 장치 등 에너지 제약이 높은 환경에서도 정확하게 거대 언어 모델을 구동할 수 있어 온디바이스 AI 구현을 위한 최적의 기술"이라고 강조했다.
유회준 KAIST 교수는 "뉴로모픽 컴퓨팅은 인공지능 시대에 필수적인 초저전력·고성능 온디바이스 AI의 핵심 기술"이라며 "앞으로도 관련 연구를 지속할 것"이라고 강조했다.
전영수 과기정통부 정보통신산업정책관은 "지난 1월 대통령 주재 반도체 민생토론회에서 AI 반도체의 중요성이 강조되었듯 앞으로도 세계적인 연구 성과를 지속해서 낼 수 있도록 적극 지원하겠다"고 밝혔다.