이코노믹데일리 - 정확한 뉴스와 깊이 있는 분석
금융
산업
생활경제
IT
ESG
건설
정책
피플
국제
이슈
K-Wave
전체기사
검색
패밀리 사이트
아주일보
베트남
회원서비스
로그인
회원가입
지면보기
네이버블로그
2025.12.28 일요일
안개
서울 7˚C
맑음
부산 9˚C
구름
대구 8˚C
흐림
인천 7˚C
맑음
광주 5˚C
흐림
대전 3˚C
구름
울산 5˚C
구름
강릉 4˚C
흐림
제주 11˚C
검색
검색 버튼
검색
'AI비용절감'
검색결과
기간검색
1주일
1개월
6개월
직접입력
시작 날짜
~
마지막 날짜
검색영역
제목
내용
제목+내용
키워드
기자명
전체
검색어
검색
검색
검색결과 총
1
건
KAIST, 저렴한 GPU로 AI 비용 67% 절감하는 '스펙엣지' 기술 개발
[이코노믹데일리] 인공지능(AI) 서비스의 고질적인 문제로 지적되던 운영 비용을 획기적으로 낮출 수 있는 기술이 국내 연구진에 의해 개발됐다. 한국과학기술원(KAIST·총장 이광형)은 전기및전자공학부 한동수 교수 연구팀이 데이터센터 외부의 저렴한 소비자급 GPU를 활용해 대규모 언어모델(LLM) 인프라 비용을 절감하는 '스펙엣지(SpecEdge)' 기술을 개발했다고 28일 밝혔다. 그동안 LLM 기반 AI 서비스는 고가의 데이터센터 GPU에 전적으로 의존해 비용 부담이 크고 기술 진입장벽이 높다는 한계가 있었다. 이번에 개발된 스펙엣지는 데이터센터 GPU와 개인 PC 및 소형 서버에 탑재된 '엣지 GPU'가 역할을 분담하는 방식이다. 연구팀은 '추측적 디코딩(Speculative Decoding)' 기술을 적용해 엣지 GPU가 먼저 확률 높은 단어를 빠르게 생성하면 데이터센터의 대규모 모델이 이를 검증하도록 설계했다. 이 과정에서 엣지 GPU는 서버 응답을 기다리지 않고 연속적으로 단어를 생성해 처리 속도를 높였다. 기술 적용 결과는 놀랍다. 기존 데이터센터 GPU만 사용하는 방식 대비 AI가 문장을 만드는 최소 단위인 토큰당 비용을 약 67.6% 절감하는 데 성공했다. 비용 효율성은 1.91배 높아졌고 서버 처리량 또한 2.22배 향상됐다. 특히 일반적인 인터넷 환경에서도 원활하게 작동해 별도 네트워크 구축 없이 즉시 상용화가 가능하다는 점이 특징이다. 연구팀은 이 기술이 스마트폰과 개인용 컴퓨터 및 신경망 처리장치(NPU) 등 다양한 기기로 확장될 경우 AI 서비스의 대중화를 앞당길 것으로 보고 있다. 한동수 교수는 "데이터센터를 넘어 사용자 주변의 엣지 자원까지 인프라로 활용해 누구나 고품질 AI를 저렴하게 이용하는 환경을 만들겠다"고 강조했다. 이번 연구 성과는 그 우수성을 인정받아 이달 초 미국 샌디에이고에서 열린 세계 최고 권위의 AI 학회 '신경정보처리시스템 학회(NeurIPS)'에서 상위 3.2%에 해당하는 스포트라이트 논문으로 선정돼 발표됐다.
2025-12-28 13:04:22
처음
이전
1
다음
끝
많이 본 뉴스
1
이노스페이스 '한빛-나노' 발사 오전 10시 확정… 기상 악화 뚫고 우주로
2
박윤영 KT 대표 후보, '100일 작전' 시작됐다… "보안은 수술하고 AI는 실리 챙긴다"
3
이노스페이스 '한빛-나노' 상업 발사 실패… 이륙 30초 만에 추락
4
쿠팡 "유출자 검거, 유출 정황 없다"…정부 즉각 반발
5
1기 신도시 선도지구 '막차 탔다'…분당·평촌·산본 정비계획 심의 통과
6
오늘부터 휴대폰 개통 시 '안면 인증' 필수… 대포폰 원천 차단 시범 운영
7
국세청, 쿠팡 특별세무조사…조사 4국 투입
8
농협 노조 "비리경영진 퇴진 투쟁 계속"
영상
Youtube 바로가기
오피니언
[e경제일보 사설] 국적을 갈아입는 사람들, 합법과 염치 사이