eFactoryNews

인피니언(5월21일부터)

인프라 효율

인프라 효율

가트너 “AI 토큰 단가 내려도 기업 부담은 계속”…에이전트 확산이 비용 구조 바꾼다

2026.03.30by 배종인 기자

가트너는 2030년까지 초대형 거대언어모델(LLM)의 추론 단가가 2025년보다 90% 이상 낮아질 것으로 전망했다. 반도체 성능 개선과 모델 설계 효율화가 배경으로 꼽힌다. 다만 기업의 AI 비용 부담이 함께 줄어드는 것은 아니라는 분석도 내놨다. AI 에이전트처럼 더 복잡한 기능이 확산되면 작업당 필요한 토큰 수가 크게 늘어 전체 추론 비용이 오를 수 있어서다. 이에 따라 향후 기업 경쟁력은 하나의 대형 모델에 의존하기보다, 업무 특성에 따라 소형 모델과 고성능 모델을 나눠 활용하는 ‘멀티 모델 오케스트레이션’ 역량에 달릴 것으로 전망됐다.

«
1
»

많이 본 뉴스

[열린보도원칙] 당 매체는 독자와 취재원 등 뉴스이용자의 권리 보장을 위해 반론이나 정정보도, 추후보도를 요청할 수 있는 창구를 열어두고 있음을 알려드립니다.

고충처리인 장은성 070-4699-5321 , news@e4ds.com

Top