2026.03.24by 배종인 기자
노타 AI 조석영 매니저는 지난 3월6일 코엑스에서 개최된 ‘e4ds Physical AI Frontier 2026’에서 ‘엣지 AI에서의 AI 추론, 경량화 모델 및 경량화 방법’에 대해 발표하며, 현장 개발자의 병목을 정면으로 겨냥한 경량화·최적화 전략을 공개했다. 엣지 AI 시대에 경쟁력은 더 작은 모델이 아니라, 더 빠르게 제품으로 완성시키는 능력에 있다. 자체 경량화와 전문 솔루션 사이의 선택은 이제 기술 취향이 아니라, 비용과 시간에 대한 전략적 판단의 영역으로 이동하고 있다.
2026.03.05by 배종인 기자
AI 모델 운영비의 핵심 변수인 GPU 메모리 부담을 낮추기 위한 ‘양자화(Quantization)’ 경쟁이 대형언어모델(LLM)로 확산되는 가운데, 노타가 업스테이지의 ‘Solar-Open-100B’를 대상으로 한 양자화 모델을 허깅페이스에 공개했다. 모델 카드에 따르면 ‘Nota MoE Quantization’ 적용 시 가중치 메모리 풋프린트는 191.2GB에서 51.9GB로 줄었다. 성능 지표로는 위키텍스트-2 기준 PPL이 원본 6.06 대비 6.81로 제시됐다. 노타는 이를 MoE 구조에서 발생할 수 있는 양자화 왜곡을 줄이기 위한 기법이라고 설명했으며, 일부 보도에서는 과기정통부 ‘독자 AI 파운데이션 모델’ 프로젝트와 연계 및 특허 출원도 언급했다.
[열린보도원칙] 당 매체는 독자와 취재원 등 뉴스이용자의 권리 보장을 위해 반론이나 정정보도, 추후보도를 요청할 수 있는 창구를 열어두고 있음을 알려드립니다.
고충처리인 장은성 070-4699-5321 , news@e4ds.com
아직 회원이 아니신가요?
아이디와 비밀번호를 잊으셨나요?