![국내 AI 반도체 스타트업 리벨리온의 AI 가속기 [출처=리벨리온 홈페이지]](https://cdn.ebn.co.kr/news/photo/202504/1661243_675354_4242.png)
국내 인공지능(AI) 반도체 팹리스 스타트업들이 'AI 칩 제왕' 엔비디아의 아성에 도전장을 내밀고 있지만, 엔비디아의 '범용성'이라는 장벽에 고전하고 있다는 분석이 나온다.
리벨리온, 퓨리오사AI, 딥엑스 등 유망 기업들이 특정 연산에 최적화된 신경망처리장치(NPU)로 승부수를 띄웠으나, 급변하는 AI 모델 발전 속도 앞에서 엔비디아 그래픽처리장치(GPU)가 가진 범용성이 더욱 부각되는 양상이다.
1일 반도체 업계에 따르면 엔비디아의 경쟁력은 쿠다(CUDA)로 대표되는 강력한 소프트웨어 생태계와 하드웨어 성능에서 나오는 것으로 알려졌다. 개발자들이 쉽게 AI 모델을 만들고 구동할 수 있도록 지원하는 소프트웨어 환경과 NV링크 등 하드웨어적 연결성은 엔비디아가 AI 시장을 장악하는 데 핵심적인 역할을 했다.
여기에 더해 AI 기술이 급속도로 발전하면서 어떤 AI 모델이든 처리할 수 있는 GPU의 '범용성'이 엔비디아의 또 다른 핵심 경쟁력으로 떠올랐다.
반면 국내 스타트업들이 주력하는 NPU는 특정 AI 알고리즘 연산에 특화돼 해당 분야에서는 엔비디아 GPU보다 뛰어난 전력 효율과 성능을 보이는 것이 장점이다.
하지만 최근 AI 모델의 개발 주기가 극도로 짧아지고 예측 불가능하게 변하면서 문제가 발생했다. 현재 가장 뛰어난 성능을 보이는 AI 모델이라도 몇 달 뒤에는 새로운 구조와 알고리즘을 가진 모델로 대체될 수 있다. 특정 모델에 맞춰 정교하게 설계된 NPU는 빠르게 변화하는 새로운 모델에서 최적의 성능을 내지 못한다.
![하이퍼비주얼에이아이의 GPNPU 개념도 [출처=하이퍼비주얼에이아이]](https://cdn.ebn.co.kr/news/photo/202504/1661243_675356_4546.jpg)
실제로 한 국내 주요 AI 스타트업 관계자는 "오픈AI와 같은 거대 모델 개발사들과 미팅할 때 가장 궁금한 것 중 하나가 다음 모델에 어떤 알고리즘을 사용할 것인지"라며 "미리 알아야 그 알고리즘에 최적화된 칩을 개발할 수 있기 때문"이라고 말했다.
이러한 상황에 대응하기 위해 새로운 접근법도 모색되고 있다. 엔비디아 GPU의 범용성과 NPU의 특화된 성능을 결합하려는 시도가 대표적이다. 하이퍼비주얼에이아이와 같은 기업은 GPU와 NPU를 통합 설계해 다양한 연산 방식에 유연하게 대응할 수 있을뿐 아니라 전력 효율도 개선시켰다.
하이퍼비주얼에이아이는 GPU와 NPU가 메모리를 공유해 각각 병렬연산과 행렬연산을 전담하는 방식으로 칩을 설계했으며, 이에 따라 기존의 이종 연산 코어(CPU, DSP, NPU) 간 분리된 연산 구조에서 발생하던 병목 현상, 메모리 접근 지연, 복잡한 파이프라인 문제를 해결했다.
한국형 AI 반도체가 엔비디아의 벽을 넘기 위해서는 단순히 특정 성능의 우위를 넘어, 빠르게 변화하는 AI 환경에 적응할 수 있는 능력과 혁신적인 설계 방안을 확보하는 것이 핵심 과제가 될 전망이다.