국내 AI 반도체 기업 딥엑스가 수백 채널 규모의 영상 AI 분석을 30W(와트) 수준의 전력으로 처리하는 비디오 인텔리전스 전용 칩셋 ‘DX-H1 V-NPU’를 출시했다고 8일 밝혔다.
DX-H1 V-NPU는 그동안 GPU 서버와 별도 코덱 장비로 나뉘어 이뤄지던 영상 입력, 압축, AI 추론 과정을 하나의 카드로 통합해 전력과 비용, 시스템 복잡도를 낮춘 것이 특징이다.
딥엑스는 이 제품이 영상 AI 인프라의 기본 단위를 GPU에서 V-NPU로 전환하는 계기가 될 것으로 설명했다.
구체적으로는 동일 채널 기준으로 GPU 대비 약 80%의 하드웨어 비용과 약 85%의 전력 비용을 절감하면서 24시간 실시간 추론 성능을 유지한다고 밝혔다.
GPU가 범용 연산에 강점을 지닌 반면, 다채널 영상 입출력과 스트리밍 처리에는 최적화되지 않은 구조라는 점도 언급됐다.
향후 DX-H1 V-NPU는 스마트시티, 교통 관제, 국가 인프라 등 다양한 분야에서 영상 AI 기반 서비스 확대에 활용될 전망이다.
이 제품은 내년 1월 미국 라스베이거스에서 열리는 CES 2026에서 혁신상을 수상했으며, 해당 행사에서 공식 공개될 예정이다.
딥엑스 관계자는 “대규모 영상 AI가 범용 GPU 연산의 여분을 쓰는 방식에서 벗어나 전용 칩셋 기반 구조로 이동하게 될 것”이라고 말했다.
한편 영상 기반 AI 인프라가 고도화되면서 GPU 중심 구조가 가진 전력 소모와 처리 효율 측면의 한계가 점차 부각되면서 특정 연산에 최적화된 ‘NPU’의 필요성이 상승하는 추세다.
GPU는 범용 병렬 가속기로서 대규모 모델 학습과 복잡한 행렬 연산 수행에 유리하지만, 다채널 영상 스트리밍처럼 입력량이 크고 실시간 특성이 요구되는 경우 메모리 접근 부담이 커지는 구조적 제약이 지적돼 왔다.
반면 NPU는 신경망 연산에 필요한 곱셈·누산, 텐서 연산을 중심으로 설계돼 데이터 이동을 최소화하며 와트당 성능을 높이는 방향으로 발전해 왔다.
또 온칩 메모리 기반 데이터 재사용 구조를 통해 외부 메모리 접근을 줄이고 지연 시간을 낮추는 데 초점이 맞춰져 있으며, 특히 장시간 실시간 추론 과정에서 안정적인 에너지 효율을 확보하기 위해 출력 고정 방식의 데이터 흐름을 활용하는 점이 특징이다.
이 방식은 영상 프레임 단위로 반복 계산되는 연산 특성에 적합해 고정 비용이 큰 데이터 이동을 최소화하는 구조로 설명된다.
구체적으로 다채널 영상 처리 분야는 차세대 기술 개발에서 메모리 병목 완화라는 과제가 지속적으로 꼽혀 왔다.
이때 NPU는 입력과 가중치를 온칩 SRAM에 유지해 반복 연산 시 데이터 재사용률을 높이고, 외부 DRAM 접근 횟수를 줄임으로써 처리 효율을 개선하도록 설계됐다.
이는 영상 AI의 특성상 수백 개의 채널이 동시에 입력될 때 GPU 대비 전력 소비를 낮추면서도 처리량을 유지할 수 있는 기제로 작용한다.
GPU와 NPU의 설계 차이는 워크로드 적합성 측면에서도 명확히 구분된다.
대규모 모델 학습과 같은 고도 연산 집약형 작업은 GPU의 병렬 코어가 여전히 우위를 보여왔으나, 전력 제약이 크고 지연 시간이 민감한 엣지·도심 인프라·스마트시티 분야에서는 NPU의 추론 특화 구조가 효율성 측면에서 경쟁력을 보이는 흐름이 관찰된다.
이에 따라 앞으로 범용 구조에서는 GPU가 주로 사용되더라도 특정 분야에서는 NPU를 사용하면서 영상 입력부터 추론까지 일관된 처리를 구현해 서버 밀도를 높이고 총소유비용(TCO)을 낮추려는 시도가 이어질 전망이다.






![[금융진단] 미 증시, 지정학 완화·빅테크 반등에 상승](https://images.jkn.co.kr/data/images/full/982892/image.jpg?w=288&h=168&l=50&t=40)

