인텔은 14일(현지시각) 2025 OCP 글로벌 서밋(2025 OCP Global Summit)에서, 자사 AI 가속기 포트폴리오에 추가되는 주요 제품인 인텔 데이터센터용 GPU 신제품 코드명 크레센트 아일랜드(Crescent Island)를 발표했다. 이 GPU는 증가하는 AI 추론 워크로드 수요를 충족하도록 설계되었으며, 고용량 메모리·에너지 효율적인 성능을 제공한다.
인텔 사친 카티(Sachin Katti) 최고기술책임자(CTO)는 “인공지능(AI)은 정적 학습에서 에이전트형 AI가 주도하는 실시간·전역 추론으로 전환되고 있다”며 “이러한 복잡한 워크로드를 확장하려면 적절한 실리콘을 적절한 작업에 매칭하는 이종 시스템이 필요하다. 인텔의 Xe 아키텍처 데이터센터 GPU는 토큰 처리량이 급증함에 따라 고객이 필요로 하는 효율적인 헤드룸 성능과 더 큰 가치를 제공할 것”이라고 밝혔다.
추론이 주요 AI 워크로드로 자리잡으며, 강력한 칩 이상의 요소, 즉 시스템 차원의 혁신이 성공을 가늠하는 주요 요소가 되었다. 하드웨어부터 오케스트레이션까지, 추론은 다양한 컴퓨팅 유형을 개발자 중심의 개방형 소프트웨어 스택과 통합하는 워크로드 중심의 개방형 접근 방식을 필요로 하며, 이러한 접근 방식은 배포 및 확장이 용이한 시스템으로 제공된다.
인텔은 인텔 제온 6 프로세서, 인텔 GPU를 기반으로 구축한 솔루션을 통해 AI PC부터 데이터 센터, 산업용 엣지까지 엔드 투 엔드(end-to-end) 솔루션을 제공할 수 있는 독보적인 입지를 갖추고 있다.
인텔은 성능, 에너지 효율성, 개발자 연속성을 위한 시스템 공동 설계 및 OCP(Open Compute Project)와 같은 커뮤니티와의 협력을 통해 AI 추론이 가장 필요한 모든 곳에서 실행될 수 있도록 지원하고 있다.
새로운 데이터센터용 GPU 코드명 크레센트 아일랜드로 명명된 새로운 데이터센터 GPU는 공랭식 엔터프라이즈 서버에 맞춰 전력 및 비용 최적화를 이루었으며, 추론용 워크플로우에 최적화된 대용량 메모리 및 대역폭을 제공하도록 설계되었다.
주요 특징은 다음과 같다. 와트당 성능(PPW)이 최적화된 Xe3P 마이크로아키텍처 160GB LPDDR5X 메모리 "서비스형 토큰(Token-as-a-Service)" 공급업체 및 추론 사용 사례에 적합한 광범위한 데이터 유형 지원
인텔의 이기종 AI 시스템을 위한 개방형 통합 소프트웨어 스택은 조기 최적화 및 이터레이션(iteration) 작업이 가능하도록 현재 아크 프로 B(Arc Pro B) 시리즈 GPU에서 개발 및 테스트 중이다. 새로운 데이터센터용 GPU(코드명: 크레센트 아일랜드)의 고객 샘플링은 2026년 하반기에 제공될 예정이다.
등록순 최신순 댓글순