Apr 19, 2023
AI 및 DSP 워크로드를 위한 Flex Logix 구성 가능 하드웨어 IP는 FPGA, 텐서 유닛 및 소프트웨어를 융합합니다.
오늘은 AI, DSP, FPGA, IP, SoC에 대해 이야기해보겠습니다. 일반적으로 이러한
오늘은 AI, DSP, FPGA, IP, SoC에 대해 이야기해보겠습니다. 일반적으로 이러한 것들이 모두 함께 진행되는 것은 아닙니다. AI 및 DSP 알고리즘은 일반적으로 서로 다른 종류의 계산을 포함하지만 확실히 FPGA는 AI 및 DSP 알고리즘을 구현하는 데 사용되었습니다. ("단일 칩 DSP의 간략한 역사, 2부" 참조) DSP 설계는 풍부한 MAC(곱셈기/누산기) 덕분에 FPGA 구현에 크게 머물렀고 AI 교육은 GPU로 마이그레이션되었습니다. 요즘 AI 추론은 증강된 CPU, 전용 칩, SoC용으로 특별히 제작된 AI 엔진, 심지어 FPGA를 포함한 여러 하드웨어 구현으로 이동하고 있습니다. 이제 Flex Logix는 AI 및 DSP 워크로드를 실행하도록 특별히 설계된 구성 가능한 하드웨어 IP라는 또 다른 대안을 도입했습니다.
2014년에 설립된 Flex Logix는 구성 가능한 하드웨어 IP 분야의 새로운 기업이 아닙니다. 이 회사는 거의 10년 동안 EFLEX 임베디드 FPGA(eFPGA) IP 타일과 소프트웨어를 제공해 왔습니다. Flex Logix의 공동 창업자이자 CEO인 Geoff Tate에 따르면, 현재 이 회사는 EFLEX eFPGA를 통합한 23개의 서로 다른 칩을 대량 생산하는 여러 국방 관련 고객과 6개 이상의 상용 고객을 보유하고 있습니다. 이러한 장치의 예로는 MIMO 안테나 인터페이스용 다중 송신 및 수신 디지털 프런트 엔드와 함께 100K-LUT(조회 테이블) eFPGA를 통합하는 이름 없는 고객의 고급 5G MIMO SoC부터 작고 저렴한 새로운 라인에 이르기까지 다양합니다. 1K~4K LUT를 갖춘 Renesas ForgeFPGA는 볼륨 비용이 50센트 미만입니다.
그림 1: 작고 저렴한 Renesas ForgeFPGA는 Flex Logix FPGA IP를 기반으로 하며 개발 도구는 Flex Logix에서 제공하는 도구를 기반으로 합니다. 이미지 출처: Flex Logix
Renesas ForgeFPGA는 내 친구이자 동료인 Max Maxfield가 이전에 쓴 Silego 장치의 계보를 추적합니다. ("아주 일어나지 않았거나 그랬나요?" 및 "Renesas가 멋진 ForgeFPGA 제품군을 발표합니다." 참조) Dialog Semiconductor는 2017년에 Silego를 인수했고, 2021년에 Renesas가 다시 인수하여 Renesas가 FPGA 공급업체가 되었습니다. 작은 물고기는 더 큰 물고기에게 먹히고, 그 물고기는 더 큰 물고기에게 먹히게 됩니다.
Renesas FPGA는 ForceFlex 장치 구성을 위해 개발자에게 직접 Flex Logix FPGA 소프트웨어 버전을 제공합니다. 이는 Flex Logix가 사용 가능한 소프트웨어를 시스템 개발자에게 직접 제공할 수 있음을 나타냅니다. 이는 하드웨어 개발 배경이 없는 데이터 과학자와 프로그래머가 제품을 쉽게 사용할 수 있도록 하는 AI 시장에 진입할 때 중요한 기능입니다.
여러 면에서 이러한 새로운 Flex Logix InferX 하드웨어 타일은 회사의 eFPGA 타일까지 거슬러 올라갑니다. InferX IP 타일은 특정 파운드리의 특정 IC 제조 노드에 대해 Flex Logix가 고객에게 제공하는 강화된 IP입니다. 이러한 방식으로 InferX IP는 회사의 EFLEX FPGA IP와 같습니다. InferX IP의 경우 Flex Logix는 처음에는 TSMC의 N5 5nm 프로세스 노드를 대상으로 했지만 회사에서는 모든 FinFET 프로세스가 이 IP의 후보라고 말합니다.
또한 AI 및 DSP 알고리즘은 수많은 곱셈/누산 작업을 실행합니다. Flex Logix eFPGA 타일을 포함한 FPGA는 일반적으로 이러한 모든 작업을 실시간으로 실행하기 위해 매우 많은 곱셈기/누산기를 제공하지만 이러한 MAC는 할머니의 맛있는 금요일 밤 쌀 푸딩 조리법에 나오는 건포도처럼 FPGA 패브릭에 내장되어 있습니다. 상대적으로 적고 그 사이에 멀었습니다. FPGA에서는 강화된 MAC이 FPGA의 상호 연결 패브릭으로 둘러싸여 있어 모든 종류의 실행 파이프라인을 생성할 수 있습니다. 그러나 AI 및 DSP 알고리즘에는 그러한 종류의 유연성이 필요하지 않습니다. 계산 파이프라인이 훨씬 더 규칙적이므로 FPGA 라우팅 구조의 실리콘 오버헤드가 불필요하므로 제거할 수 있습니다. Tate에 따르면 이러한 실리콘 오버헤드는 상당하며 MAC 내부 및 주변 영역에 있는 실리콘의 80%에 달할 수 있습니다.
대신 Flex Logix는 MAC 설계를 가져와 AI 및 DSP 작업을 위해 개선했으며 SoC가 설계되는 방식과 마찬가지로 강화된 상호 연결을 통해 다수의 MAC를 상호 연결하는 유선 텐서 유닛을 만들었습니다. 결과 InferX 하드웨어 IP 타일은 아래 그림 2와 같이 이러한 텐서 유닛 4개를 개별 L2 SRAM 캐시 및 텐서 유닛을 구성하고 상호 연결하는 데 사용되는 작은 eFPGA와 결합합니다.