바이트

소식

홈페이지홈페이지 / 소식 / 바이트

Sep 26, 2023

바이트

인공지능(AI) 알고리즘은 더 크고 더 강력하게 실행됩니다.

더 크고 강력한 하드웨어에서 실행되는 인공 지능(AI) 알고리즘이 종종 주목을 받는 반면, 엣지 AI의 중요성을 과소평가해서는 안 됩니다. 엣지 AI(Edge AI)는 클라우드 기반 솔루션에만 의존하지 않고 스마트폰, 카메라, 센서, 기타 사물인터넷 기기 등 로컬 디바이스에 AI 알고리즘을 구현하는 것을 말한다. 이러한 분산형 접근 방식은 수많은 이점을 제공하고 광범위한 적용 가능성을 열어줍니다.

엣지 AI의 주요 장점 중 하나는 대기 시간 단축입니다. 엣지 AI는 장치 자체에서 로컬로 데이터를 처리함으로써 클라우드로 왕복할 필요가 없어 응답 시간이 더 빨라집니다. 이 실시간 기능은 자율주행차, 산업 자동화, 중요 인프라 모니터링 등 즉각적인 의사결정이 필수적인 시나리오에서 매우 중요합니다. 또한 엣지 AI는 민감한 데이터가 로컬 장치에 남아 있으므로 개인정보 보호와 보안을 강화하여 데이터 침해 위험을 줄이고 사용자 기밀성을 보장합니다.

수많은 장점에도 불구하고 복잡한 객체 감지 또는 딥 러닝 모델과 같은 리소스 집약적인 알고리즘을 엣지 장치에서 실행하는 것은 상당한 과제를 안겨줍니다. 엣지 컴퓨팅 장치는 클라우드 기반 하드웨어에 비해 컴퓨팅 성능, 메모리, 에너지 리소스가 제한적인 경우가 많습니다. 효율적인 작동을 보장하려면 알고리즘 정확도와 장치 제약 사이의 균형을 맞추는 것이 중요합니다. 이러한 알고리즘이 에지 장치에서 제대로 작동하려면 모델 압축, 양자화 및 효율적인 추론 기술과 같은 최적화가 필요합니다.

이미지나 비디오 속 객체를 이해하고 인식하는 것은 시각적 인식의 기본 작업이므로 객체 감지 알고리즘은 다양한 산업과 응용 분야에서 특히 중요합니다. MobileNet SSD보다 최대 30배 빠르게 실행되지만 많은 사용 사례에서 200KB 미만의 메모리가 필요한 Edge Impulse의 FOMO 알고리즘과 같이 리소스가 제한된 엣지 장치에 객체 감지 모델을 적용하는 데 큰 진전이 있었습니다. 그러나 이렇게 중요하고 다양한 응용 분야에는 앞으로 더 발전할 여지가 많습니다.

이 분야에 가장 최근에 참여한 사람은 ETH Zurich의 프로젝트 기반 학습 센터의 연구원 팀입니다. 그들은 TinyissimoYOLO라고 부르는 매우 유연하고 메모리 효율적이며 초경량 객체 감지 네트워크를 개발했습니다. 이 모델에 적용된 최적화 덕분에 저전력 마이크로컨트롤러에서 실행하는 데 적합합니다.

TinyissimoYOLO는 널리 사용되는 YOLO 알고리즘의 아키텍처를 기반으로 하는 CNN(컨벌루션 신경망)입니다. 이는 3 x 3 커널과 완전히 연결된 출력 레이어를 갖춘 양자화된 컨벌루션 레이어로 구성되었습니다. 컨벌루션 레이어와 완전 연결 선형 레이어 모두 최신 장치의 하드웨어 및 소프트웨어 툴체인에서 크게 최적화되어 있어 TinyissimoYOLO의 속도와 효율성이 향상됩니다. 광범위한 작업에 적용할 수 있는 일반화된 객체 감지 네트워크이며, 모델 매개변수를 저장하는 데 512KB 이하의 플래시 메모리가 필요합니다.

이 모델은 Arm Cortex-M 프로세서 또는 AI 하드웨어 가속기가 탑재된 플랫폼을 포함하여 매우 적당한 요구 사항을 충족하는 거의 모든 하드웨어에 배포할 수 있습니다. Analog Devices MAX78000, Greenwaves GAP9, Sony Spresense 및 Syntiant TinyML을 포함한 다양한 장치가 TinyissimoYOLO로 테스트되었습니다.

팀은 방법을 평가하는 동안 MAX78000 보드에서 초당 180프레임의 놀라운 속도로 객체 감지를 실행할 수 있다는 사실을 발견했습니다. 그리고 이 뛰어난 성능은 추론당 196μJ에 불과한 초저에너지 소비와 함께 제공됩니다. 물론 모델이 제대로 작동하지 않으면 이 중 아무 것도 중요하지 않습니다. 그러나 놀랍게도 이 작은 모델은 훨씬 더 큰 물체 감지 알고리즘과 비교해도 성능이 비슷했습니다.

그러나 그러한 위업을 달성하려면 당연히 일부 모서리를 잘라야 합니다. 예를 들어 이미지의 입력 크기는 88 x 88 픽셀로 제한됩니다. 이는 많은 용도에 있어 해상도가 충분하지 않습니다. 또한 멀티클래스 객체 검출 문제는 객체 수가 증가할수록 어려워지기 때문에 이미지당 최대 3개의 객체를 지원한다.