하드웨어 및 소프트웨어 설계에서 가장 빠르게 성장하고 있는 분야 중 하나는 인공지능(AI)/머신러닝(ML)
입니다. 자율 주행 차량과 같은 자율 시스템 그리고 개인 비서 앱을 위한 음성 인식에 대한 수요가
증가함에 따라 이러한 흐름은 더욱 강해지고 있습니다. 이러한 알고리즘 중 다수는 컨볼루션 신경망(CNN)
을 통해 딥러닝 시스템을 구현합니다. 컨볼루션이라는 개념은 비교적 단순하지만, CNN을 ML 분야에
응용함으로써 수십 가지의 신경망 접근 방식이 탄생했습니다. 이들 네트워크는 CPU/GPU에서
소프트웨어로 실행되지만, 해당 솔루션의 전력 요구사항 때문에 대다수의 추론 응용 분야(대부분 휴대
가능한 저전력 기기를 사용함)에서 실용적이지 못합니다. 전력/성능을 향상시키기 위해 하드웨어 팀들은
ML 하드웨어 가속화 블록을 만들기 위해 힘을 모으고 있습니다. 하지만 이러한 컴퓨팅 집약적 네트워크를
하드웨어, 특히 에너지 효율적인 하드웨어에 통합할 때 기존의 RTL 설계 플로우를 채택할 경우 상당한
시간이 걸리는 프로세스입니다.