요약
최근 인공지능 모델의 개발 방향은 하나의 모델로 언어, 음성 및 이미지 처리 등 다양한 애플리케이션에 활용함과 동시에 대형화의 방향으로 진보하고 있다. 이러한 대형 트랜스포머 기반 딥러닝 모델은 추론 및 학습 가속에 걸리는 시간을 크게 증가시켜 모델 개발뿐만 아니라 모델 기반 서비스 제공에 어려움을 유발한다. 이러한 문제를 해결하기 위하여 대형 모델 추론 및 학습에 딥러닝 가속기를 활용하고자 하는 노력이 지속해서 증가하고있다.본 원고에서는 딥러닝 모델을 딥러닝 가속기로 구동하는 데 필요한 가장 중요한 기술 중 하나인 딥러닝 컴파일러의 개발 현황 및 기술을 소개하고자 한다.