이영민 교수 |
세부전공 HW/SW 통합설계, GPU 컴퓨팅, 고성능 컴퓨터 시스템 |
연구실 소개 현재, 구체적으로 아래와 같은 내용들을 연구한다. 온디바이스 LLM 추론기 모델 경량화, 입력 희소화 등 다양한 최적화 기법 주어진 LLM 모델과 HW 시스템에 최적인 설정 도출을 위한 설계공간 자동탐색 신경망 자동탐색 (NAS: Neural Architecture Search) 정확도를 만족하면서 희소성을 향상시키는 신경망 자동탐색 기법 마이크로컨트롤러와 같은 소형 시스템에서 구동가능한 딥러닝 추론시스템 AI 가속기 AI 가속기 성능예측 및 이에 기반한 설계공간탐색 거대언어모델을 위한 3차원 딥러닝 병렬화 파이프라인 병렬성, 텐서 병렬성, 데이터 병렬성을 모두 활용하는 효율적인 다중 GPU 시스템의 설계 이기종 다중 GPU 시스템 활용에 따른 넓은 설계공간을 효율적으로 탐색 |