subvisual


이영민 교수

세부전공      HW/SW 통합설계, GPU 컴퓨팅, 고성능 컴퓨터 시스템
학     력       서울대학교 공학박사
연  구  실     고성능 인공지능 시스템 연구실
Email           ymyi@sogang.ac.kr

연구실 소개

연구실명
고성능 인공지능 시스템 연구실
위치
CY411
연락처
02-710-2541
홈페이지
https://aisys.sogang.ac.kr

연구분야
AI 모델의 연산 및 메모리 요구량이 갈수록 증가함에 따라, 효율적인 학습과 추론이 가능한 AI 시스템 연구의 중요성이 높아지고 있다. 본 연구실에서는 서버와 임베디드 시스템에 이르는 다양한 시스템, 특히 CPU, GPU, NPU가 혼재된 이기종 시스템에서 AI 모델을 효율적으로 학습 또는 추론하는 고성능 AI시스템에 대한 설계를 주제로 연구하며, 트랜스포머 알고리즘과 GPU 및 HW시스템에 대한 제반 이해를 기반으로 한 통합적인 설계 방법론을 취한다. 

현재, 구체적으로 아래와 같은 내용들을 연구한다.


온디바이스 LLM 추론기
임베디드 GPU나 SoC에서 효율적인 LLM 추론을 위한 HW/SW 통합 설계

모델 경량화, 입력 희소화 등 다양한 최적화 기법

주어진 LLM 모델과 HW 시스템에 최적인 설정 도출을 위한 설계공간 자동탐색


신경망 자동탐색 (NAS: Neural Architecture Search)
제약조건을 만족하는 최적의 신경망에 대한 자동 탐색 및 설계

정확도를 만족하면서 희소성을 향상시키는 신경망 자동탐색 기법

마이크로컨트롤러와 같은 소형 시스템에서 구동가능한 딥러닝 추론시스템


AI 가속기
HLS 기반 AI 가속기의 설계 및 검증

AI 가속기 성능예측 및 이에 기반한 설계공간탐색


거대언어모델을 위한 3차원 딥러닝 병렬화

파이프라인 병렬성, 텐서 병렬성, 데이터 병렬성을 모두 활용하는 효율적인 다중 GPU 시스템의 설계

이기종 다중 GPU 시스템 활용에 따른 넓은 설계공간을 효율적으로 탐색