기존 AI영상 생성 모델 한계 극복 성과
![한보형 서울대 전기·정보공학부 교수 [출처=과학기술정보통신부]](https://cdn.ebn.co.kr/news/photo/202510/1680964_698322_2025.jpg)
과학기술정보통신부와 한국연구재단은 '이달의 과학기술인상' 10월 수상자로 한보형 서울대학교 전기·정보공학부 교수를 선정했다고 1일 밝혔다.
이번 수상은 '2025년 인공지능 주간(9월 30일~10월 2일)'을 맞아 인공지능(AI) 연구에서 세계적 성과를 거둔 한 교수가 주인공이 됐다.
최근 인공지능 분야에서 텍스트, 이미지, 오디오 생성은 빠르게 발전해왔지만 영상 생성은 여전히 난도가 높은 과제로 꼽힌다. 기존 확산(diffusion) 모델은 설명에 맞는 영상을 만드는 데 활용되지만 생성 길이가 늘어날수록 메모리 사용량이 기하급수적으로 증가해 활용에 큰 한계를 드러냈다.
한 교수는 이 문제를 해결하기 위해 '피포 디퓨전(FIFO-Diffusion)'이라는 새로운 추론 알고리즘을 고안했다.
이 방법은 '대각선 디노이징(diagonal denoising)' 기법을 도입해 프레임을 컨베이어 벨트처럼 순차적으로 배치하고 앞쪽부터 차례로 노이즈를 제거하며 영상을 생성하는 방식이다.
해당 기법을 이용하면 영상 길이가 늘어나더라도 메모리 사용량은 일정하게 유지돼 기존 모델의 병목 문제를 극복할 수 있다.
여기에 긴 시퀀스를 나눠 안정성을 높이는 '잠재 구간 분할(Latent Partitioning)', 깨끗한 프레임을 활용해 화질을 개선하는 '미래 참조 디노이징(Lookahead Denoising)' 기법을 추가 적용해 장시간 영상에서도 선명한 화질과 시간적 일관성을 확보하는 데 성공했다.
이번 성과는 지난해 12월 세계적 권위의 학회인 신경정보처리시스템학회(NeurIPS)에 발표됐다. 연구팀이 공개한 소스코드는 깃허브에서 450개 이상의 별(Star)을 얻으며 전 세계 연구자와 개발자들에게 활발히 활용되고 있다.
한 교수는 "이번 연구는 기존 영상 생성 모델의 한계를 새로운 추론 방식으로 극복했다는 데 의미가 크다"며 "앞으로 영화, 게임, 광고 등 콘텐츠 산업 전반에서 제작 비용과 시간을 크게 단축하는 데 기여할 수 있을 것"이라고 말했다.
'이달의 과학기술인상'은 최근 3년간 독보적인 연구 성과를 통해 과학기술 발전에 기여한 연구자를 매달 1명씩 뽑아 수여한다. 수상자에게는 과기정통부 장관상과 함께 상금 1000만원이 주어진다.