2002년 SF영화 ‘마이너리티 리포트’ 중 한 장면.
20세기 폭스사 제공
20세기 폭스사 제공
광주과학기술원(GIST) AI대학원 연구팀은 거대언어모델(LLM) 기술을 활용해 인간의 사고를 모방한 프로세스로 보행자 경로를 정확히 예측하는 알고리즘을 개발했다고 18일 밝혔다.
이번 연구 결과는 미국 시애틀에서 열리는 컴퓨터 공학 분야 국제 학술대회인 ‘컴퓨터비전 및 패턴인식 학회’(CVPR)서 6월 19일 발표될 예정이다.
자율주행차나 배달 로봇 등 서비스 로보틱스 분야에서 교통 법규 준수와 시민 안전 보장을 위해 보행자 동선을 미리 파악하고 예측하는 것은 중요하다. 이 때문에 최근에는 비디오 영상을 통해 보행 가능 경로와 최종 도착 위치를 추정하는 연구가 활발하다.
그러나 지금까지 인공지능(AI)을 활용해 보행자 경로를 예측하는 방법은 인간 행동 역학을 수치 회귀 기법이라는 수학적 방법론으로 모델링하는 것이었다. 문제는 숫자만 이용해 가능성 있는 위치를 예측하기 때문에 인간의 사고를 대신하거나 유추한다고 보기는 어렵다.
이번 연구의 접근 방법과 기존 방법의 비교
숫자로 구성된 위치 좌표만을 사용하는 기존 예측기술과 달리, 이번에 개발된 기술은 거대언어모델의 지식을 활용해 인간과 같은 추론 방식을 모사하여 설명할 수 있고 정확한 미래를 예측할 수 있다.
GIST 제공
GIST 제공
연구를 이끈 전해곤 GIST 교수는 “이번 연구 성과는 거대언어모델이 인간 사고방식을 모사해 사회적 관계성을 추론하고, 인간의 행동 역학을 배워 미래 행동을 예측했다는 데 의미가 크다”라면서 “LLM이 문자를 넘어 물리 역학적 추론까지 가능하게 될 경우 흔히 강인공지능이라고 부르는 인공 일반지능(AGI)으로 기술 확장과 실용화를 앞당길 수 있을 것”이라고 설명했다.