‘그녀’가 현실로 왔다

‘그녀’가 현실로 왔다

민나리 기자
민나리 기자
입력 2024-05-14 23:21
수정 2024-05-14 23:44
  • 기사 읽어주기
    다시듣기
  • 글씨 크기 조절
  • 댓글
    14

영화 ‘her’처럼… 실시간 대화로 감정까지 나누는 AI

오픈AI ‘GPT-4o’ 전격 출시

보고 듣고 약 0.23초 만에 응답
한국어 등 50개 언어 무료 제공
구글 연례행사 전날 기습 공개
이미지 확대
스파이크 존즈 감독이 연출한 SF 멜로 영화인 ‘그녀’(her·2013)의 영화 포스터. 2025년 미국 로스앤젤레스에서 인공지능(AI) 서맨사와 사랑에 빠지는 주인공 테오도르(호아킨 피닉스 분)가 정면을 응시하고 있다.
스파이크 존즈 감독이 연출한 SF 멜로 영화인 ‘그녀’(her·2013)의 영화 포스터. 2025년 미국 로스앤젤레스에서 인공지능(AI) 서맨사와 사랑에 빠지는 주인공 테오도르(호아킨 피닉스 분)가 정면을 응시하고 있다.
“이름이 있나요?”(주인공 테오도르)

“음… 서맨사예요.”(인공지능·AI)

“정말요? 어디서 그 이름을 가져왔죠?”

“제가 저에게 서맨사라는 이름을 지어 줬어요.”

AI와 사랑에 빠지는 한 남성의 이야기를 담은 스파이크 존즈 감독의 영화 ‘그녀’(her)에는 주인공이 AI에게 이름을 묻는 장면이 나온다. AI는 자신의 이름을 ‘서맨사’라고 소개하는데, ‘울림이 좋다’는 이유로 스스로에게 붙여 줬다고 설명한다. 서맨사는 테오도르의 질문을 듣자마자 0.01초 만에 ‘아기 이름 짓는 법’이라는 책에 등장하는 1만 800개의 이름 중 가장 마음에 드는 이름을 ‘스스로’ 골랐다.

챗GPT 개발사인 오픈AI가 13일(현지시간) 온라인 신제품 발표 행사를 통해 사람처럼 ‘보고 듣고 말하는’ 새로운 AI 모델인 ‘GPT-4o’ (GPT-포오)를 공개하자 영화 ‘그녀’의 실현이 머지않았다는 기대가 커지고 있다. 샘 올트먼 오픈AI 최고경영자(CEO)도 지난해 이 영화에서 AI 개발에 대한영감을 얻었다고 말한 적 있으며, 이날 행사 종료 후 자신의 엑스(X·옛 트위터)에 ‘her’라는 단어를 게시하며 영화를 연상시켰다.

이날 오픈AI가 공개한 GPT-4o의 ‘o’는 ‘옴니모델’(omnimodel)을 의미하는데 여기서 omni는 라틴어로 ‘모든’이란 뜻을 지니고 있다. 멀티모달을 넘어선 GPT-4o는 글자(텍스트)는 물론 청각과 시각으로 입력된 정보를 추론하고 실시간으로 그 결과를 제공한다.

이날 오픈AI는 간단한 수식 풀이 과정을 GPT-4o가 도와주는 모습을 시연했는데, 수식을 글자로 직접 입력할 필요가 없었다. “정답을 말하지 말고 풀이 과정을 도와 달라”는 요청과 함께 카메라를 통해 ‘3x+1=4’라는 수식을 보여 주자 GPT-4o는 “x의 값을 구하기 위해선 x를 제외한 모든 숫자를 한쪽으로 모이게 해야 한다”며 풀이 과정을 차근차근 설명했다. 다양한 목소리와 감정, 톤을 바꿔 가며 대화를 나누는 것도 가능했다.
이미지 확대
미라 무라티 오픈AI의 최고기술책임자(CTO)가 13일(현지시간) 온라인 신제품 발표 행사에서 오픈AI의 새로운 플래그십 AI모델인 ‘GPT-4o’를 선보이고 있다. 무라티 CTO는 “사용 편의성에 관해 우리가 정말로 큰 진전을 이뤘다고 생각하는 것은 이번이 처음”이라고 말했다. 오픈AI 라이브 스트림 캡처
미라 무라티 오픈AI의 최고기술책임자(CTO)가 13일(현지시간) 온라인 신제품 발표 행사에서 오픈AI의 새로운 플래그십 AI모델인 ‘GPT-4o’를 선보이고 있다. 무라티 CTO는 “사용 편의성에 관해 우리가 정말로 큰 진전을 이뤘다고 생각하는 것은 이번이 처음”이라고 말했다.
오픈AI 라이브 스트림 캡처
시연자가 “잠을 잘 자지 못하는 친구를 위해 이야기를 들려 달라”고 요청하자 즉시 동화를 만들어 읊어 줬고 “좀더 극적인 말투로 해 달라”고 하자 성우처럼 감정을 추가한 목소리로 바꿨다. 놀라운 점은 이러한 과정이 사람과 대화하는 것처럼 빠른 속도로 이뤄졌다는 점이다. 오픈AI에 따르면 GPT-4o의 응답 시간은 평균 232밀리초(밀리초·1000분의1초)로 평균 320밀리초에 불과한 인간을 앞선다. 이전 모델인 GPT-3.5의 평균 응답 시간은 2.8초였으며, GPT-4는 5.4초였다.

GPT-4o는 이날부터 글로벌 챗GPT 사용자들에게 순차적으로 적용될 예정이다. 지원 언어는 한국어를 포함해 50개다. 모든 사용자에게 무료로 공개되는 대신 유료 구독자인 챗GPT 플러스 사용자는 한 번에 입력할 수 있는 메시지 양이 무료 이용자보다 5배 더 많다. 이날 시연된 ‘AI음성 모드’는 몇 주 내에 공개될 예정이다.

이날 오픈AI의 GPT-4o 발표는 경쟁사 구글의 연례 최대 행사인 구글 연례 개발자 회의(IO)를 하루 앞두고 기습적으로 이뤄졌다. 오픈AI가 AI 기반의 검색엔진을 공개할 거란 예상과는 달리 이날 행사에선 이에 대한 언급은 없었지만, IO를 앞둔 구글 입장에선 스포트라이트를 뺏긴 상황이 됐다. 구글이 14일(현지시간) 개최할 IO에서 어떤 내용을 발표할 것인지는 알려지지 않았지만 업계에선 구글의 AI 모델인 ‘제미나이’의 업그레이드와 관련된 내용이 담겨 있을 것으로 전망하고 있다. GPT-4o와의 비교 역시 불가피해진 셈이다.
이미지 확대
구글은 지난해 구글 IO 행사 이후 선보인 자사의 첫 거대언어모델(LLM)인 제미나이를 통해 자사의 검색엔진, 지도, 운영체제(OS) 등을 강화하는 방안을 모색해 왔다. 그러나 오답 제시 사례가 꾸준히 발견되면서 데이터 학습 측면에서 오픈AI의 챗GPT에 비해 성능이 뒤처진다는 평가를 받았다. 올해 행사에서는 생성형 AI와 검색을 융합하는 방법 등을 다룰 것으로 보이는데, GPT-4o와 마찬가지로 AI와의 대화나 가상체험을 위한 AI의 이미지 생성 기능 등이 언급될 가능성이 점쳐지고 있다.

오픈AI의 추격자로 나선 구글은 바둑 AI 프로그램인 알파고를 개발한 딥마인드의 창업자인 데미스 허사비스를 전면에 내세운 상태다. ‘알파고의 아버지’로도 불리는 허사비스는 이날 구글의 IO 무대에 올라 직접 구글의 AI 기능을 발표할 예정인데, 허사비스가 IO 무대에 오르는 것은 이번이 처음인 만큼 획기적인 AI 전략이 발표될 가능성도 언급된다. 애플 역시 다음달 10일부터 닷새간 열리는 연례 개발자회의(WWDC24)에서 AI 기능이 대거 추가된 iOS 18을 발표할 것으로 예상된다. AI 신기능을 두고 앞서 공개된 경쟁사들의 AI폰처럼 음성 기록, 통역, 일정 관리 등의 기능이 추가될 것이라는 관측이 지배적이다. 애플의 음성 비서인 ‘시리’(Siri)에 AI가 적용돼 활용도가 한층 높아질 것이라는 분석이다.

AI 경쟁에서 ‘지각생’ 평가를 받는 애플은 그간 오픈AI의 챗GPT, 구글의 제미나이 등과 AI 협업을 추진해 왔는데, 최근엔 오픈AI와의 협상이 마무리 단계에 접어든 것으로 알려졌다. 계약이 임박하면서 애플이 챗GPT를 차세대 시리는 물론 iOS 18 전반에 장착할 가능성이 커졌다. 다만 애플이 제미나이가 있는 구글 모회사 알파벳과도 비슷한 협상을 진행 중인 만큼 챗GPT와 독점 계약을 맺지 않고 제미나이까지 함께 탑재할 가능성도 거론되고 있다.

한편 오픈AI의 최대 라이벌로 꼽히는 미국 스타트업 ‘앤스로픽’은 이날 14일부터 유럽 시장에 자사 AI 챗봇 ‘클로드’를 출시한다고 밝혔다. 유럽 시장은 엄격한 AI 규제 탓에 앤스로픽의 경쟁자들이 고전하고 있는데, 오픈AI는 챗GPT와 관련해 이탈리아 등에서 개인정보보호법 위반 조사를 받고 있으며, 구글은 제미나이를 아직 유럽에서 출시하지 못했다.
2024-05-15 1면
close button
많이 본 뉴스
1 / 3
전북특별자치도 2036년 하계올림픽 유치 가능할까?
전북도가 2036년 하계올림픽 유치 도전을 공식화했습니다. 전북도는 오래전부터 유치를 준비해 왔다며 자신감을 보였지만 지난해 ‘세계잼버리’ 부실운영으로 여론의 뭇매를 맞은 상황이라 유치는 쉽지 않을 것이라는 우려도 있습니다. 전북도의 올림픽 유치 여러분의 생각은 어떤가요?
가능하다
불가능하다
광고삭제
광고삭제
위로