“컴퓨터와 대화 이젠 자연스러워…흥미진진한 미래 볼 수 있어”
(샌프란시스코=연합뉴스) 김태종 특파원 = 2013년 개봉한 영화 ‘그녀'(her)에는 ‘사만다’라는 인공지능(AI)이 등장한다.
다른 사람의 편지를 대필해주는 회사에서 작가로 일하는 주인공은 아내와 이혼 절차를 밟는 우울한 현실 속에서 ‘사만다’를 알게 된다.
이 AI는 스스로를 단순한 운영체제가 아닌 하나의 인격체로 소개한다.
주인공은 처음에 사만다를 단순한 컴퓨터처럼 생각하다가 차츰 그 이상의 무언가를 느끼게 되고, 마침내 하나의 인격체로 느끼기 시작한다.
사만다는 주인공의 미팅 시간을 알려주는 것에서부터 주인공의 속마음까지도 들어주는 친구가 된다. 우울한 주인공을 위해 놀이동산에 가자고 제안도 한다.
AI와 사랑에 빠진다는 설정의 이 영화는 여전히 영화 그 자체이지만, 인간의 AI 기술이 이 영화를 현실로 구현해 가고 있다.
챗GPT 개발사 오픈AI가 13일(현지시간) 공개한 ‘GPT-4o'(GPT-포오)라는 이름의 이 새 AI 모델이 그것이다.
기존 모델이 프롬프트를 주로 텍스트로 했다면 ‘GPT-4o’는 이용자와 음성 대화가 가능하다. 카메라를 통해서 사물을 볼 수 있고 스피커를 통해 소리를 듣는다. 사람처럼 말을 하면서 대화할 수 있다.
텍스트를 입력하고 난 뒤 한참을 기다려야 답변을 들을 수 있는 것이 아니라 사람과 대화 속도로 질문을 주고 답변을 받을 수 있다.
영화 속 AI처럼 아직 완벽하지는 않지만, 그에 근접해 가고 있는 셈이다.
샘 올트먼 오픈AI 최고경영자(CEO)도 이날 ‘GPT-4o’를 공개한 뒤 자신의 소셜미디어 엑스(X·옛 트위터)에 이 영화를 뜻하는 ‘her'(그녀)라고 적었다.
그러면서 “새로운 음성과 영상 모드는 제가 사용한 컴퓨터 인터페이스 중 최고”라고 자평했다.
올트먼은 “(AI 모델이)영화에 나오는 AI처럼 느껴지고, 그것이 현실이라는 게 조금 놀랍다”며 “인간 수준의 반응 시간과 표현력에 도달하는 것은 큰 변화”라고 말했다.
실제 GPT-4o는 사람과 자연스럽게 대화하듯이 질문에 대한 답을 곧바로 제공한다. GPT-4o의 응답 시간은 최소 232밀리초(ms·1천분의1초), 평균 320밀리초로, 오픈AI에 따르면 이는 인간의 응답시간과 비슷하다.
이전 모델인 GPT-3.5는 평균 2.8초, GPT-4가 응답에 5.4초가 걸렸는데, GPT-4o는 사람과 같은 수준이다. 답 제공 중에 끼어들어도 대화는 끊어지지 않는다.
또 마치 감정과 표현력이 있는 것처럼 이용자의 요구에 다양한 목소리와 감정, 톤으로 바꿔가며 이야기를 들려준다.
올트먼은 “컴퓨터와 대화가 자연스럽게 느껴진 적은 없지만, 지금은 그렇지 않다”며 “그것은 빠르고, 똑똑하고, 재미있고, 자연스럽고, 도움이 된다”고 말했다.
그러면서 “컴퓨터를 이용해 어느 때보다 훨씬 더 많은 일을 할 수 있는 흥미진진한 미래를 정말로 볼 수 있다”며 “이것을 실현하기 위해 큰 노력을 기울인 팀에 큰 감사를 드린다”고 전했다.
taejong75@yna.co.kr