오랜만에 재미로 상상해보는 미래 PC 모습 시리즈(원래 시리즈로 기획한건 아니었지만)
ChatGPT가 생성형 AI의 시대를 열면서 요즘 기술계는 어딜가든 AI, AI, AI를 부르짖는 중이다. 특히 MS는 거의 AI에 사활을 걸었다 싶을 정도로 OpenAI와 긴밀하게 협력하며 GPT 기반 AI 도구를 엣지 브라우저, 오피스, 윈도우 등에 통합하기 위해 혈안이다.
그 중 가장 최근에 나온건 윈도우 11 탑재 PC에 기본 사양으로 추가될 Copilot 버튼인데, 윈도우 버튼과 오피스 버튼 이후에 윈도우 PC에 기본 사양으로 권장될 버튼이라고 한다. 뭐 그만큼 AI에 사활을 걸었다는걸 티를 내고 싶어하는 거겠지만..
애플 쪽은 꽤 일찍부터 모든 컴퓨터에 NPU가 들어가기 시작했다. 바로 뉴럴 엔진이 그것인데, OS 차원의 많은 AI 작업을 할 때 사용이 가능하다. 이미지의 텍스트를 읽어내거나, 이미지의 누끼를 따는 기능 등이 머신러닝을 이용한 기능이다.
아래 영상은 아이폰의 뉴럴 엔진을 이용해 사용자의 목소리를 학습해서 텍스트를 목소리로 합성하는 기능에 대한 동영상이다.(목소리를 잃어가는 환자들에게 상당히 중요한 기능이라고 한다.)
아무튼, 분명한건 우리가 싫어하든 좋아하든 AI 시대는 다가오고 있고 MS든 애플이든 다가오는 AI 시대에 대응할 수 있는 하드웨어나 소프트웨어를 만들기 위해 노력할 것이라는 것이다. 지금은 AI PC가 등장하기 아주 초기 단계라고 볼 수 있다.
그럼 AI 시대의 컴퓨터는 어떤 모습일까? 우리가 부르게될 AI PC라는건 어떤 디자인을 갖추고 있을까? 이전 글에서 컨텐츠의 소유가 아닌 대여가 일반적인 세상이 되는 시대의 PC를 상상해봤던 것처럼, AI 시대의 컴퓨터는 어떨지 재미로 상상해보았다.
미리 말해두지만, 나는 AI에 있어서 회의론자에 가까운 사람이다. 그리고 전문가도 아니다. 하지만 내 블로그니까 이런저런 상상 정도는 해볼 수 있을 것 같다.
우리는 왜 생성형 AI를 좋아할까?
AI PC의 모습을 상상해보기 전에, 우리가 왜 생성형 AI에 열광하는지부터 다시 생각해볼 필요가 있다. 그동안 인공지능을 활용한 것들은 많았다. 크롬에서 어떤 사이트든 훨씬 자연스러운 언어로 번역해주는 기능도, 아이폰에서 사진 누끼를 쉽게 따주는 기능도 인공지능을 활용한 기능이다.
하지만 우리는 ChatGPT가 등장하고 나서야 AI에 열광하기 시작했다. 이유는 뭘까?
나는 이 질문에는 간단하게 답할 수 있을 것 같다. LLM에 기초한 생성형 AI는 “대화”가 가능하기 때문이다. “대화”는 달리 말하면 상호작용이다. 우리가 컴퓨터를 사용하는 것도 인터페이스를 통한 상호작용이다.
컴퓨터는 일반적으로 키보드나 마우스, 또는 복잡한 프로그래밍 언어로 대화해야했지만, ChatGPT는 그런 작업을 “자연어”로 쉽게 대화할 수 있게 해주었다.
Mid Journey, ChatGPT 등 최근 각광 받는 모든 생성형 AI는 “텍스트”라는 자연어를 기계에 입력하면 쉽게 결과물로 반환해준다. 심지어 맥락을 갖고 대화도 가능하다. 예전에는 복잡한 컴퓨팅 지식을 갖고 있어야 했던 일들이 이제 내가 사용하는 언어로 손쉽게 가능해진 것이다.
말하는 밥솥
쿠쿠에서 말하는 밥솥이 처음 나왔을 때만해도, 많은 사람들은 대수롭지 않게 생각했던 것 같다. 밥솥이 말하는게 뭐가 그렇게 중요해? 밥이 다 됐는지는 램프를 보면 되잖아? 하지만 지금은 시중에 나오는 모든 밥솥이 다 말을 한다.
인간은 기본적으로 관계를 중요시하는 동물이다. 한자 인간(人間)에도 間은 “사람과 사람사이, 관계”를 뜻하는 말이다. 인간은 인간끼리만 관계를 맺는게 아니라 동물과도 관계를 맺고, 심지어 인간이 만든 기계들과도 관계를 맺는다.
밥솥이 말을 한다는 것이 그렇게 중요한 개념은 아니었을지 모르지만, 인간은 기본적으로 대화를 통해 상호작용을 하고 관계를 맺는다. 달리 말하면 인간에게 가장 직관적인 인터페이스는 “귀로 듣고 입으로 말하는 대화”라는 것이다. 말하는 밥솥은 “귀로 듣는다”는 직관적인 인터페이스를 훌륭하게 구현했던 셈이다.
자연어로 대화가 가능해진 AI PC가 궁극적으로는 말하는 밥솥처럼 인간과 가장 자연스러운 방식으로 “대화”하게 될 것이라는 것은 어렵지 않게 상상해볼 수 있다. 완성된 AI PC는 결국 음성으로 인간과 대화가 가능해질 것이다. 인간과 대화 만으로 많은 복잡한 작업들을 처리해낼 수 있을 것이다.
상상해본 AI PC의 모습
음성 인식 기술이 나날이 발전하고 있고, 컴퓨터와 스마트폰에 NPU가 탑재되면서 음성 인식 기술의 정확도는 매우 높아졌다. 위에서 봤던 애플의 사례처럼 목소리를 합성하는 기술이 스마트폰 내에서 가능할 정도가 되었다. 생성형 AI가 완성되면 우리는 컴퓨터와 완벽한 자연어로 대화가 가능할 것이다. 이런 세상에 과연 키보드가 필요할까?
밥솥이 말을하고 스마트폰이 말을 하기 시작했을 때 사람들이 열광했던 것처럼, AI PC의 시대가 되면 사람들은 컴퓨터와 음성으로 대화하기 시작할 것이다. 이유는 간단하다. 그게 가장 직관적이고 학습이 필요 없기 때문이다. 그렇게 되면 키보드와 마우스 같은 전통적인 장치들은 사라지거나 보조적인 수단이 될 것이다.
디스플레이도 없어질까? 그렇진 않을 것 같다. 인간은 시각을 통해 정보를 입력 받는다. 인류가 가장 좋아했고 가장 효과적인 정보 입력 방식은 책이었다. 책은 눈으로 본다. 우리에게 정보를 입력해줄 수 있는 가장 훌륭한 방식은 시각이기 때문에, 디스플레이는 없어지지 않을 것이다.
터치스크린은 어떨까? 인간에게 가장 직관적인 인터페이스는 대화지만, 때론 열마디 말보다 손가락으로 가리키는게 더 빠르고 정확하다. AI가 내놓은 작업물을 수정할 때, 혹은 원하는 것을 말하고자 할 때 때로는 말보다 손가락으로 가리키는게 더 빠를 것이다. 꼭 터치스크린이 아니어도 된다. 제스쳐 인터페이스가 일반적인 세상이 올 것이다.
AI PC 후보
그럼 위에서 나온 결론들을 토대로 봤을 때, 진정한 AI PC는 어떤 모습일까? 나는 상상력이 빈곤하므로 현재의 기술이나 미디어에 나왔던 것들을 중심으로 생각해봤다.
후보 1. 영화 <Her>에 나왔던 컴퓨터
영화 <Her>의 주인공 테어도어가 집과 사무실에서 사용하는 PC는 키보드와 마우스가 없다. 모든 상호 작용은 OS와 대화로만 한다. 아이맥 같은 외형의 일체형 PC에 디스플레이만 갖고 있다. 아마 위에서 상상했던 컴퓨터의 모습과 가장 닮은 PC일 것 같다.
다만 제스쳐 등의 인터페이스는 없는데, 스마트폰 같은 디바이스에 설치된 카메라를 통해 제스쳐를 인식하는 것 같은 모습이 영화에 등장한다.
후보 2. 태블릿 PC
거치형 데스크탑이 아닌 휴대용에서는 어떨까? 디스플레이만 있고 제스쳐가 중심이 되는 디바이스. 지금 기준으로는 태블릿 PC가 그런 모습에 가장 적합할 것 같다. 어느정도 크기의 디스플레이를 갖추고 있고, 음성 대화가 가능하며 터치스크린과 제스쳐 인터페이스를 갖고 있다. 아마 미래의 아이패드는 매직 키보드 같은 악세사리는 필요 없을지도.
후보 3. 안경 형태의 공간 컴퓨팅 장치
이제 곧 시작될 새로운 폼팩터의 PC는 어떨까? 애플에서 발표한 비전 프로, 오큘러스 등의 공간 컴퓨팅 장치들은 공간적 제약을 없앴다. 거의 무한한 공간의 디스플레이를 갖고 있고 제스쳐 인터페이스를 기본으로 갖고 있다. 이런 장치에 생성형 AI가 결합되면 대부분의 작업은 대화로 가능할 것이다.
하지만 지금 같은 형태의 장치는 장시간 착용시 무리가 있어서 여러번의 폼팩터 발전이 있어야 할 것 같다. 아직은 좀 요원해보이는게 사실이다.
마무리
지금까지 AI PC의 미래 모습에 대해서 살펴봤다. 이 글에서는 인터페이스를 중심으로 살펴봤지만 사실 진정한 의미의 AI PC는 넘어야할 산들이 아직 많이 존재한다. AI가 소비하는 전력, 개인정보 처리 이슈, 환각 이슈 등 AI PC가 대중적으로 사용되기 위해서는 넘어야할 작지 않은 산들이 많이 있다.
이미 지금도 생성형 AI가 통합된 하드웨어를 만들고자 하는 시도가 많이 있다. 애플의 디자이너로 유명한 조너선 아이브는 OpenAI와 함께 ChatGPT 하드웨어를 만들고 있는 중이고, 예전 Workflow 애플리케이션(지금은 “단축어”로 통합되어있는)을 만든 사람들은 데스크탑 컴퓨터에 생성형 AI를 가져오고자 시도하고 있다.
어떤 시도가 성공하게 되어 “AI 시대의 아이폰”이 될지는 알 수 없지만 아마 향후 10년간은 컴퓨팅에 있어서 가장 흥미로운 순간을 목도하게 될 것은 분명하다. 물론 그러기 위해서는 지금의 AI도 많이 발전해야하는 것은 분명해보인다.