☕️ 분기점을 지나는 AI 개발 경쟁

숨가쁘게 이어지는 멀티 모달(Multi Modal) 단계
2024년 5월 22일 수요일 
오늘은 최근 연속으로 이어진 빅테크 AI 발표의 핵심을 전해드립니다. 지난주부터 연속으로 이어진 오픈AI, 구글, 마이크로소프트의 발표는 AI 개발 경쟁이 분기점을 지나고 있다는 점을 확실히 했는데요. 이들이 LLM(대규모 언어 모델)이라는 단어를 더는 쓰지 않고 있는 이유 그리고 이제 본격적으로 진입하는 멀티 모달(Multi Modal) AI의 시대는 어떤 모습인지에 대한 힌트를 전합니다.

 놀라운 데모와 그에 대한 분석과 평가가 계속 이어져 온 가운데, 현재 AI 개발 경쟁이 어떤 단계로 접어들고 있는지를 살펴볼게요.

+ 커피팟 구독하시고 현업의 전문가들이 전하는 비즈니스 이야기 꾸준히 받아보세요!

[빅테크] #AI #AI는빅테크판
1. 분기점을 지나는 AI 개발 경쟁
지난주부터 빅테크 기업들의 블록버스터 AI 행사가 이어졌죠.

우선 오픈AI는 구글의 연례 개발자 행사인 구글 I/O 2024가 열리기 하루 전에 자신들의 최신 모델 GPT-4o('포오'라고 읽죠) 모델을 공개하면서 오랜만에 업계에 지진을 일으켰습니다. 아직 오픈AI의 여운이 가시지 않은 바로 다음 날, 구글은 제미나이를 융합한 다양한 서비스 시나리오들과 차세대 AI 모델인 프로젝트 아스트라(Project Astra)를 발표했죠. 이번 주 들어서는 마이크로소프트가 코파일럿+ PC를 발표하면서 AI PC 시대를 열었고, 어제는 역시 연례 개발자 행사인 마이크로소프트 빌드(Build) 2024를 바로 이어서 진행했습니다.

그리고 이제는 애플의 연례 개발자 행사인 WWDC가 또 6월에 기다리고 있습니다. 2024년의 초여름은 AI가 진정한 의미의 '다음 단계'로 나아가기 시작한 계절이라고 기록될 듯한데요. AI의 '다음 단계'는 무엇일까요? 그리고 이는 무엇을 의미할까요?

최근 빅테크들이 발표한 내용들 중 주요한 AI 서비스의 핵심을 짚어 보고, 어떤 의미에서 이러한 기술들이 '다음 단계'를 의미하는지를 살펴보겠습니다. AI 개발은 이제 분기점에 이르렀습니다.
오픈AI는 20개가 넘는 데모를 선보이면서 GPT를 이용한 가능성을 사용자들에게 매력적으로 보여주었습니다.  그중에서도 수학 문제를 함께 풀면서 마치 개인 과외 선생님이 된 데모는 큰 관심을 받았습니다. (이미지: 오픈AI)
영화를 실현시킨 오픈AI의 마케팅
오픈AI가 GPT-4o의 발표 몇 주 전, LLM들의 성능을 비교하는 리더보드에서 'im-a-good-gpt2-chatbot'이라는 의문의 모델이 등장했고, 이 모델의 성능이 GPT-4를 능가한다는 비교에 AI 연구자 및 사용자 커뮤니티는 떠들썩해졌습니다. 이후 오픈AI CEO 샘 알트먼의 트윗을 통해, 해당 모델이 오픈AI의 기술이라는 것이 간접적으로 밝혀졌고, 오픈AI의 발표 전 알트먼은 "마법 같이 느껴지는 것"을 공개할 것이라고 미리 예고했습니다.

지난주 공개된 GPT-4o는 알트먼의 말처럼 많은 이들이 마법처럼 느끼는 놀라움을 선사했습니다. 실시간에 가까운 음성 응답 속도, 비약적으로 발전한 추론 능력, 텍스트, 이미지를 넘어 비디오를 이해하고 반응하는 능력, 심지어 사용자의 요청에 맞추어 음성 응답에 감정을 조절하는 것까지 보여주었죠. 오픈AI는 이런 GPT-4o를 무료 사용자에게까지 확대할 것이라고 발표했고요.

오픈AI는 GPT-4o의 놀라움을 보여주는 다양한 데모 영상들도 함께 공개했는데요. 놀라운 장면들이 많았지만, 그중에서도 수학 문제를 푸는 데모는 가장 구체적으로 가까운 미래를 보여준 사례였습니다. 디지털 교육 서비스인 칸 아카데미의 창업자 살만 칸과 그의 아들은 실시간으로 GPT-4o와 함께 문제를 풀었고, GPT-4o가 자신이 보는 화면을 완벽히 이해하고 문제를 논의하면서 정답으로 사용자를 이끄는 모습을 보여주었습니다. 이 제품에 접근 가능한 모든 아이들은 이제 아주 뛰어난 개인 과외 선생님과 공부할 수 있는 것입니다.

샘 알트먼은 그의 블로그를 통해서 이번 발표에서 중요한 점 두 가지를 언급했습니다. 첫 번째는 최신, 최고의 모델인 GPT-4o를 무료로 공개했다는 것이고, 두 번째는 마침내 음성/영상을 통해 컴퓨터와 소통하는 것이 자연스럽게 느껴지게 되었다는 것인데요. 

이렇게 대담한 오픈AI의 행보는 다음 날 이어진 구글의 발표에 대한 기대감을 낮추는 효과도 있었던 것으로 보입니다. 여러모로 AI 시대 들어 소위 '폼'이 계속 떨어졌다고 평가 받는 구글의 모습이기도 하지만, 오픈AI가 선보인 모습이 워낙 놀랍기도 했습니다.
구글은 제미나이를 자신들이 가진 서비스에 다양하게 적용하면서 어필했습니다. 이메일 정리도 도와주며, 화상 회의도 요약해 작성해 주죠.  (이미지: 구글)
다양한 서비스 적용에 힘 싣는 구글
하지만 구글 또한 만만치 않게 칼을 갈고 나왔다는 평도 많았습니다. 우선 구글은 자신들의 AI 모델인 제미나이를 지메일, 구글 포토, 구글 밋(Meet, 화상 통화 앱) 등과 강력하게 결합한 서비스 시나리오를 선보였습니다.

받은 이메일들을 요약해 달라고 부탁하거나, 방금 끝낸 화상 회의의 회의록을 써달라거나, 수천 장의 사진이 담긴 구글 포토 앱에서 딸아이가 수영하는 모습이 발전한 과정을 찾아달라고 하는 등 요청하는 내용의 맥락을 높은 수준으로 이해해야만 가능한 작업들을 예시로 보여 주었습니다.

또한 검색 시 'AI 오버뷰(Overview)'라는 이름으로 제미나이가 찾은 결과들을 먼저 보여주고, 동영상을 통해서도 AI 오버뷰를 보여주는 등, 구글의 핵심 비즈니스인 검색에도 제미나이를 적극적으로 도입하는 모습을 보였습니다. 

한마디로 요약하자면 다양한 서비스에 "우리는 (AI를) 다 적용할 수 있다"라고 말하면서, 구겨진 자존심을 회복하기 위해 애쓴 모습이었죠.
스마트폰으로 촬영하는 영상에서 코드를 분석해 달라고 할 수 있는 '프로젝트 아스트라'는 구글 발표의 핵심이었습니다. (이미지: 구글)
그리고 무엇보다 이번 행사의 백미는 새롭게 구글의 AI를 책임지는 딥마인드의 수장이 된 데미스 하사비스가 발표한 '프로젝트 아스트라'였습니다. 실시간으로 텍스트/음성/영상 인풋을 이해하고, 그에 맞는 답변을 하는 어시스턴트인데요. 

데모 영상에서는 스마트폰으로 촬영하는 영상에서 코드를 분석해 달라고 한다던가, 자신이 잊고 지나친 선글라스의 위치를 묻는다던가, 안경에 카메라가 결합된 형태의 기기를 쓰고, 강아지와 호랑이 인형에게 이름을 붙여 달라고 합니다. 

GPT-4o와 거의 동일한 성능과 기능을 가진 모델로 보입니다. 하지만 아직 프로토타입이라고 말한 것으로 보아, 정식 출시 가능한 수준은 아니라고 판단하고 있는 것으로 예상됩니다. 
빅테크 중에는 마이크로소프트가 일단 5월의 대미를 장식합니다. AI PC를 발표한 데 이어 현재 마이크로소프트 빌드(Build) 2024 행사가 이어지는 중입니다. 인프라부터 투자까지 AI 개발에 가장 앞서 있는 자의 여유가 보이기도 하죠. (이미지: 마이크로소프트 유튜브 캡처)
온디바이스(On-device)에 집중하는 MS
마이크로소프트(MS)는 그제 "프롬 클라우드 투 엣지(From cloud to edge)"라는 슬로건으로 MS의 AI 모델인 '코파일럿'을 기기에서 실행할 수 있음을 알렸습니다. 코파일럿+ PC라는 브랜드로 새로운 PC 라인업을 소개했됴. 코파일럿+ PC에서는 구글 제미나이와 마찬가지로 아웃룩의 이메일 요약이나, 사진 정리, 편집 등 윈도우에서 가능한 다양한 작업들을 코파일럿에게 요청해 처리가 가능합니다.

비교적 가벼운 작업이나, 보안에 유의가 필요한 작업들은 클라우드 서버를 거치지 않고 하드웨어 기기 단에서 바로 처리되고, 영상 해석이나 깊은 추론 등이 필요한 작업들은 클라우드를 통해 연산을 수행하는, 투트랙 전략이라고 볼 수 있습니다.

또한 큰 지분을 소유한 오픈AI와의 협력을 통해 앞서 소개한 GPT-4o를 코파일럿에서 사용 가능하도록 탑재했습니다. 애플과 마찬가지로 하드웨어부터 소프트웨어까지 탄탄하게 라인업을 갖추고 있는 MS는, 소프트웨어 중심의 구글이나 오픈AI와 다르게 하드웨어 단에서부터 AI를 적용하는 것을 우선순위로 두고 있는 것으로 보입니다.
전반적인 흐름은 멀티 모달 어시스턴트가 만들어지는 단계가 되었습니다. 이제 애플이 6월에 열리는 WWDC 2024에서 어떤 '모델'을 선보이는지도 기다려야 할 차례입니다. (이미지: 애플)
이들이 나아가고 있는 '다음 단계'
최근 발표들은 앞서 언급한 '다음 단계'를 명확하게 추론해 볼 수 있게 해줍니다. 

챗GPT로 촉발된 텍스트 기반의 모델, 즉 '언어 모델'의 단계는 이제 지났으며, 이제 AI 기술은 인간 수준으로 영상을 이해하고, 실시간으로 문답을 주고받는 진정한 멀티 모달(Multi Modal) AI 어시스턴트들이 만들어지는 단계입니다. 오픈AI의 GPT-4o와 구글의 프로젝트 아스트라가 바로 그 시작점이고요. 

풀어서 설명하자면 영상, 사진, 텍스트 등을 모두 이해하는 멀티 모달리티가 달성됨에 따라, GPT-4o가 화면의 수학 문제를 같이 풀어주는 예시처럼, AI가 자연스럽게 소비자들의 기기 사용을 "눈으로 관찰하며" 보조할 수 있는 진정한 어시스턴트가 될 수 있다는 것입니다. 그리고 이제 그 사용 사례가 폭발적으로 확장해 나갈 것임을 예상할 수 있죠.

변화가 커질 것이라는 점을 암시하는 포인트는 또 있습니다. 그것은 바로 이제 빅테크 기업들의 AI 관련 발표에서 'LLM(대규모 언어 모델)'이라는 단어가 사용되는 경우가 거의 없다는 것입니다.

이제 단순히 '모델'이라고 지칭하면서, 자신들의 모델이 텍스트를 넘어 어떻게 효과적인 ‘멀티 모달리티'를 달성했는지에 대해 집중적으로 이야기하고 있습니다. 그리고 이를 뒷받침하는 데모를 보여준 것이죠. 

첫 번째 단계인 '언어 모델'과 멀티 모달리티를 달성해 가는 '모델'이 된 두 번째 단계 사이의 짧은 기간에 천문학적인 투자가 집중되었습니다. 그리고 그 투자로 인해 빅테크들만이 가질 수 있는 해자가 형성 되고 있는 것으로 보입니다.

이번에 이어진 발표들은 분기점이 되었습니다. AI의 주도권은 (이전에도 그랬지만) 미국의 빅테크가 꽉 쥐었고, 이제 이들이 이 주도권을 놓치는 일은 일어나지 않을 가능성이 크다고 판단됩니다. 이미 AI를 위한 '인프라'가 되어 버린 AWS나 애저(Azure)와 같은 클라우드 컴퓨팅 서비스와 같은 존재가 될 것이라고 평가할 수 있는데요. 

이는 AI 기술 또한 다른 기업들이 직접 개발하기보다는 이들 빅테크가 잘 만들어 놓은 것을 잘 활용하는 것에 집중을 해야 하는 시점이 되었다는 것입니다. 이들이 이미 테크를 넘어, 테크가 바꾸는 세상에서 가진 영향력을 생각하면 많은 것을 시사하는 분기점이기도 합니다. 

-
By . 글로벌 IT 기업에서 일하고 있어요. 스타트업, 웹3, AI 등 새로운 기술이 바꾸어 나가는 세상의 모습에 많은 관심을 두고 있습니다.

[미디어] #빅테크 #미디어산업
2. 애플은 미디어의 마지막 보루가 아니다
페이스북과 구글이 미디어 지원 프로그램과 프로덕트를 예전처럼 운영하고 있지 않은 가운데 최근에 미국 뉴스 미디어들이 수익을 올릴 희망으로 주목받는 곳이 있습니다. 그것은 다름 아닌 애플 뉴스와 애플 뉴스+이죠. 

미국판 디지털 정치 타블로이드라고도 할 수 있는 '더 데일리 비스트'는 망하기 직전까지 갔다가 애플 뉴스+에 콘텐츠를 제공하면서 안정적으로 수익을 올리는 중입니다. 자체 구독제는 유입이 미미한 수준이지만, 애플 뉴스+를 통해서는 올해 광고 수익과 합쳐 300~400만 달러의 수익을 받을 것으로 예상되죠. 애플 뉴스+는 크지 않은 규모의 미디어가 충분히 운영을 해 나갈 수 있는 안정적인 수익원이 되어주고 있는 것입니다. 

타임지도 애플 뉴스의 '파트너'가 되어 흥행에 집중하면서 연간 수백만 달러의 수익을 얻고 있다고 알려졌습니다. 타임지는 애플 뉴스+ 소개 화면의 중앙에 위치하면서 애플 뉴스+의 간판(?)임을 보여주고 있는데요. 이들에 의하면 지난달에만 애플 뉴스를 통해서 500만 명의 사용자가 타임지의 콘텐츠를 접했습니다.

현재 애플 뉴스에는 뉴욕타임스 등의 메이저 미디어는 올라가 있지는 않지만, 타임과 월스트리트저널, 그리고 블룸버그의 주간 매거진인 비즈니스위크 등이 들어가 있습니다. 뉴요커와 뉴욕매거진 그리고 각종 라이프스타일/패션 매거진 등과 뉴미디어는 모두 올라가 있다고 해도 과언이 아닙니다. 총 400여 개의 대표적인 퍼블리케이션이 콘텐츠를 제공하는 상황이죠.

이들은 모두 이제는 다른 곳에서 얻기 어려운 수익을 애플 뉴스+에서 얻을 것을 기대하고 있죠. 하지만 과연 장기적으로도 애플 뉴스+는 미디어들이 믿을 만한 플랫폼으로 남아 있을까요? 애플은 계속해서 이 뉴스 제품을 키워나갈까요? 제품을 계속 발전시키면서 키워나가려면 확실한 유인이 있어야 하는데, 애플에게 그 유인은 무엇일까요? 

어제 전한 이야기입니다. 아직 열어보지 않으셨다면 꼭 살펴보세요. 

[거시경제] #안젤라의매크로시선
3. '중국의 생산 과잉이 초래하는 위기
중국 경제가 어렵다는 이야기는 지속되고 있습니다. 부동산 투자 과잉으로 인해 촉발된 중국의 경제 위기는 이제 생산 투자 과잉으로 옮겨가 커지는 모양새가 된 상황이죠. 많은 전문가들은 중국이 '생산' 투자가 아닌 '소비' 진작을 할 수 있는 경기부양 처방을 우선해야 한다고 보고 있는데, 어쩐지 중국은 이런 해법은 전혀 고려하지 않고 있습니다.  

왜 그런 걸까요? 중국은 경기부양책보다는 각 산업의 생산성 향상에 집중하면서 현재 전기차를 비롯한 재생에너지 그리고 AI 산업의 경쟁력을 끌어올리는 데 초점을 맞추고 있습니다. 이는 지난 20년 넘게 부동산 부양으로 떠받쳐온 경제 성장의 체질을 바꾸기 위해서는 어쩔 수 없는 선택이라고도 분석됩니다. 경기부양책을 쓰면 그간 일었던 '부동산 버블'과 같은 현상이 다시 나타날 수 있다는 점도 염려하고 있고요. 

하지만 이는 현재 중국 경제의 본질적인 문제를 외면하고 있다고 보는 시각이 큽니다. 부동산 버블은 민간 수요가 넘쳐서만 만들어졌던 것이 아니라 각 지방 정부가 토지 사용권 출양을 남발해 만들어졌고, 오히려 지금은 팬데믹 시절부터 옥죄었던 소비가 다시 살아나게만 해야 한다는 것이죠. 

현재 알리익스프레스 등을 통해 전 세계에 쏟아지는 값싼 물건은 중국이 만든 세계적인 생산 과잉 문제의 일부분입니다. 이는 중국 내 소비가 충분하지 못하기 때문에 일어나는 현상이기도 한 것입니다. 중국은 왜 이런 본질적인 문제를 외면하고 있는 것일까요? 지금 시진핑 정권은 왜 소비 대신 생산에 집중하는 기조를 계속 유지하는 것일까요?

간단한 답이 있는 문제는 아니지만, 이번 달의 [안젤라의 매크로 시선]은 그 답을 명쾌하게 전합니다. 현재 중국이 이어온 문제의 히스토리를 명확하게 짚으면서요. 

☕️☕️ 커피팟 유료 구독하고 꾸준히 받아보세요!

각 분야 현업의 전문가 저자들이 새로운 이야기를 발견해 쉽고 재밌게 전해드려요. 월스트리트부터 실리콘밸리, 그리고 전 세계 주요 경제 이슈까지. 나만의 참고 자료가 될 뉴스레터를 메일함으로 꾸준히 받아보세요. 월, 수, 금 + @ 찾아가요!

+ 첫 1개월은 50% 할인해 드려요. 더 할인된 연간 구독도 가능합니다.


good@coffeepot.me

© COFFEEPOT 2023
더는 받아보고 싶지 않으시다면
수신거부