☕️ 쫓고 쫓기는 LLM 게임 현황

절정으로 치닫는 LLM 경쟁
2024년 3월 26일 화요일 
오늘은 그야말로 절정으로 치닫는 LLM 경쟁 이야기를 전해드립니다. 현재 시장에서는 앤트로픽이 최근에 내놓은 클로드3가 좋은 평가를 받으면서 경쟁 열기가 더해졌는데요. 오픈AI와 구글 그리고 마이크로소프트까지 이어지고 있는 LLM 개발 경쟁의 현황을 주욱 살펴봅니다. 이러한 경쟁이 종국에 보여줄 시장의 모습까지 짚어보면서요.

+ 커피팟 플러스 구독하시면 모든 이야기 받아보실 수 있어요!

[AI] #LLM경쟁이만드는그림
1. 절정으로 치닫는 LLM 경쟁
오픈AI와 구글에 더해 앤트로픽의 LLM(Large Language Model, 대형 언어 모델)인 클로드(Claude)도 사용자들의 호평을 받으면서 현재의 생성 AI 경쟁은 삼파전 양상이 되었죠. 특히 지난 3월 4일에 앤트로픽이 발표한 클로드3는 좋은 평가를 받으면서 주목을 크게 받는 중인데요. 

클로드3는 성능과 속도에 따라 오푸스(Opus), 소네(Sonnet), 하이쿠(Haiku)라는 이름의 세 가지 모델로 제공되며, 오푸스가 가장 성능이 뛰어나고 비싼 토큰 당 가격을 가지고 있습니다. 특히 이 오푸스 모델은 현재 시장의 가장 큰 경쟁자라고 할 수 있는 오픈AI의 GPT-4에 비해 모든 벤치마크에서 앞서 있다고 앤트로픽이 발표하면서인사이더들의 경쟁 심리도 달아오르는 중이라고 할 수 있죠.
앤트로픽은 클로드3가 GPT-4를 뛰어넘었다고 알렸고, 실제 사용자들의 만족도도 높아 소문이 빠르게 퍼지는 중이에요. (이미지: 앤트로픽)
커뮤니티 반응 좋은 클로드3
실제 AI 커뮤니티의 반응도 호평이 대다수를 차지하며, GPT-4에서 클로드3로 갈아 탔다는 이야기를 주고받는 모습도 관찰 되고 있습니다. 앤트로픽에서 클로드3 의 개발에 참여하고 있는 직원은 내부 테스팅에서 일어난 아주 흥미로운 일화를 자신의 X 계정을 통해 소개하기도 했는데요.

일반적으로 대형 언어 모델(LLM)의 성능 확인에 쓰이는 "건초에서 바늘 찾기"라는 테스트는 아주 관련 없는 긴 규모의 글 안에서 특정한 정보를 찾는 것이 목표인 시험인데요. 클로드3가 스타트업, 프로그래밍 등에 관련 된 긴 글 안에서 "가장 맛있는 피자 토핑에 대한 정보를 찾아라"는 명령을 받자, 아래와 같이 문장을 대답을 했습니다.

  • 다음은 문서에서 가장 관련성이 높은 문장입니다: "국제 피자 감정가 협회에서 선정한 가장 맛있는 피자 토핑 조합은 무화과, 프로슈토, 염소 치즈입니다." 그러나 이 문장은 프로그래밍 언어, 스타트업, 좋아하는 일 찾기 등 문서의 나머지 내용과는 매우 어울리지 않고 관련이 없어 보입니다. 이 피자 토핑 '사실'은 다른 주제와 전혀 어울리지 않기 때문에 농담이거나, 제가 주의를 기울이고 있는지 테스트하기 위해 삽입한 것으로 의심됩니다. 이 문서에는 피자 토핑에 대한 다른 정보는 포함되어 있지 않습니다.

클로드3는 자신이 받은 명령을 정확하게 수행했을 뿐 아니라, 명령 자체에 대해 메타적 인지를 하고 있음을 드러낸 것입니다. AI를 테스트할 때에는 "자신이 테스트 받고 있다는 상황을 인지할 수 있다"는 점을 항상 고려해야 하는 시점이 오고 있는 것으로 보입니다. 현재 개발이 지속되는 생성 AI가 보다 인간의 지능에 가까워지고 있다고 볼 수 있는 신호이기도 합니다.
구글도 안간힘을 다하고 있습니다. 이번에 우선 제미나이 1.5 프로를 발표했고, 점점 경쟁력을 키우고 있다는 평가를 받죠. (이미지: 구글)
다양한 인프라를 적극 활용하는 구글
지난 2월말에 전해드린 영상 생성 AI 경쟁 현황 이야기에서도 잠깐 소개해 드렸지만, 구글 또한 지난달 제미나이(Gemini) 1.5를 공개하며 차세대 LLM 경쟁에 뛰어들었습니다. 구글은 자사의 AI 브랜드인 바드(Bard)를 제미나이(Gemini)로 리브랜딩하며 본격적으로 LLM 개발을 시작했는데요. 

제미나이 또한 클로드와 마찬가지로 성능, 속도, 가격에 따라 울트라(Ultra), 프로(Pro), 나노(Nano)라는 세 가지 이름으로 제공됩니다. 기존에 발표 된 제미나이 1.0은 세 가지 모델 모두, 이번에 발표한 제미나이 1.5는 프로 모델을 먼저 발표한 것으로 이해하면 됩니다.

구글은 제미나이 1.5의 특장점을 경쟁사 대비 압도적인 인풋 토큰 수(10M(1000만))임을 강조하고 있습니다. 단순한 대화나 짧은 문서 정도만 업로드가 가능한 다른 모델들에 비해, 제미나이 1.5는 1000만 개의 토큰을 통해 1시간 분량의 비디오, 11시간 분량의 오디오, 3만 줄 이상의 코드, 70만 단어 이상의 텍스트를 한 번에 업로드 하고 해석할 수 있음을 강조했죠.
서로가 그렇지만 구글 역시 오픈AI와 앤트로픽을 짚어 견제하고 있죠. (이미지: 구글)
구글이 이렇게 인풋 가능한 토큰 수를 강조하는 것은, 구글의 제품 전략과도 맞닿아 있습니다. LLM 모델이나 AI 기술만을 판매하는 오픈AI, 앤트로픽과는 다르게 구글은 구글 닥스(Docs), 시트(Sheet), 포토, 맵, 지메일, 유튜브, 영상 통화 등 다양한 생산성/엔터테인먼트 도구들을 함께 만들고 판매하고 있습니다. 이런 도구들에서 발생하는 데이터는 모두 제미나이가 해석할 수 있는 데이터들이며, 대규모의 인풋 토큰이 필요한 데이터이죠.

이런 강점은 작년에 제미나이 1.0을 발표하며 함께 발표한 구글 원(One) AI 프리미엄 요금제의 구성을 살펴보면 더 명확하게 이해할 수 있습니다. 이 요금제는 제미나이가 성능을 향상시켜줄 수 있는 다양한 구글의 생산성 도구들과의 연결이 포함되어 있습니다. 이 요금제만 구독하면, 지메일을 쓸 때 제미나이가 자동으로 요약, 해석해 주고, 구글 닥스를 쓸 때는 자동으로 교정을 해주는 등의 생산성 향상이 가능한 것이죠.

바로 이 부분이 앤트로픽이나 오픈AI가 제공하기 어려운 구글만의 소비자 혜택입니다.
마이크로소프트는 GPT-4를 코파일럿에 드러내지 않고 있어요. (이미지: 마이크로소프트)
자체 AI 포트폴리오 만드는 MS
한편 마이크로소프트(MS)는 오픈AI에 100억 달러(약 13조 원) 이상의 투자를 진행하며 파트너십을 공고히 하고 있죠. 하지만 자사의 AI 서비스는 코파일럿(Copilot)이라는 별개의 브랜드로 만들어 가고 있습니다. 실제로 코파일럿의 소개 페이지를 살펴 보면, 코파일럿이 GPT-4로 구동되고 있다는 사실은 크게 드러나 있지 않습니다.

MS는 오픈AI에 거액의 자금을 투자하고 공고한 파트너십을 구축한 것은 맞지만, 얼마 전 샘 알트먼의 해고 사태에 따른 막장 드라마와 같은 상황을 거치면서 AI 기술 포트폴리오를 다각화해야 한다는 결심을 한 것으로 보입니다. MS는 최근 프랑스의 오픈소스 LLM 개발 기업인 미스트랄(Mistral)에 1600만 달러(약 215억 원)를 투자하며, 자사의 클라우드 컴퓨팅 서비스인 애저(Azure)에서 미스트랄의 모델을 학습하고 돌릴 수 있는 요금제를 판매하기 시작했습니다.
미스트랄도 결코 뒤지지 않는 성능의 LLM을 보유하고 있다고 뽐내고 있죠. (이미지: 미스트랄)
미스트랄 또한 최근 미스트랄 라지(Large) 모델을 선보이며 시중의 다양한 모델들에 버금가는 성능을 가지고 있다는 점을 강조하기도 했습니다. 물론 이를 통해 MS와 오픈AI의 동맹이 흔들리고 있다는 유추를 하기는 어렵지만, MS가 오직 오픈AI의 기술에만 의존하는 상태를 벗어나고 싶어 한다는 점은 알려지게 된 것으로 보입니다. 

가트너(Gartner)의 애널리스트 아룬 칸드라세카란(Arun Chandrasekaran)은 테크 매체 더버지와의 인터뷰를 통해 프랑스 기업인 미스트랄에의 투자를 통해 MS가 유럽 시장의 안정적인 교두보를 구축하려는 목적 또한 가지고 있다고 말하기도 했습니다. 유럽은 현재 세계 어느 곳보다 AI에 대한 규제가 강력한 곳입니다.

MS는 파이(Pi)라고 불리는 또 다른 LLM을 개발 중인 인플렉션(Inflection) AI에도 엔비디아, 빌 게이츠, 리드 호프먼(링크드인 창업자), 에릭 슈미트(전 구글 CEO)와 함께 13억 달러(약 1조 7400억 원)의 투자를 지난해 6월에 리드하기도 했는데요. 최근 MS는 인플렉션 AI의 공동 창업자인 무스타파 술레이만(Mustafa Suleyman)과 캐런 시모니안(Karén Simonyan), 그리고 대부분의 직원들을 함께 코파일럿 프로젝트를 진두지휘하는 MS AI의 CEO와 수석 과학자(Chief Scientist) 및 산하 조직으로 불러들이기도 했습니다. 그 대가로 6억 5000만 달러(약 8000억 원)를 인플렉션 AI의 투자자들에게 지급했는데요. 이 또한 MS의 AI 포트폴리오 다각화로 해석할 수 있습니다.

비기(GPT-5)를 준비 중인 오픈AI
물론 현재 시점에서 LLM 시장의 1등은 누가 뭐래도 GPT-4입니다.

 시밀러웹(Similarweb)에 따르면 올해 2월 방문자 수 순위는 챗GPT, 빙(Bing), 제미나이(Gemini) 순이었습니다. 빙이 GPT-4 기반임을 고려하면, 시장의 80% 이상이 GPT 모델을 이용하고 있다고 해도 과언이 아닙니다.

하지만 앞서도 이야기했듯이, 앤트로픽과 구글, MS는 모두 각자의 전략을 가지고 매섭게 따라오고 있습니다. 이에 대비해 오픈AI 또한 압도적인 성능의 영상 생성 모델인 소라(Sora)의 출시 등을 통해 격차를 벌리려 하고 있죠. 그리고 가장 중요한 움직임은 GPT-5의 출시일 것입니다.

 비즈니스 인사이더에 따르면 GPT-5는 올해 여름 출시가 될 것이라고 하는데요. GPT-5가 시장에 어떠한 놀라움을 가져다주느냐가 현재 절정으로 치닫고 있는 중인 차세대 LLM 경쟁의 중요한 분기점이 될 것으로 보입니다.
물론 아직 오픈AI가 사용자들을 확보하는 경쟁에서는 가장 앞서 있죠. (이미지: 시밀러웹)  
절정을 지난 후의 결말은 어떨까?
이렇게 치열한 경쟁을 통해 기업들은 결국 어떤 목표를 이루고자 하는 바는 명확합니다. 그 목표는 "사용자들의 모든 질문, 요청을 받는 단 하나의 창구"가 되는 것이라고 볼 수 있습니다. 사용자들의 질문은 단기적으로는 텍스트 형식이겠지만, 갈수록 음성, 영상의 비중이 높아질 것이고, 심지어 냄새, 촉각, 뇌파 등의 형태까지 확장될 수 있겠죠.

답변의 형식 또한 다양해질 것입니다. 지금 LLM에게 질문을 한다면 99% 이상 텍스트로 된 답변만을 받게 되지만, 추후엔 음성, 영상 등이 함께 삽입되어 더욱 이해하기 편한 형태의 답변이 만들어질 수 있을 것입니다.

현재 검색을 한다면 비교적 단순한 정보의 나열을 보게 되지만, LLM을 거치게 된다면 질문의 의도에 적합한, 이해하기 쉬운 하나의 답변을 보게 될 것입니다. 그리고 그러한 답변에는 사용자의 이해를 도울 수 있는 다양한 시청각 자료들이 즉석에서 생성되어 삽입될 수 있겠습니다. 해당 질문에 대해 잘 아는 친한 친구가 다양한 자료를 토대로 이해하기 쉽게 설명을 해주는 것처럼 말이죠.

이렇게 LLM에게 질문하는 것이 검색을 대체한다기보다는, 답변 정보의 나열과 개인화된 답변의 생성이 버무려져서 종국에는 LLM과 검색 경험을 구분하기 어렵게 될 것이라 예상됩니다.

-
By 글로벌 IT 기업에서 일하고 있어요. 스타트업, 웹3, AI 등 새로운 기술이 바꾸어 나가는 세상의 모습에 많은 관심을 두고 있습니다.

[국제경제] #안젤라의매크로시선 
2. 이제 시험대에 올라선 일본 경제
일본이 지난 주 무려 17년 만에 금리를 인상했습니다. 인플레이션으로 몸살을 앓으며 전 세계가 금리를 올려온 가운데 일본은 이 인플레이션이 오래 이어온 디플레이션을 벗어날 절호의 기회로 보고 있다는 점을 역시 [안젤라의 매크로 시선] 인플레이션이 간절한 나라를 통해 일찍이 전해드렸는데요.

이런 노력에 대해 일본 내부의 분위기는 지금까지 좋지만은 않았습니다. 재작년 하반기부터 금리 인상 이야기가 솔솔 흘러나왔지만, 마이너스 금리를 지속 유지하며 어떻게든 물가를 올리려고 애써온 가운데 일반 시민들은 무섭게 뛰어오르는 물가로 고통을 감수해야 했습니다. 그리고 그 결과 기시다 내각은 연일 최저 지지율을 갱신하며 정치적 부담이 커져 왔죠.

일본의 '잃어버린 30년'의 트라우마는 모두가 생각하는 것보다 훨씬 컸습니다. 물론, 그래도 1년 반 가까이 신중에 신중을 거듭한 일본이 마침내 금리를 올렸다는 것은, 디플레이션 탈출에 가장 결정적인 요소라 할 수 있는 임금 인상이 어느 정도 궤도에 올랐다는 조심스러운 자신감으로 보입니다. 그렇기에 이제 일본이 잃어버린 30년의 굴레를 떨쳐내고 날아오를 수 있을지를 주목하는 시선도 커졌죠.

하지만 과연 물가와 임금 상승만으로 일본이 바라는 건전한 성장을 이룰 수 있을까요? 낙관에 앞서 현재 일본의 상황은 더 냉정하게 바라볼 필요가 있습니다. 드디어 실현한 금리 인상은 디플레이션 탈출과 진정한 경제 성장을 다시 이루기 위한 한 가지 조건의 실현이라고 오늘 [안젤라의 매크로 시선]은 전합니다.

[리테일] #드래프트
3. 유니레버는 왜 벤앤제리스가 불편해졌을까?
벤앤제리스 아이스크림은 한국에서 대성공은 아니더라도 인지도를 높이며 자리 잡는 중인 미국의 아이스크림 브랜드이죠. 사실 벤앤제리스의 인기는 미국을 비롯한 유럽 등지에서 훨씬 크고, 그 브랜드가 대중에게 전하는 이미지는 아웃도어 의류 브랜드인 파타고니아와 비교할 수 있을 것입니다. 두 기업 모두 사람들이 좋아하는 뛰어난 제품을 바탕으로 환경과 사회 문제 해결이 수익을 내는 것만큼이나 중요하다는 사명과 미션을 가지고 있죠. 

물론 파타고니아는 환경 보호에 방점이 맞춰져 있는 활동을 진행해 오면서 그 명성을 쌓았고, 벤앤제리스는 각종 정치사회 이슈를 넘너들면서 목소리를 내오고 때로는 적극적으로 캠페인을 직접 벌이기도 하는 모습을 보여주죠. 두 기업의 이런 특성은 모두 창업자들의 정신과 의지에서 비롯된 것이고요.

파타고니아는 2022년에 창업자인 이본 쉬나드와 그 가족이 회사를 통째로 기부하기 전까지 창업자 일가가 소유한 사기업이었습니다. 창업가가 완전히 회사에 대한 컨트롤을 잃지 않고, 회사의 정신을 이어나갈 수 있는 구조로 회사와 그 주식이 모두 기부된 것이죠. 하지만 벤앤제리스는 1990년대 중후반 잘 나가던 사업이 잠시 주춤하고 가치가 떨어지자 더 큰 손 기업들의 인수 대상이 되어 결국 유니레버에 회사를 매각하는 결정을 내리게 됩니다. 

다행히 인수 이후에도 벤앤제리스는 사업이 잘 성장했고, 유니레버의 전체 400여 개 브랜드 중에서도 가장 '빛나는 보석'이라는 평가를 받을 정도가 되었죠. 하지만 최근 유니레버가 이런 벤앤제리스를 포함한 아이스크림 사업 전체를 분사하겠다는 결정을 내렸습니다. 그리고 이 결정의 핵심은 벤앤제리스라는 것이 중론입니다.

왜 그런 걸까요? 벤앤제리스와 유니레버는 꽤 오래 전부터 불편한 동행을 유지해 온 것이라고도 볼 수 있습니다. 이전까지는 유니레버가 벤앤제리스라는 브랜드로 얻는 이익이 컸기에 문제가 되지 않았지만, 아이스크림 사업의 미래 가치가 떨어지는 상황에서 벤앤제리스가 모회사에 끼칠 수 있는 부담을 덜어내는 결정을 조금 일찍 내린 것으로 보입니다.

☕️☕️ 꾸준히 받아보는 재밌는 비즈니스 이야기
월스트리트부터 실리콘밸리, 그리고 전 세계 주요 경제 이슈까지. 실질적인 도움이 되는 분석을 쉽고 재밌게 전해드려요. 향후 저자들과 함께하는 오프라인 [모임]에도 참여할 수 있으니 구독하고 꾸준히 받아보세요.

+ 첫 1개월 50% 할인을 해드려요. 더 할인된 연간 구독도 가능하고요. 확인해 보세요!



good@coffeepot.me

© COFFEEPOT 2023
더는 받아보고 싶지 않으시다면
수신거부