AI 에이전트는 대세가 될까?

[준의 테크 노트] 한계에 부딪힌 '확장의 법칙'과 새로운 방향

2024년 11월 27일 수요일
'AI 에이전트'라는 말, 요즘 부쩍 더 많이 듣고 계시지 않나요? LLM(대규모 언어 모델)과 AI 모델, 각 기업들의 경쟁 현황이 늘 이어지는 가운데, 잠시 흐름을 놓치면 "갑자기 AI 에이전트는 무엇일까?"라고 할 수밖에 없을 만큼 AI 시장의 방향은 빨리 바뀌고 그 흐름도 빨라지고 있습니다. 그리고 그 이유는 천문학적인 액수가 투입된 이 시장에서 사용자를 확보하고 수익을 낼 제품을 만드는 경쟁을 대표적인 테크 회사들이 한순간도 뒤돌아보지 않으며 진행하고 있기 때문인데요.

사실 AI 에이전트는 AI 모델의 발전이 이전만큼 빠른 속도로 이루어지지 않는 상황에 이르면서 나온 각 기업들의 '상품'이라고도 할 수 있습니다. 이런 AI 에이전트의 핵심은 사용자를 대신해 작업을 수행해 준다는 것이고요. 이전보다 훨씬 더 효율적인 검색뿐만 아니라, 시간이 오래 걸리는 스프레드시트 작업부터 쇼핑까지, 효과적으로 명령을 하면 작업에 에너지를 쏟지 않아도 되는 세상을 만들고 있는 중이죠.

그렇다면 과연 이렇게 발전하는 AI 에이전트는 광범위하게 퍼지는 AI 기반의 새로운 '플랫폼'이 될까요? 오늘 [준의 테크 노트]는 훈련에서 추론 능력 향상으로 바뀐 AI 모델 발전 방향의 의미 그리고 현재 나온 제품들의 현황을 통해 그 가능성이 어떤지 살펴볼 수 있습니다.

[준의 테크 노트]
AI 에이전트는 대세가 될까?
한계에 부딪힌 AI '확장의 법칙'과 새로운 방향
최근 몇 년간 AI의 발전은 파죽지세였습니다. 오픈AI를 필두로, 수 많은 스타트업들과 빅테크 기업들은 일주일 단위로 충격적일 정도로 놀라운 개발 결과를 앞다투어 공개했습니다. 그리고 그 근간에는, "AI의 성능은 컴퓨팅 파워를 증대시키는 것과 비례하려 증가한다"라는 믿음이 있었습니다. 그렇기에 메타, 구글, 마이크로소프트 등의 빅테크 기업들은 어마어마한 금액을 컴퓨팅 파워, 즉 GPU 구매에 사용했죠.

하지만 최근 로이터, 블룸버그, 디인포메이션의 보도에 따르면, 오픈AI를 비롯한 구글, 앤트로픽 내 복수의 관계자들이 "더 이상 이전의 확장의 법칙(Scaling Law)이 통하지 않기 시작했다"라고 말했다는 사실이 전해졌습니다. AI가 사용되는 과정에서 컴퓨팅 파워가 필요한 것은 크게 훈련과 추론으로 구분됩니다. 

지금까지의 확장 법칙은 훈련 단계에서 더 많은 데이터와 더 많은 훈련을 시켜 더 나은 성능을 기대하는 것이었는데요. 이러한 확장 법칙이 점점 한계에 부딪히기 시작했다고 말하는 것입니다. 더 많은 데이터를 넣고, 더 많은 훈련을 시켜도 결과값으로 나오는 AI의 성능이 이전만큼 빠른 속도로 성장하지 않게 된 것이죠.

이러한 한계에 부딪힌 AI 기업들의 다음 스텝은 무엇일까요? 어떤 타개책을 만들고 있을지를 통해서 무슨 미래를 그리고 있는지를 살펴보고자 합니다. 

AI 에이전트는 '추론'을 더하면서 사용자를 대신해 특정 작업들을 더 효율적으로 수행해 줍니다. (이미지: AWS)
추론에 집중해 검색 시장 보는 빅테크
앞서 말했듯이, AI 모델의 성능은 크게 훈련과 추론이라는 두 가지 단계에 의해 좌우됩니다.

훈련 단계는 더 많은 데이터와 더 많은 훈련 시간을 가져가면서 모델이 알고 있는 지식 자체를 늘리는 방향이고, 추론 단계는 훈련을 통해 학습된 지식을 바탕으로 사용자의 질문에 대답하기 위해 '생각하는' 단계라고 이해하시면 됩니다. 

오픈AI는 위와 같은 한계를 극복하기 위해, 훈련과 추론 중 추론의 단계에 컴퓨팅 파워를 집중하고 있습니다. 그래서 탄생한 것이 o1이라는 모델이죠. 엔비디아의 CEO 젠슨 황은 최근 인터뷰에서 "AI의 목표는 훈련이 아니다, 추론이다"라는 말을 하기도 했는데요.

그렇다면 추론을 잘한다는 것은 어떤 의미일까요?

지난 10월에 있었던 TED AI 컨퍼런스에서 오픈AI의 연구자 노암 브라운(Noam Brown)은 "AI봇이 진행하는 포커 게임에서, 20초 더 생각하는 것이 훈련양과 학습 데이터를 10만 배 늘리는 것과 동일한 성능을 낸다"라고 말해 화제가 되었는데요. 결국 더 나은 추론을 한다는 의미는, 같은 양의 학습 데이터를 가지고 더 높은 성능을 낼 수 있다는 이야기입니다.

예를 들어,
.
.
.
이어서 보시려면 구독해 보세요!
이메일로 꾸준히 받는 글로벌 산업 이야기
지금 필요한 분석과 새로운 시선을 전합니다. 쉽고 재밌는 글로벌 산업 이야기 내 메일함으로 꾸준히 받아보세요!

+
구독하면 플러스 구독자만 참여할 수 있는 커피팟 저자들과의 오프라인 '모임'과 플러스 구독자만 볼 수 있는 커피팟 콘텐츠 아카이브를 안내해 드립니다. 


글쓴이: 준. O2O 스타트업에서 일했고, 현재는 글로벌 콘텐츠 회사에서 일하고 있습니다. 스타트업, 웹3, AI 등 새로운 기술이 바꾸어 나가는 세상의 모습에 관심이 큽니다.

[준의 테크 노트]는 테크 기업과 그들이 새로이 개발하는 기술과 현상에 대한 이야기를 전합니다.



커피팟 Coffeepot
good@coffeepot.me
© Coffeepot 2024