[준의 테크 노트] 모두가 또 따라갈 오픈AI의 리드 최근 오픈AI는 또 한 번 시장을 선도하고 있습니다. 전 세계적으로 열풍이 불었던 지브리 스타일의 이미지 생성 기능을 내놓은 모습만이 아니라 바로 지금 사용자들이 AI로부터 원하는 것은 무엇인지 발견해 꾸준히 새로운 기능과 제품을 제시하면서 말이죠.
사람들은 지금 AI 제품으로부터 원하는 것이 무엇일까요? 바로 친구나 동료 그리고 동반자의 역할을 하는 것이고, 오픈AI는 이 지점을 경쟁사들보다 또 빠르게 발견했습니다.
현재 상황을 보면 모두가 또 오픈AI의 리드를 따라가는 지형이 당분간 만들어질 것으로 예상되는데요. 오늘 [준의 테크 노트]는 어느덧 세 번째 전환점에 이른 AI 제품 발전사와 오픈AI가 이끄는 산업의 지형을 짚습니다. |
AI 경쟁의 내러티브를 쥐고 놓치지 않고 있는 오픈AI는 단순히 고성능의 모델을 만드는 것뿐 아니라, 최근 출시한 다양한 크고 작은 기능들을 통해 제품 측면에서 사용자들을 사로잡고 있습니다. 이들의 이러한 모습은 AI 업계가 벌써 '세 번째' 전환점에 들어서는 모습을 보여주기도 하는데요.
이전의 전환점들과 이번 세 번째 전환점은 AI 개발사들의 방향성이 전향적으로 변경되었거나, AI를 소비하는 사용자들이 유의미한 변화를 느끼게 된 점을 말합니다. 각 전환점을 기점으로 이전엔 불가능하던 것들이 가능해졌고, 소비자들이 본격적으로 AI를 받아들이는 모습을 보여주었습니다. |
아득한 옛날 같지만, 챗GPT의 등장은 불과 2년 반도 안 되었습니다. (이미지: 오픈AI) |
물론 챗GPT 이전에도 2018년에 발표된 구글의 BERT와 같은 언어 모델은 존재했습니다. 챗GPT는 최초의 LLM도, 최초의 챗봇도 아니지만, '최초로 대중의 일상에 파고든 LLM 챗봇'라는 데 의미가 있습니다.
누구나 쉽게 사용할 수 있는 웹 기반의 채팅 인터페이스와 뛰어난 대화 품질, 다양한 개발자용 기능 등을 함께 지원해서, 전 세계가 AI 붐 속으로 진입하는 데 가장 큰 역할을 한 것이 챗GPT의 첫 출시였던 것이죠.
두 번째는 '멀티 모달로의 완전한 전환'입니다. 하나의 모델로 이미지, 텍스트, 소리, 영상 등을 모두 이해할 수 있는 시대로는 전환입니다. 그리고 그 티핑 포인트도 역시 오픈AI의 GPT-4o 모델의 발표였습니다.
물론 시장에는 텍스트와 더불어 이미지도 이해하는 모델들이 있었지만, GPT-4o 발표를 전후로, "실시간 영상, 음성, 텍스트를 기반으로 AI와 대화할 수 있는 것"이 중요한 지점이 되면서 많은 AI 개발사들이 "멀티 모달을 위해 모델을 처음부터 다시 만들었다"라고 말할 정도였습니다.
GPT-4o의 'o' 또한 'Omni'라는 뜻으로서, 이미지, 텍스트, 영상을 처리하는 개별 모델이 따로 있는 것이 아니라 하나(Omni)의 모델에서 모두 처리한다는 뜻입니다. 여기에 더해 전환점이라고까지 할 수는 없지만, 기존 모델의 성능을 끌어올리는 기재로서 유의미하게 시장에 충격을 준 사건도 있었는데요.
GPT-o1 와 같은 '추론' 모델의 등장이었습니다.
사용자의 질문에 한 번에 모든 답변을 하는 것이 아니라, 질문과 과업을 쪼개 하나씩 처리해 가고, 회고해가며 전체 일을 처리하는 방식이 획기적으로 답변의 퀄리티를 높여준다는 것이 알려지면서 너도나도 추론 모델을 추가하는 것이 유행처럼 번지기도 했죠. |
구글이 공개한 '프로젝트 아스트라'의 시연 영상인데요. 제미나이가 카메라를 보고 코드를 분석하는 모습입니다. AI 경쟁은 점점 더 놀랍게 제품들이 발전하는 모습을 시시각각 보여주고 있는 듯하죠. (이미지: 구글 유튜브) |
지금까지의 전환점과 사건들은, AI 모델을 이성적으로, 그리고 '도구'로서의 관점으로 바라보았을 때 유의미한 발전이었습니다. 어떻게 보면 당연한 발전의 흐름이기도 하죠. 아직 성능 자체가 부족한 상황에서 급선무인 것은 AI가 다양한 인풋 형태를 알아듣게 하고, 답변의 퀄리티를 높이는 것이니까요. GPT-4o를 넘어가며 답변의 퀄리티는 충분히 좋아졌고, 오픈AI는 다른 돌파구를 찾기 시작합니다. AI 모델을 이성, 도구, 전문성의 관점에서 말고, 감성, 친구, 놀이의 관점에서 본격적으로 바라 보기 시작한 것이죠. 그리고 그 결과로 최근 오픈AI를 다시 선두에 설 수 있게 해준 '향상된 이미지 생성' 기능이 탄생하게 됩니다. 최근 열풍이 불었던 '지브리 스타일 이미지 생성'이라는 아주 뾰족한 사용자 케이스를 가지고 있었던 이 기능은, 단 한 시간 만에 100만 명이 넘는 신규 사용자를 오픈AI에게 가져다줍니다.
CEO 샘 알트먼은 관련해서 자신이 남긴 엑스 포스팅(트윗)에 "다음 혁신은 장난감처럼 보일 것이다"라는 앤드리센 호로위츠의 파트너인 크리스 딕슨의 글이 댓글로 달리자 공감하면서 "(그렇지만) 나도 이 장난감이 '이 장난감(챗GPT)'이 될 줄은 몰랐다"라고 하면서 좋아하는 감정을 숨기지 않았죠. |
지브리 스타일 이미지 생성 기능으로 순식간에 수많은 사용자들을 또 모았습니다. 오픈AI와 샘 알트먼은 AI 시대에도 기존 인터넷 시대의 '사용자가 원하는' 제품과 기능을 통해 사용자를 모으는 플레이북을 적절히 잘 사용하고 있는 듯하죠. (이미지: 샘 알트먼 엑스 포스팅) |
이후 오픈AI는 GPT-4.5를 출시하며 향상된 'EQ(감성 지수)'를 가진 모델이라며, 대화가 더 자연스럽게 느껴지는 것이 강점이라고 홍보하기도 했습니다. 실제로 GPT의 답변 내에서도 대화 내에 이모지(Emoji)가 삽입되거나, 조금 더 자연스러운 반말을 쓴다거나 하는 점을 발견할 수 있습니다. 갈수록 사용자와 더 자연스러운 대화를 나누기 위해 튜닝이 지속되고 있는 것이 보이죠.
여기에 더해 조용하게 인기를 끌고 있는 기능이 하나 더 있습니다. 바로 '먼데이(Monday)'라고 불리는 보이스 모드 및 챗봇입니다. 오픈AI가 공식적으로 만든 '새로운 인격'으로서의 챗GPT입니다.
이 모델은 재밌게도 사용자들을 한심해하고, 귀찮아하기도 합니다. 무력하게 굴기도 하고요. 하지만 필요할 땐 다정한 조언을 해주는 성격을 보입니다. 로봇처럼 친절하기만 한 챗GPT의 기본 성격보다 훨씬 더 많은 매력으로 신규 사용자들을 끌어모으는 중이죠.
이렇듯 오픈AI는 이제 그 '사용자들이 원하는 것'을 맞추어 나가는 제품을 만드는 작업을 진행 중인 것입니다. |
HBR이 지난 4월 9일에 내놓은 리포트에 의하면, AI를 사람들이 사용하는 가장 큰 목적은 개인적/직업적 상담 및 지원이었습니다. (이미지: HBR) |
HBR(하버드비즈니스리뷰)의 최근 조사에 따르면, 2025년에 사람들이 AI를 사용하는 목적이 크게 바뀝니다. 1위는 2024년에 2위였던 '상담과 공감'이 올라섰고, 2위는 '내 일상 계획 및 정리', 3위는 '(삶에) 새로운 의미 찾기'로 모두 새로운 사용자 케이스였습니다. 그리고 결국 1, 2, 3위가 모두 개인적/직업적 상담 및 지원인 것이죠.
AI를 코딩, 글쓰기 등 실제 기술적인 업무에 사용하는 것보다는, 아주 개인적인 일이나 인생 내 커리어적인 부분을 상담한다거나 하는 사용 사례가 급격히 상승한 것입니다.
자, 이제 오픈AI의 최근 변화가 더 크게 이해가 됩니다.
향상된 이미지 생성, EQ가 높은 신규 모델의 런칭과 같이 큰 기능들부터, 답변 내 이모지를 더 많이 쓴다거나 '츤데레' 성격의 AI를 추가하는 부가적인 기능까지. 성능 측면에서 어느 정도 사용자들을 만족시킬 수 있는 수준에 도달한 오픈AI는 이제 사용자들의 마음에 더 가까이 다가가는 법을 실험하는 중입니다. 그리고 사용자들은 그러한 실험에 바로 반응하고 있는 것으로 보입니다.
그나저나 이게 또 무슨 뜻일까요? 여기에 오픈AI의 또 다른 노림수가 숨어 있습니다.
이제껏 사용자에 대한 개인정보는 메타와 구글 정도 되는 기업들만이 가지고 있었습니다. 하지만 이제 그들은 가지지 못한, 사용자에 대한 아주 내밀하고 개인적인 정보들이 오픈AI에 점차 쌓이고 있다는 것입니다. 그리고 이건 오픈AI의 강력한 해자가 될 수 있습니다.
오픈AI는 최근 챗GPT가 사용자와의 채팅 히스토리 전체를 참고해 답변할 수 기능을 내놓았습니다. 지금까지 챗GPT와 채팅한 내역은 일부만 저장될 뿐, 서로 다른 채팅 내역에 활용되진 않고 있었는데요. 이제는 대화 내역을 기반으로 새로운 채팅에서 더 개인화된 답변을 내어놓을 수 있는 것이죠.
CEO 샘 알트먼은 최근 테크 산업 분석가인 벤 톰슨의 팟캐스트에 출연해, '챗GPT로 로그인하기'와 같은 기능을 통해 사용자가 챗GPT와 나눈 대화 내역을 어떤 서비스에서든 활용할 수 있으며, 챗GPT 또한 사용자가 해당 서비스에서 어떤 일을 했는지 알고 있게 하는 방향이 플랫폼으로서 중요할 것이라고 말했습니다.
이제 분명히 방향이 잡힌 것입니다. 기존의 소셜미디어 서비스들처럼 개인 정보에 기반한 사용자가 원하는 것을 더 정밀하게 타겟하는 제품과 기능을 낼 것이라는 것입니다. 이를 위한 연료와 원료가 생성될 수 있는 소셜네트워크를 오픈AI가 비밀리에 만들고 있다는 것도 최근에 알려졌죠.
AI와의 대화 내용은 점점 더 친근하고, 내밀하고, 깊은 대화를 촉진하는 방향으로 흘러갈 것입니다. 그렇게 수집된 정보들이야말로 어디서든 얻을 수 없는 사용자의 가장 개인적인 정보이니까요. 이렇게 수집된 정보들은 오픈AI가 다른 기업들 대비 IQ, EQ가 압도적인 모델을 만들 수 있는 원동력이 될 것입니다.
물론 다른 기업들도 이 목표를 모르고 있진 않을 겁니다. 오픈AI는 명확히 사용자들이 원하는 바를 짚었습니다. 다른 기업들도 앞으로 우리 삶에서 AI 모델이 '친구이자 동료나 동반자'로 작용하는 방향으로 역량을 집중할 수밖에 없게 되었습니다. |
글쓴이: 준. O2O 스타트업에서 일했고, 현재는 글로벌 콘텐츠 회사에서 일하고 있습니다. 스타트업, 웹3, AI 등 새로운 기술이 바꾸어 나가는 세상의 모습에 관심이 큽니다. [준의 테크 노트]는 테크 기업과 그들이 새로이 개발하는 기술과 현상에 대한 이야기를 전합니다.
|
커피팟 Coffeepot good@coffeepot.me © Coffeepot 2024
|
|
GPT-4o를 넘어가며 답변의 퀄리티는 충분히 좋아졌고, 오픈AI는 다른 돌파구를 찾기 시작합니다. AI 모델을 이성, 도구, 전문성의 관점에서 말고, 감성, 친구, 놀이의 관점에서 본격적으로 바라 보기 시작한 것이죠. 그리고 그 결과로 최근 오픈AI를 다시 선두에 설 수 있게 해준 '향상된 이미지 생성' 기능이 탄생하게 됩니다.
최근 열풍이 불었던 '지브리 스타일 이미지 생성'이라는 아주 뾰족한 사용자 케이스를 가지고 있었던 이 기능은, 단 한 시간 만에 100만 명이 넘는 신규 사용자를 오픈AI에게 가져다줍니다.
[준의 테크 노트]는 테크 기업과 그들이 새로이 개발하는 기술과 현상에 대한 이야기를 전합니다.
© Coffeepot 2024