☕️ 새로운 세계를 보여주는 사례들

1. 확장되는 GPT 비전의 세계, 2. 인스타카트는 무엇이 될까?
2023년 11월 14일 화요일
오늘은 새로운 세계를 확장해 보여주는 GPT-4의 새로운 사례들에 대해서 살펴볼게요. 오픈AI가 개발자 컨퍼런스를 진행한 지도 벌써 일주일 넘게 지났지만, 여전히 여운이 가시지 않은 모습입니다. 이번에 새롭게 공개된 API를 통해 어떤 사례들이 만들어지고 있을까요? 하나씩 차근히 살펴보세요. 놀랍고 재밌습니다. 

이어서 식료품을 직접 쇼핑해 배달해 주는 서비스를 시장에 선보이고 크게 성장했던 인스타카트에 대한 이야기를 전해드려요. 인스타카트는 지난 9월에 미국 나스닥에 상장까지 했고, 최근 상장 이후 첫 실적 발표를 했는데요. 성적이 나쁘진 않았지만, 향후 확장에 대한 한계가 보인다고 평가 받습니다.

+ 샷 추가하면 커피팟의 모든 콘텐츠 받아볼 수 있다는 것 아시죠? :)

[AI] #GPT-4 #비전API 
1. 새로운 세계를 보여주는 사례들
챗GPT의 런칭으로부터 약 1년 후, 지난주 개최한 첫 개발자 컨퍼런스(Devday)에서 오픈AI는 GPT-4 터보와 각종 부가 기능들을 발표했죠. 관련해서는 커피팟을 통해서도 상세히 소개했는데요.

컨퍼런스 이후 일주일이 지난 현재 아직 그 여운이 가시질 않고 있고, 사용자들이 자신만의 'GPTs'를 어떻게 만들고 어떻게 활용할지에 대한 이야기는 계속되고 있습니다. 샘 알트만이 시현한 '스타트업 멘토'와 같이 다양한 설정을 통해 개인들이 직접 수많은 페르소나를 만들고 공유하는 모습도 보이죠.

하지만 각종 커뮤니티와 X(구 트위터) 등지에서 사용자들을 뜨겁게 달군 것은 GPT-4 비전 API 공개이기도 했습니다. API가 공개되었다는 건 어떤 의미일까요?

API는 어플리케이션 프로그래밍 인터페이스(Application Programming Interface)의 약자로, 어떤 어플리케이션이 내부/외부적으로 다른 어플리케이션들과 이어지는 방식을 의미합니다. UI(User Interface)라는 말은 익숙하시죠? UI는 사용자와 프로그램이 소통할 수 있도록 만드는 방법이라면, API는 어플리케이션 간의 소통 창구라고 생각하시면 됩니다.

챗GPT의 등장 이후 기술은 급속도로 발전해 1년도 안 되어 AI는 보고, 듣고, 말할 수 있게 되었습니다. 그리고 이는 일전에도 전해드렸듯이 '멀티 모달리티(Mulit-modality)'라고 부르죠. 멀티 모달리티는 AI의 발전에 가장 중요한 발걸음이기도 합니다. 원래도 챗GPT 사이트에 직접 이미지 업로드를 하는 방식으로 사용할 수 있었지만, 이번 API 공개를 통해 개발자들은 자신이 이용 중인 프로그램 아무 곳에서나 GPT-4에게 이미지를 보고 읽어 달라고 요청할 수 있게 되었습니다.

우선 몇 가지 재밌고 놀라운 사례를 살펴보겠습니다.
메시의 단독 드리블 돌파 이후 골까지의 장면을 드라마틱하게 표현한 영상이 화제가 되었어요. 여기에서 직접 들어보시죠.
축구 해설도 하고, 쇼핑도 하는 AI
첫 번째 사례는 오픈AI에서도 공식적으로 가이드를 주고 있는, '비디오를 이해하고, 해석하여, 이를 다시 음성으로 말해주는 기능'을 이용해 축구 선수 메시가 단독으로 드리블하여 골을 넣는 장면을 AI가 해설하도록 만들었습니다.

단순히 해설을 하는 것이 아니라, 열정적인 톤과 단어 선택을 하라고 미리 주문해 마치 실제 축구 경기의 해설자처럼 흥분하고, 소리치는 것을 들어볼 수 있습니다. 아직 GPT-비전은 비디오를 직접적인 인풋으로 받진 않지만, 해당 비디오를 프레임 단위로 쪼개어 이미지 상태로 이해한 후, 이를 해석하고, 역시 오픈AI의 TTS(Text-to-speech) 기능인 위스퍼(Whisper)를 이용하여 음성으로 변환한 것입니다.

다음 사례는, 자신의 컴퓨터와 스크린을 그대로 GPT에게 공유한 다음, GPT가 (각 페이지를 보면서) 크리스마스를 위한 물품들을 알아서 쇼핑하는 사례입니다.
이제 직접 구글에서 검색을 하고, 직접 주문까지 다 할 수 있습니다. 필요한 물건도 자동화해 살 수 있는 것이죠. (이미지: (엑스(트위터) 공개 영상)
이 또한 프레임 단위로 API를 통해 GPT에게 페이지 이미지를 넘겨주고, GPT는 이를 해석하고, 자체적으로 코드를 만들고 실행하여 (각 페이지에서) 어떤 버튼을 어떻게 클릭할지 결정하는 것입니다. 

이러한 흐름이 가능하다는 것은, 어떤 사이트나 서비스가 GPT를 위한 연동 방법을 제공하고 있지 않더라도, 사람이 사용 가능하기만 하다면 무엇이든 GPT가 자동화할 수 있다는 의미입니다. GPT가 직접 '보고' 판단할 수 있으니까요.

다음 사례는 좀 더 가볍고 재미있는 사례입니다.

GPT에게 자신의 현재 의상 사진을 보내면, GPT는 이를 보고 개선할 부분들에 대해 작성하고, 이를 기반으로 개선된 의상에 대한 개념을 잡을 수 있도록 달리(DALL-E)를 통해 그림까지 그려 주는 데모입니다.
옷을 어떻게 입어야 할지에 대한 조언도 이미지로 바로 이렇게 전해줄 수 있죠. (이미지: 엑스 포스팅)
이러한 사례들은 실제 서비스에 적용하기엔 아직 이른 것으로 보이지만, 대략 어떤 흐름으로 서비스들이 발전할 지 파악해 볼 수 있습니다.

이제 AI가 '보기' 시작했다는 것이 어떤 의미를 가지는 지 조금 이해가 되시나요?

이제 AI를 위한 하드웨어까지
이렇게 보고, 듣고, 말할 수 있게 된 AI의 멀티 모달리티를 극한으로 활용해 새로운 개념의 하드웨어를 출시한 스타트업이 있습니다. 바로 '휴메인 AI 핀(Humane AI Pin)'이라는 제품입니다.

옷깃 근처에 부착하는 '핀(Pin)' 형태로 만들어진 작은 기기입니다. 안에는 카메라와 스피커, 마이크와 아주 작은 빔프로젝터가 달려 있습니다. 사용자는 핀을 누르거나, AI를 음성으로 호출하여 AI와 대화를 할 수 있고, 현재 카메라를 통해 보이는 사물들에 대해 질문도 할 수 있습니다. 물론 스마트폰과 같이 통화도 가능하며, 문자를 보내거나 받을 수도 있습니다.

받은 문자 등 스크린이 필요할 경우엔 작은 빔프로젝터를 통해 손바닥 위에 스크린을 쏴서 볼 수 있습니다. 그리고 손바닥을 조금씩 기울이면서 스크린 내에서 정보를 선택해 볼 수 있죠.
문자를 어떻게 보내라고 명령한 후 문자 내용을 또 손바닥 위에 비춰 확인할 수도 있죠. 이번 기기는 AI를 최대한도로 활용하는 실험하는 데 의미가 있기도 해요. (이미지: 휴메인 영상)  
또한 휴메인 AI 핀은 사용자가 앱을 설치하는 것이 아니라, AI가 알아서 필요한 순간에 앱을 호출하게 됩니다. 사용자는 그냥 필요한 것을 이야기하면 되는 것이에요.

이제껏 볼 수 없었던, AI를 최우선으로 둔 굉장히 실험적인 기기입니다. 성공할지 섣불리 예상할 수는 없지만, AI가 하드웨어의 패러다임까지 점차 바꾸어 나갈 것임은 분명해 보입니다.

스마트폰은 사용자가 능동적으로 납작한 스크린을 통해, 손가락으로, 혹은 가끔 음성으로 앱을 실행해야만 동작하는 수동적인 기계였습니다. 이제는 사용자가 보고, 듣는 것을 기계가 항상 함께 보고, 듣고 있으며, 사용자가 필요한 순간에 어떤 수단이건 상관없이 기계에게 요청을 한 다면 기계가 알아서 그 요청을 수행하는 것으로 역할이 변화하고 있는 것이죠.

나의 일, 그리고 생활 속에서 AI를 손쉽게 활용하는 순간은 이미 코 앞에 와 있습니다. 이 모든 것이 AI가 진정한 멀티 모달리티를 달성하고 있기 때문에 가능해지는 것입니다.

-
By 준. 글로벌 IT 기업에서 일하고 있어요. 스타트업, 웹3, AI 등 새로운 기술이 바꾸어 나가는 세상의 모습에 많은 관심을 두고 있습니다.

[리테일] #식료품배달 #시장
2. 인스타카트는 무엇일 될 수 있을까?
식료품에 더해 확장할 수 있는 카테고리는 무엇일까요? (이미지: 인스타카트)
식료품 쇼핑을 대신해 배달해 주는 서비스인 인스타카트는 한 때 390억 달러(약 51조 6800억 원)에 달하는 기업가치를 기록할 정도로 잘 나가는 스타트업이었어요. 하지만 이는 팬데믹과 저금리 시대의 덕택을 본 크게 부풀려진 가치였고, 우여곡절 끝에 지난 9월에 상장한 이후 현재는 시가총액이 70억 달러(약 9조 2760억 원)에 불과합니다.

그래도 이번에 상장 이후 발표한 첫 실적은 나름 선방했다는 평가도 받는데요. 코스트코와 월마트 그리고 크로거 등 각종 브랜드 마트 그리고 내 주변의 로컬 상점에서 쇼퍼들이 대신 쇼핑을 해주고 배달해 주는 모델은 과연 지속 가능할까요? 플랫폼은 외연을 넓히며 성장할 수 있을까요?

시장은 긍정적으로 바라보고 있지 않아요. 온라인 식료품 시장의 확장성도 한계가 있다고 보면서요.

[냅킨메모] #뉴욕타임스 #1000만구독자
3. 뉴스가 핵심이 아니어도 괜찮은 뉴스 사업자
생성 AI의 빠른 발전으로 영향을 받을 수밖에 없겠지만, 구독자를 끌어들이는 본질은 앞으로도 크게 달라지지 않을 것으로 보입니다.
뉴욕타임스가 최근 1000만 구독자를 달성했다는 소식은 놀랍지 않습니다. 꾸준히 성장해 왔고, 꾸준히 성장할 방법을 만든 이들이 곧 이 마일스톤을 달성하리라고 업계 대부분이 예상을 하고 있었죠.

뉴욕타임스는 넷플릭스만큼이나 (혹은 그 이상으로) 구독자 증대 방법과 성장 공식을 깨우친 기업입니다. 뉴스가 아닌 엔터테인먼트적인 요소가 깃든 콘텐츠 제품(프로덕트)들이 이 공식의 핵심이기도 하고요. 그래서 일각에서는 미디어 기업인 뉴욕타임스의 뉴스 구독제가 감소하는 흐름을 걱정스럽게 바라보기도 합니다.

하지만 '뉴스'만을 담은 상품이 많이 팔리지 않는다고 해서 뉴스가 뉴욕타임스의 주력 콘텐츠가 아니게 되는 것도 아니고, 미래 성장에 걸림돌이 될 요소도 아닙니다. 뉴스는 늘 핵심으로 남고, 뉴욕타임스의 우산 아래 콘텐츠의 영역이 넓어지는 것입니다.

이번 [냅킨 메모]는 오히려 외연을 확장해 다른 요소들과 함께 미디어 플랫폼으로서의 기반을 점점 공고히 하는 뉴욕타임스의 모습을 전해드립니다.

냅킨 메모는 주목할 비즈니스 혹은 기업들의 이야기 중 빠르게 메모하면서 기억하면 좋을 이야기를 전하는 커피팟의 샷 추가 콘텐츠입니다. 

[부엉이의 차트피셜] #채권 #금리
4. 투자의 패러다임이 바뀌는 순간
하워드 막스가 2018년에 월스트리트저널과의 인터뷰를 하면서 직접 그린 그림이에요. 당시 자신의 새로운 책 <투자와 마켓 사이클의 법칙(Mastering the Market Cycle)>을 출간한 이후였는데, 장기적으로 시장이 변화하는 모습을 표현한 것이죠.

RICH라고 쓴 부분은 시장 가격이 높을 때를 의미하고, FAIR는 시장 가격이 알맞을 때, 그리고 아래의 CHEAP는 시장 가격이 낮을 때를 의미합니다. 장기적으로는 (계속 우상향하지만) 시장이 세 가지 경우의 파도를 끊임없이 타고 있음을 표현한 것이에요. 우측 상단의 점선들은 '단기적으로는' 시장에서 무슨 일이든 일어날 수 있음을 보여주는 것을 표현한 것이라 설명했고요. (이미지: 하워드 막스, 월스트리트저널)
월스트리트의 대표적인 투자 구루 하워드 막스(Howard Marks)의 월간 '메모(The Memo)'는 워런 버핏도 읽는 투자자들의 필독서입니다. 최근 들어서는 이 유명한 메모가 더 주목을 받고 있는데, 현재 투자 시장에서 일어나는 '거대한 변화'를 콕 짚어주고 있기 때문이죠.

그가 말하는 거대한 변화는 저금리가 이어지던 지난 십수 년간의 지형이 완전히 무너지고, 이제는 새롭게 바뀐 환경이 장기간 이어진다는 것입니다. 시장이 그렇게 움직이는 것 같긴 해도 누구도 강하게 주장하지 못하고 있던 이 이야기를 그는 어떤 근거를 들어서 '선언'하듯이 이야기한 걸까요? 

커피팟의 롱폼 아티클인 [부엉이의 차트피셜]이 이 이야기를 해설해 주고, 현재 투자 시장은 어떤 자산을 바라보고 있는지를 전해드립니다. 차근히 따라 읽어가 보시면 금리와 채권 그리고 관련한 자산 시장의 현재 방향에 대한 구체적인 힌트가 되어주는 이야기입니다.

투자 지침이라기보다는 거시경제의 큰 변화에 따른 자본의 이동을 명확하게 보여주는 이야기라고도 할 수 있고요.

☕️☕️ 샷 추가하고 꾸준히 받아보세요!
빅테크, AI, 리테일, 미디어, 에너지 등에 걸친 산업과 기업 그리고 거시경제를 분석하는 이야기를 전합니다. 어려울 수 있는 주제도 쉽고 재밌는 해설로 접하실 수 있어요. 커피팟 저자들과 함께하는 오프라인 [모임]에도 참여할 수 있고요 :) 

+ 첫 1개월 50% 할인이 되어요. 연간으로는 더 할인이 되고요.

☕️
오늘 커피팟 어땠나요?




good@coffeepot.me

© COFFEEPOT 2023
더는 받아보고 싶지 않으시다면
수신거부