중국 빅테크의 생성 AI는 어디까지 왔을까? 오늘은 미국 기업들의 AI 발전 소식이 아닌 중국 빅테크 기업들의 AI 현황을 살펴봅니다. 알리바바와 텐센트 같은 중국 빅테크도 오픈AI를 중심으로 한 미국 AI 개발 기업들과의 격차가 더 크게 벌어지지 않도록 관련한 연구를 꾸준히 발전시켜 오고 있었습니다.
이들은 당장 알리익스프레스와 테무 등의 이커머스 플랫폼과 틱톡(더우인)과 같은 소셜미디어에서 유용하게 활용될 기술을 선보이면서 자체 AI 기술의 발전 방향을 고민하고 있는데요. 이번 이야기는 각 기술을 설명하는 쉬운 사례들을 차례로 살펴보고, 궁극적으로 어떻게 쓰이게 되는지, 그리고 중국의 빅테크가 현재 뒤처져 있는 미국 빅테크 기업들과의 AI 경쟁에서 어떤 방향을 가리키고 있는지를 짚어볼 수 있습니다. |
[AI] #알리바바 #텐센트 1. 중국 빅테크의 생성 AI는 어디까지 왔을까? |
현재 AI에 대한 대다수의 관심은 미국 기업에 집중되어 있습니다. 챗GPT로 AI 붐의 신호탄을 쏘아 올리고 최근 영상 생성 AI 소라(Sora)를 통해 세 번째 AI 대전을 열어젖힌 오픈AI부터, 오픈 소스 공개를 중심으로 영역을 확장하고 있는 메타, 자사가 가지고 있는 엄청난 데이터를 바탕으로 지속적으로 성능을 업데이트 중인 제미나이(Gemini)를 출시한 구글, 그리고 이곳저곳 제품 내에 실제로 유용하게 사용될 만한 UX를 중심으로 AI를 적용하고 있는 애플까지. 빅테크를 중심으로 한 AI 업계는 누가 뭐래도 미국을 중심으로 돌아가고 있습니다. 하지만, 첨단의 연구 결과 트렌드를 보자면 상황은 조금 다릅니다. 알리익스프레스로 친숙한 알리바바 그룹의 연구 결과부터 베이징 대학교, 텐센트(Tencent) 연구 그룹 등이 경쟁적으로 자신들의 연구 결과를 발표하고 있으며, 이러한 결과들은 이미지 생성 AI 분야를 깊게 파고 있는 매니아층과 실무진들에게 많은 영감을 주고 있죠.
이들은 AI와 관련해서는 모두가 미국을 주목하는 사이에 어느덧 꾸준히 결과물을 쌓아 올리는 중인데요. 이러한 연구 결과들의 속도와 그 방향성도 잘 살펴봐야 할 시기가 되었습니다. |
알리바바와 텐센트 같은 중국 빅테크도 이제 생성 AI 기술에 속도를 올리고 있습니다. |
만만치 않은 속도 보여주는 두 기업 최근 AI 쪽 창작자 및 매니아들에게 주목받은 연구들은 다수가 이미지 생성 중심입니다. 그중에서도 정지된 이미지를 움직이게 하거나, 존재하는 이미지를 변형시키거나 하는 연구 결과이죠. 이들은 각종 콘텐츠와 쇼핑 플랫폼에서 바로 적용할 수 있는 '실용적인' 이미지 생성 기술에 집중하고 있습니다.
우선 텐센트와 알리바바가 만든 기술들이 활용되고 있는 사례를 살펴보면요.
널리 쓰이는 텐센트의 IP 어댑터 텐센트가 발표한 IP 어댑터는 대표적인 이미지 생성 도구인 스테이블 디퓨전(Stable Diffusion)의 추가 기능으로, 인풋 이미지 한 장을 기준 삼아 다양한 변형을 가능케 하는 기술입니다.
아래와 같이 특정한 틀에 이미지를 넣으면 그에 맞게 이미지를 생성해 주는데요. |
왼쪽의 인풋 이미지를 오른쪽의 틀에 넣으면 탄생하는 결과물들입니다. 하나의 이미지로 다양하게 변형된 이미지를 생산할 수 있는 것이죠. (이미지: IP 어댑터) |
IP 어댑터는 이미지 일관성을 어느 정도 유지하면서도 다양한 장면을 생성할 수 있어 AI 기술 기반 창작자들이 이미 즐겨 사용하는 기술로 자리매김했습니다.
아래와 같이 생성 AI 기술을 활용해 만든 애니메이션에 들어갈 장면들도 이 기술을 통해 섬세하게 구현할 수 있죠. 캐릭터의 얼굴과 각 장면이 일정하게 유지되어 표현될 수 있도록 해주죠. |
이 링크로 들어가시면 전체 영상을 살펴보실 수 있어요. (이미지 출처: 엑스) |
AI 기술 기반 창작자들은 어떻게 작업물을 생성했는지에 대한 방법론(워크플로우(Workflow))을 공유하는 것이 일반적인데요. 이미 이들 사이에서는 이미지의 일관성 유지를 위해서 IP 어댑터가 널리 쓰이고 있는 점이 발견되고 있습니다. 일관성 유지는 AI 창작물에서 중요한 주제 중 하나이며, 텐센트에서 연구한 IP 어댑터는 일관성 유지에 탁월한 성능을 보여 주고 있죠. 바로 활용되는 알리바바의 연구
|
애니메이트 애니원(위)와 드림무빙(아래)는 한장의 고정된 이미지를 기반으로 말그대로 뼈대를 만들어 움직임을 재현합니다. |
의상을 합성하는 기술은 이전부터 있어 왔지만, 생성 AI를 통해 해당 인물이 '진짜 입은 것처럼' 표현하는 것이 특장점인 연구 결과입니다. |
합성이 아니라 옷을 진짜 갈아입어 본 것처럼 표현할 수 있게 되었죠. (이미지: 아웃핏 애니원) |
인상적인 점은 음성 인풋의 톤이나 강세에 따라 표정도 자연스럽게 변한다는 것입니다. |
말하거나 노래하는 것에 따라 얼굴 표정을 섬세하게 잡아주고 있죠. (이미지: EMO) |
앞서 살펴보았듯, 현재 주목 받고 있는 중국 기업 및 대학에서의 연구들은 이미지 생성에 집중되어 있습니다. 중국어 기반의 대규모 언어 모델은 중국어권 사용자들에게만 유효한 데다, 영어 기반의 대규모 언어 모델을 만드는 것은 미국 기업들에 비해 경쟁력을 발휘하기 어려운 분야이니 눈에 보이고 적용이 쉬운 이미지 생성 쪽 연구를 중점적으로 진행하는 것이라고 예상해 볼 수 있죠.
한 가지 아쉬운 점을 짚자면, 활발하게 연구를 이어가면서 유의미한 발전을 보여주는 알리바바 그룹은 창작자들이 실제로 사용해 볼 수 있는 코드를 공개하진 않았다는 것인데요. 메타의 오픈 소스 언어 모델인 라마(LLAMA)처럼 기업 자체에서 주도권을 쥐고 오픈 소스 움직임을 주도 하지 않는 이상, 일반적으로 알비바바와 같은 사기업들의 연구 결과는 폐쇄적으로 코드를 공개하지 않는 경향성이 큽니다. 특히 자신들의 사업 영역과 밀접한 기술일수록 성과는 알리되, 노하우는 감추는 것이죠. 이런 경향은 앞으로도 이어질 것으로 예상됩니다.
이커머스 플랫폼에 바로 활용 위 공유 드린 연구 결과들이 유용하게 적용될 수 있는 분야들은 바로 생각해 볼 수 있습니다. 알리익스프레스에서 의류 쇼핑을 할 때, 해당 의상이 나에게 어울리는지 아웃픽 애니원 기반 기술로 알아볼 수 있고, 라이브 쇼핑의 호스트는 드림무빙이나 EMO와 같은 기술로 처음부터 끝까지 AI가 진행할 수도 있습니다.
|
중국에서는 이미 딥페이크가 라이브 쇼핑에 활용되고 있어요. (이미지: MIT 테크놀로지 리뷰) |
그렇기에 지금까지 공개된 연구 결과들이 지향하는 바는 비교적 명확해 보입니다. 쇼핑과 콘텐츠 소비 분야에서 고객들에게 보여지는 이미지와 콘텐츠에 AI로 생성된 결과들을 최대한 활용하는 것이에요. 그렇게 된다면 플랫폼 입장에서는 크리에이터와 상품 공급자들에게 의지해야 했던 부분을 덜게 되고, 반대로 크리에이터와 상품 공급자들 입장에선 상품 상세 이미지 등을 매번 손으로 만들어야 했던 것을 플랫폼이 제공하는 AI가 해주니 제공하는 콘텐츠와 상품의 본질에 더 집중할 수 있게 될 것이라고 예상해 볼 수 있죠.
미국 기술과 경쟁이 될까? 하지만 사실 위 연구 결과들이 사람들에게 놀라움을 안겨줬던 시간은 오픈AI가 소라를 발표하기 전까지였습니다. 소라를 통해 고정된 이미지를 영상화한다거나, 새로운 영상을 생성한다는 기준 자체가 급격하게 높아지면서, 이전까지 시장에서 주목받았던 기업이나 영상화 기술에 대한 관심은 시들해졌죠. 하지만, 그럼에도 자체 영상화 기술에 투자한다는 것은 의미가 큽니다.
소라는 오픈AI의 다른 기술과 함께 역시나 유료로 제공될 것으로 예상되는데요. 소라에 기반한 서비스를 만드는 것은 그 자체만으로도 큰 비용을 전제하게 됩니다. (결국 오픈AI와 같이 기술 제공자들이 큰 이익을 보는 구조이죠) 비용 효율적이면서도 의상을 대체하는 것과 같은 특정한 사례를 위한 AI 기술을 만드는 것은 소라 이후에도 기업에서 충분히 고려해야 하는 선택지로 남아 있을 것입니다. 이에 더해 중국 입장에선 기술 주도권을 미국 기업에 빼앗기지 않으려면, 더욱 자체적으로 기술 개발에 박차를 가해야 하는 측면이 분명 있습니다. 그렇기에 중국에선 기업과 대학을 필두로 실제 비즈니스에 거의 바로 적용 가능한 AI 기술들의 연구가 역시나 빠르게 진행되고 있었던 것이고요.
이렇게 개발된 기술들은 앞으로 현재 미국은 물론 한국을 포함한 세계 곳곳에서 확장세가 무서운 알리익스프레스, 테무 등에서 쓰이게 될 것입니다. 의류 이커머스의 패션 모델들은 해당 기술로 만든 AI 생성 모델로 점차 교체되고, 사용자들이 AI 기술로 옷을 자유롭게 입어볼 수 있도록 할 것이고, 틱톡과 같은 소셜미디어 플랫폼에선 어느샌가 AI로 생성된 크리에이터들이 하나둘 피드에 뜨게 될 것이라 예상해 볼 수 있습니다.
미국에서 먼저 태동한 기술들과는 현재 격차가 있지만, 사용자들에게 '지금' 필요한 기술로서 각 플랫폼에서 활발히 사용되면 유용성을 입증하고 발전할 가능성을 충분히 보여주고 있습니다.
- By 준. O2O 스타트업에서 일했고, 현재는 글로벌 콘텐츠 회사에서 일하고 있습니다. 스타트업, 웹3, AI 등 새로운 기술이 바꾸어 나가는 세상의 모습에 많은 관심을 두고 있습니다. |
[빅테크] #키티의빅테크읽기 2. 엔비디아의 AI 패권 패러독스 |
엔비디아의 독주 체제는 굳혀졌습니다. 얼마 전부터 예견되어 오던 일이지만, 독주는 현실화가 되었고 AI 산업의 판도를 사실상 쥐었다고 할 수 있는 수준이 되었습니다. 시가총액은 3월 들어 2조 달러를 넘기고 미국 주식 시장에서 마이크로소프트와 애플에 이어 3위 자리를 굳혔고요. CEO인 젠슨 황은 어느덧 일론 머스크, 샘 알트먼과 같은 테크를 대표하는 인물들도 뛰어넘는, 세상을 바꿀 AI 산업의 얼굴이 되었죠.
자, 그렇다면 엔비디아의 독주 체제는 이대로 계속 이어질까요? 과연 엔비디아의 수요를 받쳐줄 AI 산업에서 엔비디아에게 리스크가 될 사항은 없는 걸까요?
당분간 엔비디아를 대적할 상대는 없지만, 그렇다고 엔비디아가 끝도 없이 성장을 이어갈 수 있다는 것은 또 섣부른 판단이 될 수 있습니다. 미국과 중국 관계는 미국에서 어떤 행정부가 들어서도 쉽게 풀리지 않을 것으로 예상되고, 특히나 핵심 반도체의 경우 수출길이 계속 막힐 것으로 예상되는 상황이에요. 또, 대만에 생산 의존도가 큰 엔비디아에게는 중국과 대만의 양안 관계 악화도 리스크가 됩니다. 단기적으로도 중장기적으로도 어쨌든 중국 그리고 대만과 관련한 리스크가 늘 엔비디아를 따라다닐 수밖에 없습니다.
또한, 엔비디아의 질주는 이미 반독점 당국의 레이더망에도 걸려 있는 상황입니다. 기세를 몰아 ARM과 같은 반도체 기업을 엔비디아가 인수하는 일은 현재 규제 당국이 유지된다면 쉽지 않을 것이라고 이번 [키티의 빅테크 읽기]는 전합니다. 젠슨 황이 펼치는 비전이 쉽지만은 않을 이유는 기술이 그 자체로 패권이 될 때라는 점을 명확하게 짚으면서요.
엔비디아의 질주를 놀랍게 바라보면서도, "과연 언제까지 이어질 수 있을까?", "리스크는 분명 있을텐데, 그게 명확하게 무엇일까?"와 같은 질문이 떠오르셨다면 이번 이야기가 큰 틀에서의 해답이 됩니다. 명확하게 보이지 않던 이면과 그 요소들을 발견할 수 있고요. |
[투자/금융] #부엉이의차트피셜 3. 버핏이 걸어야 하는 마지막 승부 |
최근 평생의 파트너 찰리 멍거를 떠나보낸 94세의 워런 버핏은 여전히 버크셔 해서웨이와 함께 건재한 모습을 보여주고 있습니다. 최근 발표한 2023년 실적은 사상 최대치를 기록했고, 그 어느 때보다 많은 현금까지 쌓아놓은 상황이죠. 하지만 워런 버핏도 이제 마지막 여정을 준비해야 하는 이때, 버크셔 해서웨이는 어쩌면 또다시 도전적인 상황에 놓여있는 것으로 보입니다.
일단 사상 최대치의 실적을 냈지만, 자세히 들여다보면 올해가 그 정점인 것으로 판단하고 있습니다. 현금은 두둑이 쌓여있지만 고평가되었다고 판단한 시장에서 미래 성장을 위한 투자처 역시 찾기가 쉽지 않은 상황이고요.
버크셔 해서웨이가 수십 년간의 누적 성장률이 압도적으로(라고 표현해도 담을 수 없을 만큼) 높을 수 있었던 가증 큰 비결은 효율적인 '자본배분'으로 꼽힙니다. 그리고 이 일을 가장 훌륭하게 소화해 낸 것이 워런 버핏이었고요. 하지만 그런 워런 버핏도 현재 마땅히 자본을 효율적으로 재배치할 수 있는 상황이 아니라는 것입니다. 수년을 기다려야 할 수도 있는 상황이면서, 워런 버핏에게는 버크셔 해서웨이의 미래와 자신의 레거시를 위해 마지막 승부를 걸어야 하는 상황이기도 하죠.
과연 워런 버핏은 현재의 상황을 어떻게 타개해 나갈까요? 현재로서는 그의 자본배분 역량을 따라 할 수 있는 사람은 찾을 수 없습니다. 그렇다고 워런 버핏이 때가 아닌데 액션을 취하는 선택은 하지 않을 것이라고 이번 [부엉이의 차트피셜]은 전합니다. 버크셔 해서웨이의 2023년 주주서한 발표를 계기로 워런 버핏의 마지막 승부수는 무엇이 될지를 살펴보면서요.
오히려 때를 기다리고, 설령 그에게 남은 시간 동안 기회가 오지 않는다 하더라도 버크셔 해서웨이의 투자 원칙을 끝까지 지킬 것이라고 예상합니다. 그가 만든 버크셔 해서웨이의 투자 원칙을 끝까지 지키는 것이 어쩌면 가장 멋진 마지막 승부수일 수 있습니다. |
☕️☕️ 모든 뉴스레터 받아보려면! 월스트리트부터 실리콘밸리, 그리고 전 세계 주요 경제 이슈까지. 실질적인 도움이 되는 분석을 쉽고 재밌게 전해드려요. 향후 저자들과 함께하는 오프라인 [모임]에도 참여할 수 있으니 구독하고 꾸준히 받아보세요. + 첫 1개월 50% 할인을 해드려요. 더 할인된 연간 구독도 가능하고요. 확인해 보세요!
|
good@coffeepot.me
© COFFEEPOT 2023 |
|
|
하지만, 첨단의 연구 결과 트렌드를 보자면 상황은 조금 다릅니다. 알리익스프레스로 친숙한 알리바바 그룹의 연구 결과부터 베이징 대학교, 텐센트(Tencent) 연구 그룹 등이 경쟁적으로 자신들의 연구 결과를 발표하고 있으며, 이러한 결과들은 이미지 생성 AI 분야를 깊게 파고 있는 매니아층과 실무진들에게 많은 영감을 주고 있죠.
최근 AI 쪽 창작자 및 매니아들에게 주목받은 연구들은 다수가 이미지 생성 중심입니다. 그중에서도 정지된 이미지를 움직이게 하거나, 존재하는 이미지를 변형시키거나 하는 연구 결과이죠. 이들은 각종 콘텐츠와 쇼핑 플랫폼에서 바로 적용할 수 있는 '실용적인' 이미지 생성 기술에 집중하고 있습니다.
바로 활용되는 알리바바의 연구
특히 자신들의 사업 영역과 밀접한 기술일수록 성과는 알리되, 노하우는 감추는 것이죠. 이런 경향은 앞으로도 이어질 것으로 예상됩니다.
위 공유 드린 연구 결과들이 유용하게 적용될 수 있는 분야들은 바로 생각해 볼 수 있습니다. 알리익스프레스에서 의류 쇼핑을 할 때, 해당 의상이 나에게 어울리는지 아웃픽 애니원 기반 기술로 알아볼 수 있고, 라이브 쇼핑의 호스트는 드림무빙이나 EMO와 같은 기술로 처음부터 끝까지 AI가 진행할 수도 있습니다.
그렇게 된다면 플랫폼 입장에서는 크리에이터와 상품 공급자들에게 의지해야 했던 부분을 덜게 되고, 반대로 크리에이터와 상품 공급자들 입장에선 상품 상세 이미지 등을 매번 손으로 만들어야 했던 것을 플랫폼이 제공하는 AI가 해주니 제공하는 콘텐츠와 상품의 본질에 더 집중할 수 있게 될 것이라고 예상해 볼 수 있죠.
비용 효율적이면서도 의상을 대체하는 것과 같은 특정한 사례를 위한 AI 기술을 만드는 것은 소라 이후에도 기업에서 충분히 고려해야 하는 선택지로 남아 있을 것입니다. 이에 더해 중국 입장에선 기술 주도권을 미국 기업에 빼앗기지 않으려면, 더욱 자체적으로 기술 개발에 박차를 가해야 하는 측면이 분명 있습니다. 그렇기에 중국에선 기업과 대학을 필두로 실제 비즈니스에 거의 바로 적용 가능한 AI 기술들의 연구가 역시나 빠르게 진행되고 있었던 것이고요.
이렇게 개발된 기술들은 앞으로 현재 미국은 물론 한국을 포함한 세계 곳곳에서 확장세가 무서운 알리익스프레스, 테무 등에서 쓰이게 될 것입니다. 의류 이커머스의 패션 모델들은 해당 기술로 만든 AI 생성 모델로 점차 교체되고, 사용자들이 AI 기술로 옷을 자유롭게 입어볼 수 있도록 할 것이고, 틱톡과 같은 소셜미디어 플랫폼에선 어느샌가 AI로 생성된 크리에이터들이 하나둘 피드에 뜨게 될 것이라 예상해 볼 수 있습니다.
+ 첫 1개월 50% 할인을 해드려요. 더 할인된 연간 구독도 가능하고요. 확인해 보세요!
수신거부