[준의 테크 노트] 또 새로운 터닝포인트 맞이한 콘텐츠 생성 AI 각종 AI 기반 이미지 생성 유행이 소셜미디어를 타고 화제가 되기 시작한 지 이제 3년이 채 안 되었습니다. 처음에는 누가 봐도 AI로 생성했지만, '1990년대 졸업 앨범 사진' 같은 그 기발한 설정 덕분에 모두가 즐거워하면서 놀이로 퍼져나갔죠.
이제는 그런 놀이가 '영상'으로도 가능한 시대가 되었습니다. 몇 가지 생성 AI 툴을 활용하면 누구나 쉽게 영상을 만들고 공유할 수 있게 되었는데, 이 영상들이 심지어 현실보다 더 현실 같은 모습을 하고 있다는 것이 특이점입니다.
그렇다면 이런 툴들은 단순히 사람들 사이의 소셜미디어 놀이를 넘어서 콘텐츠 산업에는 어떤 영향을 끼칠까요? 이미 짧은 영상의 제작과 배포는 특히 중국 시장을 중심으로 커지기 시작했고, 산업 내 새로운 산업을 만들어 가는 중입니다.
이미지 생성 AI가 발전하고, 음악 생성 AI도 어느새 영역이 커졌습니다. 이들과 결합하는 영상 생성 AI를 기반으로 한 콘텐츠 시장이 어떻게 커가는지를 주목해야 할 때가 다가왔음을 오늘 [준의 테크 노트]가 짚습니다. |
[준의 테크 노트] #AI모델 #영상생성흐름 AI 영상도 현실처럼 만들게 되면 |
또 새로운 터닝포인트를 맞이한 콘텐츠 생성 AI |
AI 트렌드의 시작점이자 발원지인 소셜미디어에서 최근 흥미로운 유행이 있었습니다. 한 엑스 사용자가 이른바 한국 프로 야구 경기의 야구장 캠에 찍힌 듯한 여성의 영상을 포스팅했고, 이를 본 사람들 사이에서 이 영상이 AI로 만들어진 것인지에 대해 갑론을박이 순식간에 커졌죠.
이 영상들은 시중에 나와 있는 AI 영상 제작 툴인 클링AI(KlingAI), 힉스필드(Higgsfield) 등으로 만든 것으로 예상됩니다.
사용자들은 해당 영상의 스타일을 재빠르게 카피해서, 마치 자신의 얼굴이 야구 전광판에 잡힌 듯한 모습을 AI로 생성하기 시작했습니다. 이러한 흐름은 야구장 캠에서 멈추지 않고, 전 세계 사람들이 마치 자신이 한국의 음악방송에 출현한 아이돌인 것처럼 동영상을 생성하는 모습까지 보입니다. 그리고 이런 영상을 생성하는 노하우 또한 공유되기 시작했죠.
약 3년 전 선풍적으로 유행했던 AI 졸업 앨범과도 유사한 모습을 보입니다. 당시에도 발전하는 AI 기술에 놀라는 모습을 보이면서 재밌게 1990년대 감성의 졸업 앨범 사진 생성기에 자신의 사진을 넣어 짧은 유행이 올라탔죠.
하지만 이번에 보인 흐름과 결정적으로 다른 점이 두 가지 있습니다. 이번 유행은 '영상'이라는 점, 그리고 퀄리티 자체가 훨씬 좋아져서 실제라고 해도 믿을 결과물이 나왔다는 것입니다. AI 생성 툴들이 막 생겨나기 시작했던 3년 전에는 모두가 사진을 보면 AI로 생성했다는 것을 알 수 있었죠. |
2년 반도 안 되는 시간 만에 누가 봐도 AI 생성 프레임이라고 볼 수 있는 '이미지'에서 실제 공연을 찍었다고 볼 '영상'까지 만드는 모습으로 AI 모델은 발전했습니다. 누구나 쓸 수 있는 도구로요. (이미지: 인스타그램 및 엑스 캡처) |
이렇게 높은 수준의 동영상이 AI로 생성될 수 있게 된 것은 물론 이미지 생성 모델과 영상 생성 모델 양측의 비약적인 발전 덕분입니다.
사실적인 영상을 만들려면 그만큼 사실적인 이미지가 먼저 필요하고, 이미지 모델을 통해 이를 생성하고, 동영상 모델을 통해 움직이게 만드는 방식이라고 보시면 됩니다. 물론 영상 모델만을 가지고도 텍스트-투-비디오(Text-to-Video)로 바로 생성이 가능하지만, 그만큼 사용자들의 의도 등을 반영하지는 못합니다. 이미지 생성 모델은 2026년 2월 출시된 구글의 나노 바나나2, 그리고 이어서 4월에 출시된 오픈AI의 챗GPT 이미지(Images) 2.0이 대부분의 역할을 담당합니다. 특히 챗GPT 이미지 2.0는 실제와 구분이 불가능할 정도로 사실적인 이미지들을 생성하고, AI 이미지의 약점으로 여겨졌던 이미지 내 글자들에 대한 생성도 완벽에 가깝게 해내는 모습을 보여, 많은 사용자들이 열광했습니다.
비디오 생성 모델에선, 틱톡을 서비스하는 중국의 바이트댄스(ByteDance)에서 개발한 영상 모델 시댄스(Seedance) 2.0도 지난 2월 공개되며 압도적인 영상 생성 능력을 보여주었고, 최근 대부분의 AI 영상 생성 모델로 활용되고 있습니다.
이렇게 챗GPT 이미지 2.0으로 캐릭터 시트, 스토리보드 등의 이미지를 고퀄리티로 생성하고, 이를 참조하여 시댄스 2.0으로 영상화하는 것이 2026년 5월 기준으로 가장 높은 퀄리티의 AI 생성 영상을 만들어내는 워크플로우(workflow)입니다. |
오픈AI가 절치부심해 내놓은 챗GPT 이미지 2.0과 구글의 나노 바나나2, 그리고 바이트댄스의 시댄스 2.0을 함께 이용하면 현실과 구분 못하는 영상을 빠르게 만들어낼 수 있죠. (이미지: 오픈AI) |
이러한 워크플로우를 기반으로 사용자들은 짧은 픽사(Pixar) 스타일의 애니메이션을 만들거나, 클로드가 유명 TV 시리즈인 <디 오피스(The Office)>에 출연한 에피소드를 생성한다거나, 누구도 만들어본 적 없는 새로운 애니메이션을 만들기도 했습니다. 모두 굉장히 높은 퀄리티로, 사용자들의 주목을 받기에 모자람이 없었습니다.
이러한 유행은 소셜미디어 트렌드로 그치고 있지 않습니다. 산업적인 차원의 변화를 만들고 있기도 합니다.
가장 대표적인 사례가 중국발 마이크로드라마(세로형 숏폼 드라마) 앱들입니다. 릴쇼트(ReelShort), 드라마박스(DramaBox) 등으로 대표되는 이 시장은 1~2분짜리 에피소드를 클리프행어로 끊고, 다음 화를 보려면 기다리거나 결제하게 만드는 '페이-투-언락(pay-to-unlock)' 방식으로 빠르게 성장해 왔습니다. 2025년 1~8월 해외 마이크로드라마 매출만 15억 달러(약 2조 2590억 원)를 넘기며 전년 대비 195% 성장했고, 글로벌 시장 규모는 2025년 약 110억 달러(약 16조 5640억 원)에서 2026년 140억 달러(약 21조 원)로 커진다는 전망입니다. 주목할 점은 이 산업이 AI 영상 생성을 가장 먼저 대규모로 받아들인 영역이라는 것입니다.
제작사들은 예산의 약 30%를 AI 워크플로우에 배정하면서 제작 기간을 3개월에서 1개월로, 비용을 기존 촬영의 5분의 1 수준으로 줄였습니다. 그 결과 2026년 1월 마이크로드라마 흥행 상위 100위 중 AI 생성 작품 비중이 1년 만에 7%에서 38%로 급증했고, 매달 1만 편이 넘는 AI 생성 애니메이션 마이크로드라마가 쏟아지고 있습니다. 드라마박스는 아예 알고리듬으로 만든 비주얼과 보이스오버(Voice-over)로 채워지는 별도의 애니메이션 섹션을 운영하고 있고, AI 제작 파트너를 적극적으로 발굴해 AI 콘텐츠를 공급망에 편입시키는 전략을 펴고 있습니다. 넷쇼트(NetShort), 굳쇼트(GoodShort) 같은 다른 배급 플랫폼들 역시 AI 드라마를 별도의 '실험'이 아니라 기존 콘텐츠와 동일한 유통 퍼널에 그대로 태우기 시작했습니다.
즉, AI 생성 영상이 단순한 화제성 콘텐츠를 넘어 실제 매출을 내는 정규 인벤토리로 자리 잡았다는 신호입니다. |
클로드가 <디 오피스 >에 출근한 모습을 영상으로 생성해 공유하는 모습도 나오죠. 실제 TV 시리즈가 제작되었다고 착각할 만큼 정교합니다. (이미지: 엑스 캡처) |
콘텐츠를 생성하는 AI 모델에는 크게 세 번의 터닝포인트가 있었습니다. . . . |
현업 전문가들의 글로벌 산업 이야기 테크, 미디어, 리테일, 매크로에 걸친 이야기들 |
트렌드 너머의 산업 구조와 비즈니스의 맥락을 전합니다. 커피팟 플러스 구독하고 꾸준히 새로운 관점 배달 받아보세요! |
글쓴이: 준. O2O(Online to Offline) 플랫폼 스타트업을 거쳐 현재 글로벌 콘텐츠 플랫폼에서 AI를 포함한 제품 기획을 리드하고 있습니다. AI, 플랫폼, 크리에이터 이코노미의 영역에서 기술 변화가 비즈니스를 어떻게 바꾸는지 관찰하고 기록합니다. [준의 테크 노트]는 테크 기업과 그들이 새로이 개발하는 기술과 현상에 대한 이야기를 전합니다.
|
커피팟 Coffeepot good@coffeepot.me © Coffeepot 2026
|
|
이미지 생성 모델은 2026년 2월 출시된 구글의 나노 바나나2, 그리고 이어서 4월에 출시된 오픈AI의 챗GPT 이미지(Images) 2.0이 대부분의 역할을 담당합니다. 특히 챗GPT 이미지 2.0는 실제와 구분이 불가능할 정도로 사실적인 이미지들을 생성하고, AI 이미지의 약점으로 여겨졌던 이미지 내 글자들에 대한 생성도 완벽에 가깝게 해내는 모습을 보여, 많은 사용자들이 열광했습니다.
비디오 생성 모델에선, 틱톡을 서비스하는 중국의 바이트댄스(ByteDance)에서 개발한 영상 모델 시댄스(Seedance) 2.0도 지난 2월 공개되며 압도적인 영상 생성 능력을 보여주었고, 최근 대부분의 AI 영상 생성 모델로 활용되고 있습니다.
이러한 유행은 소셜미디어 트렌드로 그치고 있지 않습니다. 산업적인 차원의 변화를 만들고 있기도 합니다.
2025년 1~8월 해외 마이크로드라마 매출만 15억 달러(약 2조 2590억 원)를 넘기며 전년 대비 195% 성장했고, 글로벌 시장 규모는 2025년 약 110억 달러(약 16조 5640억 원)에서 2026년 140억 달러(약 21조 원)로 커진다는 전망입니다. 주목할 점은 이 산업이 AI 영상 생성을 가장 먼저 대규모로 받아들인 영역이라는 것입니다.
제작사들은 예산의 약 30%를 AI 워크플로우에 배정하면서 제작 기간을 3개월에서 1개월로, 비용을 기존 촬영의 5분의 1 수준으로 줄였습니다. 그 결과 2026년 1월 마이크로드라마 흥행 상위 100위 중 AI 생성 작품 비중이 1년 만에 7%에서 38%로 급증했고, 매달 1만 편이 넘는 AI 생성 애니메이션 마이크로드라마가 쏟아지고 있습니다.
드라마박스는 아예 알고리듬으로 만든 비주얼과 보이스오버(Voice-over)로 채워지는 별도의 애니메이션 섹션을 운영하고 있고, AI 제작 파트너를 적극적으로 발굴해 AI 콘텐츠를 공급망에 편입시키는 전략을 펴고 있습니다. 넷쇼트(NetShort), 굳쇼트(GoodShort) 같은 다른 배급 플랫폼들 역시 AI 드라마를 별도의 '실험'이 아니라 기존 콘텐츠와 동일한 유통 퍼널에 그대로 태우기 시작했습니다.
[준의 테크 노트]는 테크 기업과 그들이 새로이 개발하는 기술과 현상에 대한 이야기를 전합니다.
© Coffeepot 2026