Seedance 1.0

14 hours ago 2

Hacker News 의견
  • 이런 기능들이 언젠가는 너무 평범하고 시시하게 느껴질 미래를 기대하는 입장임
    • 내 휴대폰에서 재미로 친구들과 단체 채팅방에서 즉석으로 24화짜리 풀 보이스 애니메이션을 만들 수 있는 수준이 될 것이라 상상하게 됨
    • 지금도 믿기지 않을 정도로 많은 걸 할 수 있는데, 곧 아무도 신경 쓰지 않게 될 점 역시 신기함
    • 아무리 간단하게 프롬프트를 입력해 만든 24화짜리 시리즈라도, 결국 누구도 관심 가지지 않을 것이라는 점을 지적함
      • AI가 콘텐츠의 가치를 높이는 게 아니라, 희소성을 파괴함으로써 의미를 사라지게 만드는 것이라는 생각임
      • ‘Tea. Earl Grey. Hot.’처럼, 그저 기계적으로 나오는 느낌에 대한 비유도 남김
    • 이렇게 콘텐츠 제작이 쉬워지면, 누가 긴 시간 들여 영상을 시청할지 의문을 품음
      • 결국 각자 자기만의 생성형 콘텐츠를 즐기느라 바빠질 것이라는 추측임
    • 나 역시 이 기술을 매우 기다리고 있음
      • 예를 들어 Shadowrun 영화 같은 것도 직접 만들어보고 싶은 기대감임
    • 한 달에 만들어지는 콘텐츠의 양이 인류 역사상 지금까지 나온 모든 콘텐츠의 합을 넘을 전망임
      • Disney, Marvel, Star Wars와 같은 대중 미디어 일색 대신, 각자 관심사에 딱 맞는 롱테일 미디어를 누릴 수 있을 것이라는 점에서 기대
      • 이집트와 아틀란티스에 관심이 있다면, 두 문명이 싸우는 스팀펑크 시리즈를, ‘The Wire’ 같은 진지한 색채로 바로 감상하는 세상도 상상 가능
      • 기존에는 절대 제작되지 않았을 기획도 실현 가능한 시대가 될 전망
      • 좋은 창작자가 나타나겠고, 이제는 인디 음악, 인디 만화, 인디 게임처럼 다양한 크리에이터가 두각을 드러낼 수 있다고 봄
      • 진짜 문제는 ‘발견성’이 될 것임
      • 결국 1년에 500개 한정적인 자리에 낙하산으로 들어가야만 했던 기존 업계 구조가 붕괴되고, 각자의 비전을 가진 많은 인재가 큰 시도를 할 수 있을 것이라 강조
      • VivziePop(Vivienne Medrano 위키), PsychicPebbles(Zach Hadel 위키)처럼 유튜브에서 시작해 거대한 IP로 성장하는 모델이 미래의 표준이 될 전망
      • 창작계의 혁신이 단순히 2~10배가 아니라, 1000배 가까이 좋아질 것이라고 예상
      • 지금 대부분의 영화/드라마는 내 취향에 맞지 않기 때문에 싫어했지만, 미디어라는 매체 자체는 좋아해 온 입장임
      • 이젠 내 취향, 내 관심사에 딱 맞는 콘텐츠를 만날 수 있는 세계가 펼쳐질 거라 굉장한 기대감임
  • 미래에는 TikTok 알고리즘처럼, 내가 보는 즉시 내 취향을 파악해 그때그때 새롭게 영상을 만들어주는 형태가 될 전망임
    • 사용자가 스크롤 할 때마다 좋아하는 것을 배우고, 더 많은 영상을 자동 생성해서 보여주는 시스템이 될 것임
    • 충분한 컨텍스트가 모델에 입력되면, 그 사람이 반응하는 콘텐츠는 너무나 매혹적이라 도저히 화면에서 눈을 뗄 수 없게 만드는 중독성을 가질 것임
      • 섬뜩한 상상인 동시에, 장기적으로는 불가피하다고 생각함
    • 아쉽지만, 단순히 사용자의 취향을 따르기보다는, 참여를 극대화하기 위해 사용자의 취향 자체를 조작하려 들 것이라는 우려도 있음
    • 사실 이런 기술 방향은 사람들이 소셜미디어를 사용하는 이유와는 거리가 있다는 의견도 존재함
      • ChatGPT도 끝없이 댓글을 생성할 수 있지만, 결국 우리는 여기 Hacker News에 와 있다는 점을 예로 제시함
    • 나중에는 ‘라이브 모드’라는 개념으로 실시간으로, 사용자의 목소리에 맞춰 영상을 즉시 생성하는 기능도 등장할 것으로 예상함
      • Netflix에도 이런 기능이 들어갈 수 있을 것 같음
    • 광고를 싫어한다는 것도 학습해서 제대로 반영해줄지 궁금함
  • 샘플 영상들 중 꽤 인상적인 장면도 있지만, 일부 장면에서는 부자연스러운 움직임이 자주 보임
    • 훈련 데이터가 TikTok 중에서도 가장 과장된 부분에 집중됐는지, 5초 이상 한 장면을 유지하지 못하는 듯한 특징이 보임
    • 확실히 어려운 장면은 잘 처리하는데, 오히려 간단해보이는 부분에서 실수가 많이 보인다는 평가임
      • 오프닝 피아노나 사진작가가 사용하는 카메라에는 ‘AI text’가 써있고, 카페의 노신사는 손이 베레모를 뚫고 지나가며, 바닷가에서 뒤돌아보는 소녀는 부엉이처럼 머리를 돌림
      • 유럽 도시에서 자전거 타는 소년 장면에서는 광장에 암호화된 존재가 외발자전거를 타고 나무 아래 서 있는 모습으로 마무리됨
    • ByteDance는 이미 수주 전부터 Model Arena에서 내부적으로 ‘Unicorn’이라는 이름으로 모델을 테스트해왔음
  • 5년 후에는 모든 콘텐츠가 실시간으로 생성되는 세상이 가능할 것이란 전망임
    • 내가 무언가를 말하면, 바로 5초짜리 영상으로 응답해주는 방식임
    • 이제 영상이 ‘고정된 자산’이 아니라, 즉석에서 만들어졌다 사라지는 ‘에페메랄’한 응답이 될 것
    • 동영상은 업로드되는 수동적 파일이 아니라, 데이터 스트림의 출력물이 되어감
    • 스와이프를 대체할 미래의 UI는 음성 프롬프트가 될 가능성이 큼
    • Seedance에서 하는 일은 새로운 포맷의 실험이라기보다, 런타임 생성 콘텐츠 시스템 실험임
    • 백엔드에서는 model infra를 comet으로 압축하고, LLM을 더 싸고 빠르게 돌릴 수 있도록 세팅함
    • 이 조합이 실현되면, 커다란 배치나 캐시 없이도 대규모로 콘텐츠 생성 제공이 가능하게 됨
    • 만약 이것이 실제로 자리 잡으면 피드는 더 이상 스크롤이 아니라 랜더 루프가 되어버림
    • 이 모든 것이 더 이상 ‘미디어 서비스’가 아니라, 비디오 플랫폼 외형을 쓴 저지연 AI 모델 호스팅 시스템이라는 평가임
  • 비디오 품질은 뛰어나지만, 소리는 어디 있냐는 질문 등장
    • VEO3가 영상은 잘 만들어도, 오디오 쪽 완성도가 대폭 차별화를 만들어낸다는 점을 언급함
    • 나는 대형 영상 스트리밍 회사에서 AI 솔루션을 다루는 입장임
      • VEO3의 문제는 프롬프트 간 일관성이 떨어진다는 것임
      • 예를 들어 캐릭터 레퍼런스 이미지를 올려도, ‘늙은 신부가 몸을 숙인다’와 ‘늙은 신부가 동전을 집는다’를 각각 생성하면 등장 인물이 매번 달라보임
      • 물론 VEO3는 이미지-투-비디오 기능을 제공하지만, 실제 씬을 만드는 데는 아직 많이 부족함
      • 시간 지나면 발전하겠지만, 지금 단계에서는 개인적으로 Seedance가 숏 간 일관성에 초점을 맞춘 점이 마음에 듦
      • 이 점이 VEO3에도 압박을 줘서 해당 기능이 빨리 개선될 것이라 기대
  • 왜 모든 예제 영상에는 큰 동그라미가 나오는지 궁금증 제기
  • Seedance를 어디서 쓸 수 있는지 묻는 질문 등장
    • Seedance 1.0은 2025년 6월부터 Doubao와 Jimeng 등 여러 플랫폼에 통합될 예정임
    • 이 기능은 곧 TikTok으로 직행하게 될 것 같음
      • TikTok자체 플랫폼에서 엄청난 생성형 콘텐츠 홍수가 일어날 것이며, 모두가 크리에이터가 되고 싶어하는 현상을 수익화할 방법을 찾게 될 것이라는 지적임
      • 앞으로는 “콘텐츠를 무료로 올릴 수 있다”에서 “AI 게이트웨이를 거쳐야 올릴 수 있고, 그 요금도 지불해야 한다”는 방식으로 플랫폼 정책이 바뀔 것이라는 관측임
  • 모션이 많은 영상에서 속이 메스껍거나 어지러움을 느끼는 경우가 있다고 밝힘
    • Sora 첫 공개 때도 유사한 경험이 있었으나 Seedance에서는 약간 완화됨
    • Veo 3 시연에서는 이런 증상이 없었는데, 혹시 다른 사람들도 Seedance의 모션이 많은 샘플에서 비슷한 느낌을 받았는지 질문함
  • AI 생성 영상의 리얼리즘이 기존 CGI 애니메이션 영화 수준에 근접했는지 궁금증 표출
    • 전문가라면 당연히 현재 결과물에서 분명한 결함을 지적할 수 있을 거라 예상함
    • 다만, 향후 특정 구간만 프롬프트로 미세 수정할 수 있을지 기대함
    • 또, 할리우드 고예산 CGI 한 초당 소요 비용과 비교해 실제로 어느 정도의 연산자원/금전이 들지 궁금함
    • 요즘 할리우드에서 보이는 일반(비애니메이션) CGI조차도 퀄리티가 떨어지는 경우가 많아서 기대치가 그리 높지 않음
      • 실제로 CGI 결과에 변화를 적용/관리하는 과정(change management)도 꽤 흥미진진해보임
  • "Old man"이 그렇게 나이 들어보이지 않아 개인적으로 좀 의아함 (혹시 내가 나이 들어서일지도 모른다는 농담 섞인 고백)

Read Entire Article