[情報] Tiktok發佈AI模型「OmniHuman-1」 - Stock板

首頁(home) 上頁(↑) 下頁(↓) 末頁(end)

※ 本文轉寄自 ptt.cc 更新時間: 2025-02-07 22:22:41

看板 Stock

作者 LimYoHwan (gosu mage)
標題 [情報] Tiktok發佈AI模型「OmniHuman-1」
時間 Fri Feb 7 13:53:28 2025

標題：

字節跳動發布AI模型「OmniHuman-1」：讓黃仁勳變Rapper、泰勒絲唱日文歌…網讚超逼
真

來源：
Blocktempo

網址：

https://tinyurl.com/mtuddvts

字節跳動發布AI模型「OmniHuman-1」：讓黃仁勳變Rapper、泰勒絲唱日文歌…網讚超逼真 | 動區動趨-最具影響力的區塊鏈新聞媒體

TikTok 母公司字節跳動近期發佈了最新 AI 模型 OmniHuman-1，該模型允許用戶僅透過一張靜態圖片加上搭配音頻，就能生成栩栩如生的影片，包括人物說話時的口型、手勢等細節，都能得到細緻的刻畫。（前情提要：被DeepSeek逼急？OpenAI免費上線新推理模型o3-mini！Altman ...

內文：

在中國 AI 新創公司 DeepSeek 上月向全球 AI 界投下震撼彈之後，TikTok 母公司字節
跳動近期也吸引了全球 AI 界的關注。據《Forbes》報導，字節跳動在 2 月 5 日公佈了
其最新 AI 模型 OmniHuman-1，該模型允許用戶僅透過一張靜態圖片加上搭配的音頻，就
能生成一個栩栩如生的影片，包括人物說話時的口型、手勢等細節，都能得到細緻的刻畫
。

目前社群上已經有釋出部分 OmniHuman-1 使用成果，例如：黃仁勳唱 Rap、愛因斯坦演
講、泰勒絲唱青鳥…效果相當逼真。紐約大學教授 Samantha G. Wolfe 就表示：

從技術角度來看，僅僅根據一張圖片，就能創造出來看起來真的會說話、會動的人物形象
，這非常令人著迷。

OmniHuman-1 特性有哪些？
據官方說明，OmniHuman-1 的關鍵特性包括：

多模態輸入：OmniHuman-1 模型支援文本、語音和影片等多種輸入形式，由此生成的數位
人物可以在不同的場景中展示出豐富的情感與動作；
高質量輸出：OmniHuman-1 由於具備先進的深度學習技術，能夠生成包含真人、動漫人物
、3D 人物等高質量數位形象，可用於直播、娛樂、教育等眾多場景；
實時生成：OmniHuman-1 具備實時生成的能力，在互動中，用戶能夠即時獲得數位人物的
反饋；
表現力強：在多種驅動模式下，由 OmniHuman-1 生成的數位人物能夠完成具有挑戰性的
動作，進一步提升了影片的真實感和表現力。
OmniHuman-1 引人擔憂
不過雖然 OmniHuman-1 的強大功能讓人讚歎 AI 可能為人類生活帶來的改變，當前社群
對這一模型也產生了一些擔憂，具體來看包括：

身份冒用：該模型看起來能夠精確複製特定個人的容貌和動作，可能會被用於惡意模仿和
身份詐欺；
資訊操縱：當前 AI 最令人擔憂的負面影響之一，就是可能會催生網路虛假資訊的氾濫，
這可能嚴重影響公共輿論和社會認知；
隱私侵犯：該模型的推出，也可能導致惡意分子在未經許可的情況下，擅自重建和操縱個
人形象，例如利用某明星的圖片製作色情影片等，可能引發倫理問題。
不過要說明的是，當前雖然字節跳動已經推出 OmniHuman-1 模型，但目前該模型尚未正
式投入商業使用，官方也尚未清楚說明具體釋出時間。

另一方面，字節跳動掌管著抖音這一中國當前最熱的社交媒體平台，但 OmniHuman-1 的
推出似乎在中國社群內部的討論度還不高，頗令人玩味。

OmniHuman：通過一張圖片配合音頻或視頻，生成非常自然的會說話、唱歌的人類動作視
頻

支持各種不同類型輸入（如單一的人物圖片和音頻、視頻等信號）生成非常逼真真人視頻
動畫，涵蓋從面部表情到全身動作，無論是說話、唱歌、跳舞等。

OmniHuman 在生成動畫時能夠保持極高的真實感，能夠精確捕捉到人類的面部表情、身體
動作、手勢變化、物體交互等細節，超越了現有的方法。

支持手勢、肢體語言、舞蹈動作等自然動畫。

支持臉部特寫（Close-up）、半身（Half-body）、全身（Full-body）動畫。

可適應不同畫面比例（如 16:9、9:16、1:1）。

能夠處理各種人體姿勢和全身動作，尤其是在面對複雜的運動和物體交互時，表現出更高
的準確度。

https://www.xiaohu.ai/c/xiaohu-ai/omnihuman

OmniHuman：通过一张图片配合音频或视频，生成非常自然的会说话、唱歌的人类动作视频 | XiaoHu.AI 学院

字节跳动开发出一种名为 OmniHuman 的端到端多模态条件人类视频生成框架。可以根据不同类型输入（比如单一的人物图片和音频、视频等信号）生成非常逼真真人视频动画，涵盖从面部表情到全身动作，无论是说话、唱歌、跳舞等。
简而言之，它可以让一张普通的图片配合音频或视频，生成非常自然的会说话、唱歌的人类 ...

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.72.195.108 (臺灣)
※ 作者: LimYoHwan 2025-02-07 13:53:28
※ 文章代碼(AID): #1dfP_QEu (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738907610.A.3B8.html

推 leotompp : 放我照片可以改成彭于晏身材跳舞嗎??1F 02/07 13:54

推 KSUGOD : 抖音供應鏈噴2F 02/07 13:54

→ b9513227 : 你各位ai慢慢吹 tsm跟nv躺著發財3F 02/07 13:55

推 hpk89 : 裸圖變影片？小日本av產業的末日？4F 02/07 13:57

推 QooSnow : （遙遙領先！）5F 02/07 13:57

→ goodapple807: 所有人都要有AI 笑死6F 02/07 13:58

推 cosmite : 台灣不是有個法在罰deep fake的嗎？這樣做沒問題？7F 02/07 13:58

推 ntnuljg : 全部的人都用AI做短影音沒辦法做出自己的特色並8F 02/07 13:58
→ ntnuljg : 且不被模仿就跟垃圾一樣

推 iamjojo : 這挺多類似的AI有就是了10F 02/07 13:59

推 love80 : 大家都急了，青鳥怎麼唱？11F 02/07 13:59

推 qwe78971 : 這東西半年前就有了一堆meme 鬼畜12F 02/07 13:59

推 leotompp : 先跳個坑恰娜~壓壓驚13F 02/07 14:00

推 herculus6502: 股版快變成AI版了14F 02/07 14:00

→ calmerrorans: 校署開始蒸餾你的蒸餾瘋狂推出15F 02/07 14:01

→ blacklight27: 太神啦中國16F 02/07 14:02

噓 sean667cd : 每間快點都買老黃烤箱裡的GPU 快賣！17F 02/07 14:02

推 onekoni : 想不想跟我做壞壞的事…放空老黃18F 02/07 14:02

推 metallolly : 現在連網友貼布萊德彼特的病照都不能相信了19F 02/07 14:02

→ qwerkevin : 抖音超多AI生成的影片了20F 02/07 14:03

推 ntr203 : 換臉大降價時代要來了嗎？21F 02/07 14:04

推 metallolly : 不過這也不是什麼新奇我最近都看狗狗貓貓煮飯22F 02/07 14:04

→ abljy : 抖音可以作習大大小熊維尼片頭曲嗎23F 02/07 14:08

推 DA3921999 : 可以做老黃大罵NV空軍嗎24F 02/07 14:08

→ idernest : PTT金城武的大勝利25F 02/07 14:10

→ lalacos123 : 到處都在推出AI系統北七一直喊算力無用那後來推出26F 02/07 14:11
→ lalacos123 : 的八成都複制貼上的XD

→ s1001234 : 這個模型感覺很危險...28F 02/07 14:14

→ x58420 : 老黃要崩了29F 02/07 14:14

推 Brioni : 發展模型應用場景跟節省算力不衝突30F 02/07 14:16

→ IBIZA : 算力跟複製貼上的關係在哪?31F 02/07 14:16

推 ll6a : 放空也是講求時機問題，賣鏟子要衰弱那也要買鏟子32F 02/07 14:18
→ ll6a : 的先衰弱，就看淘金客花錢買鏟子掏不掏的到金子，
→ ll6a : 現在還在瘋狂買鏟子的階段，不急不急

推 rereterry : 之前就有可以換臉直播等等免費應用出來了，一直覺得35F 02/07 14:23
→ rereterry : 中國企業在簡化門檻這塊蠻願意投入的，雖然是早就有
→ rereterry : 的應用，但現在方便更多群體可以參與了

推 SRNOB : 小玉你真冤啊38F 02/07 14:25

推 WTF55665566 : 這以後會有肖像爭議吧不過未來這門檻大幅拉低整39F 02/07 14:25
→ WTF55665566 : 體環境算力需求反而上升

→ Lowpapa : 這在台灣要關12年41F 02/07 14:26

→ MizPerfect : 國際板豆包42F 02/07 14:26

→ kimula01 …

推 kotorichan : 美國根本沒管制中國AI發展等著被卷44F 02/07 14:27

推 QooSnow : （買鏟子的，）（不想買）（金鏟子，）（要買）（鐵45F 02/07 14:29
→ QooSnow : 鏟子！）（嘻嘻。）

推 panda816 : 人類滅亡倒數計時47F 02/07 14:30

→ ramirez : 鏟子買起來!!!!!!!!!!!!!!!!!48F 02/07 14:30

噓 PureAnSimple: 不重要不用每天po模型有錢賺嗎？49F 02/07 14:32

推 pttabs : 台灣他媽的不是只看不到車尾燈，應該是坐在原地不會50F 02/07 14:37
→ pttabs : 動啊

推 smch : 小八都會買切糕了還在買台積電52F 02/07 14:39

推 HEINOUS : 迪士尼掰掰53F 02/07 14:45

→ cl3bp6 : 連結內那個比Sora弱太多了54F 02/07 14:48

推 camoont : 香55F 02/07 14:55

推 newmiga : 現在網路的影片快沒真的了56F 02/07 14:55

推 DDDDRR : 現在看影片都當成動畫看反正都是假的57F 02/07 14:57

推 sdbb : 電影的背景也是動畫師用電腦畫的，不一定是真實取景58F 02/07 14:58
→ sdbb : 廣義來說，大家都在看電腦動畫，只有演員是真人
→ sdbb : 以後也不用真人，配音也交由AI處理

推 pttsac : 川普:來人把抖音買起來~~~~~~~~~61F 02/07 15:05

推 Diver123 : 老鐵牛逼62F 02/07 15:07

推 joewucool : 川普爸爸不開心了63F 02/07 15:07

→ PTTMAXQQ : 說實話，美國的AI影像生成…嘖嘖64F 02/07 15:09

→ wr : 換臉太難聽了請說濾鏡65F 02/07 15:10

推 popo123456 : 中國大概都免費的,美國怎麼拼啊66F 02/07 15:14

推 QooSnow : （還在玩）（文字生成的，）（加油好嗎？）67F 02/07 15:15

推 joe0934 : 對嘴叫欸哎的話，我們早有了啊68F 02/07 15:22

噓 madeinheaven: 這又不是新東西早就有了69F 02/07 15:23

→ MizPerfect : 白話一點字節的豆包屌打 deepthink70F 02/07 15:27

推 good10740 : 下一步導入AI眼鏡71F 02/07 15:30

→ a0809449333 : 以後會不會真人更難看到72F 02/07 15:31

推 x20165 : 泰勒絲唱青鳥抓到了73F 02/07 15:41

推 harry458031 : 小玉領先五年74F 02/07 15:49

推 worf : 可以用小熊維尼嗎75F 02/07 16:17

→ gstym : 啥小 ai抖音喔76F 02/07 16:58

推 Grothendieck: 幹片自動生成77F 02/07 17:28

推 nakinight : 這在台灣會被關78F 02/07 18:05

推 epephanylo : 話說CLOSE AI 不是有個SORA嗎? 好像沒火起來?79F 02/07 18:20

推 kisusu : 豬大哥也會唱法文歌了嗎80F 02/07 18:30

推 moto000 : 肖像權！81F 02/07 18:47

推 letyouselfgo: 既然有人做開源應用就會爆炸性的產出82F 02/07 21:06

※ 看板: Stock　文章推薦值: 0 目前人氣: 0 累積人氣: 150　

作者 LimYoHwan 的最新發文:

+6 Re: [新聞] 馬斯克吹了半年的模型終於發布：Grok 3 你需要知道的所 - Stock 板

作者: LimYoHwan 42.72.7.38 (台灣) 2025-02-20 11:40:47

13F 8推 2噓
+43 [情報] DOGE即將調查SEC - Stock 板

作者: LimYoHwan 223.136.65.180 (台灣) 2025-02-18 12:28:57

標題：無來源： X 網址：內文： DOGE is seeking help from the public! Please DM this account with insights on f …

80F 44推 1噓
+82 [情報] 巴菲特賣光spy voo - Stock 板

作者: LimYoHwan 111.243.159.214 (台灣) 2025-02-15 13:38:18

標題：無來源： X 網址：內文： BREAKING: Warren Buffett and Berkshire Hathaway have sold 100% of their $SPY a …

165F 94推 12噓
+45 [情報] Tiktok發佈AI模型「OmniHuman-1」 - Stock 板

作者: LimYoHwan 42.72.195.108 (台灣) 2025-02-07 13:53:28

標題：字節跳動發布AI模型「OmniHuman-1」：讓黃仁勳變Rapper、泰勒絲唱日文歌…網讚超逼真來源： Blocktempo 網址：內文：在中國 AI 新創公司 DeepSeek …

82F 48推 3噓
+379 [情報] 50美元訓練出媲美DeepSeek R1 - Stock 板

作者: LimYoHwan 42.72.195.108 (台灣) 2025-02-06 16:56:06

標題：李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型來源： Futu 網址：內文：李飛飛等斯坦福大學和華盛頓大學研究人員近日以不到50美元的雲計算費用訓練了一個名叫 …

804F 402推 23噓

點此顯示更多發文記錄

分享網址: 複製

DispBBS

回到看板(←)《Stock》

→

guest

x)推文 r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄同主題: =)首篇 [)上篇 ])下篇

回列表(←) 分享