新浪科技訊 8月21日下午消息,百度蒸汽機(jī)(MuseSteamer)音視頻一體化模型宣布完成升級(jí),業(yè)內(nèi)首次實(shí)現(xiàn)多人有聲視頻一體化生成。其Turbo版、Lite版、Pro版及全系有聲版全面開(kāi)放,用戶可通過(guò)百度搜索“百度蒸汽機(jī)”或登錄“繪想”平臺(tái)體驗(yàn),企業(yè)用戶可在千帆平臺(tái)享受高性能視頻生成服務(wù)。
據(jù)介紹,百度蒸汽機(jī)是全球首個(gè)中文音視頻一體化生成的I2V模型,其首創(chuàng)多模態(tài)潛在空間規(guī)劃技術(shù)cá c??c bóng ?á ti?ng anh(Latent Multi-ModalPlanner), 能夠自主協(xié)調(diào)多角色身份、情感與互動(dòng)邏輯;同時(shí)深度中文場(chǎng)景適配,以超98%的還原度精準(zhǔn)呈現(xiàn)中文語(yǔ)音細(xì)節(jié)與情感表達(dá)。在效果上能夠?qū)崿F(xiàn)電影級(jí)高清視頻畫面、逼真環(huán)境音效和自然人物語(yǔ)音的同步輸出。百度官方同時(shí)表示,該系列大模型已經(jīng)在百度搜索、營(yíng)銷等多個(gè)場(chǎng)景落地應(yīng)用,且定價(jià)低至行業(yè)70%。
cá c??c bóng ?á ti?ng anh業(yè)內(nèi)人士認(rèn)為,除了質(zhì)量提升,百度蒸汽機(jī)2.0也帶來(lái)了創(chuàng)作成本大幅下降。知名視效指導(dǎo)姚騏在此次發(fā)布會(huì)現(xiàn)場(chǎng)展示了其用百度蒸汽機(jī)2.0制作的科幻短片《歸途》,并表示:蒸汽機(jī)讓好萊塢級(jí)大片鏡頭不再需要百萬(wàn)預(yù)算。
海量資訊、精準(zhǔn)解讀,盡在新浪財(cái)經(jīng)APP
責(zé)任編輯:何俊熹
頂: 637踩: 72693
cá c??c bóng ?á ti?ng anh
人參與 | 時(shí)間:2025-09-13 23:45:38
評(píng)論專區(qū)
相關(guān)文章
- 斜挎包潮牌小包包女2021新款潮日系帆布單肩學(xué)生韓版背包休閑百搭
- 嘉楠科技Q2財(cái)報(bào):營(yíng)收1億美元同比增長(zhǎng)39.5%,當(dāng)季挖出284枚比特幣
- 英偉達(dá)宣布Jetson Thor已發(fā)售,宇樹(shù)科技、銀河通用已接入
- 凈利10年新低! “風(fēng)口捕手”周亞輝,All in AI虧麻了
- 小馬智行沖刺全球自動(dòng)駕駛出行服務(wù)第一股
- 阿里AI To C業(yè)務(wù)啟動(dòng)近千人招聘,涉夸克、通義、AI眼鏡等業(yè)務(wù)
- 值得買科技發(fā)布2025年半年報(bào):營(yíng)業(yè)收入5.82億元,凈利潤(rùn)1269.26萬(wàn)元
- Rokid今日開(kāi)啟海外眾籌,或破AI眼鏡最高籌款記錄
- 法萊 阿瑪尼男錢包長(zhǎng)款真皮皮夾多卡位錢夾牛皮銀行信用卡包卡夾
- 開(kāi)源版Genie 3世界模型來(lái)了:實(shí)時(shí)+長(zhǎng)時(shí)間交互,單卡可跑,國(guó)內(nèi)公司出品