Gemini OmniDocBench怎么用?实测3步搞定视频生成

作者:袖梨 2026-06-01

Gemini OmniDocBench怎么用?实测3步搞定视频生成

这个问题其实挺简单的——谷歌的Gemini Omni模型已经在Gemini App里上线了。想试试视频生成?没错,咱们直接说人话:三分钟就能出片。

第一步,搞定“入场券”。想用这个功能,个人账号得订阅Google AI方案,企业账号得有对应的Workspace许可。还没满18岁?那暂时用不了。别担心,登录Gemini App后,点进去就能看到那个全新的视频生成入口。这步挺关键,没错吧?

第二步,找到“视频生成”入口。进入Gemini App,界面里赫赫写着“快来认识一下我们全新的视频生成模型”。点击进去,你就能看到Gemini Omni了。它跟谷歌以前的Veo模型不一样——Omni是个全能型选手,一次对话就能生成视频、图像、文本、音频,甚至还能直接编辑视频。为什么这么强?因为它把脚本、画面、旁白、配乐全塞进同一个模型主干里了。

第三步,输入描述,生成视频。你可以写一段话,比如“一个海边餐厅,夕阳,客人吃意大利面。旁白:在这一刻,时间像盐一样融化。”模型18秒就给你生成一段42秒的4K视频,带画面、带旁白、带环境音。这丝滑程度,是不是挺惊艳的?当然,生成真人形象时要小心——模型内置了安全机制,在这方面比较谨慎。而且,消耗额度确实挺高的。

有一点得注意:目前这个功能还没正式开放,谷歌计划在2026年5月19-20日的I/O大会上正式亮相。现在能用吗?有网友已经发现它在Gemini应用里悄悄上线了。试试无妨,毕竟每天有3次免费生成机会。有什么注意事项?记得遵守《使用限制政策》,别上传没权用的图片,别侵犯他人版权。

关于OmniDocBench——这其实是Gemini Omni的一个内置评测工具,用来测试视频生成效果。怎么用?其实就在第三步里,生成视频后你可以直接用对话式指令编辑:改角色、换背景、加新分镜,一句话搞定。这不比从前用五个工具串起来做视频省事多了?

相关文章

精彩推荐