Gemini Omni 三个 Reddit 讨论真实槽点:期待高,实测却有点拉
谷歌I/O 2026大会上,Gemini Omni 这个号称“全模态”的模型正式亮相,官方宣称它能从任何输入创建任何内容。Reddit 上的讨论热闹归热闹,但扒开实测反馈和网友吐槽,真实槽点其实挺扎心。说白了,大家的期待和实际体验之间,落差确实不小。

槽点一:实际表现与高期待严重不符
官方放出的demo确实惊艳,比如教授在黑板上推导公式的视频,连贯性和画质拉满,很多人以为“视频版香蕉”来了。但根据媒体实测,这模型“有点拉”。为什么实测差距这么大? 有用户指出,demo 展示的是最高规格的生成结果,而普通订阅用户跑出来的效果,在细节和一致性上都有明显缩水。这就导致Reddit上很多人发帖吐槽,觉得谷歌这次又玩了一把“宣传片诈骗”。
槽点二:功能强大但使用门槛不低
Gemini Omni 的功能听起来确实全面:能输出4K分辨率、保持60秒连续镜头一致性,还支持40多种语种旁白。但想爽用这些功能,你得是AI Plus、Pro或Ultra的付费订阅用户。Reddit上就有讨论抱怨,免费用户每天只能用3次,且生成时长有限制。说白了,这玩意儿的完整能力更像是给高端会员准备的,普通人想体验“一次对话生成完整视频”的丝滑感?你得先掏钱。
槽点三:全模态的隐私和内容争议
作为一个能同时处理文字、图片、音频、视频输入和输出的全模态模型,它在隐私安全方面引发了部分用户的担忧。Reddit 上有帖子讨论,当你把原始视频和指令全部交给云端模型去“重新混剪”时,数据究竟如何处理?对于内容创作者来说,这可是潜在的隐患。再想想,一个可以从任何输入创建内容的模型,万一被人用来生成误导性内容或深度伪造视频呢?虽然谷歌有内容审查机制,但不少用户觉得在AI监管还不成熟的当下,步子迈得太快了。
总的来说,Gemini Omni 绝对是个技术上的里程碑,但它在实测表现、付费门槛和安全性上暴露出的槽点,让不少 Reddit 用户觉得挺纠结。谷歌画了一张大饼,能不能烤熟,还得看后续。