Google DeepMind 的 Project Genie (Genie 3) 已经将范式从被动的视频生成转变为主动的世界模拟。然而,对于想要讲述更长故事的创作者来说,目前的体验会触碰一个硬性限制:60秒的会话时长。
这个限制并非随意设定;它是由实时 TPU 推理成本和 KV Cache 内存压力造成的物理瓶颈。但你不必止步于此。
这就引出了**「种子图拼接法」**(或手动状态转移)。这种工业级工作流程允许你串联多个会话,理论上可以创建无限连续的虚拟世界。
核心概念:手动状态转移
与 Runway 或 Pika 中专注于像素连续性的视频扩展器不同,Genie 3 模拟的是物理规律和因果关系。要延长 Genie 会话,我们依赖马尔可夫特性:即世界的下一个状态仅取决于当前状态和当前动作。
通过提取第60帧(最后一秒)的视觉状态,清理它,并将其作为新会话的第0帧注入,我们可以重置时间计数器,同时保持空间连续性。
工具包:你需要什么
要执行无缝拼接,你需要以下数字供应链:
- 访问权限:Google AI Ultra 订阅(用于访问 Project Genie 实验室)。
- 硬件:配备独立显卡的 PC/Mac(RTX 3060+),用于流畅的 WebGL 渲染和高码率录制。
- 语义清理:Nano Banana Pro(Gemini 3 Pro Image)。*这是关键。*你不能使用简单的克隆图章工具;你需要一个能够理解"赛博朋克建筑"与"森林树冠"区别的 AI,以重建隐藏在 UI 后面的数据。
- 录制:OBS Studio(以 60fps/20,000 Kbps 录制)。
分步工作流程
步骤 1:「软着陆」(第 N 个会话)
下一段视频的成功取决于你如何结束当前视频。你不能在动作中途直接切断。
- 55秒标记:停止快速的摄像机移动。释放 WASD 键,让物理引擎自然减速角色。
- 中心构图:确保你的角色位于画面正中央。Genie 3 的图像编码器优先处理中心区域;边缘角色通常会在下一个会话中产生"传送"故障。
- 清晰背景:将摄像机对准结构清晰的区域。避免面对空白墙壁或混乱的粒子效果。
步骤 2:高保真提取
不要使用 Genie UI 提供的缩略图。
- 将高码率的 OBS 录像导入编辑器(Premiere/DaVinci)。
- 在最后一秒找到最清晰的帧(无运动模糊)。
- 导出为 PNG 格式。绝不使用 JPG,以避免压缩伪影。
步骤 3:语义净化(秘密武器)
你必须移除 Genie UI(计时器、提示词、标志),同时不破坏世界的逻辑。
- 工具:打开 Nano Banana Pro。
- 遮罩:用 2-3 像素的缓冲区在 UI 元素上涂抹。
- 上下文感知提示:不要让提示词为空。如果计时器覆盖了天空,输入提示词:"赛博朋克夜空,霓虹雾霭,无缝纹理融合"。
- 身份恢复:利用这个机会修复角色的退化。遮住角色并使用高分辨率提示词(例如,"高精细度机器人面孔,4K 纹理")来锐化在 720p 渲染过程中模糊的细节。
步骤 4:潜在空间注入与对齐
- 上传:在 Project Genie 中,上传你"净化"后的 PNG。确保裁剪覆盖完整的视野。
- 提示词对齐:复用之前的提示词,但更新逻辑。如果你从城市走到了森林,将提示词从 "赛博朋克城市" 改为 "赛博朋克城市与森林的边缘"。
- 风格锁定:保持所有光照和渲染关键词不变,以维持渲染管线。
步骤 5:「动量握手」
一旦新世界加载完成,你必须手动同步物理。
- 视觉检查:由于重采样,光照可能会略有变化。这是正常的。
- 输入匹配:如果你在上一个视频中向前走,立即按住 W。模型失去了动量数据,但观众的眼睛还没有。
- 等待3秒:最初缓慢移动,让模型重新建立深度缓冲和碰撞体积。
后期处理:拼接视频
要在视频编辑器中隐藏视频片段之间的"接缝":
- 变形剪切:在连接点使用 Adobe Premiere 的"变形剪切"(2-4帧)。这使用光流来平滑微小的像素偏移。
- 升级放大:由于 Genie 以 720p 渲染,使用 AI 升级器(如 Topaz Gaia)将最终输出锐化到 4K。
进阶策略
1.「永不回头」协议
Genie 3 以流的形式生成世界;它不会"记住"你身后的地图。如果你在第2个会话中转身查看第1个会话的位置,几何结构很可能会被重新构建得不同。把你的模拟当作一部"公路电影"——始终向前。
2. 解决「死胡同」问题
如果你的60秒结束时正对着一面墙,在 Nano Banana Pro 中使用外扩绘制(Outpainting)。通过在截图周围生成更宽的视野来人工缩放图像,然后将那个用作种子。这给 Genie 一个"广角镜头"来理解几何结构。
常见问题解答 (FAQ)
Q:我的角色在新视频中"传送"或改变了位置。
A:角色可能在种子图像中太靠近画面边缘。Genie 3 基于中心稳定生成。
Q:视频片段之间的光照变化剧烈。
A:Nano Banana Pro 的修复可能改变了全局伽马值。使用色彩稳定器插件或手动匹配曝光曲线。
本指南基于《深度技术报告:通过种子图拼接的交互式世界扩展》(2026)。
