首页

探索最新的文章和分享


一张照片 + 一段音频 = 一个会说话的数字人视频。本文记录了在 RTX 2080 (8GB) 上从零部署 EchoMimic 的完整过程,包括环境搭建、模型下载、基础推理、长视频分段处理,以及如何用 512x512 推理 + 超分放大生成 720x1280 竖屏高清视频。

2026年3月24日