首页

探索最新的文章和分享


一张照片 + 一段音频 = 一个会说话的数字人视频。本文记录了在 RTX 2080 (8GB) 上从零部署 EchoMimic 的完整过程,包括环境搭建、模型下载、基础推理、长视频分段处理,以及如何用 512x512 推理 + 超分放大生成 720x1280 竖屏高清视频。

2026年3月24日

拆解 OpenClaw 自动化工具链三大核心:CDP 无头浏览器实现网页视觉抓取与操控、跨会话协同工具实现多工作区消息调度,以及 ClawHub 插件生态的沙箱隔离与动态挂载机制。

2026年3月14日