
想做自媒体数字人访谈视频在百度 AI Studio 上安装 OpenAvatarChat显存要求在百度 AI Studio 上安装 OpenAvatarChat百度 AI Studio 是免费 GPU 云环境但有几个坑需要绕过去。下面一步步来。⚠️ 核心难点预判难点 原因 解决方案GitHub 访问慢/超时 国内网络限制 用 ghproxy 镜像HuggingFace 模型下载不了 国内被墙 用 hf-mirrorGradio WebUI 无法访问 AI Studio 端口不直接暴露 用 AI Studio 的端口代理子模块拉取失败 同样是网络问题 手动处理子模块 第一步创建 AI Studio 项目打开 aistudio.baidu.com新建项目 → 选择 Notebook 模式运行环境选 GPUV100 或 A100 都行进入 Notebook 后打开 终端Terminal 第二步基础环境准备在终端中执行1. 检查 GPU 和 CUDAnvidia-smipython --version # AI Studio 一般是 Python 3.102. 安装 uv 包管理器curl -LsSf https://astral.sh/uv/install.sh | shsource ~/.bashrc # 让 uv 命令生效uv --version # 验证3. 设置 HuggingFace 镜像关键export HF_ENDPOINThttps://hf-mirror.com写入 bashrc 永久生效echo ‘export HF_ENDPOINThttps://hf-mirror.com’ ~/.bashrc 第三步克隆项目用国内镜像加速用 ghproxy 加速克隆git clone https://ghproxy.com/https://github.com/HumanAIGC-Engineering/OpenAvatarChat.gitcd OpenAvatarChat子模块单独处理直接递归可能失败先初始化git submodule init查看有哪些子模块git config --file .gitmodules --get-regexp url如果子模块拉取也慢手动改用镜像把子模块的 github 地址替换为 ghproxy 地址sed -i ‘s|https://github.com/|https://ghproxy.com/https://github.com/|g’ .gitmodules然后更新并拉取git submodule update --init --recursive如果 sed 替换后子模块还是失败就手动一个个克隆查看需要哪些子模块cat .gitmodules假设子模块在 third_party/xxx手动克隆git clone https://ghproxy.com/https://github.com/xxx/xxx.git third_party/xxx 第四步创建虚拟环境 安装依赖用 uv 创建虚拟环境指定 Python 版本uv venv --python 3.11.11source .venv/bin/activate选择配置安装依赖Edge TTS LiteAvatar 方案最省事uv run install.py --uv --config config/chat_with_openai_compatible_edge_tts.yaml如果 install.py 报错看错误信息逐个解决。常见问题如果某个包安装失败尝试单独装uv pip install 包名 -i https://pypi.tuna.tsinghua.edu.cn/simple如果是 PyTorch 相关问题确认 CUDA 版本后重装uv pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 第五步下载 LiteAvatar 模型确保镜像变量还在export HF_ENDPOINThttps://hf-mirror.com运行下载脚本bash scripts/download_liteavatar_weights.sh如果脚本报错手动下载在 Notebook 里新建一个 cell 执行from huggingface_hub import snapshot_downloadimport osos.environ[“HF_ENDPOINT”] “https://hf-mirror.com”snapshot_download(repo_id“HumanAIGC-Engineering/LiteAvatar”,local_dir“./weights/liteavatar”,local_dir_use_symlinksFalse)print(“下载完成”) 第六步配置 LLM API Key你需要一个 OpenAI 兼容的 API推荐用免费的方案A百度千帆AI Studio 自家免费额度修改配置文件vim config/chat_with_openai_compatible_edge_tts.yaml找到 LLM 部分改成llm:api_base: “https://qianfan.baidubce.com/v1” # 或千帆的兼容端点api_key: “你的千帆API_KEY”model: “ernie-4.0-8k” # 或其他免费模型方案B其他免费 API平台 免费额度 兼容性百度千帆 有免费额度 OpenAI 兼容硅基流动 (SiliconFlow) 有免费额度 OpenAI 兼容DeepSeek 有免费额度 OpenAI 兼容Groq 免费额度大 OpenAI 兼容 第七步启动服务关键端口映射AI Studio 的 Notebook 不能直接访问 localhost:7860需要用它的端口代理source .venv/bin/activate启动 OpenAvatarChatuv run src/demo.py --config config/chat_with_openai_compatible_edge_tts.yaml --server_name 0.0.0.0 --server_port 7860在 AI Studio 中访问 WebUIAI Studio 提供了两种方式访问服务方式1直接点击生成的链接启动后终端会显示类似 https://xxx.aistudio.baidu.com/proxy/7860 的链接点击即可打开方式2手动设置端口代理如果 AI Studio 有端口转发按钮添加 7860 端口或者查看 AI Studio 的自定义服务入口 不同版本的 AI Studio 界面不同找 “自定义服务” 或 “端口映射” 按钮把 7860 映射出来。 第八步改成访谈模式启动成功后修改 LLM 的 system prompt让它输出访谈格式在配置文件中找到 system_prompt 相关字段改成system_prompt: |你是一个访谈节目的主持人。请按以下格式输出主持人[你的提问]嘉宾[嘉宾的回答]每次只输出一轮对话等待用户嘉宾回应后再继续。 常见报错及解决报错1git submodule update 失败跳过子模块手动处理git submodule deinit -f .rm -rf .git/modules/然后手动克隆需要的子模块报错2uv: command not foundsource ~/.bashrc或source ~/.cargo/env报错3CUDA out of memory换成 CPU 模式慢但能跑export CUDA_VISIBLE_DEVICES“”或者选更高显存的 GPU 实例报错4HuggingFace 下载超时确认镜像设置echo $HF_ENDPOINT应该输出 https://hf-mirror.com如果不是重新设置export HF_ENDPOINThttps://hf-mirror.com报错5端口访问不了在 Notebook 里测试服务是否启动import requestsresp requests.get(“http://localhost:7860”)print(resp.status_code) # 应该是 200 整体时间估算步骤 预计时间克隆项目 5-10 分钟安装依赖 15-30 分钟下载模型 10-20 分钟配置 调试 20-30 分钟总计 约 1-1.5 小时总结核心就是三个坑要绕——GitHub 用 ghproxy、HuggingFace 用 hf-mirror、WebUI 用 AI Studio 端口映射。把这三个搞通剩下的按官方文档走就行。显存要求要看你选哪种“数字人”和是否用本地大模型差别非常大。最省显存的组合LiteAvatar 云端 LLM Edge TTS / CosyVoice API官方实测只要 36GB 显存就能跑如果用本地未量化的 MiniCPM-o就要 20GB 显存。1. 官方给的“硬指标”项目文档里写得很清楚支持 CUDA 的 NVIDIA GPU未量化 MiniCPM-o 模型需要 20GB 以上显存int4 量化版 MiniCPM-o需要 10GB 以下显存数字人推理支持CPU/GPU显存不够可以靠 CPU 兜底另外一篇低显存实测文章用SenseVoice LLM API CosyVoice API跑 LiteAvatar / LAM在 RTX 3060 6G 上LAM 数字人约3.1GB 显存LiteAvatar 数字人约5.3GB 显存2. 按你选择的组件看显存需求2.1 只看“数字人”这一块不含本地 LLM数字人类型典型显存占用单路说明LiteAvatar2D约 36GB官方说 CPU 也能 30fpsGPU 大概 3G 起步46G 更舒服LAM3D 高斯泼溅约 3GB 左右实测比 LiteAvatar 略省一点但和场景/分辨率强相关MuseTalk口型同步一般 48GB 就能跑8GB 以上更稳它是视频驱动分辨率/batch_size 影响很大如果你只想要“数字人画面”4GB 显存 云端 API 基本够玩6GB 以上更舒服。2.2 加上本地大模型MiniCPM-o这是真正吃显存的大头模型方案显存需求适合什么显卡MiniCPM-o 未量化20GB3090/4090 这种 24G 卡或 A100 40GMiniCPM-o int4 量化10GB 以下3060 12G、3060Ti 8G 都可以尝试完全用云端 LLM API数字人那点 36G 就够1060 6G / 3050 4G 都能跑 LiteAvatar所以如果显存 ≤8GB基本不要想本地跑完整 MiniCPM-o老实用云端 LLM API。3. 不同硬件档位怎么选配置结合官方和社区实测可以这么选3.1 4GB 显存如 GTX 1650 / 3050 4G推荐配置chat_with_openai_compatible_edge_tts.yaml或chat_with_openai_compatible_bailian_cosyvoice.yaml特点LLM云端 API千帆 / 文心 / DeepSeek 等TTSEdge TTS 免费 或 CosyVoice API数字人LiteAvatar可设use_gpu: true但要降分辨率/帧率显存占用官方实测类似配置在 6G 卡上约 35G4G 卡建议分辨率512×512 或更低fps2025不开其他大模型3.2 68GB 显存如 3060 6G / 3060Ti 8G推荐配置想省钱chat_with_openai_compatible_edge_tts.yaml想音质好一点chat_with_openai_compatible_bailian_cosyvoice.yaml CosyVoice API显存规划LiteAvatar / LAM36G再开个本地量化小模型勉强能塞但会很紧张建议还是云端 LLM可以尝试MuseTalk8GB 显存是官方“推荐起步线”但要注意分辨率、batch_size 都要调小3.3 1012GB 显存如 3080 10G / 3080 12G可以玩本地量化 MiniCPM-oint4约 10G 以下显存LiteAvatar / MuseTalk 同时跑基本没问题推荐配置chat_with_minicpm.yaml本地量化模型或者云端 LLM MuseTalk 做更酷的口型同步3.4 16GB 及以上显存如 3090 / 4090 / A100想怎么玩怎么玩未量化 MiniCPM-o LiteAvatar / LAM MuseTalk 都能上多路并发数字人客服每路大约 3G 左右自己算一下能开几路4. 实用显存优化技巧用云端 LLM 替代本地 MiniCPM-o这是降显存最狠的一招从 20G 直接掉到 36G。LiteAvatar / MuseTalk 参数调低分辨率从 1024×1024 降到 512×512fps从 30 降到 2025batch_sizeMuseTalk 推理设为 1开启 FP16 / 半精度LiteAvatar 官方实测 FP16 可以把显存再砍掉一截RTX 3060 也能更流畅。多会话时注意并发数OpenAvatarChat 支持多路对话每路 LiteAvatar 大约 3G 显存。6G 卡建议 12 路8G 卡23 路12G4 路以上没问题5. 一句话总结只想跑 LiteAvatar 数字人 云端 API4GB 显存就能玩6GB 以上更舒服。想本地跑 MiniCPM-o至少 10GB 显存int4 量化20GB 才敢用未量化版。显存不够就云端 LLM Edge TTS LiteAvatar这是最低门槛组合。如果你告诉我你现在的显卡型号比如 3060 8G / 4060 8G / 3090 24G 之类我可以直接帮你选一个具体配置文件和推荐参数。