想做自媒体数字人访谈视频，在百度 AI Studio 上安装 OpenAvatarChat，显存要求

发布时间：2026/6/15 2:43:58

想做自媒体数字人访谈视频在百度 AI Studio 上安装 OpenAvatarChat显存要求在百度 AI Studio 上安装 OpenAvatarChat百度 AI Studio 是免费 GPU 云环境但有几个坑需要绕过去。下面一步步来。⚠️ 核心难点预判难点原因解决方案GitHub 访问慢/超时国内网络限制用 ghproxy 镜像HuggingFace 模型下载不了国内被墙用 hf-mirrorGradio WebUI 无法访问 AI Studio 端口不直接暴露用 AI Studio 的端口代理子模块拉取失败同样是网络问题手动处理子模块第一步创建 AI Studio 项目打开 aistudio.baidu.com新建项目 → 选择 Notebook 模式运行环境选 GPUV100 或 A100 都行进入 Notebook 后打开终端Terminal 第二步基础环境准备在终端中执行1. 检查 GPU 和 CUDAnvidia-smipython --version # AI Studio 一般是 Python 3.102. 安装 uv 包管理器curl -LsSf https://astral.sh/uv/install.sh | shsource ~/.bashrc # 让 uv 命令生效uv --version # 验证3. 设置 HuggingFace 镜像关键export HF_ENDPOINThttps://hf-mirror.com写入 bashrc 永久生效echo ‘export HF_ENDPOINThttps://hf-mirror.com’ ~/.bashrc 第三步克隆项目用国内镜像加速用 ghproxy 加速克隆git clone https://ghproxy.com/https://github.com/HumanAIGC-Engineering/OpenAvatarChat.gitcd OpenAvatarChat子模块单独处理直接递归可能失败先初始化git submodule init查看有哪些子模块git config --file .gitmodules --get-regexp url如果子模块拉取也慢手动改用镜像把子模块的 github 地址替换为 ghproxy 地址sed -i ‘s|https://github.com/|https://ghproxy.com/https://github.com/|g’ .gitmodules然后更新并拉取git submodule update --init --recursive如果 sed 替换后子模块还是失败就手动一个个克隆查看需要哪些子模块cat .gitmodules假设子模块在 third_party/xxx手动克隆git clone https://ghproxy.com/https://github.com/xxx/xxx.git third_party/xxx 第四步创建虚拟环境安装依赖用 uv 创建虚拟环境指定 Python 版本uv venv --python 3.11.11source .venv/bin/activate选择配置安装依赖Edge TTS LiteAvatar 方案最省事uv run install.py --uv --config config/chat_with_openai_compatible_edge_tts.yaml如果 install.py 报错看错误信息逐个解决。常见问题如果某个包安装失败尝试单独装uv pip install 包名 -i https://pypi.tuna.tsinghua.edu.cn/simple如果是 PyTorch 相关问题确认 CUDA 版本后重装uv pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 第五步下载 LiteAvatar 模型确保镜像变量还在export HF_ENDPOINThttps://hf-mirror.com运行下载脚本bash scripts/download_liteavatar_weights.sh如果脚本报错手动下载在 Notebook 里新建一个 cell 执行from huggingface_hub import snapshot_downloadimport osos.environ[“HF_ENDPOINT”] “https://hf-mirror.com”snapshot_download(repo_id“HumanAIGC-Engineering/LiteAvatar”,local_dir“./weights/liteavatar”,local_dir_use_symlinksFalse)print(“下载完成”) 第六步配置 LLM API Key你需要一个 OpenAI 兼容的 API推荐用免费的方案A百度千帆AI Studio 自家免费额度修改配置文件vim config/chat_with_openai_compatible_edge_tts.yaml找到 LLM 部分改成llm:api_base: “https://qianfan.baidubce.com/v1” # 或千帆的兼容端点api_key: “你的千帆API_KEY”model: “ernie-4.0-8k” # 或其他免费模型方案B其他免费 API平台免费额度兼容性百度千帆有免费额度 OpenAI 兼容硅基流动 (SiliconFlow) 有免费额度 OpenAI 兼容DeepSeek 有免费额度 OpenAI 兼容Groq 免费额度大 OpenAI 兼容第七步启动服务关键端口映射AI Studio 的 Notebook 不能直接访问 localhost:7860需要用它的端口代理source .venv/bin/activate启动 OpenAvatarChatuv run src/demo.py --config config/chat_with_openai_compatible_edge_tts.yaml --server_name 0.0.0.0 --server_port 7860在 AI Studio 中访问 WebUIAI Studio 提供了两种方式访问服务方式1直接点击生成的链接启动后终端会显示类似 https://xxx.aistudio.baidu.com/proxy/7860 的链接点击即可打开方式2手动设置端口代理如果 AI Studio 有端口转发按钮添加 7860 端口或者查看 AI Studio 的自定义服务入口不同版本的 AI Studio 界面不同找 “自定义服务” 或 “端口映射” 按钮把 7860 映射出来。第八步改成访谈模式启动成功后修改 LLM 的 system prompt让它输出访谈格式在配置文件中找到 system_prompt 相关字段改成system_prompt: |你是一个访谈节目的主持人。请按以下格式输出主持人[你的提问]嘉宾[嘉宾的回答]每次只输出一轮对话等待用户嘉宾回应后再继续。常见报错及解决报错1git submodule update 失败跳过子模块手动处理git submodule deinit -f .rm -rf .git/modules/然后手动克隆需要的子模块报错2uv: command not foundsource ~/.bashrc或source ~/.cargo/env报错3CUDA out of memory换成 CPU 模式慢但能跑export CUDA_VISIBLE_DEVICES“”或者选更高显存的 GPU 实例报错4HuggingFace 下载超时确认镜像设置echo $HF_ENDPOINT应该输出 https://hf-mirror.com如果不是重新设置export HF_ENDPOINThttps://hf-mirror.com报错5端口访问不了在 Notebook 里测试服务是否启动import requestsresp requests.get(“http://localhost:7860”)print(resp.status_code) # 应该是 200 整体时间估算步骤预计时间克隆项目 5-10 分钟安装依赖 15-30 分钟下载模型 10-20 分钟配置调试 20-30 分钟总计约 1-1.5 小时总结核心就是三个坑要绕——GitHub 用 ghproxy、HuggingFace 用 hf-mirror、WebUI 用 AI Studio 端口映射。把这三个搞通剩下的按官方文档走就行。显存要求要看你选哪种“数字人”和是否用本地大模型差别非常大。最省显存的组合LiteAvatar 云端 LLM Edge TTS / CosyVoice API官方实测只要 36GB 显存就能跑如果用本地未量化的 MiniCPM-o就要 20GB 显存。1. 官方给的“硬指标”项目文档里写得很清楚支持 CUDA 的 NVIDIA GPU未量化 MiniCPM-o 模型需要 20GB 以上显存int4 量化版 MiniCPM-o需要 10GB 以下显存数字人推理支持CPU/GPU显存不够可以靠 CPU 兜底另外一篇低显存实测文章用SenseVoice LLM API CosyVoice API跑 LiteAvatar / LAM在 RTX 3060 6G 上LAM 数字人约3.1GB 显存LiteAvatar 数字人约5.3GB 显存2. 按你选择的组件看显存需求2.1 只看“数字人”这一块不含本地 LLM数字人类型典型显存占用单路说明LiteAvatar2D约 36GB官方说 CPU 也能 30fpsGPU 大概 3G 起步46G 更舒服LAM3D 高斯泼溅约 3GB 左右实测比 LiteAvatar 略省一点但和场景/分辨率强相关MuseTalk口型同步一般 48GB 就能跑8GB 以上更稳它是视频驱动分辨率/batch_size 影响很大如果你只想要“数字人画面”4GB 显存云端 API 基本够玩6GB 以上更舒服。2.2 加上本地大模型MiniCPM-o这是真正吃显存的大头模型方案显存需求适合什么显卡MiniCPM-o 未量化20GB3090/4090 这种 24G 卡或 A100 40GMiniCPM-o int4 量化10GB 以下3060 12G、3060Ti 8G 都可以尝试完全用云端 LLM API数字人那点 36G 就够1060 6G / 3050 4G 都能跑 LiteAvatar所以如果显存 ≤8GB基本不要想本地跑完整 MiniCPM-o老实用云端 LLM API。3. 不同硬件档位怎么选配置结合官方和社区实测可以这么选3.1 4GB 显存如 GTX 1650 / 3050 4G推荐配置chat_with_openai_compatible_edge_tts.yaml或chat_with_openai_compatible_bailian_cosyvoice.yaml特点LLM云端 API千帆 / 文心 / DeepSeek 等TTSEdge TTS 免费或 CosyVoice API数字人LiteAvatar可设use_gpu: true但要降分辨率/帧率显存占用官方实测类似配置在 6G 卡上约 35G4G 卡建议分辨率512×512 或更低fps2025不开其他大模型3.2 68GB 显存如 3060 6G / 3060Ti 8G推荐配置想省钱chat_with_openai_compatible_edge_tts.yaml想音质好一点chat_with_openai_compatible_bailian_cosyvoice.yaml CosyVoice API显存规划LiteAvatar / LAM36G再开个本地量化小模型勉强能塞但会很紧张建议还是云端 LLM可以尝试MuseTalk8GB 显存是官方“推荐起步线”但要注意分辨率、batch_size 都要调小3.3 1012GB 显存如 3080 10G / 3080 12G可以玩本地量化 MiniCPM-oint4约 10G 以下显存LiteAvatar / MuseTalk 同时跑基本没问题推荐配置chat_with_minicpm.yaml本地量化模型或者云端 LLM MuseTalk 做更酷的口型同步3.4 16GB 及以上显存如 3090 / 4090 / A100想怎么玩怎么玩未量化 MiniCPM-o LiteAvatar / LAM MuseTalk 都能上多路并发数字人客服每路大约 3G 左右自己算一下能开几路4. 实用显存优化技巧用云端 LLM 替代本地 MiniCPM-o这是降显存最狠的一招从 20G 直接掉到 36G。LiteAvatar / MuseTalk 参数调低分辨率从 1024×1024 降到 512×512fps从 30 降到 2025batch_sizeMuseTalk 推理设为 1开启 FP16 / 半精度LiteAvatar 官方实测 FP16 可以把显存再砍掉一截RTX 3060 也能更流畅。多会话时注意并发数OpenAvatarChat 支持多路对话每路 LiteAvatar 大约 3G 显存。6G 卡建议 12 路8G 卡23 路12G4 路以上没问题5. 一句话总结只想跑 LiteAvatar 数字人云端 API4GB 显存就能玩6GB 以上更舒服。想本地跑 MiniCPM-o至少 10GB 显存int4 量化20GB 才敢用未量化版。显存不够就云端 LLM Edge TTS LiteAvatar这是最低门槛组合。如果你告诉我你现在的显卡型号比如 3060 8G / 4060 8G / 3090 24G 之类我可以直接帮你选一个具体配置文件和推荐参数。

相关新闻

workbuddy ，node.js 每次会在 项目目录上安装 node_modules,能不能一次安装多次使用，为什么 npm 不把包装在全局

OpenH264编码器mv_pred.cpp 深度源码分析

低压CPU配高端独显：性能瓶颈与系统平衡深度解析

SPSS案例复盘：一次失败的多因素方差分析，我踩了哪些坑？（附正确操作与解读指南）

Halcon深度学习从入门到部署：GPU配置、模型推理与热图可视化全攻略

数据科学竞赛实战指南：特征可信度、验证鲁棒性与提交确定性

对话式文档提示工程：让大模型精准阅读PDF/Word

GPT-4动态稀疏激活：2%参数如何实现5.6倍推理效率提升

避坑指南：解决PLC与Matlab通信中最常见的5个连接失败问题（基于S7-1200实测）

一键解决DLL缺失、程序崩溃，这工具真的省事

绝地求生罗技鼠标宏终极指南：5分钟实现完美压枪控制

SD-PPP：将AI智能融入Photoshop设计工作流的革命性方案

2026手机录音转文字工具怎么选？手把手教你各类工具使用方法

Python实现DNA链式自组装模拟器

026华夏之光永存：国家级痛点破局 5G通信基站用高端射频滤波器（BAW/SAW）

workbuddy ，node.js 每次会在项目目录上安装 node_modules,能不能一次安装多次使用，为什么 npm 不把包装在全局