ADH(Awesome Digital Human)作为一款创新的开源数字人项目,致力于帮助用户构建私有化且高度可定制的数字生命体。该项目通过模块化架构设计,让数字人具备类人的交互能力和情感表达,为用户创造真正有温度的数字伴侣体验。
核心功能亮点
• 容器化快速部署:支持Docker一键式安装,大幅简化部署流程
• 轻量化资源需求:仅需2核CPU与2GB内存即可流畅运行
• 框架无缝集成:完美兼容Dify/FastGPT等AI编排框架服务
• 模块化扩展能力:支持ASR语音识别、LLM大语言模型、TTS语音合成及Agent代理的灵活扩展
• 角色深度定制:提供Live2d人物模型库及多样化控制方案
• 全平台适配:优化支持PC端与移动端Web访问体验
重要提示:在飞牛系统环境中,8000端口的默认占用可能导致部署异常,而Unraid系统则无此问题。尝试通过修改.env配置文件调整端口号可能无法解决问题,可能需要重新构建镜像才能彻底解决。
详细安装步骤
Docker Compose部署方案
services:
adh_web:
image: registry.cn-hangzhou.aliyuncs.com/awesome-digital-human/adh-web:main-latest
container_name: adh_web
ports:
- 3000:3000
volumes:
- /vol1/1000/docker/adh/.env:/workspace/.env
restart: always
adh_server:
image: registry.cn-hangzhou.aliyuncs.com/awesome-digital-human/adh-api:main-latest
container_name: adh_server
ports:
- 8000:8000
volumes:
- /vol1/1000/docker/adh/configs:/workspace/configs
restart: always
关键参数解析(建议查阅官方文档获取完整配置指南):
/workspace/.env
路径映射:用于配置前端界面参数/workspace/configs
路径映射:用于配置服务端运行参数
部署前需从GitHub项目仓库下载必备文件,包括configs配置文件夹及web目录中的.env环境配置文件。
功能使用指南
在浏览器地址栏输入http://NAS的IP:3000
即可访问数字人交互界面。
通过"Gallery"功能可自由切换不同风格的人物模型。
系统预置多款精美的Live2d人物模型供用户选择。
背景自定义功能支持个性化场景设置。
在"Setting"面板中可进行深度交互配置。
交互模式配置
• 聊天模式:专注于文本对话交互,不展示数字人形象
• 数字人模式:实现与数字人的全方位交互体验
• 沉浸模式(开发中):专为语音唤醒设计的深度交互模式
系统默认提供三种交互模式的切换功能。
Agent服务对接
• ReapterAgent:用于功能测试的语句复读模式
• DifyAgent:对接Dify智能服务平台
• FastgptAgent:接入FastGPT智能服务
• OpenaiAgent:兼容OpenAI接口标准的服务接入
在服务配置界面可灵活对接各类API服务。
成功对接第三方OpenAI接口的配置示例。
文字交互与语音反馈功能运行流畅,并实现精准的嘴型同步效果。
移动端网页适配效果展示。
高级功能扩展
浏览器安全策略限制HTTP协议下的麦克风访问权限,需手动调整浏览器配置。
在Chrome浏览器地址栏输入:chrome://flags/#unsafely-treat-insecure-origin-as-secure
在"Insecure origins treated as secure"设置项中添加数字人前端访问地址(如:http://192.168.31.90:3000
)
重启浏览器后,地址栏安全警告标识消失。
当前版本中,语音输入功能可能存在兼容性问题。
项目总结与评价
ADH作为创新型开源数字人项目,提供了独特的交互体验。遗憾的是项目已近半年未更新。若能整合直播弹幕交互功能,将有望实现24小时无人直播解决方案。
综合评估:
推荐指数:⭐⭐⭐⭐(值得体验)
使用体验:⭐⭐⭐(功能有待完善)
部署难度:⭐⭐⭐(中等复杂度)