WMW
Insights

title: "浏览器中直接运行Qwen3大语言模型:Docker零安装部署完整指南"
date: "2025-12-05"

Qwen-Web 是一个创新的开源项目,它使用户能够在本地浏览器中直接运行 Qwen3-0.6b 大语言模型。该项目实现了零安装需求,同时不记录日志或存储任何用户数据,确保了隐私和安全。

Image

您可以通过访问在线演示来体验该项目的功能:https://qwen-web.sdan.io。

部署步骤

使用 Docker Compose 可以快速部署该项目,具体配置如下:

services:  
  qwen-web:  
    image: heizicao/qwen-web:latest  
    container_name: qwen-web  
    ports:  
      - 8443:443  
    restart: always

操作指南

在浏览器地址栏中输入 https://NAS的IP:8443 即可访问界面,请注意必须使用 HTTPS 协议。

Image

提示:如果浏览器显示有关私密连接的警告,请选择继续访问以进入界面。

Image

每次打开网页访问时,系统都需要先加载 Qwen3-0.6b 的模型文件,这可能需要一些时间初始化。

Image

界面顶部栏提供了颜色主题切换功能,用户可以根据喜好调整外观。

Image

背景支持添加网格效果,这增强了视觉体验并可能辅助界面布局。

Image

在输入框中键入文字并按回车确认后,系统会生成回复并显示在对话区域内。

Image

界面上方会显示回复速度,例如 14.93TPS,由于模型会展示思考过程,因此整体响应速度在可接受范围内。

Image

左侧边栏内置了多个预设角色,用户可以选择这些角色进行针对性的聊天交互。

Image

网页聊天功能通过 WebGPU 技术调用设备 GPU 进行计算,这提升了模型运行的效率和性能。

Image

评价与总结

这个项目展现了在浏览器环境中直接运行 Qwen3 大语言模型的有趣潜力。它利用 WebGPU 技术实现网页对设备 GPU 的调用,从而进行计算和渲染。目前,该项目在 PC 界面适配方面尚有改进空间,且运行模型时偶尔会出现 BUG,例如卡顿或回复英文内容。尽管如此,个人认为它仍然具有较高的娱乐性和探索价值,用户可以在运行模型的同时测试设备 GPU 的性能表现。

综合推荐:⭐⭐⭐(项目概念新颖,具有一定趣味性)

使用体验:⭐⭐(界面设计较为简单,且存在偶发的功能性问题)

部署难易:⭐(部署过程极为简便,适合快速上手)

© WMW 2025