MinerU 是一款高效的数据处理工具,基于 Docker Compose 部署可以极大简化环境配置流程,无需复杂的依赖安装即可快速启动服务。本文将详细讲解通过 Docker Compose 分步部署 MinerU 的完整流程,适配国内网络环境,新手也能轻松上手。
一、部署前准备
1. 环境要求
已安装 Docker 和 Docker Compose(建议 Docker 版本 ≥ 20.10,Compose 版本 ≥ 2.0)
服务器/本地机器具备外网访问能力(用于下载镜像和配置文件)
至少 2GB 可用内存,确保容器正常运行
2. 环境检查
执行以下命令验证 Docker 和 Compose 是否安装成功:
# 检查 Docker 版本 docker --version # 检查 Docker Compose 版本 docker compose version若未安装,可参考 Docker 官方文档完成安装(国内用户建议使用阿里云镜像加速)。
二、分步部署 MinerU
步骤1:构建 MinerU 镜像(适配国内环境)
首先下载适配国内网络的 Dockerfile,并构建本地镜像:
# 下载国内版 Dockerfile wget https://gcore.jsdelivr.net/gh/opendatalab/MinerU@master/docker/china/Dockerfile # 构建 MinerU 镜像(标签为 latest) docker build -t mineru:latest -f Dockerfile .执行过程中会自动下载基础镜像和依赖,国内网络可能需要几分钟,耐心等待即可;
若出现下载超时,可配置 Docker 镜像加速(如阿里云、网易云镜像源)。
步骤2:下载 Compose 配置文件
Compose 配置文件定义了 MinerU 各服务的运行规则,执行以下命令下载:
wget https://gcore.jsdelivr.net/gh/opendatalab/MinerU@master/docker/compose.yaml下载完成后,可通过cat compose.yaml查看文件内容,确认配置无异常。
步骤3:启动 OpenAI 服务(可选)
若需使用 OpenAI 相关功能,启动对应 profile:
docker compose -f compose.yaml --profile openai-server up -d--profile指定启动的服务组,openai-server对应 OpenAI 相关服务;-d表示后台运行,不占用当前终端。
步骤4:启动 API 服务
API 服务是 MinerU 的核心接口层,执行以下命令启动:
docker compose -f compose.yaml --profile api up -d启动后可通过docker compose ps查看服务状态,若状态为Up则表示启动成功。
步骤5:启动 Gradio 可视化界面
Gradio 提供了可视化操作界面,方便非命令行用户使用:
docker compose -f compose.yaml --profile gradio up -d启动完成后,访问服务器 IP + 对应端口(默认 7860)即可打开 Gradio 界面。
三、常用运维命令
1. 查看服务状态
docker compose -f compose.yaml ps2. 查看服务日志
# 查看 API 服务日志 docker compose -f compose.yaml logs mineru-api # 实时查看日志 docker compose -f compose.yaml logs -f mineru-gradio3. 停止服务
# 停止单个服务 docker compose -f compose.yaml stop mineru-gradio # 停止所有服务 docker compose -f compose.yaml down4. 重启服务
docker compose -f compose.yaml restart mineru-api四、常见问题解决
镜像构建失败:检查网络是否正常,或手动替换 Dockerfile 中的源为国内镜像(如清华源、阿里云源);
服务启动后无法访问:检查服务器防火墙/安全组是否开放对应端口(30000、7860、8000 等);
Compose 命令报错:确认 Docker Compose 版本为 v2,若为 v1 需替换为
docker-compose(带短横线)。
总结
MinerU Docker Compose 部署核心分为三步:构建国内适配镜像、下载配置文件、按 profile 启动对应服务;
不同 profile 对应不同功能模块,可根据需求选择性启动(如仅用可视化界面可只启动 gradio,需 API 调用则启动 api);
部署后可通过
docker compose系列命令完成服务的启停、日志查看等运维操作,便于问题排查。
通过以上步骤,你可以快速完成 MinerU 的 Docker Compose 部署,无需关注复杂的环境依赖,直接开箱即用。根据实际需求选择启动的服务模块,既能节省资源,又能满足不同的使用场景。