公共资源速递
6 个公共数据集:
* Human faces 人脸数据集
* SimpleQA 简明事实性问答评测数据集
* Med-Banana-50K 医学图像编辑数据集
* DeepSearchQA 多步信息搜索问答数据集
* TongSIM-Asset 具身智能模拟资产数据集
* Calories Burnt Prediction 卡路里消耗预测数据集
10 个公共教程:
* AWPortrait-Z 肖像美术 LoRA
* Fara-7B:高效的网页智能体模型
* HY-MT1.5-1.8B:多语言翻译模型
* Maya1:高度写实的情感语音合成服务
* Circuit Sparsity:OpenAI 开源新稀疏模型
* vLLM+Open WebUI 部署 granite-4.0-h-small
* Chatterbox-Turbo Demo: 高性能语音印模复制与转换
* Cambrian-S-7B:面向视频的空间超感知多模态大模型
* Live Avatar:基于实时音频驱动的无限长度虚拟形象生成
* Qwen-Image-Layered-Interface 图像图层分解系统教程
访问官网立即使用:http://openbayes.com
公共数据集
1. Human Faces 人脸数据集
Human Faces 是一个面向人脸相关计算机视觉任务的数据集,旨在为人脸识别、检测、表情分析以及生成建模等应用提供高质量、结构清晰的图像数据支持。数据集共包含 9,630 张人脸图像,由 5,000 张真实人脸图像与 4,630 张 AI 生成人脸图像构成,真实与合成数据的结合有助于提升模型在多样化场景下的泛化能力。该数据集整体规模适中,适合用于人脸分析模型训练、鲁棒性研究以及真实与合成数据对比实验。
* 在线使用:
khttps://go.openbayes.com/CAgKa
数据集示例
2. SimpleQA 简明事实性问答评测数据集
SimpleQA 是一个面向大语言模型事实准确性评测的数据集,用于评估模型在回答简短、明确且可唯一验证的事实性问题时的正确性表现。数据集共包含 4,326 条问题样本,覆盖科学与技术、艺术、娱乐等多个主题领域,其中 4,321 条构成正式测试集,另有 5 条用于 few-shot 设置。每个问题均对应唯一且无争议的标准答案,并附带主题类别、答案类型及参考来源,适合用于高强度事实可靠性评测与模型对比分析。
* 在线使用:
https://go.openbayes.com/EFJhl
3. Med-Banana-50K 医学图像编辑数据集
Med-Banana-50K 是一个面向文本引导医学影像编辑任务的大规模数据集,旨在支持多模态模型在不同医学影像模态与疾病条件下的病灶编辑能力研究。数据集包含超过 50,000 条医学影像编辑样本,并额外提供约 37,000 条失败编辑尝试及其完整评估日志,覆盖胸部 X 光、脑部 MRI 与眼底影像三种模态以及 23 种疾病类型。所有样本均支持病灶添加与去除两种编辑方向,并附带基于自动评估流程生成的多维质量判定结果,适合用于医学图像编辑、模型评测与误差分析研究。
* 在线使用:
https://go.openbayes.com/wXQsK
数据集示例
4. DeepSearchQA 多步信息搜索问答数据集
DeepSearchQA 是一个面向复杂信息检索与事实性评测的问答数据集,用于评估大语言模型或智能体在多步骤搜索任务中的规划能力与上下文保持能力。数据集包含 900 条人工设计的评测样本,覆盖 17 个不同领域,问题以因果链形式构建,要求模型基于前一步搜索结果持续获取并整合新信息。约 65% 的问题需要给出完整答案集合,所有答案均具备客观可验证性,适合用于评测具备联网搜索能力的研究型模型与智能体系统。
* 在线使用:
https://go.openbayes.com/CRpYa
5. TongSIM-Asset 具身智能模拟资产数据集
TongSIM-Asset 是一个面向具身智能研究的高一致性模拟环境与资产数据集,旨在为智能体在接近真实物理世界的环境中进行感知、决策与交互提供统一平台支持。数据集包含 100 个高质量三维模拟场景,覆盖室内多房间环境与完整室外城市场景,并提供 3,000 余个可交互三维物体、500 余类物品类别以及多种智能体类型与动画。该数据集适合用于具身智能体的仿真训练、评测与复杂交互研究。
* 在线使用:
https://go.openbayes.com/RklDR
6. Calories Burnt Prediction 卡路里消耗预测数据集
Calories Burnt Prediction 是一个面向运动能量消耗预测任务的监督学习数据集,旨在利用个体生理特征与运动状态信息预测单次锻炼过程中的卡路里消耗量。数据集以单次运动记录为基本样本单位,包含性别、年龄、身高、体重、运动时长、心率与体温等多维特征,并对应连续数值型卡路里消耗标签。其任务目标明确、数据结构清晰,适合用于个体化运动能耗建模与回归预测研究。
* 在线使用:
https://go.openbayes.com/JrTLG
公共教程
1. AWPortrait-Z 肖像美术 LoRA
AWPortrait-Z 是一款面向人像生成任务的美术增强 LoRA 模型,通过轻量化参数适配显著提升扩散模型在人像细节与摄影质感方面的表现。模型无需重新训练底座模型,仅通过加载少量权重即可改善面部结构、肤质纹理与整体光影效果,在保持推理效率与显存占用的同时获得更自然的人像生成结果,适用于写真级人像生成与高质量人物图像创作。
* 在线运行:
https://go.openbayes.com/qCWYq
项目示例
2. Fara-7B:高效的网页智能体模型
Fara-7B 是 Microsoft Research 推出的面向真实网页操作场景的智能体小语言模型,参数规模仅 70 亿,但在网页理解、操作规划与执行任务中表现突出。模型针对浏览器环境下的界面解析与多步骤交互进行了专项优化,在多项 Web Agent 基准中达到同规模模型的领先水平,适用于自动化网页操作、智能浏览助手与轻量级通用 Agent 系统。
* 在线运行:
https://go.openbayes.com/ZLIvY
3. HY-MT1.5-1.8B:多语言翻译模型
HY-MT1.5-1.8B 是腾讯混元团队推出的 18 亿参数多语言神经机器翻译模型,基于统一 Transformer 架构在单一模型中支持 30 余种语言及多种民族语言/方言的高质量互译。模型针对混合语言、术语控制、上下文约束与格式保持等真实翻译场景进行了专项优化,在翻译质量与推理效率之间取得良好平衡,适用于国际化内容生产与多语言系统部署。
* 在线运行:
https://go.openbayes.com/wzKLw
项目示例
4. Maya1:高度写实的情感语音合成服务
Maya1 是一款专注于高真实感情感表达的语音合成模型,能够从文本中精确建模说话人的情绪状态、语调、语速与表达风格。模型采用自回归语音生成架构与分层声码器设计,在保持自然度的同时实现稳定、可控的情感输出,适用于数字人语音、配音生成、播客制作与高质量语音内容创作。
* 在线运行:
https://go.openbayes.com/2VBTd
项目示例
5. Circuit Sparsity:OpenAI 开源新稀疏模型
Circuit Sparsity 是 OpenAI 推出的新型稀疏大语言模型,通过将绝大多数权重强制归零,构建出高度可解释的稀疏计算结构。该模型使推理过程能够以「电路级」形式被逐层分析和追踪,为理解模型能力形成机制提供了新的研究路径,适用于模型可解释性研究、基础模型分析与机制探索。
* 在线运行:
https://go.openbayes.com/SPAm1
6. vLLM+Open WebUI 部署 granite-4.0-h-small
Granite-4.0-h-small 是 IBM 推出的 32 亿参数长上下文指令模型,在指令理解、工具调用与企业级任务执行方面进行了系统优化。通过 vLLM 与 Open WebUI 的组合部署,可快速构建 OpenAI API 兼容的本地推理服务,在保证性能的同时降低部署复杂度,适用于企业私有化部署与内部智能助手系统。
* 在线运行:
https://go.openbayes.com/1PKnF
7. Chatterbox-Turbo Demo: 高性能语音印模复制与转换
Chatterbox-Turbo 是面向实时对话场景优化的高性能语音合成与音色克隆框架,采用非自回归生成架构,在极低延迟下实现高保真语音输出。模型仅需少量参考音频即可完成对目标音色与韵律的精准复制,并支持笑声、叹息等非语言事件生成,适用于智能客服、数字人交互与实时语音代理应用。
* 在线运行:
https://go.openbayes.com/i4qSX
项目示例
8. Cambrian-S-7B:面向视频的空间超感知多模态大模型
Cambrian-S-7B 是一款专注于视频空间理解的多模态大模型,通过创新的空间感知架构显著提升对对象位置、空间关系与动态变化的建模能力。模型在保持通用视频理解性能的同时,在空间推理任务中表现突出,适用于自动驾驶、机器人导航、AR/VR 交互与复杂视频分析场景。
* 在线运行:
https://go.openbayes.com/r8F1b
项目示例
9. Live Avatar:基于实时音频驱动的无限长度虚拟形象生成
Live Avatar 是一套面向实时交互与直播场景的虚拟形象生成系统,通过大规模扩散模型实现高达 20 FPS 的端到端生成速度,并支持无限时长稳定运行。系统能够根据实时音频驱动虚拟角色的口型与表情变化,在保证生成质量的同时保持极低延迟,适用于数字人直播与沉浸式互动内容创作。
* 在线运行:
https://go.openbayes.com/B8BWv
项目示例
10. Qwen-Image-Layered-Interface 图像图层分解系统教程
Qwen-Image-Layered 是通义千问推出的一套图像图层分解系统,专注于将复杂自然图像自动拆分为多个语义清晰、空间对齐的独立图层。该系统通过显式建模图像内部结构,显著提升图像编辑与理解过程中的可控性与可解释性,适用于图像结构分析、分层编辑以及可编辑视觉系统的开发。
* 在线运行:
https://go.openbayes.com/kJyCf
项目示例