安阳市网站建设_网站建设公司_企业官网_seo优化
2026/1/1 0:41:52 网站建设 项目流程

青云智算

该企业由青云智算投递并参与金猿组委会×数据猿×上海大数据联盟共同推出的《2025中国大数据产业年度AI Infra领先企业》榜单/奖项评选。


大数据产业创新服务媒体

——聚焦数据 · 改变商业


TCL集团拥抱AI、建造新型AI Infra,来自全球AI技术产业化加速、国家政策导向、自身全产业链升级需求及行业竞争驱动,叠加其长期技术与场景沉淀,以“AI向实”为核心推动AI落地创造真实价值。

全球AI技术与产业浪潮倒逼基础设施升级。AI竞争聚焦模型参数与算力基建扩张,但出现技术空转、算力浪费、同质化内卷等问题,AI多停留在技术层未充分落地。同时,传统软硬件架构难以支撑未来发展需求。

中国制造业正从加工制造向高端制造、智能制造转型,政策鼓励企业以AI赋能全链条,TCL依托半导体显示、新能源光伏、智能终端全产业链,借助AI Infra推动制造升级,契合国家战略导向。

TCL业务覆盖研发、制造、供应链、运营、终端等多个环节,全链路数字化与智能化在AI时代提出新需求,以数据智能驱动决策优化、供应链协同和管理精细化。TCL在语音识别、图像识别等AI领域早有布局,拥有海量真实生产与消费场景数据,能为为垂域AI模型训练、AI Infra优化提供核心资源。

与此同时,消费者对个性化、智能化产品需求不断提升,TCL需通过AI Infra提供新的IT支撑,打造差异化优势,实现品质升级与成本优化,巩固全球化竞争地位。

时间周期:

项目开始时间:2025年6月中旬

中间重要时间节点:

2025年6月底完成惠州公司AI Infra一期部署,2025年8月完成深圳公司算力统一纳管。

项目完结时间:2025年8月

AI Infra应用需求

结合业务推进中的实际痛点与长期发展规划,TCL明确提出对AI Infra的四大核心需求,以改变当前基础设施支撑能力不足的问题:一是构建跨部门协同的算力调度体系,解决多业务线、多算法团队同时争抢GPU资源的协调难题,保障研发与生产任务的高效推进;二是实现算力资源的精细化运营,打破传统物理机独占模式,提升资源利用率,降低闲置资源浪费;三是搭建灵活适配的多场景计算支撑体系,由于AI应用场景不同,存在差异化计算需求,而传统物理机配置流程复杂,难以实现简化机器配置流程,难以快速响应与适配;四是建立标准化的跨地域运维体系,降低多区域运营维护成本,提升基础设施的整体稳定性与可扩展性。

在青云智算看来,TCL的AI Infra需求本质上是构建“算力集约化、运营精细化、适配灵活化、运维标准化”的智能基础设施底座,核心目标是打通算力资源与业务场景的协同壁垒,为AI技术在全产业链的落地提供稳定、高效、低成本的基础支撑。在资源层,核心是解决“算力供需失衡”与“资源浪费”的矛盾,需实现从“物理机独占”到“虚拟化/容器化共享”的转型,通过资源池化改造提升GPU等核心算力资源的调度效率与利用率。在运营层,重点解决“配置繁琐”与“调度低效”的问题,全流程化管理需覆盖资源申请、分配、配置、回收全生命周期,实现多部门需求的智能调度与优先级排序。

面临挑战

作为中国最大的、全球性规模经营的消费类电子企业集团之一,TCL集团及各分子公司在人工智能、大数据分析、高性能计算等领域的业务需求日益增长,业务对GPU算力资源的需求呈现出爆发式增长,也面临一些现实问题。

组织架构分散导致AI Infra需求碎片化。TCL集团下设多个分子公司及业务板块,各板块拥有独立的IT运维团队与资源调配权限,且不同业务线对AI Infra的认知与需求存在差异,给整体AI Infra底座的统筹规划带来阻碍。

同样,GPU算力资源分散于各业务部门,采用物理机静态分配模式,缺乏统一的算力调度中枢,当大规模算力需求出现时,资源无法快速聚合调度。更重要的是,各业务部门在地域上也是分散的,缺乏统一的监控、告警与故障响应机制,难以实现全域基础设施的集中管控。

到业务创新层面,AI训练环境异构化严重,部署效率低且兼容性差,如果搭建独立训练环境,环境配置需手动调试,单场景部署耗时超4小时,且不同环境间存在兼容性壁垒,难以支撑跨团队协作。

业务连续性的保障也是AI Infra建设中必须考虑的问题。AI Infra作为支撑集团全业务线AI应用的核心底座,其建设与升级涉及现有IT架构改造、资源迁移、系统适配等多个关键环节,而这些环节均可能对当前正常的生产研发业务产生冲击。如何在AI Infra架构升级、技术改造与资源迁移过程中,建立科学的风险防控机制与平滑过渡方案,确保现有核心业务不受影响、数据安全得到充分保障,成为集团推进AI Infra建设必须突破的关键难点之一。

战略目标

构建AI Infra的顶层战略目标核心是以统一AI Infra为核心底座,全面支撑 “AI向实”战略落地,驱动全产业链智能化变革,强化全球产业竞争壁垒。

其一,构建集团级统一AI Infra底座,实现资源统筹与效率升级。GPU服务器的资源池化整合,建立统一算力调度中枢,将GPU资源利用率从当前不足35%提升至65%以上,跨部门资源协同响应时长从超3个工作日缩短至10分钟内。

其二,推动AI价值规模化落地,实现业务提质增效。通过AI Infra支撑全产业链AI应用规模化部署,推动5年内覆盖80%以上的核心生产与研发场景。

其三,推进运营运维标准化升级,降低管理成本与风险。依托AI Infra搭建集团统一的自动化运维和运营管理平台,实现算力资源全生命周期(申请、分配、监控、回收、计量计费、账单统计)自动化管理,自动化运维覆盖率提升至90%以上;建立标准化运维流程与故障分级响应机制,每年运维管理成本降低25%以上。

实施与部署过程

针对TCL的AI Infra核心需求,青云智算依托十余年企业级服务沉淀的全栈技术能力与产品体系,联合TCL成立专项实施团队,从资源投入、系统架构、核心技术、重要产品、创新思维、团队配合六大维度构建协同实施体系,确保项目高效落地并达成预期目标,推进智能基础设施的重构与升级。

1.精准化资源投入:构建供需匹配的算力与人力支撑体系

在资源投入层面,双方秉持“按需配置、弹性扩展”的原则,形成算力资源与人力资源的双重协同支撑。在算力资源投入上,青云智算协助TCL完成全集团算力资源的盘点与整合,针对不同业务线的算力需求差异,制定分层级的资源投入方案:对于核心研发场景(如大模型训练、算法迭代),优先投入高性能NVIDIA GPU,通过资源池化改造整合现有GPU服务器,同时预留弹性扩容接口,支持业务高峰期算力的快速调度;对于常规计算场景(如OCR图像识别、大模型推理),采用虚拟化切分技术实现资源的精细化分配,避免物理资源的浪费。为保障项目推进效率,对TCL存量服务器、存储设备进行兼容性测试与优化,确保青云产品体系与现有硬件资源的无缝对接。

在人力资源投入上,双方组建跨职能专项团队。其中青云智算核心成员均具备丰富的AI Infra项目落地经验;TCL则投入IT部门及运维团队的核心人员,负责需求对接、业务场景梳理及内部协调工作。为确保资源投入的精准性,双方建立资源动态调整机制,通过定期的项目进度复盘,根据业务需求变化与项目实施难点,实时优化算力资源分配与人力配置,保障资源投入与项目进度的高效匹配。

2.全栈式系统架构:搭建“兼容历史、面向未来”的AI Infra底座

基于青云AI Infra 3.0全栈架构理念,双方共同设计了“四层架构、统一调度”的系统架构方案,实现通算与智算的协同调度,兼顾TCL存量系统兼容与未来业务扩展需求。架构底层为PrimusOS信创操作系统层,确保对异构硬件环境的全面兼容,为上层架构提供稳定的运行基础。

架构核心层为KubeSphere统一调度底座,这是整个AI Infra系统的“中枢神经”。该层基于青云成熟的云原生架构,实现对全集团算力资源的统一纳管与调度,打破传统部门割裂的资源管理模式。通过这一层架构,可实现CPU、GPU等异构资源的池化管理,支持一张物理GPU卡的精细化切分与动态调整,既满足多业务线的差异化算力需求,又提升资源利用率。同时实现存量应用与AI应用的协同运行,避免了颠覆性改造带来的业务中断风险。

架构顶层为开放服务层,通过开放API及MCP协议,支持TCL根据业务需求对接第三方应用服务,实现AI算法开发、模型微调及应用发布的全流程支撑,为业务创新提供灵活的扩展能力。

3.核心技术突破:破解资源调度与运维协同关键难题

围绕TCL的核心需求,双方聚焦四大核心技术突破,确保AI Infra系统的高效运行。在异构算力调度技术上,采用青云智算自研的智能调度算法,实现对NVIDIA GPU、国产GPU等多元异构算力的全面纳管与智能分配。该算法具备需求优先级识别能力,可根据TCL业务重要性自动排序算力需求,确保核心业务的算力优先保障;同时支持算力资源的弹性伸缩,根据任务负载动态调整资源配置,实现算力需求与资源供给的实时匹配,大幅提升GPU资源利用率。

在容器化与虚拟化技术应用上,采用Kubernetes容器化技术与vGPU虚拟化技术相结合的方案。通过容器化技术实现AI训练环境的标准化封装,形成多套场景化环境模板,解决传统环境配置繁琐、耗时冗长的问题;借助vGPU技术实现物理GPU资源的精细化切分,支持多用户共享同一物理GPU,同时保障不同用户数据与任务的隔离安全,有效降低资源浪费。针对跨地域运维难题,双方采用分布式监控与智能告警技术,构建全地域统一的运维监控体系,实现节点、任务、容器组及GPU资源的全方位监控,支持自定义告警规则与多渠道通知,确保运维问题的快速发现与响应。

在数据协同技术上,通过统一的数据接入接口与标准化的数据处理流程,采用数据加密与权限管控技术,确保跨地域数据传输与存储的安全合规,满足数据安全法规要求。

这些举措在技术层面有效破解了TCL在AI Infra建设中面临的资源调度、环境适配、跨地域运维及数据协同四大关键难题。

4.产品化落地支撑:依托青云成熟产品体系实现需求精准匹配

项目实施过程中,重点依托青云智算核心产品——青云AI智算平台。

该平台具备千卡级资源管理能力,支持多框架模型的一键部署与快速迭代,可轻松应对大规模AI训练任务及微调与推理任务。平台内置多种标准化AI工具与环境模板,用户可根据业务需求快速搭建训练环境,将单场景环境部署耗时从4小时以上压缩至30分钟内,大幅提升研发效率。

平台支持多租户隔离机制,能为TCL各业务部门分配独立的资源空间,保障数据安全与业务隔离;支持资源使用的计量计价功能,便于各部门资源使用的成本核算与优化,助力实现算力资源的精细化运营。

平台的统一运营运维能力,能帮助TCL跨地域运实现基础设施的集中管控。同时平台具备自动化故障诊断与修复能力,自带1000+故障特征库。结合支持运维流程的标准化配置等功能,降低跨地域运维成本。

5.创新性思维引领:价值带动以破解转型难题

项目实施过程中,双方以创新思维为引领,确保项目高效推进并实现价值最大化。一是分阶段实施策略。项目整体分为三个阶段:第一阶段完成核心算力资源的池化整合与统一调度平台部署,解决跨部门算力争抢问题,实现全集团AI Infra的一体化管控。第二阶段部署多可用区。这种分阶段实施模式,既保障了现有业务的连续性,又逐步实现了AI Infra的全面升级。

二是建立AI Infra价值评估体系,通过资源利用率、运维效率、业务创新速度等多维度指标,量化项目实施价值,持续优化资源配置与系统架构,确保项目实施始终围绕价值落地展开。

6.深度化团队配合:构建“协同高效、权责清晰”的合作机制

为确保项目顺利推进,双方建立了多层次、全流程的团队配合机制。在决策层面,双方骨干组成的项目指导委员会,负责项目整体方向的把控、重大资源的协调及关键问题的决策。在执行层面,组建联合项目组,及时同步项目进度、解决实施难点。

在沟通机制上,建立多渠道协同沟通体系,包括即时通讯工具及定期的跨部门协调会。在风险管控上,双方共同制定风险识别与应对预案,建立风险预警机制,通过定期的风险评估会,提前识别项目实施过程中的技术风险、协调风险与业务中断风险,并制定针对性的应对措施。同时,建立知识共享机制,青云智算为TCL团队提供系统的产品使用与技术运维培训,TCL团队则向青云智算传递业务场景知识,实现技术与业务的深度融合,为项目长期稳定运行提供保障。

通过六大维度的协同实施,青云智算与TCL成功构建了“算力集约化、运营精细化、适配灵活化、运维标准化”的AI Infra基础设施底座。

合作服务效果

本项目通过AI Infra的重构升级,为TCL带来全维度价值跃升,核心体现在三方面:其一,AI Infra能力实现质的飞跃,从分散割裂升级为统一高效的智能底座,GPU资源利用率提升至65%以上,跨部门协同响应与环境部署效率大幅提升,跨地域运维稳定性与合规性达行业高标准,彻底破解算力调度、运维协同等核心痛点。其二,商业价值精准落地,通过资源精细化运营与运维优化,每年减少成本数百万元,投资回报周期1.5年以内;同时推动研发与运营效率提升,核心算法迭代周期缩短50%,为业务增效创造显著增量价值。其三,夯实长期战略基础,构建全产业链AI落地支撑体系,强化全球化协同竞争能力,推动TCL向“AI Native”转型,形成“技术-业务-价值”正向循环,为长期商业增长注入核心动力。

关于企业

·青云智算

北京青云智算科技有限公司(简称:青云智算)是北京青云科技集团股份有限公司(简称:青云科技)的子公司。顺应算力基建、人工智能等趋势与需求,结合青云云计算十余年的技术积累和运营经验,青云智算打造了统一调度、统一管理、统一运营多元异构算力的AI智算平台, 实现多元异构算力的统一调度与管理,提高 AI 算力的整体使用效率和管理效率,在多个行业成功部署了AI 解决方案,涵盖智算中心、金融、具身智能、高校科研、大模型/多模态、自动驾驶、医疗医药等领域。

点击文末“阅读原文”链接还可查看青云科技官网

·TCL

TCL科技集团股份有限公司(简称:TCL),创立于1981年,是拥有半导体显示、新能源光伏等多个业务板块的科技产业集团。现有7.5万员工、29个研发中心、18个制造基地,累计7.6万件专利申请。处于高科技制造行业,TCL以“领先科技,和合共生”为使命,在与人类生活密切相关的科技领域持续投入,建立技术与产品领先优势,赢得客户的信赖。


以上由青云智算投递申报的企业,最终将会角逐由金猿组委会×数据猿×上海大数据联盟联合推出的《2025中国大数据产业年度AI Infra领先企业》榜单/奖项

该榜单最终将于1月上旬上海举办的“2025第八届金猿大数据产业发展论坛——暨AI Infra & Data Agent趋势论坛”现场首次揭晓榜单,并举行颁奖仪式,欢迎报名莅临现场。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询