宜春市网站建设_网站建设公司_MySQL_seo优化
2025/12/17 12:47:04 网站建设 项目流程

导读

立足当下,面向未来,重塑高校创新发展能力。2025年11月14日,由上海和今信息科技有限公司与北京正阳恒卓科技有限公司联合主办的人工智能赋能产教融合创新生态交流研讨会在京成功举办。会议邀请中国人民大学范举教授作专题分享,围绕数据科学课程建设经验展开交流,为高校推进数据思维与学科建设深度融合、加快培养复合型人才提供了有益参考。

分享嘉宾

范举

中国人民大学教授、博士生导师,国家级青年人才,中国计算机学会数据库专委会、大数据专委会执行委员

研究方向包括:数据治理技术与系统、智能数据库系统等。相关研究成果在计算机领域国际顶级期刊/会议发表论文60余篇。作为负责人先后主持国家自然科学基金优秀青年基金项目、重点项目、面上项目,以及多项产学研合作项目。先后获得ICDE 2025 Best Paper Runner-Up、ACM SIGMOD Research Highlight Award、ACM China Rising Award、宝钢优秀教师等奖励。


以下为分享内容实录

今日,我十分荣幸能有机会与各位老师进行分享,本次分享将主要围绕两个层面展开。

首先,我想介绍一门人大从2021年开始建设、至今已有五年历程的通识课程——《数据思维》。这是一门面向非计算机专业学生的数据类课程。在课程建设过程中,我与和鲸科技几乎同期开展了深入的合作。以此课程为出发点,我们后续又共同参与了中国大学生计算机设计大赛大数据主题赛的组织工作。因此,我今天分享的主题可以概括为数据科学的课、训、赛一体化实践。

接下来,我将重点阐述我们在这一过程中的若干思考:既包括已开展的工作,更着重探讨那些尚未完成的课题,并期待借此机会与各位交流探讨。

《数据思维》这门课程源头可追溯至2017年教育部设置的数据科学与大数据技术专业。该专业首批开设的仅有三所高校,中国人民大学是第二批,也属于较早设立该专业的院校。到2020年,我们开始酝酿一个新的想法:数据科学或许并不仅仅是计算机专业的专属领域。现在看来这可能是常识,但在当时,是我们基于人大作为综合性大学的特点,认为有必要面向更广泛的学生群体进行课程探索。

在今天这个场合,我们可以将其视为在整个教育链条中,特别是在数据科学与人工智能界限日益模糊的背景下,进行的一次定位思考。我将其归纳为几个核心矛盾:

其一,课程定位的矛盾。

数据科学或人工智能领域目前备受关注,但各方理解常存在差异,犹如“盲人摸象”。在教育范畴内,虽可包容多元理解,但我们仍需提炼其核心素养予以传授,这是首要矛盾。

第二,教学目标的矛盾。

传统教育以理论为中心的经典授课模式为主,而我们现在希望转向以数据为中心的新型范式,这中间存在差距。

其三,教学内容的矛盾。

面向文科生授课时,常面临两种选择:一是采用案例驱动教学,但这易“见树木不见森林”,陷入细节而缺乏整体视野;二是沿用计算机专业的体系化讲授方式,但这又过于繁杂。如何取得平衡是一大挑战。

其四,动手实践的矛盾。

我们要求文科生同样进行编程实践,这也基于人大的生源素质优异,许多文科生在高中阶段已接触过编程。真正的难点并非编写代码本身,而在于界定智能辅助的边界:是否意味着学生仅需掌握大模型的使用与提示词编写?这是否可能引发教育空心化的风险?

第五,教学方法的矛盾。

即如何破解以教为中心的知识灌输与以学为中心的探究学习之间的矛盾。

最后,也是与今天主题最相关的,是评价体系的矛盾。

如何权衡考试为主的结果评价与赛教融合的能力培养?

首先,关于课程定位,我们的观点是未来将呈现数智融合的趋势。随着数据规模增长和模型智能水平提升,这一趋势已愈发明显。相关文献调研显示,自2019年预训练语言模型出现,已能协助完成部分数据准备工作;到2022年左右,提示工程方法能驱使大模型完成更多任务;至2024年,智能体的发展让我们处于新范式的前夜,有望通过数智融合方法,追求更高准确性与通用性,为教育和行业提供更好解决方案。

因此,我们与和鲸团队确立了长期合作方向,旨在超越数据科学与人工智能的传统分野,实现从数据准备、分析、建模到部署和性能优化的数据科学的全流程闭环。我们期望赋能学生,特别是人大的文科生,让他们能够探索数据、提出问题。

与传统软件开发 “需求-设计-测试” 的线性流程不同,数据科学强调探索式分析:可能需反复尝试上千次,才能在特定领域发现有价值结论。最终的洞察必须与其专业背景深度融合,并服务于复杂预测与决策场景。而这一切,必须是“端到端”的——不能只优化某个环节,却无法解决真实问题。我们希望通过生态合作,构建以问题为中心、以数据为中心的问题求解体系。

第二个重点,是关于数据科学的特点。我们认同图灵奖得主 Jim Gray 提出的“科学研究的第四范式”,即利用信息技术获取、处理、存储、统计、分析数据以获取知识。数据之所以在当前备受重视,核心在于它开启了一条新的知识发现路径:从海量数据中探索模式以推动理论更新,这与传统的 “理论-观测-验证” 路径相辅相成。

过去,这需要大量人力投入。如今,我们研究智能体的一个重要动机,就是看中了大模型能够不知疲倦地探索数据,这仿佛扩展了时间的维度。人与人的协作固然能碰撞出火花,但若有足够算力支持,智能体间的交互效率可能更高。同时,我们也必须警惕 “大数据傲慢”。成功的案例如利用数据科学验证引力波,但也有失败的例子,例如谷歌流感趋势预测曾出现严重偏差。因此,我们需要并行推进两方面的工作:一方面大力发展大模型技术与算力;另一方面积极与各领域专家合作,识别并纠正数据中可能存在的因果倒置、幸存者偏差等问题。

我们的实践基于一个信念:数据思维是一种通识能力,其核心是赋能与批判并重。因此,我们围绕知识、能力、素质目标构建了这门课程。在课程设计中,我们特别强调跨学科案例驱动和打开网页学编程。人大携手和鲸共同开发建设了Datahub平台,校内师生访问 datahub.ruc.edu.cn 即可使用,我负责的两门数据科学课程及校内其他院系的多个编程类课程也均运行于此。此外,要真正赋能教育,尤其是例如考试等任务关键型(Mission-Critical)的场景,仅靠现有方案是不够的。我们也期待业界能提供更稳定、更完整的解决方案,确保在高要求场景下的公平性与稳定性。

课程的另一重要考核方式是要求学生完成一份大数据主题报告,而非传统考试。我们希望通过跨学科案例,让学生从作品创意、深度、技术实现和展示等多维度综合展现能力。学生需从创意、深度、技术实现与展示四个维度,完成一项跨学科作品。这一模式后来延伸至中国大学生计算机设计大赛大数据主题赛。自2021年起,赛事至今已举办五届,选题也紧扣时代命题:从中国经济、气候危机,到乡村振兴、科技创新与社会变革;参赛人数从最初的291名学生、145支队伍,增长至2025 年的近3500名学生、1600多支队伍,参赛学生收获颇丰。

为进一步让人工智能系统自主完成复杂的数据科学任务,约三周前,我们发布了一款数据分析智能体 DeepAnalyze。它能够理解用户意图,自动编写代码、执行数据分析流程、生成可视化图表并撰写分析报告。目前基于一个8B参数模型,其主要意义在于保障数据分析的基础水准,确保产出具备一定的基准质量。当前模型水平大致相当于学过《数据科学导论》的大二、大三本科生,深度上还远不及领域专家。

未来,我们计划沿两个方向推进:一是提升算力与模型规模,探索从8B到32B乃至更大模型,类似为学生提供小班教学和顶级资源支持的效果;二是加强与各领域专家的合作,通过领域微调,提升智能体在特定领域的分析深度,目标是逐步达到硕士生水平,甚至辅助初级分析师工作。

最后,我想总结三个关键词,这也是我们对未来教育与生态共建的期待:

我们非常期待与在座各位携手,共同推动这一愿景落地。


聚算力,赋科研,助教学。

中国人民大学携手和鲸科技共建的数据生态智能平台Datahub,深度融合教学实训与科研创新场景,面向全校师生开放使用,提供一站式的全流程支撑能力。

【点击这里】了解更多建设详情

打通Al通识到学科+Al的创新人才培养路径,Datahub 不仅是实现人大 “学科+AI” 知识融会贯通的平台,更是和鲸人工智能通识教育解决方案的一次重要落地实践。

和鲸愿将已积累、沉淀的经验与方法论,作为可供复制的模式化体系赋能各级院校!

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询