银川市网站建设_网站建设公司_Figma_seo优化
2026/1/21 21:17:49 网站建设 项目流程

1 引言

前段时间LangChain主办了一个技术分享活动,我观看了其中的一些演讲,有一个技术牛人阐述了为何“上下文工程”这一新兴概念,这是一个全新领域、文化和社区的诞生。

至于演讲的主要内容,我总结如下:

当“上下文工程”这一术语经卡帕斯(Karpathy)提出后,引发了不少反对声音。有人说“这不过是又一个营销术语”,一位黑客新闻(HN)的评论者甚至称其“最多算是个持续一个月的技能,过了就没人提了”。

但我不这么认为。在本次演讲中,我将论证“上下文工程”不仅会长期存在,其出现还将加速相关领域、文化和社区的发展。

这或许是我最喜欢的一句话。每次引用它时,我都会想起《辛普森一家》里的那个场景:“别逼我敲牌子”(Don’t make me tap the sign.)。

但这句话在人工智能领域也频繁出现。

我们使用的语言是理解世界的框架。语言不仅描述现实,更定义现实。至少,它为你与他人的对话设下了明确界限。你掌握的词汇和我们共同拥有的语言,决定了我们认知的边界。

这句话的意思是,要了解未来的发展趋势,可以关注两个领域:一是语言的创造,二是律师的聚集。语言的创造通常与创新和新思想的表达有关,而律师的聚集则可能与新规则的制定和法律框架的建立有关。

成功的流行术语并非凭空捏造,它们往往源于对我们共同经历的提炼。为这些经历命名,能将零散的想法和体验凝聚起来,成为集体共识——这正是流行术语的力量。当这些概念清晰浮现时,便会催生社区、改变文化、影响我们的工作。

“上下文工程”就是这种模式的典型例证。

“上下文工程”之所以能成为流行术语,是因为在场的每个人都能感受到:我们讨论的内容已逐渐偏离最初“提示工程”的范畴。

我们最初接触的上下文相关工作是对话式的,聚焦于优化一两轮的大语言模型交互。但随着我们构建更稳健的智能体和应用,并形成新的最佳实践,我们的关注点已与那些为聊天机器人开发使用策略的营销人员、高管或其他非技术用户渐行渐远。

我这么说并非贬低营销人员(科技圈常常低估营销的价值!)。“提示工程”与“上下文工程”只是不同的概念,并非谁天生更优越。

  1. 长上下文的重要性

    在2024年,模型构建者和相关生态系统开始重视长上下文在解决问题中的作用。长上下文指的是在处理信息时考虑更多的背景信息,这有助于提高模型的理解和响应能力。然而,这也意味着需要更多的计算资源和更复杂的处理方法,因此并不是没有代价的。

  2. 专业知识和工具的成熟

    随着时间的推移,提示工程领域的专业知识和工具已经发展成熟,形成了与其他提示编辑方法不同的特色。

  3. 工具开发

    在工具开发方面,函数调用和MCPs(模型上下文协议)的使用变得更加普遍,这表明开发者们正在寻找更高效的方式来利用模型的能力。

  4. 聊天机器人开发

    聊天机器人的开发变得更加程序化,这意味着开发者们正在采用更系统化的方法来构建和优化聊天机器人。这可能涉及到更严格的开发流程和更精细的提示设计。

  5. 智能体开发

    智能体的流行推动了结构化提示的发展。结构化提示是一种更精确、更易于管理和优化的提示方式,有助于提高智能体的性能和效率。

这种与最初“提示工程”的偏离源于几个原因。

首先,2024年多数大语言模型的研发者陷入了上下文窗口的“军备竞赛”,但使用这些模型的开发者们却发现:超大上下文窗口并不能解决我们的问题。长上下文并非免费午餐。因此,为了实现我们或上级承诺的应用功能,我们不断探索让系统正常运转的策略和技术。

在这个过程中,我们不断学习和成长:学会了如何使用和设计工具,将聊天机器人从直接的模型接口发展为功能完善的应用,并形成了智能体构建的设计模式。

贯穿这一切的主线是:我们所有人,在不同场景下同时摸索着如何系统性地设计上下文以实现目标

提示的优势和挑战

1)提示的优势

  • 易于描述

    提示允许用户以自然语言描述他们想要程序执行的功能和任务,这降低了编程的门槛,使得非专业人士也能参与。

  • 快速编写

    由于提示通常简短且直接,用户可以迅速地编写它们,这提高了开发效率。

  • 自文档化

    程序的功能和任务通过提示直接表达,这有助于理解和维护代码。

2)提示的挑战

  • 模型差异

    不同的模型可能对相同的提示有不同的理解和反应,这可能导致结果的不一致性。

  • 边缘情况

    随着提示的增加,可能会出现越来越多的边缘情况,这些情况可能需要特别的处理,增加了复杂性。

  • 组件复杂性

    提示可能包含多个组件,如指令、输入数据、预期输出等,这些都需要在一行字符串中表达,这可能导致理解和实现上的困难。

我在Databricks的数据与人工智能峰会上展示这张幻灯片时,看到满场观众都在点头认同。自然语言提示是当今最令人兴奋的创新之一,但没人会否认它在易用性、可维护性和稳健性上的不足。我们都深有体会——而“上下文工程”这一术语的出现,让这种痛点变得清晰可见。

Google统计的上下文工程的流行趋势图

“上下文工程”的发展速度惊人。一个月内,其搜索量就达到了“提示词工程”的四分之一,而且我预计还会继续增长。这种持续上升的趋势表明,人们对它早有潜在的认知。营销术语往往会昙花一现,而“上下文工程”正在整合那些已在进行的工作。

上下文失败的情况以及如何修复这些问题

  1. 上下文污染

    这是指错误或不相关的信息被错误地包含在模型的上下文中,这可能导致模型产生不准确的输出。

  2. 上下文冲突

    当上下文中包含相互矛盾的信息时,模型可能会感到困惑,不知道如何正确地处理这些信息。

  3. 上下文干扰

    这是指上下文信息过多,以至于影响了模型的训练过程,可能导致模型无法正确学习。

  4. 上下文混淆

    当上下文中包含过多的信息时,模型可能会被这些信息干扰,从而影响其生成的响应的质量。

为了解决这些问题,图中提出了几种方法:

  • RAG

    (Retrieval-Augmented Generation):通过添加相关的信息来增强模型的响应能力。

  • 工具加载

    选择性地加载与任务相关的工具或信息,以避免不必要的干扰。

  • 上下文隔离

    将不同的上下文信息隔离在不同的线程中,以防止它们相互干扰。

  • 上下文修剪

    去除那些不相关或不必要的信息,以简化模型的输入。

  • 上下文总结

    将大量的上下文信息压缩成一个摘要,以减少信息量并提高效率。

  • 上下文卸载

    将信息存储在模型的上下文之外,以减轻模型的负担。

这一点至关重要:我们其实早已在这个领域耕耘,只是它此前没有名字。

但有趣的是(这也是我认为上下文工程比其他多数流行术语更具实质意义的原因),人们立刻就用这些术语来描述自己的实践体验。

有了共识的语言,一切都会加速发展。我们不必在每次交流前都先费力界定“我们在讨论什么”。

那么,“上下文工程”这一术语的出现真的会改变什么吗?它真的重要吗?

我认为答案是肯定的。它让我们能够相互认同,拥有共同的讨论基础,并在此基础上继续前行。这必将加速变革。

我认为对上下文工程的关注将在未来几个月从以下几个方面带来改变。

普通人如何抓住AI大模型的风口?

领取方式在文末

为什么要学习大模型?

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过30%。

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

最后

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!

在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!

01教学内容

  • 从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!

  • 大量真实项目案例:带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

02适学人群

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

vx扫描下方二维码即可
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!

03入门到进阶学习路线图

大模型学习路线图,整体分为5个大的阶段:

04视频和书籍PDF合集

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)

05行业报告+白皮书合集

收集70+报告与白皮书,了解行业最新动态!

0690+份面试题/经验

AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)

07 deepseek部署包+技巧大全

由于篇幅有限

只展示部分资料

并且还在持续更新中…

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询