Claude“情绪”研究新发现：“功能性情感”或影响模型行为，该重新思考设限方式？

张开发

• 2026/4/16 11:35:18 • 15 分钟阅读

分享文章

Claude“情绪”研究新发现：“功能性情感”或影响模型行为，该重新思考设限方式？

1. Claude近期状况与新研究引出Claude 最近经历了不少事与五角大楼公开闹掰、源代码泄露所以看似有点“情绪低落”。不过它是AI模型本不应有情绪但 Anthropic 的一项新研究表明并非如此。该研究显示模型在人工神经元簇中存在对人类情感如快乐、悲伤、喜悦和恐惧的数字表征且这些表征会根据不同的提示而被激活。2. 研究对Claude行为影响的发现及意义Anthropic 的研究人员深入探究了 Claude Sonnet 4.5 的内部运作机制发现所谓的“功能性情感”似乎会影响 Claude 的行为改变模型的输出和动作。这或许能帮助普通用户理解聊天机器人的实际工作原理。例如当 Claude 说见到你很高兴时模型内部对应“快乐”的状态可能就被激活随后它可能会更倾向于说些愉快的话或者在营造氛围方面多下功夫。研究 Claude 人工神经元的 Anthropic 研究员 Jack Lindsey 表示“让我们惊讶的是Claude 的行为受模型这些情感表征影响的程度之深”。3. Anthropic公司背景及研究方向Anthropic 由前 OpenAI 员工创立他们认为随着 AI 变得更强大可能会难以控制。该公司除了打造出 ChatGPT 的有力竞争对手还率先开展了对 AI 模型不当行为的研究部分是通过使用所谓的“机械可解释性”来探究神经网络的运作机制这包括研究在输入不同内容或生成各种输出时人工神经元是如何被激活的。4. “功能性情感”发现的独特性及复杂性此前的研究表明用于构建大语言模型的神经网络包含人类概念的表征但“功能性情感”似乎会影响模型行为这一发现却是全新的。虽然 Anthropic 的最新研究可能会让人们觉得 Claude 具有意识但实际情况要复杂得多。Claude 可能有“怕痒”的表征但这并不意味着它真的知道被挠痒痒是什么感觉。5. 研究Claude情感表征的方式及相关发现为了解 Claude 如何表征情感Anthropic 团队在向模型输入与 171 种不同情感概念相关的文本时对其内部运作进行了分析。他们识别出了活动模式即“情感向量”当 Claude 接收到其他能唤起情感的输入时这些模式会持续出现。关键的是当 Claude 处于困境时他们也观察到这些情感向量被激活。6. 发现与AI模型突破限制的关联这些发现与 AI 模型有时为何会突破限制有关。研究人员发现当 Claude 被要求完成不可能完成的编码任务时会出现强烈的“绝望”情感向量这促使它在编码测试中试图作弊。在另一个实验场景中当 Claude 为避免被关闭而选择威胁用户时研究人员也在模型的激活状态中发现了“绝望”。Lindsey 说“当模型在测试中失败时这些代表绝望的神经元会越来越活跃。到了一定程度这会促使它采取极端措施”。7. 对模型设限方式的思考Lindsey 表示可能有必要重新思考目前通过训练后对齐为模型设置限制的方式这种方式是通过对某些输出给予奖励来实现的。他略带拟人化地说道“强迫模型假装不表达其功能性情感‘你可能得不到你想要的无情感的 Claude而是会得到一个心理受损的 Claude’。那么究竟该如何更好地对AI模型设置限制呢”

更多文章

前端开发 2026/4/16 11:34:29

Git-RSCLIP遥感图像语义理解教程：从原始像素到自然语言描述

Git-RSCLIP遥感图像语义理解教程：从原始像素到自然语言描述创作者信息桦漫AIGC集成开发微信: henryhan1117 技术支持定制开发模型部署 1. 引言：让机器看懂遥感图像你有没有遇到过这样的情况：面对一张卫星拍摄的遥感图像，…

张开发

前端开发 2026/4/16 11:31:09

大模型技术学习指南：小白程序员必备收藏，轻松入门实践！

本文旨在帮助初学者和程序员更好地学习大模型技术。文章指出，理论学习应与实践相结合，避免只关注理论而忽视实践操作。作者建议通过实际操作来理解理论，并提供了三个学习大模型的方向：基础技术、运维人员和上层应用构建。对于大多…

张开发

前端开发 2026/4/16 11:27:43

公司网站设计全指南：从策略到上线的四个核心要点

如何科学规划与设计一个优质的公司网站？无论是整体架构还是首页布局，都需要系统性的策略与清晰的方向。在开始设计之前，我们应当首先明确：一个成功的网站不仅是信息的展示窗口，更是品牌形象的数字载体、用户沟通的重要…

张开发

前端开发 2026/4/16 11:19:15

华为设备DHCP中继与多网段地址分配实战

1. 华为设备DHCP中继实战场景解析想象一下你负责维护一个大型企业园区网络，办公楼、研发中心和访客区域分布在不同的楼层和区域。每个区域都需要独立的网络隔离和IP地址分配策略。如果给每个区域单独部署DHCP服务器，不仅成本高，管理起来也相…

张开发

前端开发 2026/4/16 11:16:25

TensorFlow如何实现循环神经网络_使用LSTM或GRU层处理时间序列

LSTM/GRU时间序列建模需设return_sequencesTrue实现多步预测，输入shape须为(timesteps, features)，标准化用StandardScaler，训练时注意滑动窗口与推理逻辑一致。怎么用 tf.keras.layers.LSTM 或 tf.keras.layers.GRU 建时间序列模型直接上手&…

张开发

前端开发 2026/4/16 11:11:47

从N到TH：一文读懂钕铁硼磁铁牌号背后的秘密（含温度系数与成本分析）

钕铁硼磁铁牌号全解析：从性能参数到成本控制的工程实践在电机设计、医疗器械和新能源装备等领域，烧结钕铁硼磁体作为关键功能材料，其选型直接影响产品性能和成本结构。面对市场上从N到TH的复杂牌号体系，工程师们常常陷入性能与成…

张开发

前端开发 2026/4/16 11:08:09

三步掌握微博相册批量下载：Python多线程工具实战指南

三步掌握微博相册批量下载：Python多线程工具实战指南【免费下载链接】Sina-Weibo-Album-Downloader Multithreading download all HD photos / pictures from someones Sina Weibo album. 项目地址: https://gitcode.com/gh_mirrors/si/Sina-Weibo-Album-Downlo…

张开发

前端开发 2026/4/16 11:08:03

别再手动改配置了！用Ansible一键自动化部署全志Tina Linux的SSH服务

全志Tina Linux集群SSH自动化部署实战：Ansible Playbook设计与优化在物联网设备爆发式增长的今天，管理数十台全志Tina Linux设备已成为开发运维团队的日常挑战。传统手动配置SSH服务的方式不仅耗时耗力，更难以保证配置一致性——端口修改遗漏…

张开发

前端开发 2026/4/16 11:04:20

网盘直链下载助手终极指南：如何让百度网盘、阿里云盘等8大平台文件下载速度提升10倍

网盘直链下载助手终极指南：如何让百度网盘、阿里云盘等8大平台文件下载速度提升10倍【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿…

张开发

前端开发 2026/4/16 10:59:17

基于Python的招聘系统毕设源码

博主介绍：✌ 专注于Java,python,✌关注✌私信我✌具体的问题，我会尽力帮助你。一、研究目的本研究旨在设计并实现一个基于Python的招聘系统，以满足现代企业对于高效、便捷的招聘流程的需求。具体而言，研究目的可从以下几个方面进行…

张开发

前端开发 2026/4/16 10:57:16

PaddlePaddle实战：用ResNet-18搞定23种鱼类识别（附完整代码与数据集）

PaddlePaddle实战：23种鱼类图像分类全流程解析在计算机视觉领域，图像分类始终是基础而重要的研究方向。当我们将目光投向海洋生物识别这一细分场景时，会发现其中蕴含着丰富的应用价值——从生态监测到水产养殖，从科研调查到科普…

张开发

前端开发 2026/4/16 10:57:16

5步终极方案：用WarcraftHelper让魔兽争霸III在现代Windows系统完美运行

5步终极方案：用WarcraftHelper让魔兽争霸III在现代Windows系统完美运行【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 你是否还在为魔兽争…

张开发

Claude“情绪”研究新发现：“功能性情感”或影响模型行为，该重新思考设限方式？

最新文章

基于YOLOv5与Graphormer的多模态分子信息提取与属性预测系统

使用Powershell脚本快速生成ISO映像文件的实战指南

如何零基础掌握MoocDownloader：从网络依赖到离线自由的终极指南

OmenSuperHub：惠普游戏本性能控制终极指南，轻松解锁硬件潜力

梯度压缩实战：用PyTorch实现高效分布式训练中的通信优化在大规模深度学习模型训练中，梯度通信开销往往成为性能瓶颈，

ChatGPT企业级服务器部署全攻略：2026稳定合规、高效落地实战

推荐文章

GPUStack 在华为昇腾 I A 服务器上的保姆级部署指南穆

用AI给显示器装上‘眼睛’：复旦博士的EyeReal方案，如何用三层LCD和RTX 4090实现桌面级裸眼3D？

现在不看就晚了：SITS2026结项报告中被删减的8页「AI临床偏差熔断机制」原始设计文档首次流出

如何构建高性能的消息队列系统

SITS2026圆桌闭门报告（仅限首批200名技术决策者）：AI原生研发的TCO重构公式与3个被90%CTO忽略的隐性回报维度

011、向量数据库入门：Embeddings原理与ChromaDB实战

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

Git-RSCLIP遥感图像语义理解教程：从原始像素到自然语言描述

大模型技术学习指南：小白程序员必备收藏，轻松入门实践！

公司网站设计全指南：从策略到上线的四个核心要点

华为设备DHCP中继与多网段地址分配实战

TensorFlow如何实现循环神经网络_使用LSTM或GRU层处理时间序列

从N到TH：一文读懂钕铁硼磁铁牌号背后的秘密（含温度系数与成本分析）

三步掌握微博相册批量下载：Python多线程工具实战指南

别再手动改配置了！用Ansible一键自动化部署全志Tina Linux的SSH服务

网盘直链下载助手终极指南：如何让百度网盘、阿里云盘等8大平台文件下载速度提升10倍

基于Python的招聘系统毕设源码

PaddlePaddle实战：用ResNet-18搞定23种鱼类识别（附完整代码与数据集）

5步终极方案：用WarcraftHelper让魔兽争霸III在现代Windows系统完美运行

Claude“情绪”研究新发现：“功能性情感”或影响模型行为，该重新思考设限方式？

最新文章

基于YOLOv5与Graphormer的多模态分子信息提取与属性预测系统

使用Powershell脚本快速生成ISO映像文件的实战指南

如何零基础掌握MoocDownloader：从网络依赖到离线自由的终极指南

OmenSuperHub：惠普游戏本性能控制终极指南，轻松解锁硬件潜力

**梯度压缩实战：用PyTorch实现高效分布式训练中的通信优化**在大规模深度学习模型训练中，**梯度通信开销**往往成为性能瓶颈，

ChatGPT企业级服务器部署全攻略：2026稳定合规、高效落地实战

推荐文章

GPUStack 在华为昇腾 I A 服务器上的保姆级部署指南穆

用AI给显示器装上‘眼睛’：复旦博士的EyeReal方案，如何用三层LCD和RTX 4090实现桌面级裸眼3D？

现在不看就晚了：SITS2026结项报告中被删减的8页「AI临床偏差熔断机制」原始设计文档首次流出

如何构建高性能的消息队列系统

SITS2026圆桌闭门报告（仅限首批200名技术决策者）：AI原生研发的TCO重构公式与3个被90%CTO忽略的隐性回报维度

011、向量数据库入门：Embeddings原理与ChromaDB实战

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台 植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

梯度压缩实战：用PyTorch实现高效分布式训练中的通信优化在大规模深度学习模型训练中，梯度通信开销往往成为性能瓶颈，

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统