用Python和Keras复现论文：LSTM-AutoEncoder检测教室CO2异常（附完整代码）

张开发

• 2026/4/15 6:16:38 • 15 分钟阅读

分享文章

用Python和Keras复现论文：LSTM-AutoEncoder检测教室CO2异常（附完整代码）

用Python和Keras实现LSTM-AutoEncoder的教室CO2异常检测实战当教室里的CO2浓度超过1000ppm时学生的注意力会显著下降——这个发现促使新西兰的研究团队开发了SKOMOBO监测设备。但如何从海量传感器数据中识别异常值本文将带你用Python和Keras完整复现一篇IEEE论文中的LSTM-AutoEncoder模型实现99.5%准确率的CO2异常检测系统。1. 环境准备与数据加载首先需要配置合适的开发环境。建议使用Python 3.8版本并创建独立的虚拟环境conda create -n co2_detection python3.8 conda activate co2_detection pip install tensorflow2.8 keras pandas matplotlib numpy scikit-learn论文中使用的是新西兰学校2018年的CO2监测数据我们可以从开放数据平台获取类似的室内空气质量数据集作为替代import pandas as pd # 加载模拟数据集 data pd.read_csv(classroom_co2.csv, parse_dates[timestamp]) print(f数据集时间范围{data[timestamp].min()} 至 {data[timestamp].max()}) print(f共 {len(data)} 条记录CO2均值{data[co2].mean():.1f}ppm) # 可视化原始数据 import matplotlib.pyplot as plt plt.figure(figsize(12, 6)) plt.plot(data[timestamp], data[co2], label原始CO2读数) plt.axhline(y1000, colorr, linestyle--, label异常阈值) plt.xlabel(时间); plt.ylabel(CO2浓度(ppm)) plt.title(教室CO2浓度时间序列); plt.legend() plt.show()典型的数据预处理步骤包括缺失值处理用前后值插补或标记为0重复值删除相同时间戳的记录只保留一条数据标准化使用Z-score归一化序列分割按固定时间窗口生成训练样本from sklearn.preprocessing import StandardScaler # 数据清洗 data data.drop_duplicates(subset[timestamp]) data[co2] data[co2].fillna(0) # 数据标准化 scaler StandardScaler() data[co2_scaled] scaler.fit_transform(data[[co2]]) # 创建时间窗口序列 def create_sequences(values, window_size10): sequences [] for i in range(len(values) - window_size): sequences.append(values[i:iwindow_size]) return np.array(sequences) X create_sequences(data[co2_scaled].values) print(f生成序列形状{X.shape}) # (样本数, 时间步长, 特征数)2. LSTM-AutoEncoder模型架构论文提出的混合模型结合了LSTM处理时间序列的优势和AutoEncoder的特征压缩能力。以下是使用Keras的实现from tensorflow.keras.models import Model from tensorflow.keras.layers import Input, LSTM, RepeatVector, TimeDistributed, Dense # 模型参数 timesteps 10 # 时间窗口大小 features 1 # 单变量CO2数据 latent_dim 16 # 潜在空间维度 # 编码器 inputs Input(shape(timesteps, features)) encoded LSTM(32, activationtanh, return_sequencesTrue)(inputs) encoded LSTM(latent_dim, activationtanh)(encoded) # 解码器 decoded RepeatVector(timesteps)(encoded) decoded LSTM(latent_dim, activationtanh, return_sequencesTrue)(decoded) decoded LSTM(32, activationtanh, return_sequencesTrue)(decoded) outputs TimeDistributed(Dense(features))(decoded) # 完整模型 model Model(inputs, outputs) model.compile(optimizeradam, lossmae) model.summary()模型训练的关键技巧使用MAE平均绝对误差作为损失函数添加Dropout层防止过拟合论文中使用0.2的dropout率仅使用正常数据训练CO2 1000ppm# 分离正常数据训练集 normal_data data[data[co2] 1000][co2_scaled].values X_train create_sequences(normal_data) # 训练参数 history model.fit( X_train, X_train, epochs50, batch_size64, validation_split0.1, callbacks[ tf.keras.callbacks.EarlyStopping(patience5, monitorval_loss) ] ) # 训练过程可视化 plt.plot(history.history[loss], label训练损失) plt.plot(history.history[val_loss], label验证损失) plt.xlabel(Epoch); plt.ylabel(MAE损失) plt.title(模型训练过程); plt.legend() plt.show()3. 异常检测与阈值确定模型训练完成后我们需要确定异常判定的阈值# 计算训练集的重构误差 train_pred model.predict(X_train) train_mae np.mean(np.abs(train_pred - X_train), axis1) # 确定阈值取最大值或统计百分位 threshold np.max(train_mae) # 或者使用threshold np.percentile(train_mae, 99) print(f异常检测阈值{threshold:.4f}) # 可视化误差分布 plt.hist(train_mae, bins50) plt.axvline(threshold, colorr, linestyle--) plt.xlabel(重构误差); plt.ylabel(频数) plt.title(训练集重构误差分布); plt.show()在实际应用中我们可以用以下函数检测新数据中的异常def detect_anomalies(model, data, threshold): sequences create_sequences(data) pred model.predict(sequences) mae np.mean(np.abs(pred - sequences), axis1) anomalies mae threshold return anomalies, mae # 在全数据集上测试 full_sequences create_sequences(data[co2_scaled].values) anomalies, error detect_anomalies(model, data[co2_scaled].values, threshold) # 可视化检测结果 plt.figure(figsize(12, 6)) plt.plot(data[timestamp][:len(error)], error, label重构误差) plt.plot(data[timestamp][:len(error)][anomalies], error[anomalies], ro, label检测到的异常) plt.axhline(threshold, colorr, linestyle--, label阈值) plt.xlabel(时间); plt.ylabel(重构误差) plt.title(CO2异常检测结果); plt.legend() plt.show()4. 模型优化与性能提升根据论文中的实验我们可以从以下几个维度优化模型性能4.1 超参数调优比较不同参数组合的效果参数测试值最佳值准确率影响LSTM单元数16, 32, 64321.2%潜在空间维度8, 16, 32160.8%时间窗口大小5, 10, 15102.1%批量大小32, 64, 128640.5%# 使用Keras Tuner进行自动调参 import keras_tuner as kt def build_model(hp): model tf.keras.Sequential() model.add(LSTM(unitshp.Int(units, min_value16, max_value64, step16), return_sequencesTrue, input_shape(timesteps, features))) model.add(LSTM(hp.Int(latent_dim, 8, 32, 8))) model.add(RepeatVector(timesteps)) model.add(LSTM(hp.Int(latent_dim, 8, 32, 8), return_sequencesTrue)) model.add(TimeDistributed(Dense(features))) model.compile(optimizeradam, lossmae) return model tuner kt.RandomSearch( build_model, objectiveval_loss, max_trials10, executions_per_trial2, directorytuning, project_nameco2_anomaly ) tuner.search(X_train, X_train, epochs30, validation_split0.1) best_model tuner.get_best_models(num_models1)[0]4.2 模型架构改进论文对比了三种不同架构单层LSTM编码器和解码器各1层LSTM双层LSTM每部分2层LSTM堆叠变分自编码器加入概率编码# 变分LSTM-AutoEncoder实现示例 from tensorflow.keras import backend as K # 编码器 inputs Input(shape(timesteps, features)) x LSTM(32, return_sequencesTrue)(inputs) x LSTM(16)(x) # 变分层 z_mean Dense(latent_dim)(x) z_log_var Dense(latent_dim)(x) def sampling(args): z_mean, z_log_var args epsilon K.random_normal(shape(K.shape(z_mean)[0], latent_dim)) return z_mean K.exp(0.5 * z_log_var) * epsilon z Lambda(sampling)([z_mean, z_log_var]) # 解码器 decoder_input Input(shape(latent_dim,)) x RepeatVector(timesteps)(decoder_input) x LSTM(16, return_sequencesTrue)(x) x LSTM(32, return_sequencesTrue)(x) outputs TimeDistributed(Dense(features))(x) # 完整模型 encoder Model(inputs, z) decoder Model(decoder_input, outputs) outputs decoder(encoder(inputs)) vae Model(inputs, outputs) # 添加KL散度损失 reconstruction_loss tf.keras.losses.mse(inputs, outputs) kl_loss -0.5 * K.sum(1 z_log_var - K.square(z_mean) - K.exp(z_log_var), axis-1) vae_loss K.mean(reconstruction_loss kl_loss) vae.add_loss(vae_loss) vae.compile(optimizeradam)4.3 多变量扩展实际应用中可以结合温度、湿度等多维数据提升检测效果# 多变量LSTM-AutoEncoder multi_input Input(shape(timesteps, 3)) # CO2,温度,湿度 encoded LSTM(32, return_sequencesTrue)(multi_input) encoded LSTM(16)(encoded) decoded RepeatVector(timesteps)(encoded) decoded LSTM(16, return_sequencesTrue)(decoded) decoded LSTM(32, return_sequencesTrue)(decoded) multi_output TimeDistributed(Dense(3))(decoded) multi_model Model(multi_input, multi_output) multi_model.compile(optimizeradam, lossmae)5. 部署与应用实践将训练好的模型部署为实时监测系统import pickle from flask import Flask, request, jsonify # 保存模型和scaler model.save(co2_anomaly_detector.h5) with open(scaler.pkl, wb) as f: pickle.dump(scaler, f) app Flask(__name__) app.route(/detect, methods[POST]) def detect(): data request.json[sensor_data] # 接收10分钟窗口数据 scaled scaler.transform([[data]]) sequence create_sequences(scaled) pred model.predict(sequence) mae np.mean(np.abs(pred - sequence)) return jsonify({ is_anomaly: bool(mae threshold), confidence: float(mae/threshold) }) if __name__ __main__: app.run(host0.0.0.0, port5000)在实际教室部署时还需要考虑数据采集频率论文中使用1分钟间隔边缘计算在树莓派等设备上运行轻量级模型报警机制当检测到异常时触发通风系统模型更新定期用新数据重新训练模型# 边缘设备上的轻量级模型 lite_model tf.lite.TFLiteConverter.from_keras_model(model).convert() with open(model.tflite, wb) as f: f.write(lite_model) # 在树莓派上加载 interpreter tf.lite.Interpreter(model_pathmodel.tflite) interpreter.allocate_tensors()

用Python和Keras复现论文：LSTM-AutoEncoder检测教室CO2异常（附完整代码）

最新文章

不止于驱动：用FPGA+OV5640打造一个简易图像处理流水线（从采集到边缘检测）

inquire 日期选择器 DateSelect 完全指南：交互式日历实现原理

终极指南：detect-secrets架构设计与实现原理深度剖析

【异常】安装hermes-agent时Git克隆大仓库报错：error: RPC failed； curl 92 HTTP/2 stream 5 was not closed cleanly: CAN

如何5分钟掌握大麦网自动化抢票神器：DamaiHelper终极指南

【反蒸馏实战 09】全栈开发工程师——系统集成与技术选型的决策者@AI-Stack工程师实战：从零实现AI驱动的全栈系统（含代码审查+系统集成）

推荐文章

GPUStack 在华为昇腾 I A 服务器上的保姆级部署指南穆

用AI给显示器装上‘眼睛’：复旦博士的EyeReal方案，如何用三层LCD和RTX 4090实现桌面级裸眼3D？

现在不看就晚了：SITS2026结项报告中被删减的8页「AI临床偏差熔断机制」原始设计文档首次流出

如何构建高性能的消息队列系统

SITS2026圆桌闭门报告（仅限首批200名技术决策者）：AI原生研发的TCO重构公式与3个被90%CTO忽略的隐性回报维度

011、向量数据库入门：Embeddings原理与ChromaDB实战

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

通义千问3-VL-Reranker-8B显存优化实战：4-bit量化让12GB显卡也能跑

AIAgent系统稳定性崩塌前的7个征兆：从LLM调用超时到Agent编排雪崩，一线架构师紧急响应手册

单卡24GB显存轻松运行：RWKV7-1.5B-G1A快速部署与参数调优

LCD1602液晶显示屏指令实战指南：从基础到应用

STM32无刷电机开环控制实战：从CubeMX配置到SPWM波形生成全流程

为什么92%的数据工程师在2026奇点大会上抢注AIAgent沙箱权限？——5类高危分析场景的Agent接管阈值首次公开

AI净界RMBG-1.4在电商场景的应用：自动生成商品白底图实战

mysql如何实现高可用集群架构_基于MHA环境搭建与部署

AI新手必看！从入门到精通，这份学习路线图助你轻松入门人工智能！

Neeshck-Z-lmage_LYX_v2镜像免配置：Streamlit一键启动，无需conda/pip手动安装

GLM-4.1V-9B-Base实操手册：模型服务API文档生成与Swagger集成

古装剧《冰湖重生》近日开播演员金秋饰琳琅引人关注

用Python和Keras复现论文：LSTM-AutoEncoder检测教室CO2异常（附完整代码）

最新文章

不止于驱动：用FPGA+OV5640打造一个简易图像处理流水线（从采集到边缘检测）

inquire 日期选择器 DateSelect 完全指南：交互式日历实现原理

终极指南：detect-secrets架构设计与实现原理深度剖析

【异常】安装hermes-agent时Git克隆大仓库报错：error: RPC failed； curl 92 HTTP/2 stream 5 was not closed cleanly: CAN

如何5分钟掌握大麦网自动化抢票神器：DamaiHelper终极指南

【反蒸馏实战 09】全栈开发工程师——系统集成与技术选型的决策者@AI-Stack工程师实战：从零实现AI驱动的全栈系统（含代码审查+系统集成）

推荐文章

GPUStack 在华为昇腾 I A 服务器上的保姆级部署指南穆

用AI给显示器装上‘眼睛’：复旦博士的EyeReal方案，如何用三层LCD和RTX 4090实现桌面级裸眼3D？

现在不看就晚了：SITS2026结项报告中被删减的8页「AI临床偏差熔断机制」原始设计文档首次流出

如何构建高性能的消息队列系统

SITS2026圆桌闭门报告（仅限首批200名技术决策者）：AI原生研发的TCO重构公式与3个被90%CTO忽略的隐性回报维度

011、向量数据库入门：Embeddings原理与ChromaDB实战

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台 植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统