新能源与燃油汽车对比数据可视化分析
1. 项目概述
本项目旨在通过数据挖掘技术,深入分析中国汽车市场中新能源汽车(EV)与传统燃油汽车(Gasoline)的竞争格局、销售趋势及关键影响因素。系统集成了数据预处理、探索性数据分析(EDA)、机器学习销量预测模型以及交互式Web可视化系统,为用户提供直观的市场洞察和精准的销量预测工具。
2. 数据集与数据预处理
2.1 数据来源
项目使用China Automobile Sales Data数据集,涵盖了中国市场主流汽车品牌的月度销量数据。
2.2 数据特征
数据集包含以下关键特征:
- 基本信息:
Brand(品牌),Model(车型),Make(制造商) - 车辆属性:
Body Type(车身类型: SUV, Sedan等),Powertrain(动力类型: EV/Gasoline) - 市场数据:
Price Range(价格区间),Units Sold(月销量) - 时间维度:
Year(年),Month(月)
2.3 数据预处理
在进行建模前,我们对原始数据进行了清洗和转换:
- 缺失值处理:填充或移除缺失的关键属性。
- 特征工程:
- 计算
Avg_Price(平均售价) = (最低价 + 最高价) / 2。 - 提取时间特征(年、月)。
- 计算
- 数值编码:使用
LabelEncoder将类别型变量(如品牌、车型、车身类型)转换为数值型,以便机器学习模型处理。
3. 探索性数据分析 (EDA) 与可视化
在构建预测模型之前,我们对数据进行了深度的可视化分析,以理解市场特征。
3.1 市场份额与总体趋势
图解:该饼图展示了分析周期内新能源车与燃油车的总销量比例。虽然燃油车在存量上仍占主导,但新能