救命神器!专科生必看8个AI论文网站深度测评
2026/1/5 22:20:17
本文通过保险客户续保预测案例,演示如何通过数据可视化探索数据,发现业务洞察。这是数据分析的关键步骤,为后续建模奠定基础。
# 保险续保数据importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltimportseabornassnsdefprepare_insurance_data():""" 准备保险续保数据 """np.random.seed(42)n=1000data={'customer_id':range(1,n+1),'age':np.random.randint(25,70,n),'gender':np.random.choice(['M','F'],n),'policy_type':np.random.choice(['A','B','C'],n,p=[0.4,0.4,0.2]),'premium':np.random.uniform(1000,10000,n),'claim_history':np.random.randint(0,5,n),'years_as_customer':np.random.uniform(0,10,n),'satisfaction_score':np.random.uniform(1,5,n),'renewal':np.random.choice([0,1],n,p=[0.3,0.7])}df=pd.DataFrame(data)returndf df=prepare_insurance_data()print("数据形状:",df.shape)print(df.head())# 基础统计可视化defbasic_statistics(df):""" 基础统计可视化 """fig,axes=plt.subplots(2,2,figsize=(