一、常用 Python 库及代码案例
1. requests - 网络请求库
用途:发送 HTTP 请求,爬取网页数据、调用 API 接口等,比 Python 内置的 urllib 更简洁易用。
python
运行
import requests # 案例1:发送GET请求获取网页内容 def get_web_content(): # 目标URL url = "https://httpbin.org/get" # 发送GET请求 response = requests.get(url) # 检查请求是否成功(状态码200表示成功) if response.status_code == 200: print("响应状态码:", response.status_code) print("响应内容(JSON格式):") print(response.json()) # 解析JSON响应 else: print(f"请求失败,状态码:{response.status_code}") # 案例2:发送POST请求(带参数) def post_data(): url = "https://httpbin.org/post" # 要发送的表单数据 data = { "username": "test_user", "password": "123456" } # 发送POST请求 response = requests.post(url, data=data) if response.status_code == 200: print("POST请求响应:") print(response.json()) # 执行函数 if __name__ == "__main__": get_web_content() print("-" * 50) post_data()关键解释:
requests.get()/requests.post():分别发送 GET/POST 请求;response.status_code:获取响应状态码,判断请求是否成功;response.json():将 JSON 格式的响应内容解析为 Python 字典。
前置条件:需要先安装pip install requests。
2. pandas - 数据处理库
用途:处理结构化数据(如 Excel、CSV),数据清洗、筛选、分析等,是数据科学的核心库。
python
运行
import pandas as pd # 案例1:读取CSV文件(这里用模拟数据演示) def process_csv_data(): # 模拟CSV数据(实际可替换为 pd.read_csv("你的文件路径.csv")) data = { "姓名": ["张三", "李四", "王五"], "年龄": [25, 30, 28], "城市": ["北京", "上海", "广州"] } # 创建DataFrame(pandas的核心数据结构) df = pd.DataFrame(data) # 1. 查看数据基本信息 print("数据预览:") print(df.head()) # 查看前n行(默认5行) # 2. 数据筛选:筛选年龄大于28的行 df_filtered = df[df["年龄"] > 28] print("\n年龄大于28的数据:") print(df_filtered) # 3. 数据统计:计算年龄的平均值 avg_age = df["年龄"].mean() print(f"\n平均年龄:{avg_age}") # 4. 保存数据到新CSV df.to_csv("output.csv", index=False, encoding="utf-8") print("\n数据已保存到output.csv") if __name__ == "__main__": process_csv_data()关键解释:
pd.DataFrame():将字典 / 列表转换为表格型数据结构;- 布尔索引
df[df["年龄"] > 28]:快速筛选符合条件的数据; df.to_csv():将处理后的数据保存为 CSV 文件,index=False不保存行索引。
前置条件:安装pip install pandas(如需读写 Excel,还需安装pip install openpyxl)。
3. matplotlib - 数据可视化库
用途:绘制折线图、柱状图、散点图等,直观展示数据规律。
python
运行
import matplotlib.pyplot as plt import numpy as np # 设置中文显示(解决中文乱码问题) plt.rcParams["font.sans-serif"] = ["SimHei"] # 黑体 plt.rcParams["axes.unicode_minus"] = False # 解决负号显示问题 # 案例:绘制折线图+柱状图 def plot_data(): # 生成模拟数据 x = np.arange(1, 6) # x轴数据:1-5 y1 = [2, 5, 3, 6, 4] # 折线图数据 y2 = [1, 4, 2, 5, 3] # 柱状图数据 # 创建画布 plt.figure(figsize=(8, 5)) # 绘制折线图 plt.plot(x, y1, label="折线图", color="red", linewidth=2, marker="o") # 绘制柱状图 plt.bar(x, y2, label="柱状图", color="skyblue", alpha=0.7) # 添加图表元素 plt.title("Matplotlib示例图") # 标题 plt.xlabel("X轴") # X轴标签 plt.ylabel("Y轴") # Y轴标签 plt.legend() # 显示图例 plt.grid(True, alpha=0.3) # 显示网格 # 保存图片+显示图片 plt.savefig("plot.png", dpi=300) plt.show() if __name__ == "__main__": plot_data()关键解释:
plt.rcParams:配置图表样式(如中文显示);plt.plot()/plt.bar():分别绘制折线图 / 柱状图;plt.savefig():保存图片,dpi=300提高图片清晰度;plt.show():弹出窗口显示图表。
前置条件:安装pip install matplotlib numpy。
4. os + sys - 系统操作库(内置库,无需安装)
用途:os 处理文件 / 目录,sys 处理 Python 解释器相关操作,是自动化脚本的常用库。
python
运行
import os import sys # 案例:遍历指定目录、获取系统信息 def system_operation(): # 1. 获取当前工作目录 current_dir = os.getcwd() print(f"当前工作目录:{current_dir}") # 2. 遍历指定目录下的所有文件(这里遍历当前目录) print("\n当前目录下的文件/目录:") for file_name in os.listdir(current_dir): # 拼接完整路径 file_path = os.path.join(current_dir, file_name) # 判断是文件还是目录 if os.path.isfile(file_path): print(f"文件:{file_name}") elif os.path.isdir(file_path): print(f"目录:{file_name}") # 3. 获取Python版本信息 print(f"\nPython版本:{sys.version}") # 4. 获取命令行参数(演示) print(f"命令行参数:{sys.argv}") if __name__ == "__main__": system_operation()关键解释:
os.getcwd():获取当前工作目录;os.path.join():拼接路径(避免不同系统路径分隔符问题);sys.version:获取 Python 版本,sys.argv:获取运行脚本时的命令行参数。
二、进阶库(可选)
如果你的需求偏向特定领域,还可以关注这些库:
- NumPy:数值计算库,处理数组 / 矩阵,是 pandas/matplotlib 的底层依赖;
- BeautifulSoup4:解析 HTML/XML,配合 requests 做网页爬虫;
- TensorFlow/PyTorch:深度学习库,用于 AI 模型开发;
- PyQt5:GUI 开发库,制作桌面应用程序。
总结
- 基础必备:
requests(网络)、pandas(数据处理)、matplotlib(可视化)、内置的os/sys(系统操作)是 Python 入门最常用的库; - 使用原则:先明确需求场景,再选择对应库,优先使用官方文档和可运行的极简案例上手;
- 安装技巧:通过
pip install 库名安装,国内可加镜像源(如-i https://pypi.tuna.tsinghua.edu.cn/simple)提速。