银川市网站建设_网站建设公司_CSS_seo优化-广西壮族自治区网站建设公司

一、Pandas 显示设置 (Option)

这些命令决定了你在屏幕上看到数据的样子，通常放在脚本的最开头。

命令	解读	代码示例
显示所有列	别让中间的列变成省略号`...`	`pd.set_option('display.max_columns', None)`
显示所有行	慎用！数据量大时会刷屏	`pd.set_option('display.max_rows', None)`
内容不截断	让长文本（如路径）完整显示	`pd.set_option('display.max_colwidth', None)`
自动换行控制	防止表格太宽被强行折叠	`pd.set_option('display.width', 1000)`
查看设置说明	忘记参数怎么写时查阅说明书	`pd.describe_option('display')`

二、核心工具：Pandas 常用操作命令

1. 数据概览（初步体检）

在处理单细胞数据（如muxu.obs）时，先看一眼表格的结构。

importpandasaspd df=muxu.obs# 假设 df 是你的样本信息表print(df.head(10))# 查看前 10 行print(df.columns)# 查看所有的列名print(df.info())# 查看每列的类型、是否有空值print(df.shape)# 查看表格的大小（行数, 列数）

2. 数据统计（摸清家底）

统计每个类别出现的频率。

# 统计每个细胞类型有多少个细胞print(df['celltype'].value_counts())# 统计每个样本(batch)的分布print(df['batch'].value_counts())# 查看数值列（如 nCount_RNA）的平均值、标准差、最大最小值print(df['nCount_RNA'].describe())

3. 数据筛选（精准定位）

从几万行数据中选出你想要的。

# 选出所有属于 CD 组的细胞cd_data=df[df['orig.ident']=='CD']# 选出 Cortex 且 RNA 计数大于 500 的细胞filtered_data=df[(df['celltype']=='Cortex')&(df['nCount_RNA']>500)]

4. 数据修改（手术修整）

给表格增加信息或改名。

# 修改列名：把 'orig.ident' 改为 'Group'df=df.rename(columns={'orig.ident':'Group'})# 新增一列：提取细胞 ID 的前缀df['sample_prefix']=df.index.str.split('_').str[0]

三、针对你的项目：快速检查`muxu`数据

你可以直接把这段代码粘贴到你的 Python 环境中运行：

importpandasaspdimportscanpyassc# 1. 极简显示配置pd.set_option('display.max_columns',None)pd.set_option('display.width',1000)# 2. 读取数据adata=sc.read_h5ad("muxu.h5ad")df=adata.obs# 3. 核心三连看print("--- 1. 前 5 行预览 ---")print(df.head())print("\n--- 2. 所有列名清单 ---")print(df.columns.tolist())print("\n--- 3. 实验设计验证 ---")if'batch'indf.columns:print(df['batch'].value_counts())else:print("警告：未发现 batch 列，可能需要手动从 index 提取！")

💡 小贴士

**点号.与中括号[]**：df['celltype']和df.celltype大部分时候是一样的，但如果列名里有空格或特殊符号，必须用['列名']。
不改变原数据：绝大多数 pandas 操作（如rename,dropna）默认不修改原表格，而是返回一个新表格。所以记得写成df = df.rename(...)。

银川市网站建设_网站建设公司_CSS_seo优化

一、Pandas 显示设置 (Option)

二、核心工具：Pandas 常用操作命令

1. 数据概览（初步体检）

2. 数据统计（摸清家底）

3. 数据筛选（精准定位）

4. 数据修改（手术修整）

三、针对你的项目：快速检查`muxu`数据

💡 小贴士

热门文章

文章分类

标签云

需要专业的网站建设服务？

银川市网站建设_网站建设公司_CSS_seo优化

一、Pandas 显示设置 (Option)

二、 核心工具：Pandas 常用操作命令

1. 数据概览（初步体检）

2. 数据统计（摸清家底）

3. 数据筛选（精准定位）

4. 数据修改（手术修整）

三、 针对你的项目：快速检查muxu数据

💡 小贴士

热门文章

文章分类

标签云

相关文章

Python 精确计算：告别浮点数陷阱，decimal 模块实战指南

【信号处理】HST水平同步压缩变换附Matlab复现含文献

【5G通信】多目标信号处理优化：5G 系统中平衡冲突指标的方法附Matlab代码

需要专业的网站建设服务？

二、核心工具：Pandas 常用操作命令

三、针对你的项目：快速检查`muxu`数据