1 环境搭建及使用
学习目标
- 独立完成开发环境搭建
- 掌握 Anaconda的使用方法
- 掌握DataSpell和Jupyter Notebook的使用方法
1 开发环境搭建
1.1
简介
- Anaconda 是最流行的数据分析平台,全球两千多万人在使用
- Anaconda 附带了一大批常用数据科学包
- conda
- Python
- 150 多个科学包及其依赖项
- Anaconda 是在 conda(一个包管理器和环境管理器)上发展出来的
- Conda可以帮助你在计算机上安装和管理数据分析相关包
- Anaconda的仓库中包含了7000多个数据科学相关的开源库
- Anaconda 包含了虚拟环境管理工具
- 通过虚拟环境可以使不同的Python或者开元库的版本同时存在
1.2 Anaconda安装
Anaconda 可用于多个平台( Windows、Mac OS X 和 Linux)
可以在官网上下载对应平台的安装包
如果计算机上已经安装了 Python,安装不会对你有任何影响
安装的过程很简单,一路下一步即可
访问https://www.anaconda.com/products/individual,如下图所示点击下载
根据你的操作系统来选择相应的版本下载
从Windows中上传安装包到Linux虚拟机
安装anaconda
2 Anaconda的使用
2.1 Anaconda的虚拟环境管理
- 不同的python项目,可能使用了各自不同的python的包、模块;
- 不同的python项目,可能使用了相同的python的包、模块,但版本不同;
- 不同的python项目,甚至使用的Python的版本都是不同;
为了让避免项目所使用的Python及包模块版本冲突,所以需要代码运行的依赖环境彼此分开,业内有各种各样的成熟解决方案,但原理都是一样的:不同项目代码的运行,使用保存在不同路径下的python和各自的包模块;不同位置的python解释器和包模块就称之为虚拟环境,具体关系图如下:
虚拟环境的本质,就是在你电脑里安装了多个Python解释器(可执行程序),每个Python解释器又关联了很多个包、模块;项目代码在运行时,是使用特定路径下的那个Python解释器来执行
虚拟环境的作用
- 很多开源库版本升级后API有变化,老版本的代码不能在新版本中运行
- 将不同Python版本/相同开源库的不同版本隔离
- 不同版本的代码在不同的虚拟环境中运行
通过命令行创建虚拟环境
格式如下 conda create -n 虚拟环境名字python=python版本#创建虚拟环境,开始新项目时执行一次conda activate 虚拟环境名字#进入虚拟环境,每次打开终端都需要执行conda deactivate#退出虚拟环境,一般很少使用conda remove -n 虚拟环境名字 --all#删除虚拟环境,一般很少使用示例 conda create -ntestpython=3.8conda activatetestconda deactivate conda remove -ntest--all
2.3 Anaconda的包管理功能
可以通过conda install 安装【不推荐】
conda install 包名字可以通过pip install 安装
pipinstall包名字安装其他包速度慢可以指定国内镜像
# 阿里云:https://mirrors.aliyun.com/pypi/simple/# 豆瓣:https://pypi.douban.com/simple/# 清华大学:https://pypi.tuna.tsinghua.edu.cn/simple/# 中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/pipinstall包名 -i https://mirrors.aliyun.com/pypi/simple/#通过阿里云镜像安装本阶段需要安装的python包,可以通过以下命令安装
conda activate test #首先激活虚拟环境,必须先激活虚拟环境再安装 pip install pandas matplotlib seaborn jupyter notebook #使用pip安装
3 启动 Jupyter服务
3.1 创建jupyter配置文件目录
创建jupyter配置目录
mkdir .jupyter cd .jupyter
3.2 将jupyter配置文件上传到虚拟机
3 在Linux终端启动 Jupyter服务
启动jupyter
# conda activate test # 根据课程选择相应虚拟环境,也可直接在base环境中运行 jupyter notebook
4 DataSpell
4.1 DataSpell介绍
DataSpell是由Jetbrains开发的专门面向数据科学的IDE。DataSpell 支持本地和远程 Jupyter Notebook。 可以直接在 IDE 中使用,与 Jupyter 或 JupyterLab 相比的主要优势在于,可以获得成熟 IDE 提供的智能编码辅助和许多其他功能。DataSpell 支持 Jupyter 的命令模式、大多数标准快捷键、Markdown 和 LaTeX 以及交互式输出。 对于 Python 和 R 脚本,DataSpell 可以运行整个脚本或其中的一部分,并以交互方式轻松浏览输出。
4.2 DataSpell安装
- DataSpell安装比较简单,只用下一步安装就可以了
- DataSpell安装完成之后需要配置环境,这里暂不配置
配置运行环境
添加一个Jupyter连接
选择URL,输入 http://192.168.88.161:8888 即前面启动的jupyter notebook地址
输入密码,这里密码是123456
配置完成
4.3 DataSpell的使用
创建Jupyter Notebook文件,Jupyter Notebook 文档的扩展名为.ipynb
如图所示,红框内被称为单元格,是输入代码的地方
常用快捷键
两种模式通用快捷键
Shift+Enter,执行本单元代码,并跳转到下一单元格Ctrl+Enter,执行本单元代码,留在本单元格
命令模式,按ESC进入
Y,cell切换到Code模式M,cell切换到Markdown模式A,在当前cell的上面添加cellB,在当前cell的下面添加cell双击D:删除当前cell
编辑模式,按Enter进入
- 多光标操作:
Ctrl键点击鼠标 - 回退:
Ctrl+Z - 重做:
Ctrl+Y - 补全代码:变量、方法后跟
Tab键 - 为一行或多行代码添加/取消注释:
Ctrl+/
- 多光标操作:
4.4 Notebook中使用Markdown
在命令模式中,按M即可进入到Markdown编辑模式
使用Markdown语法可以在代码间穿插格式化的文本作为说明文字或笔记
Markdown语法简介
# 表示一级标题 ## 表示二级标题 - 减号后面加空格,表示无序列表 1. 表示有序列表 ```输入代码 > 引用
总结
- 独立完成开发环境搭建
- 安装Anaconda作为开发环境的管理器
- 掌握 Anaconda 的使用方法
- Anaconda可以管理虚拟环境
- Anaconda可以管理虚拟环境中的软件包
- 掌握DataSpell的使用方法
- 扩展名为.ipynb
- 在cell中编辑代码和展示输出结果
- 支持Markdown语法