重庆市网站建设_网站建设公司_百度智能云_seo优化
2025/12/30 11:50:47 网站建设 项目流程

1 环境搭建及使用

学习目标

  • 独立完成开发环境搭建
  • 掌握 Anaconda的使用方法
  • 掌握DataSpell和Jupyter Notebook的使用方法

1 开发环境搭建

1.1简介

  • Anaconda 是最流行的数据分析平台,全球两千多万人在使用
  • Anaconda 附带了一大批常用数据科学包
    • conda
    • Python
    • 150 多个科学包及其依赖项
  • Anaconda 是在 conda(一个包管理器和环境管理器)上发展出来的
    • Conda可以帮助你在计算机上安装和管理数据分析相关包
    • Anaconda的仓库中包含了7000多个数据科学相关的开源库
  • Anaconda 包含了虚拟环境管理工具
    • 通过虚拟环境可以使不同的Python或者开元库的版本同时存在

1.2 Anaconda安装

  • Anaconda 可用于多个平台( Windows、Mac OS X 和 Linux)

  • 可以在官网上下载对应平台的安装包

  • 如果计算机上已经安装了 Python,安装不会对你有任何影响

  • 安装的过程很简单,一路下一步即可

  • 访问https://www.anaconda.com/products/individual,如下图所示点击下载

  • 根据你的操作系统来选择相应的版本下载

  • 从Windows中上传安装包到Linux虚拟机

  • 安装anaconda

2 Anaconda的使用

2.1 Anaconda的虚拟环境管理

  • 不同的python项目,可能使用了各自不同的python的包、模块;
  • 不同的python项目,可能使用了相同的python的包、模块,但版本不同;
  • 不同的python项目,甚至使用的Python的版本都是不同;

为了让避免项目所使用的Python及包模块版本冲突,所以需要代码运行的依赖环境彼此分开,业内有各种各样的成熟解决方案,但原理都是一样的:不同项目代码的运行,使用保存在不同路径下的python和各自的包模块;不同位置的python解释器和包模块就称之为虚拟环境,具体关系图如下:

虚拟环境的本质,就是在你电脑里安装了多个Python解释器(可执行程序),每个Python解释器又关联了很多个包、模块;项目代码在运行时,是使用特定路径下的那个Python解释器来执行

  • 虚拟环境的作用

    • 很多开源库版本升级后API有变化,老版本的代码不能在新版本中运行
    • 将不同Python版本/相同开源库的不同版本隔离
    • 不同版本的代码在不同的虚拟环境中运行
  • 通过命令行创建虚拟环境

    格式如下 conda create -n 虚拟环境名字python=python版本#创建虚拟环境,开始新项目时执行一次conda activate 虚拟环境名字#进入虚拟环境,每次打开终端都需要执行conda deactivate#退出虚拟环境,一般很少使用conda remove -n 虚拟环境名字 --all#删除虚拟环境,一般很少使用示例 conda create -ntestpython=3.8conda activatetestconda deactivate conda remove -ntest--all

2.3 Anaconda的包管理功能

  • 可以通过conda install 安装【不推荐】

    conda install 包名字
  • 可以通过pip install 安装

    pipinstall包名字
  • 安装其他包速度慢可以指定国内镜像

    # 阿里云:https://mirrors.aliyun.com/pypi/simple/# 豆瓣:https://pypi.douban.com/simple/# 清华大学:https://pypi.tuna.tsinghua.edu.cn/simple/# 中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/pipinstall包名 -i https://mirrors.aliyun.com/pypi/simple/#通过阿里云镜像安装
  • 本阶段需要安装的python包,可以通过以下命令安装

    conda activate test #首先激活虚拟环境,必须先激活虚拟环境再安装 pip install pandas matplotlib seaborn jupyter notebook #使用pip安装

3 启动 Jupyter服务

3.1 创建jupyter配置文件目录

  • 创建jupyter配置目录

    mkdir .jupyter cd .jupyter

3.2 将jupyter配置文件上传到虚拟机

3 在Linux终端启动 Jupyter服务

  • 启动jupyter

    # conda activate test # 根据课程选择相应虚拟环境,也可直接在base环境中运行 jupyter notebook

4 DataSpell

4.1 DataSpell介绍

DataSpell是由Jetbrains开发的专门面向数据科学的IDE。DataSpell 支持本地和远程 Jupyter Notebook。 可以直接在 IDE 中使用,与 Jupyter 或 JupyterLab 相比的主要优势在于,可以获得成熟 IDE 提供的智能编码辅助和许多其他功能。DataSpell 支持 Jupyter 的命令模式、大多数标准快捷键、Markdown 和 LaTeX 以及交互式输出。 对于 Python 和 R 脚本,DataSpell 可以运行整个脚本或其中的一部分,并以交互方式轻松浏览输出。

4.2 DataSpell安装

  • DataSpell安装比较简单,只用下一步安装就可以了

  • DataSpell安装完成之后需要配置环境,这里暂不配置

  • 配置运行环境

    • 添加一个Jupyter连接

    • 选择URL,输入 http://192.168.88.161:8888 即前面启动的jupyter notebook地址

    • 输入密码,这里密码是123456

    • 配置完成

4.3 DataSpell的使用

  • 创建Jupyter Notebook文件,Jupyter Notebook 文档的扩展名为.ipynb

  • 如图所示,红框内被称为单元格,是输入代码的地方

  • 常用快捷键

    • 两种模式通用快捷键

      • Shift+Enter,执行本单元代码,并跳转到下一单元格
      • Ctrl+Enter,执行本单元代码,留在本单元格
    • 命令模式,按ESC进入

      • Y,cell切换到Code模式
      • M,cell切换到Markdown模式
      • A,在当前cell的上面添加cell
      • B,在当前cell的下面添加cell
      • 双击D:删除当前cell
    • 编辑模式,按Enter进入

      • 多光标操作:Ctrl键点击鼠标
      • 回退:Ctrl+Z
      • 重做:Ctrl+Y
      • 补全代码:变量、方法后跟Tab键
      • 为一行或多行代码添加/取消注释:Ctrl+/

4.4 Notebook中使用Markdown

  • 在命令模式中,按M即可进入到Markdown编辑模式

  • 使用Markdown语法可以在代码间穿插格式化的文本作为说明文字或笔记

  • Markdown语法简介

    # 表示一级标题 ## 表示二级标题 - 减号后面加空格,表示无序列表 1. 表示有序列表 ​```输入代码 > 引用

总结

  • 独立完成开发环境搭建
    • 安装Anaconda作为开发环境的管理器
  • 掌握 Anaconda 的使用方法
    • Anaconda可以管理虚拟环境
    • Anaconda可以管理虚拟环境中的软件包
  • 掌握DataSpell的使用方法
    • 扩展名为.ipynb
    • 在cell中编辑代码和展示输出结果
    • 支持Markdown语法

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询