tl;dr
仍在更新中……
Anaconda和 Jupyter Notebook 使用后的推荐度很高,在此整理一下笔记。
简介
Anaconda
Anaconda 是数据科学常用包的 Python 发行版,简单理解为管理工具。
其主要基于 conda 衍生而来,而这个 conda 就是包/环境管理器。
它可以帮助你更简单地按照不同的项目需求创建编程环境;分隔不同 Python 版本、不同包版本;安装、卸载和更新包。
除了 conda ,其中还包含 150 多个包及 dependency。
Conda
包管理
包管理器用于在计算机上安装库和其他软件。平时使用 python 的时候,我们通常使用默认的 Python 默认包管理器 pip。conda 与之相似,但其中可管理的包为数据科学领域,也支持其他非 Python 包。
虚拟环境管理
conda 同时还有虚拟环境管理的作用,类似于 virtualenv 和 pyenv 。
Jupyter notebook
本质上是一种文档,其中可以组合保存说明文本、图像、代码(可执行)、公式和其他可视化内容。
自2011年开始流行,目前已经成为了数据分析的标准环境。
安装 Anaconda
anaconda 中使用的 Python 不影响以及安装在本地的 Python 。它使用的是 anaconda 附带的 Python。
使用 conda list
命令查看所有安装的包版本。
使用 conda upgrade --all
命令更新所有,避免报错。
使用 conda install package_name
安装新包
可以多个,例如 conda install numpy scipy pandas
也可指定版本号 conda install numpy= 1.09
安装时会自动安装 dependency
使用 conda remove package_name
卸载
使用 conda upgrade package_name
更新
不知道包的具体名字,则用 conda search search_term
搜索
环境管理
创建环境
conda create -n env_name list of packages
进入环境
source activate my_env
进入环境
保存和加载环境
conda env export > environment.yaml
保存环境为YAML
列出环境
conda env list
删除环境
conda env remove -n env_name
安装使用 Jupyter notebook
notebook 能将数据处理后需要展示的一切内容集中在一起。
题外话:文学化编程概念
早在1984年,Donald Knuth 就提出了 Notebook 所应用的文字表达编程的概念。我们不只是可以为程序编写额外的文档内容,而是可以讲文字叙述和程序代码融合在一起。更好地向人解释,我们如何解决问题的逻辑和方法。
让我们集中精力向人们解释我们希望计算机做什么,而不是指示计算机做什么。
文学化编程概念已经发展成为了一门完整的编程语言,即 Eve。
在 anaconda 环境中安装 notebook
conda install jupyter notebook
即可
启动 notebook
jupyter notebook
服务器主页会在浏览器页面中打开。默认情况下,notebook 服务器的运行地址是 http://localhost:8888。