0%

About Anaconda

tl;dr

仍在更新中……
Anaconda和 Jupyter Notebook 使用后的推荐度很高,在此整理一下笔记。

简介

Anaconda

Anaconda 是数据科学常用包的 Python 发行版,简单理解为管理工具。
其主要基于 conda 衍生而来,而这个 conda 就是包/环境管理器。
它可以帮助你更简单地按照不同的项目需求创建编程环境;分隔不同 Python 版本、不同包版本;安装、卸载和更新包。
除了 conda ,其中还包含 150 多个包及 dependency。

Conda

包管理

包管理器用于在计算机上安装库和其他软件。平时使用 python 的时候,我们通常使用默认的 Python 默认包管理器 pip。conda 与之相似,但其中可管理的包为数据科学领域,也支持其他非 Python 包。

虚拟环境管理

conda 同时还有虚拟环境管理的作用,类似于 virtualenv 和 pyenv 。

Jupyter notebook

本质上是一种文档,其中可以组合保存说明文本、图像、代码(可执行)、公式和其他可视化内容。
自2011年开始流行,目前已经成为了数据分析的标准环境。

安装 Anaconda

anaconda 中使用的 Python 不影响以及安装在本地的 Python 。它使用的是 anaconda 附带的 Python。
使用 conda list 命令查看所有安装的包版本。
使用 conda upgrade --all 命令更新所有,避免报错。
使用 conda install package_name 安装新包
可以多个,例如 conda install numpy scipy pandas
也可指定版本号 conda install numpy= 1.09

安装时会自动安装 dependency
使用 conda remove package_name 卸载
使用 conda upgrade package_name 更新
不知道包的具体名字,则用 conda search search_term 搜索

环境管理

创建环境

conda create -n env_name list of packages

进入环境

source activate my_env 进入环境

保存和加载环境

conda env export > environment.yaml 保存环境为YAML

列出环境

conda env list

删除环境

conda env remove -n env_name

安装使用 Jupyter notebook

notebook 能将数据处理后需要展示的一切内容集中在一起。

题外话:文学化编程概念

早在1984年,Donald Knuth 就提出了 Notebook 所应用的文字表达编程的概念。我们不只是可以为程序编写额外的文档内容,而是可以讲文字叙述和程序代码融合在一起。更好地向人解释,我们如何解决问题的逻辑和方法。

让我们集中精力向人们解释我们希望计算机做什么,而不是指示计算机做什么。

文学化编程概念已经发展成为了一门完整的编程语言,即 Eve。

在 anaconda 环境中安装 notebook

conda install jupyter notebook 即可

启动 notebook

jupyter notebook

服务器主页会在浏览器页面中打开。默认情况下,notebook 服务器的运行地址是 http://localhost:8888。