1.1 集成开发工具Anaconda

Anaconda是Python的一个集成管理工具或系统,它把Python进行相关数据计算与分析所需要的包都集成在了一起,用户只需要安装Anaconda,即可使用Python语言及其相关的分析包进行可视化分析。

1.1.1 什么是Anaconda

Anaconda是一个用于科学计算的Python发行版,支持Linux、macOS和Windows系统,提供了包管理与环境管理的功能,可以很方便地解决多版本Python并存、切换以及各种第三方包的安装问题。Anaconda利用工具/命令conda来进行包和环境的管理,并且其中已经包含Python语言本身和相关的配套工具。

Anaconda是一个打包的集合,里面包含NumPy、Pandas、Matplotlib等数据科学相关的开源包,在数据分析、数据可视化、大数据和人工智能等多方面都有涉及,包括Scikit-Learn、TensorFlow和PyTorch等。

Anaconda官方网站对其功能的概括如图1-1所示。

图1-1 主要的机器学习库

Anaconda的优点总结起来就8个字:省时省心,分析利器。

· 省时省心:Anaconda通过管理工具包、开发环境、Python版本大大简化了用户的工作流程,不仅可以方便地安装、更新、卸载工具包,而且能自动安装相应的依赖包,同时还能使用不同的虚拟环境隔离不同要求的项目。

· 分析利器:Anaconda官方网站中是这么宣传自己的,适用于企业级大数据分析的Python工具,其包含720多个数据科学相关的开源包,在数据可视化、机器学习、深度学习等多方面都有涉及,不仅可以进行数据分析,还可以用在大数据和人工智能领域。

1.1.2 安装Anaconda

Anaconda的安装过程比较简单,首先进入Anaconda的官方网站下载需要的版本,这里选择Windows版本的64-Bit Graphical Installer,如图1-2所示。如果官方网站下载速度较慢,还可以到清华大学开源软件镜像站下载。

图1-2 下载Anaconda

软件下载好后,以管理员身份运行Anaconda3-2023.03-1-Windows-x86_64.exe文件,单击Next按钮,安装过程比较简单,最后单击Finish按钮即可,主要安装过程如图1-3所示。

图1-3 安装Anaconda

安装结束后,正常情况下会在计算机的“开始”菜单中出现Anaconda3(64-bit)文件夹,单击其下方的Anaconda Prompt,然后输入python,如果出现Python的版本信息,就说明安装成功,如图1-4所示。

图1-4 查看Python版本

Anaconda是一个基于Python的数据处理和科学计算平台,内置了许多非常有用的第三方库,安装Anaconda后,就相当于把Python和NumPy、Pandas、Scipy、Matplotlib等常用的库自动安装好了。但是,如果选择非集成环境Python的话,那么还需要使用pip install命令逐个安装各种库,尤其是对于初学者来说,这个过程是非常痛苦的。

Python第三方包众多,但是调用包的时候,有时会遇到问题,比如安装包失败,安装速度很慢,很影响自己的工作进度,可能还会报错,这是由于我们在CMD窗口使用pip安装的时候,默认下载的是国外资源,会由于网速不稳定甚至没有网速而出现问题,解决办法如下:

(1)首先搜索需要安装的包名称,然后去国外的网站进行下载。在本地安装包时,用户可以在窗口中看到系统会自动安装相关包,但是可能也会出现下载失败的情况,出现这种情况时,只需继续去国外网站下载缺失的包,然后在本地安装即可。

(2)第二种方法是一劳永逸的方法,选择国内镜像源,相当于从国内的一些机构下载所需的Python第三方包。那么如何选择国内镜像源,如何配置呢?首先在计算机中显示隐藏的文件,并找到C:\Users\shang\AppData\Roaming,其中shang是个人的计算机的名称,然后在该路径下新建一个文件夹,命名为pip,在pip文件夹中新建一个TXT格式的文本文档,将下面这些代码复制到该文本文档中,关闭并保存。最后将文本文档重新命名为pip.ini,这样就创建了一个配置文件。

     [global]
     timeout = 60000
     index-url = https://pypi.tuna.tsinghua.edu.cn/simple
     [install]
     use-mirrors = true
     mirrors = https://pypi.tuna.tsinghua.edu.cn

文档中的链接地址还可以更换成如下地址:

· 阿里云:http://mirrors.aliyun.com/pypi/simple/。

· 中国科技大学:https://pypi.mirrors.ustc.edu.cn/simple/。

· 豆瓣(douban):http://pypi.douban.com/simple/。

· 清华大学:https://pypi.tuna.tsinghua.edu.cn/simple/。

· 中国科学技术大学:http://pypi.mirrors.ustc.edu.cn/simple/。

通过以上操作,后续我们使用pip安装第三方包的时候,就默认选择国内源进行安装,这样安装速度较快。