# 8.8 【基础】pip 的超全使用指南
所有的 Python 开发者都清楚,Python 之所以如此受欢迎,能够在众多高级语言中,脱颖而出,除了语法简单,上手容易之外,更多还要归功于 Python 生态的完备,有数以万计的 Python 爱好者愿意以 Python 为基础封装出各种有利于开发的第三方工具包。
这才使用我们能够以最快的速度开发出一个满足基本需要的项目,而不是每次都重复造轮子。
Python 从1991年诞生到现在,已经过去28个年头了,这其间产生了数以万计的第三方包,且每个包都会不断更新,会有越来越多的版本。
当你在一个复杂的项目环境中,如果没有一个有效的依赖包管理方案,项目的维护将会是一个大问题。
pip 是官方推荐的包管理工具,在大多数开发者眼里,pip 几乎是 Python 的标配。
当然也有其他的包管理工具
- **distutils**:仅用于打包和安装,严格来讲不算是包管理工具
- **setuptools**:distutils的增强版,扩展了distutils,提供更多的功能,引入包依赖的管理,easy_install就是它的一个命令行工具,引入了 egg 的文件格式。
- **Pipenv**:一个集依赖包管理(pip)及虚拟环境管理(virtualenv)的工具
- 还有其他的,这里不一一列出。
今天的主角是 pip ,大家肯定不会陌生。但我相信不少人,只是熟悉几个常用的用法,而对于其他几个低频且实用的用法,却知之甚少,这两天,我查阅官方文档,把这些用法整理了一下,应该是网络上比较全的介绍。
## 1. 查询软件包
查询当前环境安装的所有软件包
```shell
$ pip list
```
查询 pypi 上含有某名字的包
```shell
$ pip search pkg
```
查询当前环境中可升级的包
```shell
$ pip list --outdated
```
查询一个包的详细内容
```shell
$ pip show pkg
```
## 2. 下载软件包
在不安装软件包的情况下下载软件包到本地
```shell
$ pip download --destination-directory /local/wheels -r requirements.txt
```
下载完,总归是要安装的,可以指定这个目录中安装软件包,而不从 pypi 上安装。
```shell
$ pip install --no-index --find-links=/local/wheels -r requirements.txt
```
当然你也从你下载的包中,自己构建生成 wheel 文件
```shell
$ pip install wheel
$ pip wheel --wheel-dir=/local/wheels -r requirements.txt
```
## 3. 安装软件包
使用 `pip install <pkg>` 可以很方便地从 pypi 上搜索下载并安装 python 包。
如下所示
```shell
$ pip install requests
```
这是安装包的基本格式,我们也可以为其添加更多参数来实现不同的效果。
### 3.1 只从本地安装,而不从 pypi 安装
```shell
# 前提你得保证你已经下载 pkg 包到 /local/wheels 目录下
$ pip install --no-index --find-links=/local/wheels pkg
```
### 3.2 限定版本进行软件包安装
以下三种,对单个 python 包的版本进行了约束
```shell
# 所安装的包的版本为 2.1.2
$ pip install pkg==2.1.2
# 所安装的包必须大于等于 2.1.2
$ pip install pkg>=2.1.2
# 所安装的包必须小于等于 2.1.2
$ pip install pkg<=2.1.2
```
以下命令用于管理/控制整个 python 环境的包版本
```shell
# 导出依赖包列表
pip freeze >requirements.txt
# 从依赖包列表中安装
pip install -r requirements.txt
# 确保当前环境软件包的版本(并不确保安装)
pip install -c constraints.txt
```
### 3.3 限制不使用二进制包安装
由于默认情况下,wheel 包的平台是运行 pip download 命令 的平台,所以可能出现平台不适配的情况。
比如在 MacOS 系统下得到的 pymongo-2.8-cp27-none-macosx_10_10_intel.whl 就不能在 linux_x86_64 安装。
使用下面这条命令下载的是 tar.gz 的包,可以直接使用 pip install 安装。
比 wheel 包,这种包在安装时会进行编译,所以花费的时间会长一些。
```shell
# 下载非二进制的包
$ pip download --no-binary=:all: pkg
# 安装非二进制的包
$ pip install pkg --no-binary
```
### 3.4 指定代理服务器安装
当你身处在一个内网环境中时,无法直接连接公网。这时候你使用`pip install` 安装包,就会失败。
面对这种情况,可以有两种方法:
1. 下载离线包拷贝到内网机器中安装
2. 使用代理服务器转发请求
第一种方法,虽说可行,但有相当多的弊端
- 步骤繁杂,耗时耗力
- 无法处理包的依赖问题
这里重点来介绍,第二种方法:
```shell
$ pip install --proxy [user:passwd@]http_server_ip:port pkg
```
每次安装包就发输入长长的参数,未免有些麻烦,为此你可以将其写入配置文件中:`$HOME/.config/pip/pip.conf`
对于这个路径,说明几点
- 不同的操作系统,路径各不相同
```shell
# Linux/Unix:
/etc/pip.conf
~/.pip/pip.conf
~/.config/pip/pip.conf
# Mac OSX:
~/Library/Application Support/pip/pip.conf
~/.pip/pip.conf
/Library/Application Support/pip/pip.conf
# Windows:
%APPDATA%\pip\pip.ini
%HOME%\pip\pip.ini
C:\Documents and Settings\All Users\Application Data\PyPA\pip\pip.conf (Windows XP)
C:\ProgramData\PyPA\pip\pip.conf (Windows 7及以后)
```
- 若在你的机子上没有此文件,则自行创建即可
如何配置,这边给个样例:
```ini
[global]
index-url = http://mirrors.aliyun.com/pypi/simple/
# 替换出自己的代理地址,格式为[user:passwd@]proxy.server:port
proxy=http://xxx.xxx.xxx.xxx:8080
[install]
# 信任阿里云的镜像源,否则会有警告
trusted-host=mirrors.aliyun.com
```
### 3.5 安装用户私有软件包
很多人可能还不清楚,python 的安装包是可以用户隔离的。
如果你拥有管理员权限,你可以将包安装在全局环境中。在全局环境中的这个包可被该机器上的所有拥有管理员权限的用户使用。
如果一台机器上的使用者不只一样,自私地将在全局环境中安装或者升级某个包,是不负责任且危险的做法。
面对这种情况,我们就想能否安装单独为我所用的包呢?
庆幸的是,还真有。
我能想到的有两种方法:
1. 使用虚拟环境
2. 将包安装在用户的环境中
虚拟环境,之前写过几篇文章,这里不再展开讲。
今天的重点是第二种方法,教你如何安装用户私有的包?
命令也很简单,只要加上 `--user` 参数,pip 就会将其安装在当前用户的 `~/.local/lib/python3.x/site-packages` 下,而其他用户的 python 则不会受影响。
```shell
pip install --user pkg
```
来举个例子
```shell
# 在全局环境中未安装 requests
[root@localhost ~]# pip list | grep requests
[root@localhost ~]# su - wangbm
[root@localhost ~]#
# 由于用户环境继承自全局环境,这里也未安装
[wangbm@localhost ~]# pip list | grep requests
[wangbm@localhost ~]# pip install --user requests
[wangbm@localhost ~]# pip list | grep requests
requests (2.22.0)
[wangbm@localhost ~]#
# 从 Location 属性可发现 requests 只安装在当前用户环境中
[wangbm@ws_compute01 ~]$ pip show requests
---
Metadata-Version: 2.1
Name: requests
Version: 2.22.0
Summary: Python HTTP for Humans.
Home-page: http://python-requests.org
Author: Kenneth Reitz
Author-email: me@kennethreitz.org
Installer: pip
License: Apache 2.0
Location: /home/wangbm/.local/lib/python2.7/site-packages
[wangbm@localhost ~]$ exit
logout
# 退出 wangbm 用户,在 root 用户环境中发现 requests 未安装
[root@localhost ~]$ pip list | grep requests
[root@localhost ~]$
```
当你身处个人用户环境中,python 导包时会先检索当前用户环境中是否已安装这个包,已安装则优先使用,未安装则使用全局环境中的包。
验证如下:
```python
>>> import sys
>>> from pprint import pprint
>>> pprint(sys.path)
['',
'/usr/lib64/python27.zip',
'/usr/lib64/python2.7',
'/usr/lib64/python2.7/plat-linux2',
'/usr/lib64/python2.7/lib-tk',
'/usr/lib64/python2.7/lib-old',
'/usr/lib64/python2.7/lib-dynload',
'/home/wangbm/.local/lib/python2.7/site-packages',
'/usr/lib64/python2.7/site-packages',
'/usr/lib64/python2.7/site-packages/gtk-2.0',
'/usr/lib/python2.7/site-packages',
'/usr/lib/python2.7/site-packages/pip-18.1-py2.7.egg',
'/usr/lib/python2.7/site-packages/lockfile-0.12.2-py2.7.egg']
>>>
```
### 3.6 延长超时时间
若网络情况不是很好,在安装某些包时经常会因为 ReadTimeout 而失败。
对于这种情况,一般重试几次就好了。
但是这样难免有些麻烦,有没有更好的解决方法呢?
有的,可以通过延长超时时间。
```shell
$ pip install --default-timeout=100 <packages>
```
## 4. 卸载软件包
就一条命令,不再赘述
```shell
$ pip uninstall pkg
```
## 5. 升级软件包
想要对现有的 python 进行升级,其本质上也是先从 pypi 上下载最新版本的包,再对其进行安装。所以升级也是使用 `pip install`,只不过要加一个参数 `--upgrade`。
```shell
$ pip install --upgrade pkg
```
在升级的时候,其实还有一个不怎么用到的选项 `--upgrade-strategy`,它是用来指定升级策略。
它的可选项只有两个:
- `eager` :升级全部依赖包
- `only-if-need`:只有当旧版本不能适配新的父依赖包时,才会升级。
在 pip 10.0 版本之后,这个选项的默认值是 `only-if-need`,因此如下两种写法是一互致的。
```shell
$ pip install --upgrade pkg1
$ pip install --upgrade pkg1 --upgrade-strategy only-if-need
```
## 6. 配置文件
由于在使用 pip 安装一些包时,默认会使用 pip 的官方源,所以经常会报网络超时失败。
常用的解决办法是,在安装包时,使用 `-i` 参数指定一个国内的镜像源。但是每次指定就很麻烦呀,还要打超长的一串字母。
这时候,其实可以将这个源写进 pip 的配置文件里。以后安装的时候,就默认从你配置的这个 源里安装了。
那怎么配置呢?文件文件在哪?
使用` win+r` 输入 `%APPDATA%` 进入用户资料文件夹,查看有没有一个 pip 的文件夹,若没有则创建之。
然后进入这个 文件夹,新建一个 `pip.ini` 的文件,内容如下
```ini
[global]
time-out=60
index-url=https://pypi.tuna.tsinghua.edu.cn/simple/
[install]
trusted-host=tsinghua.edu.cn
```
以上几乎包含了 pip 的所有常用使用场景,为了方便,我将其整理成一张表格。
![](http://image.iswbm.com/20191105200041.png)
- 第一章:安装运行
- 1.1 【环境】快速安装 Python 解释器
- 1.2 【环境】Python 开发环境的搭建
- 1.3 【基础】两种运行 Python 程序方法
- 第二章:数据类型
- 2.1 【基础】常量与变量
- 2.2 【基础】字符串类型
- 2.3 【基础】整数与浮点数
- 2.4 【基础】布尔值:真与假
- 2.5 【基础】学会输入与输出
- 2.6 【基础】字符串格式化
- 2.6 【基础】运算符(超全整理)
- 第三章:数据结构
- 3.1 【基础】列表
- 3.2 【基础】元组
- 3.3 【基础】字典
- 3.4 【基础】集合
- 3.5 【基础】迭代器
- 3.6 【基础】生成器
- 第四章:控制流程
- 4.1 【基础】条件语句:if
- 4.2 【基础】循环语句:for
- 4.3 【基础】循环语句:while
- 4.4 【进阶】五种推导式
- 第五章:学习函数
- 5.1 【基础】普通函数
- 5.2 【基础】匿名函数
- 5.3 【基础】高阶函数
- 5.4 【基础】反射函数
- 5.5 【基础】偏函数
- 5.6 【进阶】泛型函数
- 5.7 【基础】变量的作用域
- 5.8 【进阶】上下文管理器
- 5.9 【进阶】装饰器的六种写法
- 第六章:错误异常
- 6.1 【基础】什么是异常?
- 6.2 【基础】如何抛出和捕获异常?
- 6.3 【基础】如何自定义异常?
- 6.4 【进阶】如何关闭异常自动关联上下文?
- 6.5 【进阶】异常处理的三个好习惯
- 第七章:类与对象
- 7.1 【基础】类的理解与使用
- 7.2 【基础】静态方法与类方法
- 7.3 【基础】私有变量与私有方法
- 7.4 【基础】类的封装(Encapsulation)
- 7.5 【基础】类的继承(Inheritance)
- 7.6 【基础】类的多态(Polymorphism)
- 7.7 【基础】类的 property 属性
- 7.8 【进阶】类的 Mixin 设计模式
- 7.9 【进阶】类的魔术方法(超全整理)
- 7.10 【进阶】神奇的元类编程(metaclass)
- 7.11 【进阶】深藏不露的描述符(Descriptor)
- 第八章:包与模块
- 8.1 【基础】什么是包、模块和库?
- 8.2 【基础】安装第三方包的八种方法
- 8.3 【基础】导入单元的构成
- 8.4 【基础】导入包的标准写法
- 8.5 【进阶】常规包与空间命名包
- 8.6 【进阶】花式导包的八种方法
- 8.7 【进阶】包导入的三个冷门知识点
- 8.8 【基础】pip 的超全使用指南
- 8.9 【进阶】理解模块的缓存
- 8.10 【进阶】理解查找器与加载器
- 8.11 【进阶】实现远程导入模块
- 8.12 【基础】分发工具:distutils和setuptools
- 8.13 【基础】源码包与二进制包有什么区别?
- 8.14 【基础】eggs与wheels 有什么区别?
- 8.15 【进阶】超详细讲解 setup.py 的编写
- 8.16 【进阶】打包辅助神器 PBR 是什么?
- 8.17 【进阶】开源自己的包到 PYPI 上
- 第九章:调试技巧
- 9.1 【调试技巧】超详细图文教你调试代码
- 9.2 【调试技巧】PyCharm 中指定参数调试程序
- 9.3 【调试技巧】PyCharm跑完后立即进入调试模式
- 9.4 【调试技巧】脚本报错后立即进入调试模式
- 9.5 【调试技巧】使用 PDB 进行无界面调试
- 9.6 【调试技巧】如何调试已经运行的程序?
- 9.7 【调试技巧】使用 PySnopper 调试疑难杂症
- 9.8 【调试技巧】使用 PyCharm 进行远程调试
- 第十章:并发编程
- 10.1 【并发编程】从性能角度初探并发编程
- 10.2 【并发编程】创建多线程的几种方法
- 10.3 【并发编程】谈谈线程中的“锁机制”
- 10.4 【并发编程】线程消息通信机制
- 10.5 【并发编程】线程中的信息隔离
- 10.6 【并发编程】线程池创建的几种方法
- 10.7 【并发编程】从 yield 开始入门协程
- 10.8 【并发编程】深入理解yield from语法
- 10.9 【并发编程】初识异步IO框架:asyncio 上篇
- 10.10 【并发编程】深入异步IO框架:asyncio 中篇
- 10.11 【并发编程】实战异步IO框架:asyncio 下篇
- 10.12 【并发编程】生成器与协程,你分清了吗?
- 10.14 【并发编程】浅谈线程安全那些事儿
- 第十二章:虚拟环境
- 12.1 【虚拟环境】为什么要有虚拟环境?
- 12.2 【虚拟环境】方案一:使用 virtualenv
- 12.3 【虚拟环境】方案二:使用 pipenv
- 12.4 【虚拟环境】方案三:使用 pipx
- 12.5 【虚拟环境】方案四:使用 poetry
- 第十三章:绝佳工具
- 13.1 【静态检查】mypy 的使用
- 13.2 【代码测试】pytest 的使用
- 13.3 【代码提交】pre-commit hook
- 13.4 【项目生成】cookiecutter 的使用
- 第十四章:数据可视化
- 14.1 【可视化之matplotlib】一图带你入门matplotlib
- 14.2 【可视化之matplotlib】详解六种可视化图表
- 14.3 【可视化之matplotlib】 绘制正余弦函数图象
- 14.4 【可视化之matplotlib】难点:子图与子区
- 14.5 【可视化之matplotlib】绘制酷炫的gif动态图
- 14.6 【可视化之matplotlib】自动生成图像视频
- 14.7 【可视化神器】最高级的可视化神器: plotly_express