构建一个简单的 Keras + 深度学习 REST API

这是一篇由 Adrian Rosebrock 撰写的客座文章。Adrian 是 PyImageSearch.com 的作者，这是一个关于计算机视觉和深度学习的博客。Adrian 最近完成了 Deep Learning for Computer Vision with Python 的创作，这是一本关于使用 Keras 进行计算机视觉和图像识别的深度学习新书。

在本教程中，我们将介绍一种简单的方法来获取 Keras 模型并将其部署为 REST API。

这篇文章中涵盖的示例将作为构建您自己的深度学习 API 的模板/起点 - 您将能够根据 API 端点的可扩展性和健壮性需求来扩展和自定义代码。

具体来说，我们将学习

如何（以及如何不）将 Keras 模型加载到内存中，以便可以有效地将其用于推理
如何使用 Flask Web 框架为我们的 API 创建端点
如何使用我们的模型进行预测，将它们转换为 JSON 格式，并将结果返回给客户端
如何使用 cURL 和 Python 调用我们的 Keras REST API

在本教程结束时，您将很好地理解创建 Keras REST API 所需的组件（以其最简单的形式）。

您可以随意使用本指南中提供的代码作为您自己的深度学习 REST API 的起点。

注意：此处介绍的方法旨在说明问题。它并非旨在达到生产级别并且能够在高负载下扩展。如果您对利用消息队列和批处理的更高级的 Keras REST API 感兴趣，请参阅本教程。

配置您的开发环境

我们假设您的机器上已经配置并安装了 Keras。如果没有，请确保使用官方安装说明安装 Keras。

在此基础上，我们需要安装 Flask（及其相关依赖项），这是一个 Python Web 框架，以便我们可以构建 API 端点。我们还需要 requests，以便我们也可以使用我们的 API。

下面列出了相关的 pip 安装命令

$ pip install flask gevent requests pillow

构建您的 Keras REST API

我们的 Keras REST API 自包含在一个名为 run_keras_server.py 的文件中。为了简单起见，我们将安装保存在一个文件中 - 实现也可以轻松模块化。

在 run_keras_server.py 中，您会发现三个函数，分别是

load_model：用于加载我们训练好的 Keras 模型并为推理做好准备。
prepare_image：此函数在将输入图像传递到我们的网络进行预测之前对其进行预处理。如果您不使用图像数据，则可以考虑将其名称更改为更通用的 prepare_datapoint 并应用您可能需要的任何缩放/标准化。
predict：我们 API 的实际端点，它将对来自请求的传入数据进行分类并将结果返回给客户端。

本教程的完整代码可以在此处找到。

# import the necessary packages
from keras.applications import ResNet50
from keras.preprocessing.image import img_to_array
from keras.applications import imagenet_utils
from PIL import Image
import numpy as np
import flask
import io

# initialize our Flask application and the Keras model
app = flask.Flask(__name__)
model = None

我们的第一个代码片段处理导入所需包以及初始化 Flask 应用程序和 model。

从那里我们定义了 load_model 函数

def load_model():
    # load the pre-trained Keras model (here we are using a model
    # pre-trained on ImageNet and provided by Keras, but you can
    # substitute in your own networks just as easily)
    global model
    model = ResNet50(weights="imagenet")

顾名思义，此方法负责实例化我们的体系结构并从磁盘加载权重。

为了简单起见，我们将使用已经在 ImageNet 数据集上预训练过的 ResNet50 体系结构。

如果您使用自己的自定义模型，则需要修改此函数以从磁盘加载您的体系结构 + 权重。

在我们对来自客户端的任何数据执行预测之前，我们首先需要准备和预处理数据

def prepare_image(image, target):
    # if the image mode is not RGB, convert it
    if image.mode != "RGB":
        image = image.convert("RGB")

    # resize the input image and preprocess it
    image = image.resize(target)
    image = img_to_array(image)
    image = np.expand_dims(image, axis=0)
    image = imagenet_utils.preprocess_input(image)

    # return the processed image
    return image

此功能

接受输入图像
将模式转换为 RGB（如有必要）
将其调整为 224x224 像素（ResNet 的输入空间维度）
通过均值减法和缩放对数组进行预处理

同样，您应该根据在将输入数据传递给模型之前需要进行的任何预处理、缩放和/或标准化来修改此函数。

我们现在准备定义 predict 函数 - 此方法处理对 /predict 端点的任何请求

@app.route("/predict", methods=["POST"])
def predict():
    # initialize the data dictionary that will be returned from the
    # view
    data = {"success": False}

    # ensure an image was properly uploaded to our endpoint
    if flask.request.method == "POST":
        if flask.request.files.get("image"):
            # read the image in PIL format
            image = flask.request.files["image"].read()
            image = Image.open(io.BytesIO(image))

            # preprocess the image and prepare it for classification
            image = prepare_image(image, target=(224, 224))

            # classify the input image and then initialize the list
            # of predictions to return to the client
            preds = model.predict(image)
            results = imagenet_utils.decode_predictions(preds)
            data["predictions"] = []

            # loop over the results and add them to the list of
            # returned predictions
            for (imagenetID, label, prob) in results[0]:
                r = {"label": label, "probability": float(prob)}
                data["predictions"].append(r)

            # indicate that the request was a success
            data["success"] = True

    # return the data dictionary as a JSON response
    return flask.jsonify(data)

data 字典用于存储我们想要返回给客户端的任何数据。现在，这包括一个布尔值，用于指示预测是否成功 - 我们还将使用此字典来存储我们对传入数据进行的任何预测的结果。

为了接受传入数据，我们检查是否

请求方法是 POST（使我们能够向端点发送任意数据，包括图像、JSON、编码数据等）
在 POST 期间已将 image 传递到 files 属性中

然后我们获取传入的数据并

以 PIL 格式读取
对其进行预处理
将其传递给我们的网络
遍历结果并将它们分别添加到 data["predictions"] 列表中
以 JSON 格式将响应返回给客户端

如果您使用的是非图像数据，则应删除 request.files 代码，并自行解析原始输入数据或利用 request.get_json() 自动将输入数据解析为 Python 字典/对象。此外，请考虑阅读以下教程，其中讨论了 Flask request 对象 的基础知识。

现在要做的就是启动我们的服务

# if this is the main thread of execution first load the model and
# then start the server
if __name__ == "__main__":
    print(("* Loading Keras model and Flask starting server..."
        "please wait until server has fully started"))
    load_model()
    app.run()

首先我们调用 load_model，它从磁盘加载我们的 Keras 模型。

对 load_model 的调用是一个阻塞操作，它会阻止 Web 服务启动，直到模型完全加载。如果我们没有确保在启动 Web 服务之前将模型完全加载到内存中并准备好进行推理，我们可能会遇到以下情况

向服务器发送请求。
服务器接受请求，对数据进行预处理，然后尝试将其传递给模型
...但是由于模型还没有完全加载，所以我们的脚本会出错！

在构建您自己的 Keras REST API 时，请确保插入逻辑以确保在接受请求之前加载模型并准备好进行推理。

如何在 REST API 中不加载 Keras 模型

您可能会想在 predict 函数内部加载模型，如下所示

...
    # ensure an image was properly uploaded to our endpoint
    if request.method == "POST":
        if request.files.get("image"):
            # read the image in PIL format
            image = request.files["image"].read()
            image = Image.open(io.BytesIO(image))

            # preprocess the image and prepare it for classification
            image = prepare_image(image, target=(224, 224))

            # load the model
            model = ResNet50(weights="imagenet")

            # classify the input image and then initialize the list
            # of predictions to return to the client
            preds = model.predict(image)
            results = imagenet_utils.decode_predictions(preds)
            data["predictions"] = []
...

这段代码意味着每次有新请求传入时都会加载 model。这是非常低效的，甚至会导致您的系统内存不足。

如果您尝试运行上面的代码，您会注意到您的 API 运行速度会慢得多（尤其是当您的模型很大时） - 这是由于为每个新请求 加载模型而导致 I/O 和 CPU 操作的巨大开销。

要了解这如何轻易耗尽您的服务器内存，假设我们同时有 N 个传入请求到我们的服务器。这意味着将有 N 个模型加载到内存中……同样，是同时进行的。如果您的模型很大，例如 ResNet，则在 RAM 中存储 N 个模型副本很容易耗尽系统内存。

为此，除非您有非常具体、合理的理由这样做，否则请尽量避免为每个新传入请求加载新的模型实例。

警告：我们假设您使用的是单线程的默认 Flask 服务器。如果您部署到多线程服务器，则即使使用本文前面讨论的“更正确”方法，您仍然可能会遇到在内存中加载多个模型的情况。如果您打算使用专用服务器（例如 Apache 或 nginx），则应考虑提高管道的可扩展性，如此处所述。

启动您的 Keras Rest API

启动 Keras REST API 服务很容易。

打开终端并执行

$ python run_keras_server.py
Using TensorFlow backend.
 * Loading Keras model and Flask starting server...please wait until server has fully started
...
 * Running on http://127.0.0.1:5000

从输出中可以看到，我们的模型是先加载的 - 之后我们可以启动 Flask 服务器。

您现在可以通过 http://127.0.0.1:5000 访问服务器。

但是，如果您要将 IP 地址 + 端口复制并粘贴到浏览器中，您将看到以下图像

keras api 404

出现这种情况的原因是在 Flask URL 路线中没有设置索引/主页。

而是尝试通过浏览器访问 /predict 端点

keras api 404

您将看到“不允许使用的方法”错误。出现此错误的原因是您的浏览器正在执行 GET 请求，但 /predict 仅接受 POST（我们将在下一节中演示如何执行）。

使用 cURL 测试 Keras REST API

在测试和调试您的 Keras REST API 时，请考虑使用 cURL（无论如何，这都是一个很好的学习工具）。

下面可以看到我们想要分类的图像，一只狗，更具体地说是比格犬

dog

我们可以使用 curl 将此图像传递给我们的 API，并找出 ResNet 认为图像包含的内容

$ curl -X POST -F image=@dog.jpg 'https://:5000/predict'
{
  "predictions": [
    {
      "label": "beagle",
      "probability": 0.9901360869407654
    },
    {
      "label": "Walker_hound",
      "probability": 0.002396771451458335
    },
    {
      "label": "pot",
      "probability": 0.0013951235450804234
    },
    {
      "label": "Brittany_spaniel",
      "probability": 0.001283277408219874
    },
    {
      "label": "bluetick",
      "probability": 0.0010894243605434895
    }
  ],
  "success": true
}

-X 标志和 POST 值表示我们正在执行 POST 请求。

我们提供 -F image=@dog.jpg 来指示我们正在提交表单编码数据。然后将 image 键设置为 dog.jpg 文件的内容。在 dog.jpg 之前提供 @ 表示我们希望 cURL 加载图像的内容并将数据传递给请求。

最后，我们有我们的端点：https://:5000/predict

请注意输入图像如何以 99.01% 的置信度被正确分类为“比格犬”。其余前 5 个预测及其相关概率也包含在我们的 Keras API 的响应中。

以编程方式使用 Keras REST API

您很可能会向您的 Keras REST API提交数据，然后以某种方式使用返回的预测 - 这需要我们以编程方式处理来自服务器的响应。

使用 requests Python 包，这是一个简单的过程

# import the necessary packages
import requests

# initialize the Keras REST API endpoint URL along with the input
# image path
KERAS_REST_API_URL = "https://:5000/predict"
IMAGE_PATH = "dog.jpg"

# load the input image and construct the payload for the request
image = open(IMAGE_PATH, "rb").read()
payload = {"image": image}

# submit the request
r = requests.post(KERAS_REST_API_URL, files=payload).json()

# ensure the request was successful
if r["success"]:
    # loop over the predictions and display them
    for (i, result) in enumerate(r["predictions"]):
        print("{}. {}: {:.4f}".format(i + 1, result["label"],
            result["probability"]))

# otherwise, the request failed
else:
    print("Request failed")

KERAS_REST_API_URL 指定我们的端点，而 IMAGE_PATH 是驻留在磁盘上的输入图像的路径。

使用 IMAGE_PATH，我们加载图像，然后构造请求的 payload。

给定 payload，我们可以使用对 requests.post 的调用将数据 POST 到我们的端点。在调用的末尾附加 .json() 会指示 requests

来自服务器的响应应为 JSON 格式
我们希望自动解析 JSON 对象并为我们反序列化

获得请求的输出 r 后，我们可以检查分类是否成功（或不成功），然后遍历 r["predictions"]。

要运行，请先确保 run_keras_server.py（即 Flask Web 服务器）当前正在运行，然后执行 simple_request.py。然后，在单独的 shell 中执行以下命令

$ python simple_request.py
1. beagle: 0.9901
2. Walker_hound: 0.0024
3. pot: 0.0014
4. Brittany_spaniel: 0.0013
5. bluetick: 0.0011

我们已经成功调用了 Keras REST API，并通过 Python 获得了模型的预测结果。

在这篇文章中，您学习了如何

使用 Flask web 框架将 Keras 模型包装为 REST API
利用 cURL 向 API 发送数据
使用 Python 和 requests 包向端点发送数据并使用结果

本教程中涵盖的代码可以在此处找到，并且可以用作您自己的 Keras REST API 的模板 - 请随意根据您的需要进行修改。

请记住，这篇文章中的代码仅用于*教学*。它*并非*旨在达到生产级别，并且能够在高负载和大量传入请求下进行扩展。

此方法最适合在以下情况下使用

您需要为您的 Keras 深度学习模型快速搭建一个 REST API
您的端点不会受到大量访问

如果您对利用消息队列和批处理的更高级 Keras REST API 感兴趣，请参阅这篇博文。

如果您对这篇文章有任何问题或意见，请联系 PyImageSearch 的 Adrian（今天这篇文章的作者）。有关未来主题的建议，请在 Twitter 上找到 Francois。

其他文章

API 的用户体验设计

2017年11月21日，星期二
作者：Francois Chollet

分类：随笔。

编写代码很少仅仅是您和您的计算机之间的私事。代码不仅仅是为机器准备的；它还有人类用户。它旨在供人们阅读、供其他开发人员使用、维护和构建。当开发人员…
阅读更多
Keras 中序列到序列学习的十分钟介绍

2017年9月29日，星期五
作者：Francois Chollet

位于教程。

注意：这篇文章来自 2017 年。有关此处使用的代码的最新版本，请参阅本教程。

我经常看到这个问题——如何在 Keras 中实现 RNN 序列到序列学习？以下是一个简短的介绍。

请注意，这篇文章假设您已经具备一定的循环…
阅读更多
深度学习的未来

2017年7月18日，星期二
作者：Francois Chollet

分类：随笔。

这篇文章改编自我的著作《Python 深度学习》（曼宁出版社）第 9 章第 3 节。

它是关于深度学习当前局限性及其未来的两篇文章系列的一部分。您可以在这里阅读第一部分：深度学习的局限性…
阅读更多
深度学习的局限性

2017年7月17日，星期一
作者：Francois Chollet

分类：随笔。

这篇文章改编自我的著作《Python 深度学习》（曼宁出版社）第 9 章第 2 节。

它是关于深度学习当前局限性及其未来的两篇文章系列的一部分。

这篇文章的目标读者是已经具备…
阅读更多
在 AWS 上的 GPU 上运行 Jupyter Notebook：入门指南

2017年3月21日，星期二
作者：Francois Chollet

位于教程。

这是一份分步指南，介绍如何在 AWS GPU 实例上开始运行深度学习 Jupyter Notebook，同时在浏览器中从任何地方编辑 Notebook。如果您在本地机器上没有 GPU，这是进行深度学习研究的完美设置。

什么是…
阅读更多
Keras 2 简介

2017年3月14日，星期二
作者：Francois Chollet

分类：新闻。

Keras 于两年前的 2015 年 3 月发布。从那时起，它从一个用户发展到十万用户。

数百人为 Keras 代码库做出了贡献。成千上万的人为社区做出了贡献。Keras 催生了新的初创公司，提高了研究人员的工作效率，简化了…
阅读更多
在 Keras 模型中使用预训练的词嵌入

2016年7月16日，星期六
作者：Francois Chollet

位于教程。

注意：这篇文章最初写于 2016 年 7 月。现在已经基本过时了。有关如何使用预训练词嵌入的最新示例，请参阅此示例。

在本教程中，我们将引导您完成使用预训练的词嵌入解决文本分类问题的过程…
阅读更多
论人工智能民主化的重要性

2016年7月6日，星期三
作者：Francois Chollet

分类：随笔。

我们都知道深度学习近年来取得的惊人进展。在短短 5 年内，我们从几乎无法使用的语音识别和图像识别发展到接近人类的准确率。我们从无法战胜专业围棋选手的机器发展到战胜世界冠军。我们进一步…
阅读更多
使用极少的数据构建强大的图像分类模型

2016年6月5日，星期日
作者：Francois Chollet

位于教程。

注意：这篇文章最初写于 2016 年 6 月。现在已经非常过时了。有关最新的替代方案，请参阅本微调指南，或查看我的著作《Python 深度学习（第二版）》的第 8 章。

在本教程中，我们将介绍一些简单但有效的方法…
阅读更多
在 Keras 中构建自动编码器
2016年5月14日，星期六
作者：Francois Chollet

位于教程。

这篇文章写于 2016 年初。因此已经严重过时了。

在本教程中，我们将回答有关自动编码器的一些常见问题，我们将介绍以下模型的代码示例
- 基于全连接层的简单自动编码器
- 稀疏自动编码器
- 深度全连接自动编码器
- 深度…
阅读更多
Keras 作为 TensorFlow 的简化接口：教程

2016年4月24日，星期日
作者：Francois Chollet

位于教程。

注意：这篇文章来自 2016 年 4 月。它不再反映 TensorFlow 和 Keras 的最佳实践。Keras 现已集成到 TensorFlow 中。有关详细信息，请参阅keras.io 文档。

将 Keras 作为 TensorFlow 工作流程的一部分使用的完整指南

如果 TensorFlow 是您的主要框架，并且…
阅读更多
Keras 1.0 简介

2016年4月11日，星期一
作者：Francois Chollet

分类：新闻。

Keras 最初发布于一年前的 2015 年 3 月下旬。从那时起，它在开发方面和社区方面都取得了巨大进步。

但持续改进是不够的。开发 Keras、使用 Keras 以及从成千上万的用户那里获得反馈的一年教会了我们很多东西。为了…
阅读更多
卷积神经网络如何看待世界

2016年1月30日，星期六
作者：Francois Chollet

分类：演示。

注意：这篇文章最初写于 2016 年 1 月。现在已经非常过时了。有关如何可视化卷积网络过滤器的最新示例，请参阅此示例，或查看我的著作《Python 深度学习（第二版）》的第 9 章。

使用 Keras 探索卷积网络过滤器

在…
阅读更多
Keras 现在可以在 TensorFlow 上运行

2015年12月1日，星期二
作者：Francois Chollet

分类：新闻。

Keras 的目的是成为一个模型级框架，提供一组“乐高积木”，用于快速、直接地构建深度学习模型。在深度学习框架中，Keras 无疑处于抽象的最高层。

因此，Keras 本身不处理低级张量…
阅读更多

其他文章

什么是…

将 Keras 作为 TensorFlow 工作流程的一部分使用的完整指南

使用 Keras 探索卷积网络过滤器