# RESTful 架构和 DRF 入门

把软件(Software)、平台(Platform)、基础设施(Infrastructure)做成服务(Service)是很多 IT 企业都一直在做的事情,这就是大家经常听到的 SasS(软件即服务)、PasS(平台即服务)和 IasS(基础设置即服务)。实现面向服务的架构(SOA)有诸多的方式,包括 RPC(远程过程调用)、Web Service、REST 等,在技术层面上,SOA 是一种抽象的、松散耦合的粗粒度软件架构;在业务层面上,SOA 的核心概念是 “重用” 和 “互操作”,它将系统资源整合成可操作的、标准的服务,使得这些资源能够被重新组合和应用。在实现 SOA 的诸多方案中,REST 被认为是最适合互联网应用的架构,符合 REST 规范的架构也经常被称作 RESTful 架构。

# REST 概述

REST 这个词,是 Roy Thomas Fielding 在他 2000 年的博士论文中提出的,Roy 是 HTTP 协议(1.0 和 1.1 版)的主要设计者、Apache 服务器软件主要作者、Apache 基金会第一任主席。在他的博士论文中,Roy 把他对互联网软件的架构原则定名为 REST,即 REpresentational State Transfer 的缩写,中文通常翻译为 “表现层状态转移” 或 “表述状态转移”。

这里的 “表现层” 其实指的是 “资源” 的 “表现层”。所谓资源,就是网络上的一个实体,或者说是网络上的一个具体信息。它可以是一段文本、一张图片、一首歌曲或一种服务。我们可以用一个 URI(统一资源定位符)指向资源,要获取到这个资源,访问它的 URI 即可,URI 就是资源在互联网上的唯一标识。资源可以有多种外在表现形式。我们把资源具体呈现出来的形式,叫做它的 “表现层”。比如,文本可以用 text/plain 格式表现,也可以用 text/html 格式、 text/xml 格式、 application/json 格式表现,甚至可以采用二进制格式;图片可以用 image/jpeg 格式表现,也可以用 image/png 格式表现。URI 只代表资源的实体,不代表它的表现形式。严格地说,有些网址最后的 .html 后缀名是不必要的,因为这个后缀名表示格式,属于 “表现层” 范畴,而 URI 应该只代表 “资源” 的位置,它的具体表现形式,应该在 HTTP 请求的头信息中用 AcceptContent-Type 字段指定,这两个字段才是对 “表现层” 的描述。

访问一个网站,就代表了客户端和服务器的一个互动过程。在这个过程中,势必涉及到数据和状态的变化。Web 应用通常使用 HTTP 作为其通信协议,客户端想要操作服务器,必须通过 HTTP 请求,让服务器端发生 “状态转移”,而这种转移是建立在表现层之上的,所以就是 “表现层状态转移”。客户端通过 HTTP 的动词 GET、POST、PUT(或 PATCH)、DELETE,分别对应对资源的四种基本操作,其中 GET 用来获取资源,POST 用来新建资源(也可以用于更新资源),PUT(或 PATCH)用来更新资源,DELETE 用来删除资源。

简单的说 RESTful 架构就是:“每一个 URI 代表一种资源,客户端通过四个 HTTP 动词,对服务器端资源进行操作,实现资源的表现层状态转移”。

我们在设计 Web 应用时,如果需要向客户端提供资源,就可以使用 REST 风格的 URI,这是实现 RESTful 架构的第一步。当然,真正的 RESTful 架构并不只是 URI 符合 REST 风格,更为重要的是 “无状态” 和 “幂等性” 两个词,我们在后面的课程中会为大家阐述这两点。下面的例子给出了一些符合 REST 风格的 URI,供大家在设计 URI 时参考。

请求方法(HTTP 动词)URI解释
GET/students/获取所有学生
POST/students/新建一个学生
GET/students/ID/获取指定 ID 的学生信息
PUT/students/ID/更新指定 ID 的学生信息(提供该学生的全部信息)
PATCH/students/ID/更新指定 ID 的学生信息(提供该学生的部分信息)
DELETE/students/ID/删除指定 ID 的学生信息
GET/students/ID/friends/列出指定 ID 的学生的所有朋友
DELETE/students/ID/friends/ID/删除指定 ID 的学生的指定 ID 的朋友

# DRF 使用入门

在 Django 项目中,如果要实现 REST 架构,即将网站的资源发布成 REST 风格的 API 接口,可以使用著名的三方库 djangorestframework ,我们通常将其简称为 DRF。

# 安装和配置 DRF

安装 DRF。

pip install djangorestframework

配置 DRF。

INSTALLED_APPS = [

    'rest_framework',
    
]

# 下面的配置根据项目需要进行设置
REST_FRAMEWORK = {
    # 配置默认页面大小
    # 'PAGE_SIZE': 10,
    # 配置默认的分页类
    # 'DEFAULT_PAGINATION_CLASS': '...',
    # 配置异常处理器
    # 'EXCEPTION_HANDLER': '...',
    # 配置默认解析器
    # 'DEFAULT_PARSER_CLASSES': (
    #     'rest_framework.parsers.JSONParser',
    #     'rest_framework.parsers.FormParser',
    #     'rest_framework.parsers.MultiPartParser',
    # ),
    # 配置默认限流类
    # 'DEFAULT_THROTTLE_CLASSES': (
    #     '...'
    # ),
    # 配置默认授权类
    # 'DEFAULT_PERMISSION_CLASSES': (
    #     '...',
    # ),
    # 配置默认认证类
    # 'DEFAULT_AUTHENTICATION_CLASSES': (
    #     '...',
    # ),
}

# 编写序列化器

前后端分离的开发需要后端为前端、移动端提供 API 数据接口,而 API 接口通常情况下都是返回 JSON 格式的数据,这就需要对模型对象进行序列化处理。DRF 中封装了 Serializer 类和 ModelSerializer 类用于实现序列化操作,通过继承 Serializer 类或 ModelSerializer 类,我们可以自定义序列化器,用于将对象处理成字典,代码如下所示。

from rest_framework import serializers 


class SubjectSerializer(serializers.ModelSerializer):

    class Meta:
        model = Subject
        fields = '__all__'

上面的代码直接继承了 ModelSerializer ,通过 Meta 类的 model 属性指定要序列化的模型以及 fields 属性指定需要序列化的模型字段,稍后我们就可以在视图函数中使用该类来实现对 Subject 模型的序列化。

# 编写视图函数

DRF 框架支持两种实现数据接口的方式,一种是 FBV(基于函数的视图),另一种是 CBV(基于类的视图)。我们先看看 FBV 的方式如何实现数据接口,代码如下所示。

from rest_framework.decorators import api_view
from rest_framework.response import Response


@api_view(('GET', ))
def show_subjects(request: HttpRequest) -> HttpResponse:
    subjects = Subject.objects.all().order_by('no')
    # 创建序列化器对象并指定要序列化的模型
    serializer = SubjectSerializer(subjects, many=True)
    # 通过序列化器的data属性获得模型对应的字典并通过创建Response对象返回JSON格式的数据
    return Response(serializer.data)

对比上一个章节的使用 bpmapper 实现模型序列化的代码,使用 DRF 的代码更加简单明了,而且 DRF 本身自带了一套页面,可以方便我们查看我们使用 DRF 定制的数据接口,如下图所示。

直接使用上一节写好的页面,就可以通过 Vue.js 把上面接口提供的学科数据渲染并展示出来,此处不再进行赘述。

# 实现老师信息数据接口

编写序列化器。

class SubjectSimpleSerializer(serializers.ModelSerializer):

    class Meta:
        model = Subject
        fields = ('no', 'name')


class TeacherSerializer(serializers.ModelSerializer):

    class Meta:
        model = Teacher
        exclude = ('subject', )

编写视图函数。

@api_view(('GET', ))
def show_teachers(request: HttpRequest) -> HttpResponse:
    try:
        sno = int(request.GET.get('sno'))
        subject = Subject.objects.only('name').get(no=sno)
        teachers = Teacher.objects.filter(subject=subject).defer('subject').order_by('no')
        subject_seri = SubjectSimpleSerializer(subject)
        teacher_seri = TeacherSerializer(teachers, many=True)
        return Response({'subject': subject_seri.data, 'teachers': teacher_seri.data})
    except (TypeError, ValueError, Subject.DoesNotExist):
        return Response(status=404)

配置 URL 映射。

urlpatterns = [
    
    path('api/teachers/', show_teachers),
    
]

通过 Vue.js 渲染页面。

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>老师信息</title>
    <style>
        /* 此处省略掉层叠样式表 */
    </style>
</head>
<body>
    <div id="container">
        <h1>{{ subject.name }}学科的老师信息</h1>
        <hr>
        <h2 v-if="loaded && teachers.length == 0">暂无该学科老师信息</h2>
        <div class="teacher" v-for="teacher in teachers">
            <div class="photo">
                <img :src="'/static/images/' + teacher.photo" height="140" alt="">
            </div>
            <div class="info">
                <div>
                    <span><strong>姓名:{{ teacher.name }}</strong></span>
                    <span>性别:{{ teacher.sex | maleOrFemale }}</span>
                    <span>出生日期:{{ teacher.birth }}</span>
                </div>
                <div class="intro">{{ teacher.intro }}</div>
                <div class="comment">
                    <a href="" @click.prevent="vote(teacher, true)">好评</a>&nbsp;&nbsp;
                    (<strong>{{ teacher.good_count }}</strong>)
                    &nbsp;&nbsp;&nbsp;&nbsp;
                    <a href="" @click.prevent="vote(teacher, false)">差评</a>&nbsp;&nbsp;
                    (<strong>{{ teacher.bad_count }}</strong>)
                </div>
            </div>
        </div>
        <a href="/static/html/subjects.html">返回首页</a>
    </div>
    <script src="https://cdn.bootcdn.net/ajax/libs/vue/2.6.11/vue.min.js"></script>
    <script>
        let app = new Vue({
            el: '#container',
            data: {
                subject: {},
                teachers: [],
                loaded: false
            },
            created() {
                fetch('/api/teachers/' + location.search)
                    .then(resp => resp.json())
                    .then(json => {
                        this.subject = json.subject
                        this.teachers = json.teachers
                    })
            },
            filters: {
                maleOrFemale(sex) {
                    return sex? '男': '女'
                }
            },
            methods: {
               vote(teacher, flag) {
                    let url = flag? '/praise/' : '/criticize/'
                    url += '?tno=' + teacher.no
                    fetch(url).then(resp => resp.json()).then(json => {
                        if (json.code === 10000) {
                            if (flag) {
                                teacher.good_count = json.count
                            } else {
                                teacher.bad_count = json.count
                            }
                        }
                    })
                }
            }
        })
    </script>
</body>
</html>

# 前后端分离下的用户登录

之前我们提到过, HTTP 是无状态的,一次请求结束连接断开,下次服务器再收到请求,它就不知道这个请求是哪个用户发过来的。但是对于一个 Web 应用而言,它是需要有状态管理的,这样才能让服务器知道 HTTP 请求来自哪个用户,从而判断是否允许该用户请求以及为用户提供更好的服务,这个过程就是常说的会话管理

之前我们做会话管理(用户跟踪)的方法是:用户登录成功后,在服务器端通过一个 session 对象保存用户相关数据,然后把 session 对象的 ID 写入浏览器的 cookie 中;下一次请求时,HTTP 请求头中携带 cookie 的数据,服务器从 HTTP 请求头读取 cookie 中的 sessionid,根据这个标识符找到对应的 session 对象,这样就能够获取到之前保存在 session 中的用户数据。我们刚才说过,REST 架构是最适合互联网应用的架构,它强调了 HTTP 的无状态性,这样才能保证应用的水平扩展能力(当并发访问量增加时,可以通过增加新的服务器节点来为系统扩容)。显然,基于 session 实现用户跟踪的方式需要服务器保存 session 对象,在做水平扩展增加新的服务器节点时,需要复制和同步 session 对象,这显然是非常麻烦的。解决这个问题有两种方案,一种是架设缓存服务器(如 Redis),让多个服务器节点共享缓存服务并将 session 对象直接置于缓存服务器中;另一种方式放弃基于 session 的用户跟踪,使用基于 token 的用户跟踪

基于 token 的用户跟踪是在用户登录成功后,为用户生成身份标识并保存在浏览器本地存储(localStorage、sessionStorage、cookie 等)中,这样的话服务器不需要保存用户状态,从而可以很容易的做到水平扩展。基于 token 的用户跟踪具体流程如下:

  1. 用户登录时,如果登录成功就按照某种方式为用户生成一个令牌(token),该令牌中通常包含了用户标识、过期时间等信息而且需要加密并生成指纹(避免伪造或篡改令牌),服务器将令牌返回给前端;
  2. 前端获取到服务器返回的 token,保存在浏览器本地存储中(可以保存在 localStoragesessionStorage 中,对于使用 Vue.js 的前端项目来说,还可以通过 Vuex 进行状态管理);
  3. 对于使用了前端路由的项目来说,前端每次路由跳转,可以先判断 localStroage 中有无 token,如果没有则跳转到登录页;
  4. 每次请求后端数据接口,在 HTTP 请求头里携带 token;后端接口判断请求头有无 token,如果没有 token 以及 token 是无效的或过期的,服务器统一返回 401;
  5. 如果前端收到 HTTP 响应状态码 401,则重定向到登录页面。

通过上面的描述,相信大家已经发现了,基于 token 的用户跟踪最为关键是在用户登录成功时,要为用户生成一个 token 作为用户的身份标识。生成 token 的方法很多,其中一种比较成熟的解决方案是使用 JSON Web Token。

# JWT 概述

JSON Web Token 通常简称为 JWT,它是一种开放标准(RFC 7519)。随着 RESTful 架构的流行,越来越多的项目使用 JWT 作为用户身份认证的方式。JWT 相当于是三个 JSON 对象经过编码后,用 . 分隔并组合到一起,这三个 JSON 对象分别是头部(header)、载荷(payload)和签名(signature),如下图所示。

  1. 头部

    {
      "alg": "HS256",
      "typ": "JWT"
    }
    

    其中, alg 属性表示签名的算法,默认是 HMAC SHA256(简写成 HS256 ); typ 属性表示这个令牌的类型,JWT 中都统一书写为 JWT

  2. 载荷

    载荷部分用来存放实际需要传递的数据。JWT 官方文档中规定了 7 个可选的字段:

    • iss :签发人
    • exp:过期时间
    • sub:主题
    • aud:受众
    • nbf:生效时间
    • iat:签发时间
    • jti:编号

    除了官方定义的字典,我们可以根据应用的需要添加自定义的字段,如下所示。

    {
      "sub": "1234567890",
      "nickname": "jackfrued",
      "role": "admin"
    }
    
  3. 签名

    签名部分是对前面两部分生成一个指纹,防止数据伪造和篡改。实现签名首先需要指定一个密钥。这个密钥只有服务器才知道,不能泄露给用户。然后,使用头部指定的签名算法(默认是 HS256 ),按照下面的公式产生签名。

    HS256(base64Encode(header) + '.' + base64Encode(payload), secret)
    

    算出签名以后,把头部、载荷、签名三个部分拼接成一个字符串,每个部分用 . 进行分隔,这样一个 JWT 就生成好了。

# JWT 的优缺点

使用 JWT 的优点非常明显,包括:

  1. 更容易实现水平扩展,因为令牌保存在浏览器中,服务器不需要做状态管理。
  2. 更容易防范 CSRF 攻击,因为在请求头中添加 localStoragesessionStorage 中的 token 必须靠 JavaScript 代码完成,而不是自动添加到请求头中的。
  3. 可以防伪造和篡改,因为 JWT 有签名,伪造和篡改的令牌无法通过签名验证,会被认定是无效的令牌。

当然,任何技术不可能只有优点没有缺点,JWT 也有诸多缺点,大家需要在使用的时候引起注意,具体包括:

  1. 可能会遭受到 XSS 攻击(跨站脚本攻击),通过注入恶意脚本执行 JavaScript 代码获取到用户令牌。
  2. 在令牌过期之前,无法作废已经颁发的令牌,要解决这个问题,还需要额外的中间层和代码来辅助。
  3. JWT 是用户的身份令牌,一旦泄露,任何人都可以获得该用户的所有权限。为了降低令牌被盗用后产生的风险,JWT 的有效期应该设置得比较短。对于一些比较重要的权限,使用时应通过其他方式再次对用户进行认证,例如短信验证码等。

# 使用 PyJWT

在 Python 代码中,可以使用三方库 PyJWT 生成和验证 JWT,下面是安装 PyJWT 的命令。

pip install pyjwt

生成令牌。

payload = {
    'exp': datetime.datetime.utcnow() + datetime.timedelta(days=1),
    'userid': 10001
}
token = jwt.encode(payload, settings.SECRET_KEY).decode()

验证令牌。

try:
    token = 'eyJ0eXAiOiJKV1QiLCJhbGciOiJIUzI1NiJ9.eyJleHAiOjE1OTQ4NzIzOTEsInVzZXJpZCI6MTAwMDF9.FM-bNxemWLqQQBIsRVvc4gq71y42I9m2zt5nlFxNHUo'
    payload = jwt.decode(token, settings.SECRET_KEY)
except InvalidTokenError:
    raise AuthenticationFailed('无效的令牌或令牌已经过期')

如果不清楚 JWT 具体的使用方式,可以先看看第 55 天的内容,里面提供了完整的投票项目代码的地址。