Python 人脸识别

 “人脸识别”是人工智能的一个重要应用,听起来技术含量很高,貌似非常复杂,具体的实现也的确非常复杂,目前的算法一般都基于深度学习神经网络。但如果仅仅是使用识别功能,目前已有封装好的功能模块,并不需要训练模型,甚至不需要了解任何算法原理,只需调用 Python 的三方模块,几行代码即可实现人脸识别。

 face_recognition 是目前使用方法最简单,效果也非常好的人脸识别库,它的离线识别率高达 99.38%。除了检测面部位置,它还能快速识别出面部特征:如眉毛、眼睛、鼻子、嘴,识别具体的人,对比两张脸的相似度等等。从后面例程可以看到,识别位置相当准确。

一、安装和原理

 face_recognition 底层基于 dlib 实现。dlib 是一个人脸关键点检测库,它的核心功能由 C++ 实现,适用于多个平台。不同于一般的 Python 三方模块,它在安装时需要编译,其 Github 上主要介绍了它在 Linux 和 MacOS 系统的安装方法。在 Windows 系统下编译安装过程比较复杂,需要安装 Visual Studio 的 Visual C++ for Linux 环境,相关工具几十个 G,安装步骤和注意事项也很多,因此还是建议使用 Linux 系统(尽管这可能让一些读者望而却步)。

  在 Linux 下安装方法非常简单:

1
$ pip install face_recognition

 Linux 将自动安装 face_recognition 及其依赖的三方工具集。同时,建议下载源码:

1
2
3
$ git clone https://github.com/davisking/dlib.git
$ git clone https://github.com/ageitgey/face_recognition_models
$ git clone https://github.com/ageitgey/face_recognition

  下载源码主要为了通过其示例学习三方模块的使用方法,以及了解底层调用的库和具体的实现方法,以及相关的文档。

 dlib 模块实现最核心的功能——人脸关键点检测,从源码中可以看到,它主要由 C++ 语言实现,并提供了 C++ 和 Python 接口,因此,可以在不同环境下开发和使用,目前也有开发者将其移植到 android 手机上。

 face_recognition_models 存储了训练好的模型,供 face_recognition 模块调用,模型的扩展名为“.dat”。

 face_recognition 模块的功能代码并不多,主要是封装了 dlib,简化了开发者的调用步骤。其 example 中有很多有趣的例程,比如:虚化人脸(类似于马赛克效果),化妆,追踪视频中的人脸,甚至还启动 WebService,识别用户上传的图片;还包括与机器学习模型 KNN,SVM 结合使用的例程,其原理也是用 dlib 提取人脸特征,再加入机器学习模型训练,根据需求,生成新的模型。可将其看作图像识别在人脸识别垂直领域的细化和封装。

 dlib 的使用方法并不复杂,而 face_recognition 则更加简单,face_recognition 还提供了直接运行的两个工具:人脸检测 face_dection 和人脸识别 face_recognition。

二、face_recognition 例程

  本例程调用 face_recognition 模块,实现了人脸识别,画眉、画眼线和涂口线的功能。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
from PIL import Image, ImageDraw
import face_recognition
image = face_recognition.load_image_file("face2.png")

face_landmarks_list = face_recognition.face_landmarks(image)
for face_landmarks in face_landmarks_list:
color = [238,42,68]
pil_image = Image.fromarray(image)
d = ImageDraw.Draw(pil_image, 'RGBA')
print(face_landmarks.keys())
d.polygon(face_landmarks['left_eyebrow'], fill=(68, 54, 39, 50))
d.polygon(face_landmarks['right_eyebrow'], fill=(68, 54, 39, 50))

d.polygon(face_landmarks['top_lip'], fill=(color[0], color[1], color[2], 80))
d.polygon(face_landmarks['bottom_lip'], fill=(color[0], color[1], color[2], 80))

d.line(face_landmarks['left_eye'] + [face_landmarks['left_eye'][0]], fill=(0, 0, 0, 50), width=3)
d.line(face_landmarks['right_eye'] + [face_landmarks['right_eye'][0]], fill=(0, 0, 0, 50), width=3)

pil_image.show()
pil_image.save('out4.png')

三、dlib 例程

  本例程直接调用 dlib 模块,使用 face_recognition_models 中训练好的模型,识别人脸上的 68 个特征点。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
import dlib
import cv2

detector = dlib.get_frontal_face_detector()
predictor = dlib.shape_predictor('/exports/git/face_recognition_models/face_recognition_models/models/shape_predictor_68_face_landmarks.dat')
img = cv2.imread("/tmp/face2.png")
dets = detector(img, 1)

for k, d in enumerate(dets):
print("Detection {}: Left: {} Top: {} Right: {} Bottom: {}".format(
k, d.left(), d.top(), d.right(), d.bottom()))
shape = predictor(img, d)

for index, pt in enumerate(shape.parts()):
print('Part {}: {}'.format(index, pt))
pt_pos = (pt.x, pt.y)
cv2.circle(img, pt_pos, 1, (255, 0, 0), 2)
font = cv2.FONT_HERSHEY_SIMPLEX
cv2.putText(img, str(index+1),pt_pos,font, 0.3, (0, 0, 255), 1, cv2.LINE_AA)
cv2.imshow('img', img)
k = cv2.waitKey()
cv2.destroyAllWindows()

四、总结

  对于大多数的 Python 程序,开发者需要的 90% 功能三方模块都已经实现完成,很多功能都已非常成熟,剩余的 10% 由开发者根据需求进行适配即可完成。这使得开发者在短时间内即可实现基本功能,并且看起来非常强大,但是后期效果提升比较困难。

  个人觉得:人脸识别工具真的很适合美妆卖家,买家上传一张相片,合成各种色号的效果;在视频通话过程中察言观色;图片识别,刷脸支付,美颜相机;稍加一些艺术处理,自动生成漫画等等。

五、参考

1. 具体用法介绍

https://github.com/ageitgey/face_recognition

2.表情识别规则

https://www.jianshu.com/p/7596e428bcfe