Python人脸识别 | Word count: 1.3k | Reading time: 4min | Post View:
Python 人脸识别
“人脸识别”是人工智能的一个重要应用,听起来技术含量很高,貌似非常复杂,具体的实现也的确非常复杂,目前的算法一般都基于深度学习神经网络。但如果仅仅是使用识别功能,目前已有封装好的功能模块,并不需要训练模型,甚至不需要了解任何算法原理,只需调用
Python 的三方模块,几行代码即可实现人脸识别。
face_recognition
是目前使用方法最简单,效果也非常好的人脸识别库,它的离线识别率高达
99.38%。除了检测面部位置,它还能快速识别出面部特征:如眉毛、眼睛、鼻子、嘴,识别具体的人,对比两张脸的相似度等等。从后面例程可以看到,识别位置相当准确。
一、安装和原理
face_recognition 底层基于 dlib 实现。dlib
是一个人脸关键点检测库,它的核心功能由 C++
实现,适用于多个平台。不同于一般的 Python
三方模块,它在安装时需要编译,其 Github 上主要介绍了它在 Linux 和 MacOS
系统的安装方法。在 Windows 系统下编译安装过程比较复杂,需要安装 Visual
Studio 的 Visual C++ for Linux 环境,相关工具几十个
G,安装步骤和注意事项也很多,因此还是建议使用 Linux
系统(尽管这可能让一些读者望而却步)。
在 Linux 下安装方法非常简单:
1 $ pip install face_recognition
Linux 将自动安装 face_recognition
及其依赖的三方工具集。同时,建议下载源码:
1 2 3 $ git clone https://github.com/davisking/dlib.git $ git clone https://github.com/ageitgey/face_recognition_models $ git clone https://github.com/ageitgey/face_recognition
下载源码主要为了通过其示例学习三方模块的使用方法,以及了解底层调用的库和具体的实现方法,以及相关的文档。
dlib
模块实现最核心的功能——人脸关键点检测,从源码中可以看到,它主要由 C++
语言实现,并提供了 C++ 和 Python
接口,因此,可以在不同环境下开发和使用,目前也有开发者将其移植到 android
手机上。
face_recognition_models 存储了训练好的模型,供 face_recognition
模块调用,模型的扩展名为“.dat”。
face_recognition 模块的功能代码并不多,主要是封装了
dlib,简化了开发者的调用步骤。其 example
中有很多有趣的例程,比如:虚化人脸(类似于马赛克效果),化妆,追踪视频中的人脸,甚至还启动
WebService,识别用户上传的图片;还包括与机器学习模型 KNN,SVM
结合使用的例程,其原理也是用 dlib
提取人脸特征,再加入机器学习模型训练,根据需求,生成新的模型。可将其看作图像识别在人脸识别垂直领域的细化和封装。
dlib 的使用方法并不复杂,而 face_recognition
则更加简单,face_recognition 还提供了直接运行的两个工具:人脸检测
face_dection 和人脸识别 face_recognition。
二、face_recognition 例程
本例程调用 face_recognition
模块,实现了人脸识别,画眉、画眼线和涂口线的功能。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 from PIL import Image, ImageDraw import face_recognition image = face_recognition.load_image_file("face2.png") face_landmarks_list = face_recognition.face_landmarks(image) for face_landmarks in face_landmarks_list: color = [238,42,68] pil_image = Image.fromarray(image) d = ImageDraw.Draw(pil_image, 'RGBA') print(face_landmarks.keys()) d.polygon(face_landmarks['left_eyebrow'], fill=(68, 54, 39, 50)) d.polygon(face_landmarks['right_eyebrow'], fill=(68, 54, 39, 50)) d.polygon(face_landmarks['top_lip'], fill=(color[0], color[1], color[2], 80)) d.polygon(face_landmarks['bottom_lip'], fill=(color[0], color[1], color[2], 80)) d.line(face_landmarks['left_eye'] + [face_landmarks['left_eye'][0]], fill=(0, 0, 0, 50), width=3) d.line(face_landmarks['right_eye'] + [face_landmarks['right_eye'][0]], fill=(0, 0, 0, 50), width=3) pil_image.show() pil_image.save('out4.png')
三、dlib 例程
本例程直接调用 dlib 模块,使用 face_recognition_models
中训练好的模型,识别人脸上的 68 个特征点。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 import dlib import cv2 detector = dlib.get_frontal_face_detector() predictor = dlib.shape_predictor('/exports/git/face_recognition_models/face_recognition_models/models/shape_predictor_68_face_landmarks.dat') img = cv2.imread("/tmp/face2.png") dets = detector(img, 1) for k, d in enumerate(dets): print("Detection {}: Left: {} Top: {} Right: {} Bottom: {}".format( k, d.left(), d.top(), d.right(), d.bottom())) shape = predictor(img, d) for index, pt in enumerate(shape.parts()): print('Part {}: {}'.format(index, pt)) pt_pos = (pt.x, pt.y) cv2.circle(img, pt_pos, 1, (255, 0, 0), 2) font = cv2.FONT_HERSHEY_SIMPLEX cv2.putText(img, str(index+1),pt_pos,font, 0.3, (0, 0, 255), 1, cv2.LINE_AA) cv2.imshow('img', img) k = cv2.waitKey() cv2.destroyAllWindows()
四、总结
对于大多数的 Python 程序,开发者需要的 90%
功能三方模块都已经实现完成,很多功能都已非常成熟,剩余的 10%
由开发者根据需求进行适配即可完成。这使得开发者在短时间内即可实现基本功能,并且看起来非常强大,但是后期效果提升比较困难。
个人觉得:人脸识别工具真的很适合美妆卖家,买家上传一张相片,合成各种色号的效果;在视频通话过程中察言观色;图片识别,刷脸支付,美颜相机;稍加一些艺术处理,自动生成漫画等等。
五、参考
1. 具体用法介绍
https://github.com/ageitgey/face_recognition
2.表情识别规则
https://www.jianshu.com/p/7596e428bcfe