三分钟带你入门人脸识别

人工智能 人脸识别
人脸识别是AI研究带给世界的众多奇迹之一。对于许多技术人员来说,这是一个充满好奇的话题-他们希望对事物的工作方式有基本的了解。让我们潜入主题,看看事情如何运作。

 人脸识别是AI研究带给世界的众多奇迹之一。对于许多技术人员来说,这是一个充满好奇的话题-他们希望对事物的工作方式有基本的了解。让我们潜入主题,看看事情如何运作。

人脸识别

解决此类问题时,最好不要重新发明轮子-我们不能!最好遵循研究人员提供给我们的模型。开源中也有很多可用的工具。这样的Python库之一是face_recognition。它可以通过几个步骤工作:

  • 识别给定图像中的人脸
  • 识别面部特征
  • 生成128个值的人脸编码向量

基于这种编码,我们可以测量两个脸部图像之间的相似度-可以告诉我们它们是否属于同一个人。

首先安装face_recognition模块

  1. pip install face_recognition 

导入模块
接下来,我们导入所需的模块

  1. import PIL.Image 
  2. import PIL.ImageDraw 
  3. import requests 
  4. from io import BytesIO 
  5.  
  6. from IPython.display import display 
  7.  
  8. import face_recognition 

载入图片
接下来,我们加载图片。我已将图像存储在我的Github帐户中。这样我们就可以从URL中读取原始图像。

  1. response = requests.get("https://raw.githubusercontent.com/solegaonkar/solegaonkar.github.io/master/img/rahul1.jpeg"
  2. fr_image = face_recognition.load_image_file(BytesIO(response.content)) 

识别面孔
加载面部后,让我们看一下face_recognition模块的各个部分。它如何识别人脸?

  1. face_locations = face_recognition.face_locations(fr_image) 
  2.  
  3. number_of_faces = len(face_locations) 
  4. print("I found {} face(s) in this photograph.".format(number_of_faces)) 

这给了我们一个输出:

  1. I found 1 face(s) **in** this photograph.</span> 

这意味着,该算法仅在图像中找到了一张脸。让我们看看所识别的图像和面部。

  1. pil_image = PIL.Image.fromarray(fr_image) 
  2.  
  3. for face_location in face_locations: 
  4.     # Print the location of each face in this image. Each face is a list of co-ordinates in (top, right, bottom, left) order. 
  5.     top, right, bottom, left = face_location 
  6.     print("A face is located at pixel location Top: {}, Left: {}, Bottom: {}, Right: {}".format(top, left, bottom, right)) 
  7.     # Let's draw a box around the face 
  8.     draw = PIL.ImageDraw.Draw(pil_image) 
  9.     draw.rectangle([left, top, right, bottom], outline="black"

这给了我们一个输出

  1. A face **is** located at pixel location Top: 68, Left: 117, Bottom: 291, Right: 340</span> 

上面的代码还修改了图像以在脸部周围绘制一个矩形。让我们检查一下是否运作良好。

已经可以了。

人脸编码
这是我们的面孔。但是,对于我们的算法而言,它只是RGB值的数组—匹配从我们提供给它的数据样本中学到的模式。

对于面部识别,该算法记录了面部的某些重要测量值,例如眼睛的颜色和大小和倾斜度,眉毛之间的间隙等。所有这些共同定义了面部编码-从图像中获取的信息-即用于识别特定面孔。

为了了解从面部读取的内容,让我们看一下读取的编码。

  1. face_encodings = face_recognition.face_encodings(fr_image) 
  2. face_encodings[0

打印出一个巨大的数组:

  1. array([-0.10213576,  0.05088161, -0.03425048, -0.09622347, -0.12966095
  2.         0.04867411, -0.00511892, -0.03418527,  0.2254715 , -0.07892745
  3.         0.21497472, -0.0245543 , -0.2127848 , -0.08542262, -0.00298059
  4.         0.13224372, -0.21870363, -0.09271716, -0.03727289, -0.1250658 , 
  5.         0.09436664,  0.03037129, -0.02634972,  0.02594662, -0.1627259 , 
  6.        -0.29416466, -0.12254384, -0.15237436,  0.14907973, -0.09940194
  7.         0.02000656,  0.04662619, -0.1266906 , -0.11484023,  0.04613583
  8.         0.1228286 , -0.03202137, -0.0715076 ,  0.18478717, -0.01387333
  9.        -0.11409076,  0.07516225,  0.08549548,  0.31538364,  0.1297821 , 
  10.         0.04055009,  0.0346106 , -0.04874525,  0.17533901, -0.22634712
  11.         0.14879328,  0.09331974,  0.17943285,  0.02707857,  0.22914577
  12.        -0.20668915,  0.03964197,  0.17524502, -0.20210043,  0.07155308
  13.         0.04467429,  0.02973968,  0.00257265, -0.00049853,  0.18866715
  14.         0.08767469, -0.06483966, -0.13107982,  0.21610288, -0.04506358
  15.        -0.02243116,  0.05963502, -0.14988004, -0.11296406, -0.30011353
  16.         0.07316103,  0.38660526,  0.07268623, -0.14636359,  0.08436179
  17.         0.01005938, -0.00661338,  0.09306039,  0.03271955, -0.11528577
  18.        -0.0524189 , -0.11697718,  0.07356471,  0.10350288, -0.03610475
  19.         0.00390615,  0.17884226,  0.04291092, -0.02914601,  0.06112404
  20.         0.05315027, -0.14561613, -0.01887275, -0.13125736, -0.0362937 , 
  21.         0.16490118, -0.09027836, -0.00981111,  0.1363602 , -0.23134531
  22.         0.0788044 , -0.00604869, -0.05569676, -0.07010217, -0.0408107 , 
  23.        -0.10358225,  0.08519378,  0.16833456, -0.30366772,  0.17561394
  24.         0.14421709, -0.05016343,  0.13464174,  0.0646335 , -0.0262765 , 
  25.         0.02722404, -0.06028951, -0.19448066, -0.07304715,  0.0204969 , 
  26.        -0.03045784, -0.02818791,  0.06679841]) 

这些数字中的每一个代表面部编码的正交分量。

相似
现在让我们研究下一步-确定面孔之间的相似性。为此,我们需要加载更多图像。

让我们首先加载三个图像。加载图像时,我们还先找到人脸,再找到人脸编码。

  1. response = requests.get("https://raw.githubusercontent.com/solegaonkar/solegaonkar.github.io/master/img/rahul1.jpeg"
  2. image_of_person_1 = face_recognition.load_image_file(BytesIO(response.content)) 
  3. face_locations = face_recognition.face_locations(image_of_person_1) 
  4. person_1_face_encoding = face_recognition.face_encodings(image_of_person_1, known_face_locations=face_locations) 
  5.  
  6. response = requests.get("https://raw.githubusercontent.com/solegaonkar/solegaonkar.github.io/master/img/rahul2.jpg"
  7. image_of_person_2 = face_recognition.load_image_file(BytesIO(response.content)) 
  8. face_locations = face_recognition.face_locations(image_of_person_2) 
  9. person_2_face_encoding = face_recognition.face_encodings(image_of_person_2, known_face_locations=face_locations) 
  10.  
  11. response = requests.get("https://raw.githubusercontent.com/solegaonkar/solegaonkar.github.io/master/img/trump.jpg"
  12. image_of_person_3 = face_recognition.load_image_file(BytesIO(response.content)) 
  13. face_locations = face_recognition.face_locations(image_of_person_3) 
  14. person_3_face_encoding = face_recognition.face_encodings(image_of_person_3, known_face_locations=face_locations) 

现在,识别相似性并不困难。face_recognition模块提供了一个简单的API。

  1. face_recognition.compare_faces([person_1_face_encoding,person_3_face_encoding], person_2_face_encoding[0], tolerance=0.08

该方法检查要比较的两个面的每个分量,并告诉我们当前分量是否在公差范围内变化。上面的命令显示如下输出:

  1. [array([ True,  True,  True,  True,  True,  True,  True,  True,  True, 
  2.          True,  True,  True,  True,  True,  True,  True,  True,  True, 
  3.          True,  True,  True,  True,  True,  True,  True,  True,  True, 
  4.          True,  True,  True,  True,  True,  True,  True,  True,  True, 
  5.          True,  True,  True,  True, False,  True,  True,  True,  True, 
  6.          True,  True,  True,  True,  True,  True,  True,  True, False, 
  7.          True,  True,  True,  True,  True,  True,  True,  True,  True, 
  8.          True,  True,  True,  True,  True, False,  True,  True,  True, 
  9.          True,  True,  True,  True,  True,  True,  True,  True, False, 
  10.          True,  True,  True,  True,  True,  True,  True,  True,  True, 
  11.          True,  True,  True, False,  True,  True,  True,  True,  True, 
  12.          True,  True,  True,  True,  True,  True,  True,  True,  True, 
  13.          True,  True,  True,  True,  True,  True,  True,  True,  True, 
  14.          True,  True,  True,  True,  True,  True,  True,  True, False, 
  15.          True,  True]), 
  16.  array([ True,  True,  True,  True,  True,  True, False, False, False, 
  17.          True,  True,  True, False,  True,  True,  True, False,  True, 
  18.         False,  True,  True,  True,  True, False,  True,  True,  True, 
  19.         False,  True,  True,  True, False,  True,  True,  True,  True, 
  20.          True,  True,  True,  True, False,  True, False,  True,  True, 
  21.          True,  True,  True, False,  True, False,  True,  True,  True, 
  22.         False, False,  True,  True,  True,  True,  True, False,  True, 
  23.         False, False, False, False,  True, False,  True, False,  True, 
  24.         False,  True,  True,  True,  True, False,  True,  True,  True, 
  25.          True,  True,  True, False,  True,  True,  True, False,  True, 
  26.          True, False,  True,  True,  True,  True,  True,  True,  True, 
  27.          True,  True,  True,  True,  True, False, False,  True,  True, 
  28.         False, False, False,  True,  True, False,  True,  True,  True, 
  29.          True,  True,  True,  True,  True,  True, False, False,  True, 
  30.          True,  True])] 

这两个数组表示给定图像(在第二个参数中)与提供的列表(在第一个参数中)中每个已知面部编码的相似性。

我们可以看到第一个数组显示出更多相似性。可以正确识别该人。

数码化妆
如果您喜欢有趣,我们可以使用面部识别库做更多的事情。我们有一个API,可以帮助我们识别面部的各个特征。

  1. face_landmarks_list = face_recognition.face_landmarks(fr_image) 
  2. print(face_landmarks_list) 

这为我们提供了每个单独特征曲线的长长列表。

  1. [{ 
  2.     'chin': [(4647), (4554), (4462), (4469), (4477), (4684), (4991), (5495), (6197), (6897), (7695), (8491), (9087), (9481), (9775), (9968), (10160)],  
  3.     'left_eyebrow': [(5142), (5439), (5839), (6340), (6742)],  
  4.     'right_eyebrow': [(7544), (8044), (8644), (9047), (9351)],  
  5.     'nose_bridge': [(7048), (6852), (6756), (6660)],  
  6.     'nose_tip': [(6064), (6265), (6567), (6866), (7166)],  
  7.     'left_eye': [(5547), (5745), (6146), (6348), (6048), (5748)],  
  8.     'right_eye': [(7751), (8050), (8451), (8654), (8354), (7953)],  
  9.     'top_lip': [(5475), (5872), (6172), (6473), (6673), (7075), (7380), (7179), (6675), (6375), (6174), (5675)],  
  10.     'bottom_lip': [(7380), (6881), (6481), (6280), (6080), (5778), (5475), (5675), (6077), (6378), (6578), (7179)] 
  11. }] 

我们可以对此图像应用数字化妆。

  1. for face_landmarks in face_landmarks_list: 
  2.     pil_image = PIL.Image.fromarray(fr_image) 
  3.     d = PIL.ImageDraw.Draw(pil_image, 'RGBA'
  4.  
  5.     # Make the eyebrows into a nightmare 
  6.     d.line(face_landmarks['left_eyebrow'], fill=(000255), width=3
  7.     d.line(face_landmarks['right_eyebrow'], fill=(000255), width=3
  8.     d.polygon(face_landmarks['left_eyebrow'], fill=(000255)) 
  9.     d.polygon(face_landmarks['right_eyebrow'], fill=(000255)) 
  10.  
  11.     # Gloss the lips 
  12.     d.line(face_landmarks['top_lip'], fill=(000255), width=10
  13.     d.line(face_landmarks['bottom_lip'], fill=(000255), width=10
  14.  
  15.     d.polygon(face_landmarks['bottom_lip'], fill=(25500255)) 
  16.     d.polygon(face_landmarks['top_lip'], fill=(25500255)) 
  17.     d.line(face_landmarks['top_lip'], fill=(000255), width=2
  18.     d.line(face_landmarks['bottom_lip'], fill=(000255), width=2
  19.  
  20.     # Chin 
  21.     d.polygon(face_landmarks['chin'], fill=(2550016)) 
  22.  
  23.     # Apply some eyeliner 
  24.     d.line(face_landmarks['left_eye'] + [face_landmarks['left_eye'][0]], fill=(1000255), width=6
  25.     d.line(face_landmarks['right_eye'] + [face_landmarks['right_eye'][0]], fill=(1000255), width=6
  26.  
  27.     # Sparkle the eyes 
  28.     d.polygon(face_landmarks['left_eye'], fill=(25500200)) 
  29.     d.polygon(face_landmarks['right_eye'], fill=(25500200)) 
  30.  
  31.     display(pil_image) 

下面是我们得到的。

 

责任编辑:梁菲 来源: Python之眼
相关推荐

2022-02-17 09:24:11

TypeScript编程语言javaScrip

2024-01-16 07:46:14

FutureTask接口用法

2021-04-20 13:59:37

云计算

2020-06-30 10:45:28

Web开发工具

2024-01-12 07:38:38

AQS原理JUC

2017-01-18 15:38:20

语言

2020-03-08 16:45:58

数据挖掘学习数据量

2019-12-05 10:00:03

架构Redis服务器

2024-02-22 07:37:37

对象JVM内存

2009-11-09 12:55:43

WCF事务

2022-02-21 18:16:38

Go语言枚举

2023-12-27 08:15:47

Java虚拟线程

2020-11-03 09:20:30

MySQLOracle数据库

2013-06-28 14:30:26

2022-02-24 10:28:23

物联网

2021-12-17 07:47:37

IT风险框架

2009-11-05 16:04:19

Oracle用户表

2023-12-04 18:13:03

GPU编程

2020-06-29 07:42:20

边缘计算云计算技术

2019-07-18 17:08:56

物联网技术软件
点赞
收藏

51CTO技术栈公众号