使用深度学习的方法进行人脸解锁今天

文章插图
今天，我们将使用深度学习来创建面部解锁算法。要完成我们的任务需要三个主要部分。
1. 查找人脸的算法
1. 一种将人脸嵌入向量空间的方法
1. 比较已编码人脸的函数
人脸面孔查找和定位【使用深度学习的方法进行人脸解锁】首先，我们需要一种在图像中查找人脸的方法。我们可以使用一种称为MTCNN（多任务级联卷积网络）的端到端方法。
只是一点技术背景，所以称为Cascaded ，因为它由多个阶段组成，每个阶段都有其神经网络。下图显示了该框架。
文章插图
我们依靠facenet-pytorch中的MTCNN实现。
数据我们需要图像！我整理了一些照片，莱昂纳多·迪卡普里奥和马特·戴蒙。
遵循PyTorch最佳做法，我使用ImageFolder加载数据集。我创建了MTCNN实例，并使用transform参数将其传递给数据集。
我的文件夹结构如下：
./faces├── di_caprio│├── ....jpg├── matt_demon│├── ....jpg└── me│├── ....jpgMTCNN自动裁剪输入并调整其大小，我使用image_size = 160 ，因为模型将使用具有该尺寸的图像进行训练。我还要添加18像素的边距，以确保我们包括整个脸部。
import torchimport torchvision.transforms as Timport matplotlib.pyplot as pltfrom torch.utils.data import Dataset, DataLoaderfrom torchvision.datasets import ImageFolderfrom facenet_pytorch import MTCNN, InceptionResnetV1from pathlib import Pathfrom typing import Union, Callabledata_root = Path('.')# create the MTCNN networktransform = MTCNN(image_size=160, margin=18)ds = ImageFolder(root=data_root / 'faces', transform=transform)# our dataset is so small that the batch_size can equal to its lenghtdl = DataLoader(ds, batch_size=len(ds))ds[1]ds结构如下：
(tensor([[[ 0.9023, 0.9180, 0.9180, ..., 0.8398, 0.8242, 0.8242], [ 0.9023, 0.9414, 0.9492, ..., 0.8555, 0.8320, 0.8164], [ 0.9336, 0.9805, 0.9727, ..., 0.8555, 0.8320, 0.7930], ..., [-0.7070, -0.7383, -0.7305, ..., 0.4102, 0.3320, 0.3711], [-0.7539, -0.7383, -0.7305, ..., 0.3789, 0.3633, 0.4102], [-0.7383, -0.7070, -0.7227, ..., 0.3242, 0.3945, 0.4023]], [[ 0.9492, 0.9492, 0.9492, ..., 0.9336, 0.9258, 0.9258], [ 0.9336, 0.9492, 0.9492, ..., 0.9492, 0.9336, 0.9258], [ 0.9414, 0.9648, 0.9414, ..., 0.9570, 0.9414, 0.9258], ..., [-0.3633, -0.3867, -0.3867, ..., 0.6133, 0.5352, 0.5820], [-0.3945, -0.3867, -0.3945, ..., 0.5820, 0.5742, 0.6211], [-0.3711, -0.3633, -0.4023, ..., 0.5273, 0.6055, 0.6211]], [[ 0.8867, 0.8867, 0.8945, ..., 0.8555, 0.8477, 0.8477], [ 0.8789, 0.8867, 0.8789, ..., 0.8789, 0.8633, 0.8477], [ 0.8867, 0.9023, 0.8633, ..., 0.9023, 0.8789, 0.8555], ..., [-0.0352, -0.0586, -0.0977, ..., 0.7617, 0.7070, 0.7461], [-0.0586, -0.0586, -0.0977, ..., 0.7617, 0.7617, 0.8086], [-0.0352, -0.0352, -0.1211, ..., 0.7227, 0.8086, 0.8086]]]), 0)数据集返回张量。让我们可视化所有输入。它们已通过MTCNN图像进行了归一化，最后一行的最后三张图像是我自己的自拍照:)
文章插图
嵌入向量空间我们的数据已准备就绪。为了比较人脸并找出两个人脸是否相似，我们需要在向量空间中对它们进行编码，如果两个人脸相似，则与它们相关联的两个向量也都相似（接近）。
我们可以使用在一个著名的人脸数据集（例如vgg_face2）上训练的模型，并使用分类头之前的最后一层的输出（潜在空间）作为编码器。
在这些数据集之一上训练的模型必须学习有关输入的重要特征。最后一层（在完全连接的层之前）对高级功能进行编码。因此，我们可以使用它将输入嵌入向量空间中，希望相似图像彼此靠近。
详细地，我们将使用在vggface2数据集上训练的初始Resnet 。嵌入空间的尺寸为512 。
resnet = InceptionResnetV1(pretrained='vggface2').eval()with torch.no_grad():for (imgs, labels) in dl:embs = resnet(imgs)breakembs.shapetorch.Size([8, 512])完美，我们有8张图片，我们获得了8个矢量
相似度计算为了比较向量，我们可以使用cosine_similarity来查看它们彼此之间的距离。余弦相似度将输出[-1 ， 1]之间的值。在朴素的情况下，两个比较的向量相同，它们的相似度为1 。因此，最接近1的相似度。
现在，我们可以在数据集中找到每对之间的所有距离。
import seaborn as snsimport numpy as npsimilarity_matrix = torch.zeros(embs.shape[0], embs.shape[0])for i in range(embs.shape[0]):for j in range(embs.shape[0]):similarity_matrix[i,j] = torch.cosine_similarity(embs[i].view(1, -1), embs[j].view(1, -1))fig = plt.figure(figsize=(15, 15))sns.heatmap(similarity_matrix.numpy(), annot = True,)numicons = 8for i in range(numicons):axicon = fig.add_axes([0.12+0.082*i,0.01,0.05,0.05])axicon.imshow(un_normalize(ds[i][0]).permute(1,2,0).numpy())axicon.set_xticks([])axicon.set_yticks([])axicon = fig.add_axes([0, 0.15 + 0.092 * i,.05,0.05])axicon.imshow(un_normalize(ds[len(ds) - 1 - i][0]).permute(1,2,0).numpy())axicon.set_xticks([])axicon.set_yticks([])


上一页
1
2
下一页
		  	


















会员|美容院使用会员管理软件给顾客更好的消费体验！ 

桌面|日常使用的软件及网站分享 篇一：几个动态壁纸软件和静态壁纸网站：助你美化你的桌面 

QuestMobile|QuestMobile：百度智能小程序月人均使用个数达9.6个 

深度|iPhone12到底值得买吗 深度体验一周我发现了这些 

轻松|使用 GIMP 轻松地设置图片透明度 

电池容量|Windows 自带功能查看笔记本电脑电池使用情况，你的容量还好吗？ 

采用|iPhone12mini和iPhone7深度对比：值得升级吗 

设计|未来创意拒绝被垄断：欧拉共创成果深度解读！ 

撕破脸|使用华为设备就罚款87万，英政府果真要和中国“撕破脸”？ 

X50|vivo X50 Pro+深度测评：全能影像机皇登场