‌ · 刷 脸 识 “ 网 红 ” 机器人 还 嫩 点 专家 建议 ， 生物识别 智能 进入 商用 ， 有 必要 运用 多种 生物 特征 交叉 比对 验证 来源 ： 南方 都市报 2016 年 07 月 01 日 版次 ： AA 19 作者 ： 卫 佳 铭 王 昱 珩 在 “ 寻找 网 红 童年 照 ” 环节 进行 观察 。 
人脸 识别 机器人 “ 蚂 可 ” 。 
6 月 30 日 下午 5 时 许 ， 杭州 西湖区 凤凰 创意 园 一 会场 ， 一 场 人机 识别 极限 对抗 大赛 正在 进行 。 
决战 双方 是 有着 超强 微观 识 物 能力 、 人称 “ 鬼才 之 眼 ” 的 王 昱 珩 和 人脸 识别 机器人 “ 蚂 可 ” 。 
双方 挑战 的 “ 道具 ” — — — 50 名 青春 靓丽 的 网络 红人 身着 统一 的 服装 站 在 舞台 一边 ， 舞台 另 一侧 大 墙上 密密麻麻 地 贴着 数 百 张 姑娘 们 的 自 拍照 。 
在 公证员 的 见证 下 ， 观众 从 现场 网 红中 随机 抽取 数位 。 
对 战 双方 需要 对 被 选中 者 进行 观察 后 ， 再 从 照片 墙 中 挑出 对应 的 照片 。 
比赛 共 分 三 场 且 难度 依次 递进 ， 前 两个 回合 ， 双方 打成 平手 。 
第 三轮 的 “ 寻找 网 红 童年 照 ” 却 将 人机 双方 置于 极限 挑战 之中 ： 十 多年 的 成长 脱 变 足以 让 人 的 容貌 发生 巨大 改变 ， 辨识 难度 巨大 。 
21 分 48 秒 ， 王 昱 珩 率先 按 下 按钮 ， 提交 答案 。 
7 分钟 后 ， 机器人 “ 蚂 可 ” 也 完成 了 识别 。 
答案 揭晓 ： 王 昱 珩 成功 认出 一 位 网 红 的 童年 照 ， 并 放弃 辨认 另 一 位 ， 而 此 轮 “ 蚂 可 ” 辨识 的 两位 网 红 照片 都 出现 差错 。 
赛后 ， 王 昱 珩 笑 称 事先 并 不 知道 比赛 内容 也 未经 彩排 ， “ 她们 ( 网 红 们 ) 的 变化 真的 太 大 了 。 
” 人脸 识别 机器人 “ 蚂 可 ” 的 研发 团队 负责人 陈继东 则 说 ， 人和 机器 各有所长 ， 此次 和 人类 最强 大脑 的 PK ， 说明 机器学习 人类 的 大脑 ， “ 还有 一 段 路 要 走 。 
” 历史 利用 人脸 识别 身份 从 “ 找 规律 ” 到 “ 对号入座 ” “ 利用 人脸 识别 身份 ” ， 人类 的 这个 想法 其实 早 在 百年 以前 就 已经 出现 。 
早 在 1888 年 ， 达尔文 的 表弟 、 英国 科学家 弗朗西斯 · 高尔顿 ， 在 发表 于 《 自然 》 杂志 上 的 文章 《 对于 人 的 识别 与 描述 》 就 提出 ， 用 一 组 数字 代表 不同 的 人脸 侧面 特征 ， 并且 还 对 人类 自身 的 人脸 识别 能力 进行 了 分析 。 
有关 “ 自动 人脸 识别 ” 最早 的 研究论文 ， 至今 也 有 五 十 年的历史 。 
直到 上世纪 九十年代 ， 人脸 识别 一直 都 未能 突破 最初 的 瓶颈 。 
这项 技术 在 一 开始 被 研究者 们 认为 是 一个 一般性 的 模式 识别 问题 ， 通俗 地 说 就是 “ 找 规律 ” 。 
不过 ， 最初 的 这 三 十 余 年间 ， 研究者 们 并 没 能 取得 多少 非常 重要 的 成果 ， 更 不 要说 “ 投入 应用 ” 了 。 
进入 20 世纪 90 年代 ， 麻省理工学院 人工智能 实验室 的 一 次 实验 ， 在 对比 了 基于 结构 特征 和 基于 模板 匹配 两 种 方法 的 识别 性能 之后 ， 得出 模板 匹配 的 方法 。 
其 识别 性能 ， 要 优于 此前 “ 基于 特征 ” 的 方法 。 
这次 试验 ， 基本 终止 了 此前 研究者 们 “ 找 规律 ” 的 研究 思路 。 
从 1991 年到 1997 年 ， 基于 “ 模板 匹配 ” 方法 ， 诞生 了 若干 具有 代表性 的 人脸 识别 算法 。 
最 负 盛名 的 当 属 麻省理工学院 特克 ( Turk ) 和 潘 特 ( Pentland ) 提出 的 “ 特征 脸 ” 。 
这 一 方法 的 思路 ， 是 将 许多 张 人脸 图像 变换 到 另 一 个子 空间 ， 将 图像 “ 降 维 ” ， 用 向量 的 形式 表现 出来 ， 并 在 平均 后 得到 平均 向量 ， 也就是 一 张 “ 平均 脸 ” 。 
进而 再 通过 计算 得到 “ 特征 向量 ” 即 “ 特征 脸 ” ， 并 通过 对 每张 人脸 与 “ 特征 脸 ” 相似性 的 计算 ， 来 实现 最终 的 “ 识别 ” 。 
和 之前 “ 找 规律 ” 的 思路 相比 ， 这种 思维 更 酷似 于 “ 对号入座 ” 。 
学习 “ 训练 ” 机器人 让 人脸 识别 真正 “ 落地 ” 与此同时 ， 人工智能 的 发展 也 进入 了 新 的 阶段 。 
人们 不再 满足 于 将 计算机 仅仅 当成 一 种 工具 ， 而是 在 思考 能否 建立 、 模拟 出 人脑 进行 分析 学习 的 神经网络 ， 让 机器 能够 模仿 人脑 的 机制 来 解释 数据 。 
通俗 地 说 ， 人们 想 让 机器 具备 思维 的 能力 ， 如同 Google 资深 院士 JeffDean 所 言 ， “ 我们 现在 最 需要 从 机器学习 中 取得 的 是 ‘ 理解力 ’ ” 。 
2006 年 ， 基于 这种 想法 ， 英国 科学家 Hinton 以 自己 此前 对 “ 人工 神经网络 ” 的 研究 为 基础 ， 提出 了 “ 深度学习 ” 的 概念 。 
此后 的 几 年 里 ， Hinton 和 他 的 NCAP 团队 逐渐 建立 了 有效 的 深度学习 算法 ， 并且 在 2012 年 的 ImageNet 比赛 中 完胜 其他 参赛 团队 。 
利用 深度 模型 在 竞赛 中 学习 得到 的 特征 ， 可以 被 广泛 应用 到 其它 数据 集 和 各种 计算机 视觉 的 问题 。 
而 由 ImageNet 训练 得到 的 深度学习 模型 ， 更是 推动 计算机 视觉 领域 发展 的 强大 引擎 。 
2013 年 ， ImageNet 大规模 物体 检测 任务 挑战 中 最高 的 检测 率 只有 22.6% 。 
目前 ， 香港中文大学 由 欧阳 万里 、 王 晓 刚 和 汤 晓 鸥 教授 带领 的 DeepID 团队 ， 将 此项 成绩 大幅 提高 至 50.3% ， 达到 全球 最高 。 
而 在 此 之前 ， DeepID 团队 还 在 LFW 人脸 识别 挑战 上 战胜 了 Facebook ， 并 在 全世界 范围 内 首 次 实现 了 机器 人脸 识别 算法 超越 人眼 ， 获得 了 高达 99.15% 的 识别率 。 
一旦 具备 “ 深度学习 ” 这种 能力 ， 机器 的 人脸 识别 功能 就 可以 变得 无比 强大 。 
机器 不再 需要 人为 输入 算法 来 指示 它 进行 对 图像 的 判别 ， 而是 在 一 种 更 高阶 的 体系 下 ， 让 机器 更加 自主 地 完成 这项 工作 。 
学界 广泛 认为 ， 深度学习 是 过去 十 年中 人工智能 领域 的 最大 突破 ， 在 计算机 视觉 、 语音 识别 、 自然 语音 处理 等 领域 有 许多 应用 。 
《 麻省理工 科技 评论 》 还 将 其 列入 2013 年 10 项 最 具 突破性 技术 。 
应用 从 实验室 进入 商用 刷 脸 需 降低 错误率 近 两 年 ， 深度学习 和 大数据 两 项 技术 的 相互作用 ， 大大 提高 了 人脸 识别 的 准确率 。 
生物识别 智能 开始 进入 商用 ， 尤其 是 金融 领域 ， 成为 数 家 互联网 公司 竞相 追捧 的 香 饽饽 。 
在 不久 的 将来 ， 人脸 识别 技术 或 将 逐步 可以 取代 密码 和 手机短信 校验 码 ， 用于 互联网 金融 的 身份 验证 基础 平台 。 
资深专家 陈继东 表示 ， 人脸 识别 的 互联网 级 应用 和 金融 级 应用 存在 很大 区别 。 
“ 身份 被盗 用 ， 直接 导致 财产 的 损失 。 
” 他 指出 ， 在 金融 行业 ， 对 人脸 识别 技术 的 误 识 率 要求 非常 高 。 
“ 人脸 识别 的 现实 应用 ， 不仅 要 做到 在 一 堆 照片 中将 同一 个人 识别 出来 ， 也 需要 将 不同 的 人 也 能 区分 出来 ， 这 才 是 最 难 的 一 点 。 
” 陈继东 强调 ， 识别率 和 误 识 率 应该 综合 起来 看 ， 尤其 是在 金融 行业 ， 必须 把 错误率 设 低 。 
这 一 点 ， 绝非 危言耸听 。 
人脸 识别 从 实验室 进入 商用 ， 尤其 是 金融 领域 ， 一个 大 的 技术 难点 ， 就是 如何 防伪 造 ， 比如 用 照片 或者 视频 来 代替 真人 。 
不过 ， 称 ， 人脸 数据 的 存储 是 经过 加密 处理 的 。 
即使 泄露 ， 被 人 拿走 的 图片 也 是 焦 的 ， 黑乎乎 的 一 片 ， 只有 算法 才能 还原 ， 普通人 根本 看 不 懂 。 
同时 ， 数据源 也 在 国家 的 有效 控制 之下 ， 一般 只有 具备 经营 资质 的 企业 才能 开通 此项 业务 。 
他 认为 ， 生物识别 智能 进入 商用 ， 尤其 是 金融 领域 ， 很 有 必要 运用 多种 生物 特征 交叉 比对 验证 。 
也就是说 ， 除了 人脸 识别 ， 还要 综合 运用 指纹识别 、 声 纹 识别 、 眼 纹 识别 等 多 因子 生物 特征 ， 更好 、 更 安全 地 服务 用户 。 
揭秘 如何 训练 人工智能 机器人 谢 忆 楠 介绍 ， 所谓 深度学习 ， 打 个 形象 的 比喻 就 像是 在 “ 教 小孩儿 ” 。 
在 深度学习 的 程序 中 ， 第 一个 步骤 是 人脸 检测 ， 即 在 一 张 照片 中 把 人脸 结构 勾画 出来 。 
随后 就要 在 人 脸上 进行 关键点 标注 ， 这 一 步 相当于 “ 训练 ” 程序 学习 观察 人 脸部 特征 。 
“ 这 相当于 一个 监督 式 学习 ， 我们 会 告诉 机器人 这个 人 到底 是不是 一 个人 。 
” 久而久之 ， 机器人 会 得出 一些 关键点 参数 。 
谢 忆 楠 向南 都 记者 举例 ， 人 的 两个 瞳孔 就是 两个 关键点 ， 瞳 距 在 判断 人脸 是否 为 同一 人 的 过程 中 所 占 权重 较 高 。 
众多 关键点 之间 相互 联系 ， 形成 一个 统一 的 函数 ， 该 函数 再 对应 不同 人脸 形成 一个 独有 的 数值 。 
“ 每个 人脸 都 有 属于 自己 的 数值 ” ， 谢 忆 楠 说 。 
以 蚂 可 为 例 ， 它 识别 用户 人脸 是从 二维 图片 中 提取 600 多个 关键点 ， 进行 交叉 验证 和 动态 识别 。 
出品 ： 南方 都市报 科学 新闻 工作室 主持 ： 陈 养 凯 采写 ： 南都 记者 卫 佳 铭 实习生 张 雅 婷 王洪 春 scroll 手机 看报 RightsReserved