‌ · 刷 脸 识 “ 网 红 ” 机器人 还 嫩 点 专家 建议 , 生物识别 智能 进入 商用 , 有 必要 运用 多种 生物 特征 交叉 比对 验证 来源 : 南方 都市报 2016 年 07 月 01 日 版次 : AA 19 作者 : 卫 佳 铭 王 昱 珩 在 “ 寻找 网 红 童年 照 ” 环节 进行 观察 。 人脸 识别 机器人 “ 蚂 可 ” 。 6 月 30 日 下午 5 时 许 , 杭州 西湖区 凤凰 创意 园 一 会场 , 一 场 人机 识别 极限 对抗 大赛 正在 进行 。 决战 双方 是 有着 超强 微观 识 物 能力 、 人称 “ 鬼才 之 眼 ” 的 王 昱 珩 和 人脸 识别 机器人 “ 蚂 可 ” 。 双方 挑战 的 “ 道具 ” — — — 50 名 青春 靓丽 的 网络 红人 身着 统一 的 服装 站 在 舞台 一边 , 舞台 另 一侧 大 墙上 密密麻麻 地 贴着 数 百 张 姑娘 们 的 自 拍照 。 在 公证员 的 见证 下 , 观众 从 现场 网 红中 随机 抽取 数位 。 对 战 双方 需要 对 被 选中 者 进行 观察 后 , 再 从 照片 墙 中 挑出 对应 的 照片 。 比赛 共 分 三 场 且 难度 依次 递进 , 前 两个 回合 , 双方 打成 平手 。 第 三轮 的 “ 寻找 网 红 童年 照 ” 却 将 人机 双方 置于 极限 挑战 之中 : 十 多年 的 成长 脱 变 足以 让 人 的 容貌 发生 巨大 改变 , 辨识 难度 巨大 。 21 分 48 秒 , 王 昱 珩 率先 按 下 按钮 , 提交 答案 。 7 分钟 后 , 机器人 “ 蚂 可 ” 也 完成 了 识别 。 答案 揭晓 : 王 昱 珩 成功 认出 一 位 网 红 的 童年 照 , 并 放弃 辨认 另 一 位 , 而 此 轮 “ 蚂 可 ” 辨识 的 两位 网 红 照片 都 出现 差错 。 赛后 , 王 昱 珩 笑 称 事先 并 不 知道 比赛 内容 也 未经 彩排 , “ 她们 ( 网 红 们 ) 的 变化 真的 太 大 了 。 ” 人脸 识别 机器人 “ 蚂 可 ” 的 研发 团队 负责人 陈继东 则 说 , 人和 机器 各有所长 , 此次 和 人类 最强 大脑 的 PK , 说明 机器学习 人类 的 大脑 , “ 还有 一 段 路 要 走 。 ” 历史 利用 人脸 识别 身份 从 “ 找 规律 ” 到 “ 对号入座 ” “ 利用 人脸 识别 身份 ” , 人类 的 这个 想法 其实 早 在 百年 以前 就 已经 出现 。 早 在 1888 年 , 达尔文 的 表弟 、 英国 科学家 弗朗西斯 · 高尔顿 , 在 发表 于 《 自然 》 杂志 上 的 文章 《 对于 人 的 识别 与 描述 》 就 提出 , 用 一 组 数字 代表 不同 的 人脸 侧面 特征 , 并且 还 对 人类 自身 的 人脸 识别 能力 进行 了 分析 。 有关 “ 自动 人脸 识别 ” 最早 的 研究论文 , 至今 也 有 五 十 年的历史 。 直到 上世纪 九十年代 , 人脸 识别 一直 都 未能 突破 最初 的 瓶颈 。 这项 技术 在 一 开始 被 研究者 们 认为 是 一个 一般性 的 模式 识别 问题 , 通俗 地 说 就是 “ 找 规律 ” 。 不过 , 最初 的 这 三 十 余 年间 , 研究者 们 并 没 能 取得 多少 非常 重要 的 成果 , 更 不 要说 “ 投入 应用 ” 了 。 进入 20 世纪 90 年代 , 麻省理工学院 人工智能 实验室 的 一 次 实验 , 在 对比 了 基于 结构 特征 和 基于 模板 匹配 两 种 方法 的 识别 性能 之后 , 得出 模板 匹配 的 方法 。 其 识别 性能 , 要 优于 此前 “ 基于 特征 ” 的 方法 。 这次 试验 , 基本 终止 了 此前 研究者 们 “ 找 规律 ” 的 研究 思路 。 从 1991 年到 1997 年 , 基于 “ 模板 匹配 ” 方法 , 诞生 了 若干 具有 代表性 的 人脸 识别 算法 。 最 负 盛名 的 当 属 麻省理工学院 特克 ( Turk ) 和 潘 特 ( Pentland ) 提出 的 “ 特征 脸 ” 。 这 一 方法 的 思路 , 是 将 许多 张 人脸 图像 变换 到 另 一 个子 空间 , 将 图像 “ 降 维 ” , 用 向量 的 形式 表现 出来 , 并 在 平均 后 得到 平均 向量 , 也就是 一 张 “ 平均 脸 ” 。 进而 再 通过 计算 得到 “ 特征 向量 ” 即 “ 特征 脸 ” , 并 通过 对 每张 人脸 与 “ 特征 脸 ” 相似性 的 计算 , 来 实现 最终 的 “ 识别 ” 。 和 之前 “ 找 规律 ” 的 思路 相比 , 这种 思维 更 酷似 于 “ 对号入座 ” 。 学习 “ 训练 ” 机器人 让 人脸 识别 真正 “ 落地 ” 与此同时 , 人工智能 的 发展 也 进入 了 新 的 阶段 。 人们 不再 满足 于 将 计算机 仅仅 当成 一 种 工具 , 而是 在 思考 能否 建立 、 模拟 出 人脑 进行 分析 学习 的 神经网络 , 让 机器 能够 模仿 人脑 的 机制 来 解释 数据 。 通俗 地 说 , 人们 想 让 机器 具备 思维 的 能力 , 如同 Google 资深 院士 JeffDean 所 言 , “ 我们 现在 最 需要 从 机器学习 中 取得 的 是 ‘ 理解力 ’ ” 。 2006 年 , 基于 这种 想法 , 英国 科学家 Hinton 以 自己 此前 对 “ 人工 神经网络 ” 的 研究 为 基础 , 提出 了 “ 深度学习 ” 的 概念 。 此后 的 几 年 里 , Hinton 和 他 的 NCAP 团队 逐渐 建立 了 有效 的 深度学习 算法 , 并且 在 2012 年 的 ImageNet 比赛 中 完胜 其他 参赛 团队 。 利用 深度 模型 在 竞赛 中 学习 得到 的 特征 , 可以 被 广泛 应用 到 其它 数据 集 和 各种 计算机 视觉 的 问题 。 而 由 ImageNet 训练 得到 的 深度学习 模型 , 更是 推动 计算机 视觉 领域 发展 的 强大 引擎 。 2013 年 , ImageNet 大规模 物体 检测 任务 挑战 中 最高 的 检测 率 只有 22.6% 。 目前 , 香港中文大学 由 欧阳 万里 、 王 晓 刚 和 汤 晓 鸥 教授 带领 的 DeepID 团队 , 将 此项 成绩 大幅 提高 至 50.3% , 达到 全球 最高 。 而 在 此 之前 , DeepID 团队 还 在 LFW 人脸 识别 挑战 上 战胜 了 Facebook , 并 在 全世界 范围 内 首 次 实现 了 机器 人脸 识别 算法 超越 人眼 , 获得 了 高达 99.15% 的 识别率 。 一旦 具备 “ 深度学习 ” 这种 能力 , 机器 的 人脸 识别 功能 就 可以 变得 无比 强大 。 机器 不再 需要 人为 输入 算法 来 指示 它 进行 对 图像 的 判别 , 而是 在 一 种 更 高阶 的 体系 下 , 让 机器 更加 自主 地 完成 这项 工作 。 学界 广泛 认为 , 深度学习 是 过去 十 年中 人工智能 领域 的 最大 突破 , 在 计算机 视觉 、 语音 识别 、 自然 语音 处理 等 领域 有 许多 应用 。 《 麻省理工 科技 评论 》 还 将 其 列入 2013 年 10 项 最 具 突破性 技术 。 应用 从 实验室 进入 商用 刷 脸 需 降低 错误率 近 两 年 , 深度学习 和 大数据 两 项 技术 的 相互作用 , 大大 提高 了 人脸 识别 的 准确率 。 生物识别 智能 开始 进入 商用 , 尤其 是 金融 领域 , 成为 数 家 互联网 公司 竞相 追捧 的 香 饽饽 。 在 不久 的 将来 , 人脸 识别 技术 或 将 逐步 可以 取代 密码 和 手机短信 校验 码 , 用于 互联网 金融 的 身份 验证 基础 平台 。 资深专家 陈继东 表示 , 人脸 识别 的 互联网 级 应用 和 金融 级 应用 存在 很大 区别 。 “ 身份 被盗 用 , 直接 导致 财产 的 损失 。 ” 他 指出 , 在 金融 行业 , 对 人脸 识别 技术 的 误 识 率 要求 非常 高 。 “ 人脸 识别 的 现实 应用 , 不仅 要 做到 在 一 堆 照片 中将 同一 个人 识别 出来 , 也 需要 将 不同 的 人 也 能 区分 出来 , 这 才 是 最 难 的 一 点 。 ” 陈继东 强调 , 识别率 和 误 识 率 应该 综合 起来 看 , 尤其 是在 金融 行业 , 必须 把 错误率 设 低 。 这 一 点 , 绝非 危言耸听 。 人脸 识别 从 实验室 进入 商用 , 尤其 是 金融 领域 , 一个 大 的 技术 难点 , 就是 如何 防伪 造 , 比如 用 照片 或者 视频 来 代替 真人 。 不过 , 称 , 人脸 数据 的 存储 是 经过 加密 处理 的 。 即使 泄露 , 被 人 拿走 的 图片 也 是 焦 的 , 黑乎乎 的 一 片 , 只有 算法 才能 还原 , 普通人 根本 看 不 懂 。 同时 , 数据源 也 在 国家 的 有效 控制 之下 , 一般 只有 具备 经营 资质 的 企业 才能 开通 此项 业务 。 他 认为 , 生物识别 智能 进入 商用 , 尤其 是 金融 领域 , 很 有 必要 运用 多种 生物 特征 交叉 比对 验证 。 也就是说 , 除了 人脸 识别 , 还要 综合 运用 指纹识别 、 声 纹 识别 、 眼 纹 识别 等 多 因子 生物 特征 , 更好 、 更 安全 地 服务 用户 。 揭秘 如何 训练 人工智能 机器人 谢 忆 楠 介绍 , 所谓 深度学习 , 打 个 形象 的 比喻 就 像是 在 “ 教 小孩儿 ” 。 在 深度学习 的 程序 中 , 第 一个 步骤 是 人脸 检测 , 即 在 一 张 照片 中 把 人脸 结构 勾画 出来 。 随后 就要 在 人 脸上 进行 关键点 标注 , 这 一 步 相当于 “ 训练 ” 程序 学习 观察 人 脸部 特征 。 “ 这 相当于 一个 监督 式 学习 , 我们 会 告诉 机器人 这个 人 到底 是不是 一 个人 。 ” 久而久之 , 机器人 会 得出 一些 关键点 参数 。 谢 忆 楠 向南 都 记者 举例 , 人 的 两个 瞳孔 就是 两个 关键点 , 瞳 距 在 判断 人脸 是否 为 同一 人 的 过程 中 所 占 权重 较 高 。 众多 关键点 之间 相互 联系 , 形成 一个 统一 的 函数 , 该 函数 再 对应 不同 人脸 形成 一个 独有 的 数值 。 “ 每个 人脸 都 有 属于 自己 的 数值 ” , 谢 忆 楠 说 。 以 蚂 可 为 例 , 它 识别 用户 人脸 是从 二维 图片 中 提取 600 多个 关键点 , 进行 交叉 验证 和 动态 识别 。 出品 : 南方 都市报 科学 新闻 工作室 主持 : 陈 养 凯 采写 : 南都 记者 卫 佳 铭 实习生 张 雅 婷 王洪 春 scroll 手机 看报 RightsReserved