微软新认知技术，让真实世界可被识别和“搜索”

您当前的位置：环亚科技网新闻正文

2017-09-09 11:18:53 阅读：4069+ 来源：新浪科技 作者：曾轶可

我们对搜索引擎都很熟悉了，但如果我告诉你，有一个系统可以像搜索引擎索引数字信息和内容一样，对真实世界里的环境、物体和人进...

我们对搜索引擎都很熟悉了，但如果我告诉你，有一个系统可以像搜索引擎索引数字信息和内容一样，对真实世界里的环境、物体和人进行索引，让你可以搜索它们……你相信吗？

想象这样一个场景：

你今天在公司的三个会议室开了五个会，到下班时却突然忘记手机丢在哪个会议室里了。如果你可以在电脑上打开一个界面，对聊天机器人说：“我的手机在哪里？”它就能帮你找到，打开那个会议室的摄像头，看到里面现在有没有人。

当然，如果它还可以调取会议室的记录，让你查看是否有人曾经动过你的手机，就更棒了。

甚至可以更进一步：

假设你是公司的 CEO，你可以提前在公司的办公系统里记录你的手机、平板电脑和笔记本电脑，然后设置一个政策：如果有不是你的其他人靠近你的闲置设备，立刻向你的活跃设备推送一条通知；如果有人拿起或者开始操作你的设备，你的所有设备都会响起警报，公司 IT 部门也会得到通知……

是不是很鹅妹子嘤？

让真实世界像数字世界一样，可索引、可搜索、可查询、可编程和可交互（有点像IFTTT 的逻辑），正是微软正在做的事情。今天在西雅图举行的 Build 2017 开发者大会上，该公司 CEO 萨提亚·纳德拉宣布了一项名为 AI for Workspace Safety 的新技术，旨在帮助企业客户更好地对工作环境，特别是那些高安全级别、高危险的工作环境、资产和人员进行管理。

AI for Workplace Safety 目前仍处于早期测试阶段。它的核心是微软的认知服务 (Cognitive Services)，以计算机视觉为主。微软在 Build 上展示了一个建筑行业的场景：

通过调取微软的认知服务-计算机视觉 API，工地现场的摄像头每秒可以进行 2700 万次扫描，识别环境中的 1）记录在册的建筑工具 2）记录未记录在册的人员。识别结果将会是可搜索的，微软的演示者在一个 demo 聊天软件里输入“凿岩机(jackhammer)在哪里？”系统立刻回复她“在地上”（下图）。

过了一会，系统又发现了操作员使用完凿岩机后没有正确地将机器放到原处，于是发出了报警，告知了具体操作人员：

微软还展示了怎样通过简单的对话界面去管理员工权限：一名未授权人员进入了房间，摄像头通过人脸识别发现了这一情况，立刻记录了数十张照片，向监工发出报警。查看照片后，监工确认她是今天刚加入团队的新工人，通过一个对话框，很快就完成了新员工的信息录入和权限部署：“设定 Alice 为只可以使用本房间内的工具”

在另一个场景里，一位叉车司机在操作叉车时不小心推倒了一个液体罐，导致液体泄漏，但因为现场噪音和气味复杂而没有发现。系统在扫描画面时发现了这个异样，立刻向监工发出警报，问题很快被解决，避免了进一步的污染情况出现。

在西方国家，绝大部分建筑工地都会安装摄像头。过去，摄像头的画面会连接到工地的管理处；现在，很多摄像头都联网了，让更先进的建筑公司可以远程管理工地的情况。微软的这项技术建立在这一基础上，但实现这些从未见过功能的，其实是微软的后端人工智能，结合了计算机视觉和微软的云端软件堆栈 AzureStack。你可以理解为，认知服务就是新的爬虫，让现实世界中的物体可以被索引、搜索和交互。

微软认知服务最早出现在两年前。当时微软在自己的服务器里部署了一些训练好的人工智能 API，提供给任何第三方开发者使用。如果你对那个曾经很火的猜年龄应用 How-Old.Net 有印象，它其实就是微软为了推广认知服务，利用其中的人脸识别 API 开发的一个应用场景。到目前，认知服务已经涵盖了计算机视觉、语音识别、语音处理、知识结构和搜索 5 个领域共 29 个 API——如果任何人想开发带有人工智能功能的应用、服务，那么认知服务可以说是最适合被拿来搭建的“积木”，人工智能界的“乐高”。

去年年底，微软整合了一些产品部门和团队以及微软研究院，成立了新的“人工智能和微软研究事业部”，由微软研究院创始成员，该公司全球执行副总裁沈向洋博士领导。今年一月，在接受PingWest品玩专访时，沈向洋透露新事业部有一个（很激进的）小目标：3-5 年内实现每年贡献一百亿美元收入。从 AI for Workplace Safety 来看，只用不到半年的时间，微软已经用现有人工智能技术找到了赚钱的市场——企业级市场，或者更具体一点，工业。

沈向洋在 Build 2017 上对媒体表示，微软很注重人工智能的科研，”我是做科研出身的，做的很开心，结果被鲍尔默赶出来做产品。“鲍尔默是微软前 CEO。

玩笑之余，他也表示微软对于人工智能技术的商业化也十分看重。他指出新事业部的商业逻辑有两个：1）思考人工智能可以和什么行业结合，甚至颠覆这些行业；2）以微软的技术，能够创造哪些新的“10亿元级别”生意。“但我要明确的是，微软从来不认为人工智能需要取代人类，我们思考的是怎样用它去增强人类已有的能力，帮助我们获得更强的生产力。”沈向洋说。

在今天的 Build 2017 的主题演讲中，微软 CEO 纳德拉比较隐晦地提出了一件在 PingWest品玩看来其实很重要的事：微软的新口号。

没错，听上去“移动为先云为先”(Mobile first, cloud first) 已经到了推出历史舞台的时候了，而新的口号将会是“智能云和边缘计算”(Intelligent Cloud. Intelligent Edge)。

提出这一新口号的背景，是人工智能和计算技术的发展，正在将商业推向蒸汽机、信息技术之后的又一次重大模式转变 (paradigm shift)。对于微软而言，口号演变的背后是人工智能技术越来越多地出现在包括 Windows、Office 365 和 Azure 等重要产品中，直到最终有一天成为所有微软产品的后端技术。与此同时，人工智能和科研事业部在微软的重要性正在不断提高，贡献更多的收入，创造新的商业模式。AI for Workplace Safety 就是这一趋势的一个很好的案例。

“若干年后，很难想象任何技术的背后没有人工智能的影子……”沈向洋在一篇博客文章中提到，“人工智能拥有无穷的潜力，它有能力颠覆任何现有的垂直行业，比如银行或者零售业，还有任何单一的业务流程，比如销售、市场或者人力资源和猎头。”

他认为，尽管计算机视觉和自然语言理解技术都已经比较先进，但计算机目前尚不能对现实世界形成一个可靠和完整的认知。像 AI for Workplace Safety 这样对现实世界进行初步的索引和建模，似乎是一个靠谱的思路——更别提它的商业前景似乎也不错。

另一件纳德拉和沈向洋都提到的事情，是人工智能的道德问题。

事实上，AI for Workplace Safety 在看起来很高科技和高效率的同时，也很容易让人联想到它在道德方面的弱点：在你工作的时候，如果总有一个人或者计算机在观察着你的一举一动，矫正每一件你没做好的事情……细思极恐。这种感觉其实很像最近在北美上映的“科技惊悚电影”《The Circle》的剧情。电影里，科技公司 Circle 公司开发了一种微型摄像机，可以被藏到世界的每个角落，每一个人，甚至包括 Circle 的员工，都处于公司的监视之下，让人联想起乔治·奥威尔的著作《1984》里的设定。

《The Circle》（是一部大烂片，去看原著就行了）尝试希望说清楚的议题，确实很有讨论的必要：毫无疑问，有一天计算机视觉会被普及到世界的每个角落，当每一台摄像头每秒都可以扫描和识别 2700 万次，每一个麦克风都能随时开启随时倾听，每一个人的每一个举动都被暴露在一个系统的管理之下，每一条记录都被保留在某个“黑盒子”里——数据获取和个人/公共隐私之间的边界，到底应该如何划定？

在主题演讲中，纳德拉展示了《1984》的封面，并指出:“我们需要为自己创造的技术，自己开发的算法负责。我确实认为，我们需要自己努力，不让那些反乌托邦式的情境发生。”沈向洋则透露，由人工智能和科研事业部牵头，微软已经在内部成立了一个人工智能道德委员会，所有产品和业务部门都会派出自己的代表。该委员会的使命是推出一个指导原则，并监督公司所有部门在权衡道德、设计和发布产品时都遵守这个原则。

不知道这个原则的具体尺度怎么样。但我希望未来我在工作的时候，如果在厕所多呆了一分钟，我的老板不会收到什么通知……

上一篇：百度与招行合作推出百度一卡通

下一篇：自贡一教师收藏118位将军墨宝

网络设备

输入输出

配件专区

移动数码

软件

整机办公

数码配件

手机配件

微软新认知技术，让真实世界可被识别和“搜索”