第一站 - 轻松上网从此开始!

上网第一站

当前位置: > SEO >

搜索引擎到人工智能的终极演进(2)

时间:2014-05-03 12:07来源:虎嗅网 作者2014-05-03 08:32 作者:跌名 点击: 我来投稿获取授权
以下内容来自网络或网友投稿,www.swdyz.com不承担连带责任,如有侵权问题请联系我删除。投稿如果是首发请注明‘第一站首发’。如果你对本站有什么好的要求或建议。那么都非常感谢你能-联系我|版权认领
互联网搜索的惊人效率与传统的信息搜索方式形成了鲜明对比,因此每个理性的人在获取信息时都会优先使用互联网搜索工具,在享受搜索带来的高效率时

  互联网搜索的惊人效率与传统的信息搜索方式形成了鲜明对比,因此每个理性的人在获取信息时都会优先使用互联网搜索工具,在享受搜索带来的高效率时贡献出个人信息,促使搜索工具对我们更加了解,从而在下次为我们提供更有效率、更准确、更个性化的搜索服务,随着信息获取速度和准确率的提高,我们也将更加频繁的使用搜索工具从而贡献出更多的个人数据……这便形成了Jeff Bezos提出的那个“飞轮模型”,一个封闭的良性循环过程。

  这个良性循环为搜索工具带来了持续增长的用户习惯和数据量,更重要的是当数据积累到一定程度,搜索引擎将掌握足够多的用户个人标签和行业标签,在多维度的信息整合后对用户和行业形成准确定义,从而通过自身的数据积累和挖掘为用户和行业提供更加智能的信息服务。而这个过程应该就是李彦宏在“大数据引擎”会议上提到的“技术变革的临界点”,也是副总裁王劲口中那个“百度多年深厚技术积累的一次质变过程”。定义个人的各种标签是一个个标准的数据元,这个把所有用户都贴上标准化的标签进行统计分析的过程就是会上提到的“量化自我”。而百度“大数据引擎”的相关负责人也提到除了搜索工具在PC端的积累,手机、可穿戴智能设备的增长也加速了数据量的增长,这将贡献可以“量化自我”的更多数字标签。

  因此,搜索引擎在数据挖掘方面的优势不仅体现在自身算法和计算能力,更是体现在对用户信息的量化分析和数据挖掘,并以此基础上提供的更加智能的信息服务。值得一提的是,这些有价值的标签只有经过长时间积累和长期用户沉淀才能取得,就像人与人只有在长期交流沟通后才能深入了解对方,机器对用户的了解也是建立在长期的、无数次交互的基础之上,而对用户的了解程度又决定了机器学习的核心算法。因此,已经在市场上占据领导地位的搜索引擎在这方面的优势会较为明显。

  3、技术奇点的出现

  在搜索引擎收集战略数据并进行数据挖掘之后,接下来将是实现人工智能的最后一个阶段——机器深度学习。搜索引擎实现从传统搜索到人工智能的过渡,不仅是因为自身积累的数据量达到了质变的水平,还因为硬件存储、云计算、超级计算、模拟神经网络等相关技术的成熟。

  搜索引擎可以凭借自身的独特优势成为此次技术变革中的领导者,并且他们也已经开始了相关的准备工作。谷歌很早就通过自主研发和收购的方式来汇集实现人工智能的必要技术,包括利用1.6万个处理器构建的模拟人脑神经系统的且具备学习功能的Google Brain;将收购的Deepmind的机器学习技术应用于声音和文本搜索以更好的读懂人类自然语言;将机器深度学习领军人物Geoffrey Hinton招致麾下。而百度也是国内第一家提出机器学习(百度大脑)和组建相关研究机构(IDL,百度深度学习研究院)的互联网公司;提出“少帅计划”招揽青年科学家;拥有了超越天河二号的超级计算能力;组建起了世界上最大的拥有200亿个参数的深度神经网络。这些技术都将与搜索引擎自身积累的数据优势一起成为他们率先进入人工智能领域的重要推动力。

  4、正确的机器学习之路

  在此前的文章《潜伏的强大暗流:终极智能的群组进化路径》中曾提过通往终极人工智能有两条道路,一是从理论研究出发,在完全掌握人类的智力原理后再通过技术进行复制;二是从基础技术和具体应用出发,结合人脑各阶段的研究成果来得到相应水平的人工智能,再通过漫长的技术进化提高智能水平。

  如果采取第一种途径,在没有完全弄清大脑原理之前,只对大脑结构进行模拟是没有任何实际意义的。因此,这种方式不适合要向用户持续提供服务的搜索引擎公司。加利福尼亚斯坦福大学的Andrew Ng完成了世界上最大的拥有110亿神经连接的人工大脑,但谷歌大脑工程的两位研究者指出这个神经网络计算机甚至都没达到老鼠的智力水平。

  长达十年且耗资数十亿欧元的欧盟人脑计划也没有把目标定为完全掌握人脑原理并对其进行模拟,而是一直在强调每个阶段的研究成果都要付诸实践,通过模仿部分人脑原理来创造出一些类人脑功能(Human-like)的智能系统或应用。而对于一直面向用户的搜索引擎来说更是如此,它们应该选择第二种自下而上的、分布式的智力实现方式,每一次技术的智能化革新都是从用户的实际需求出发,每一次技术进步都代表着机器智能的进一步发展。谷歌在收购Deepmind之后明确表示不会首先将其应用在机器人部门,而是先从基础的语义识别开始。而百度也是将深度学习技术应用在了具体的用户服务方面,比如说降低语音技术的相对错误率,提高中文语音识别率、完善图像识别能力、全球首个全网人脸搜索引擎等。

  上文提到,搜索引擎构建了人与信息的意识主动化的连接,而且用户与搜索引擎的每次交互都是一种相互了解、共同成长的过程。与其他互联网服务不同,用户在使用搜索引擎时也是在作为一个“开发者”参与其中,这也就是在百度“大数据引擎”开放日上北航校长讲到的,“一种超越众包的、融合计算机与人群”的软件开发新思路。

  5、基于人脑神经网络的机器学习

  人脑与计算机最大的区别就在于它是一种双向联系,可以不停地把新信息反馈回去,加固已有东西,这就是我们的学习功能。我们大脑的层级并非生而有之,与生俱来的是毫无关联的模块,相互之间没有形成任何模式,所有模块之间的连接和增强都是通过后天学习来实现的。

  我们大脑的学习和推理能力符合贝叶斯数学原则,推理是基于由经验而来的概率,我们在遇到新情况时,总是要追溯自己的已有记忆和经验,然后再根据新情况进行调整,最后得出一个概率相对较高的应对策略,所以我们才学会了如何应对这个或然的世界。我们在执行“贝叶斯原则”进行学习时,首先将遇到的新情况在此前的记忆和经验库中进行搜索和匹配,找到成功概率较高的决策付诸实践,然后再根据现实反馈进行调整,再重复上述过程,直到找到最佳方案。经过这样一次次的贝叶斯行动,我们构成了特定的自我,也形成了那种重要的学习能力。

  而目前先进的计算机技术可以使贝叶斯计算方法能够更加有效地执行,《最有人性的“人”》作者克里斯蒂安认为计算机将一改非1即0、非真即假的科学逻辑,能够理解和使用贝叶斯概率推理。在认识到人脑的学习原理之后,借助数字化“神经网络”来模拟大脑并独立的收集和反馈信息已经成为深度学习领域的一个突破性进展,例如,机器人专家Hod Lipson研发出的机器人在观察和触摸钟摆一整天之后,通过学习推算出了F=ma,而人类花费了几千年才得出这个公式。

(责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发布者资料
第一站编辑 查看详细资料 发送留言 加为好友 用户等级:注册会员 注册时间:2012-05-22 19:05 最后登录:2014-08-08 03:08
栏目列表
推荐内容
分享按鈕