Watson首日参加《危险边缘》:人机僵持中

Niky 发表于:11年02月15日 09:51 [原创] 服务器在线

  • 分享:
[导读]今天的比赛沃森开始一路领先,正确迅速的回答了披头士的歌曲和文学作品角色的两个类别的问题。

DOIT资讯 2月15日国际报道: “深蓝”不败,“沃森”来袭!十五年后,IBM重磅推出超级电脑“沃森”,再次向人类的冠军发出挑战,与肯•詹宁斯和布拉德•鲁特在电视智力竞赛节目《危险边缘》中展开对决。

此前,IBM方面向外界宣布,超级电脑沃森将于下周在美国知名的电视智力竞赛节目《危险边缘》上与两位人类冠军展开对决。此次的人机大战将共分两场比赛,为期三天。沃森在比赛的时候并不需要接入互联网,而是利用多个算法应对竞赛中的挑战。冠军可以获得100万美元的奖金,而亚军也可以获得30万美元的奖金,一旦获奖,IBM计划将全部的奖金都捐给慈善组织。

今天上午8点开始,Watson正在美国比赛现场,挑战两位智力竞赛达人,IBM中国研究院的数位专家:潘越、倪渊、滕晓菲及张雷正在新浪微博上现场解答网友提问,而ID为IBM100的微博帐号正在做文字现场直播。

IBM中国研究院倪渊新浪微博透露,今天的比赛沃森开始一路领先,正确迅速的回答了披头士的歌曲和文学作品角色的两个类别的问题。而在今天比赛第二阶段,“人类选手追了上来。有些问题,沃森知道答案,但是抢答的速度没有人类选手快。“

此后经过一番苦战,三位选手的奖金分别为:Watson 5000美元、Brad now 5000美元 、Ken 2000美元,此前Watson一路领先,但随后有好几题的答案都在可信度阈值之下,因此没有抢答,被人类选手赶了上来。

在微博直播上有看到美国广播公司的视频直播的网友“偶是雨也是R”表示:“刚才看到有道题。沃森和旁边的选手说了一样的答案(都是错的)。也就说沃森不能根据人类选手已经错误的答案筛选自己的答案。”他认为,这可能是Watson设计上的一个小小的缺憾,询问是否能够在随后得到解决,但目前尚未有回复。

———内容持续更新,间隔20-30分钟———

———今日战绩———

今天为期半小时的人机对战比赛已经结束,明天比赛还将继续。本场结局是沃森:5000;Brad Rutter:5000;Ken Jennings:2000。

———详细战况———

据新浪微博帐号IBM100直播显示:第一轮结束时沃森得分还领先, 沃森:5200, Ken Jennings:200, Brad Rutter:400,而在第二轮开始后,Watson开始被人类选手迎头赶上,沃森也开始不断出错,比赛成绩一度为, 沃森:5000;Ken Jennings:2000, Brad Rutter:5000。

此后,沃森最高分达到了6400分,但随着4个抢答问题回答错误,分数被降低到了5000分。

———微问答:———

网友:能否简单介绍这次机器软硬件在哪方面进行了升级,从而能更好适应这种特定字符的搜索?

IBM中国研究院-张雷:DeepBlue开发并使用了一些针对下棋的专用硬件,而这次使用的完全是市场上买得到的基于Power7的通用服务器。90台服务器,每个4个CPU,每个CPU8个核。

网友@Lewind松鼠:就信息的丰度和准确度而言,沃森肯定强于人脑。我觉得对沃森的真正挑战在于能否在无外界帮助的情况下正确理解主持人提出的问题,是吗?

IBM中国研究院-张雷:理解问题是Watson系统的挑战之一。其实,Watson存储的信息也有很多不准确的。所以如何去伪存真也是Watson系统要解决的重要问题。

网友@yzll2010:Watson的技术是不是和WolframAlpha搜索引擎用的技术差不多啊?

IBM中国研究院-张雷:Watson的知识源包括各种书籍、文档、网页和结构化数据,而WolframAlpha自己手工制作了结构化数据。我们推测两者的算法是很不同的。参见Stephen Wolfram的blog:http://sinaurl.cn/hGkYV0

网友@狂牛祭坛:不过到现在仍然深以为:英语是一种崇尚简单的语言,并无很多拐弯抹角。相信沃森用中文参加的时候,会大败无疑。如:中国队大胜美国队,中国队大败美国队,是一个意思。再上点文言文,呃

IBM中国研究院-潘越:中文比英文来讲,语法更为复杂一些,由于语法和词义的多样性造成的歧义非常严重。但国内的高校、研究机构一样,包括IBM中国研究院,很早就从事这方面的研究了。由中文信息学会主办的中文信息处理国际会议就是代表性的一个连续性的关于中文计算处理的国际学术会议,具有很高的学术水准。

网友@偶是雨也是R:刚才看到有道题。沃森和旁边的选手说了一样的答案(都是错的)。也就说沃森不能根据人类选手已经错误的答案筛选自己的答案。这样的问题以后有可能得到解决么?

IBM中国研究院-潘越:你观察的没错,沃森目前没有观察人类选手已给出的答案。如果要解决这一问题需要使用ASR(自动语音识别)技术,目前沃森并不包含这一技术。但IBM也是这一技术的领先者,没有采用是因为统筹考虑的结果。

网友@何山_HeShan:能说一说你们是否在中文方面有过相似的积累,或者说相关的技术是否能够应用到中文的问答系统吗?

IBM中国研究院-潘越:IBM中国研究院和国内其它高校、研究机构一样,很早就从事中文信息处理方面的研究,并研制出了相关的产品和解决方案,如中文知识管理软件包和市场情报门户等,在机器翻译、中文信息的分类、文本摘要、语言搜索等方面有较强的技术力量。

网友@NEO的一片田地:请教,您认为今天比赛后期,Watson频频犯错的原因是?

IBM中国研究院-潘越:原因有很多。其中之一是:沃森收录的信息是不全面的,可能某类多一些,某类少一些;对于较少的信息可能找不到答案,但也有可能找到错误的答案,而且因为信息较少无从判断错误答案的可信度。

网友@崔昊Niky:过多的信息,是否也就意味着过多的答案,虽然信息增多了,但是也会增加沃森犯错的概率?

IBM中国研究院-潘越:是的,怕的是似是而非的答案。沃森采用了根据证据对答案排序的方法。证据来自于相关信息。如果是似是而非的错误的答案,它也会有很多貌似的证据。

IBM中国研究院-张雷:没错。研制Watson中的主要困难之一就是要在大量信息中去伪存真。

网友@e吴凌:过多的信息,是否也就意味着过多的答案,虽然信息增多了,但是也会增加沃森犯错的概率?

IBM中国研究院-潘越:回复@e吴凌: 沃森需要这样,但不仅仅是因为这个。沃森的机器并非世界上最快的,大概还不能排进前100或500。但沃森所采用的DeepQA的技术集成了各种自然语言理解以及相关技术,使得它能够达到与人类同等的水平。

IBM中国研究院-张雷:人脑对问题和答案的判断有着某种直觉。机器只能对所有相关信息和证据逐一处理,如果算得不够快是不行的。

[责任编辑:崔昊]
Niky
SPARC T5与SPARC M5处理器及其相应计算系统的上市,也标志着这一重要的产品家族对客户的承诺得到了相应的保证。
官方微信
weixin
精彩专题更多
联想发布“腾云计划”正式进入云市场,同时推出ThinkServer Gen5,在众说纷“云”的云时代里联想推出云战略正当其时,服务器产品线的更新便是联想云时代里前行的新生力量。
2014年11月6号,HPC China 2014大会在广州长隆酒店正式召开。本次会议由中国计算机学会主板,中国计算机学会高性能计算专业委员会、中山大学和广东工业大学承办。
思科UCS:突破性能极限 重新定义平台
 

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心

Copyright © 2013 DOIT Media, All rights Reserved.