手机浏览器扫描二维码访问
同时语音识别的规模,从几百词上升到了两万多词,堪称革命性的发展。
最重要的是贾里尼克的研究得出一个结论。
即:
随着数据量的不断提升,系统会变得越来越好。
因此,国际上的人工智能研究分成了两派。
一派是模仿人的鸟飞派,一派是数据驱动派。
而后者之所以没有迅速发展起来,主要是因为数据获取非常困难。
第一,当时没有机读资料。
第二,很多文学明珠不同版本分散在不同国家,并且其翻译常常不是一一对应。
当然还有很多其它原因就不一一细说了。
但,这个困难在互联网时代被改变了。
它的出现,让研究机构可以轻易获得全球的机读资料。
而且数据量还在随着互联网的发展,每年呈几倍,甚至十几倍的增长。
在庞大的数据支持下,从1994年到2004年的十年里,语音识别的错误率减少了一半。
而机器翻译的准确性提高了一倍。
其中20%的贡献来自方法的改进,80%来自数据量的提升。
再就是今年2月份,在美国召开的全球机器翻译系统大赛。
鸿蒙和Google通过数据驱动的方法,取得了50%以上的BLEU分数。
比著名的南加州大学、IBM沃森实验室等研究机器翻译几十年的顶尖研究机构领先了5%。
而提高这五个百分点在过去需要研究5~10年的时间。
在中文到英文的翻译中,鸿蒙的得分比第三名领先了17%,同样采用数据驱动方法的Google比第二名领先了15%,这个差距已经超出了一代人的水平。
而鸿蒙和Google都是成立不超过十年的新公司。
在人工智能研发上的底蕴肯定没有南加州和沃森实验室深厚。
但我们却超过了他们。
原因是我们比他们更优秀吗?
不是。
那么差距是怎么产生的?
很简单。
作为全球最大的两个搜索公司,鸿蒙必应和Google都拥有庞大的搜索数据库。
而且我们每年都在对全球所有的图片、图书、报刊数据化。
这让我们掌握着全球最大的数据库。
南加州大学和IBM沃森实验室虽然人才比我们多,研究基础比我们深厚。
但他在数据量上远远不如必应和Google。
所以,他们落后了。
这次比赛的结果在人工智能领域产生了巨大的影响。
从我们得到的消息来看,全球绝大部分科研机构都放弃了传动的‘鸟飞派’方法,改用了数据驱动的方法。
也就是说,2005年将成为全球人工智能领域的分水岭。
从今年开始,鸟飞派将被彻底抛弃,数据驱动将成为唯一的主流。
...
池棠穿书了,穿成娃综文里的恶毒女配。 女主傻白甜人设,炫老公炫儿子火爆全网,她恶毒人设,打骂儿子引来无数网暴。 她在娃综里奔赴火葬场,为女主爆红添砖加瓦? 池棠姐就是大女主剧本,自己的...
妖魔东京我的手办变成诡异是躺赢一直爽精心创作的科幻,旧时光文学实时更新妖魔东京我的手办变成诡异最新章节并且提供无弹窗阅读,书友所发表的妖魔东京我的手办变成诡异评论,并不代表旧时光文学赞同或者支持妖魔东京我的手办变成诡异读者的观点。...
主角重生于1986年的东北农村,这个年代不禁猎不禁枪,山中野兽众多,野生人参肆意生长,河里珍贵河鲜无数。 主角过起了偶尔打打猎,挖挖大人参,钓钓大河鲜的美好日子,他只要求自己的家人吃好穿暖,幸福简单就可以了。各位书友要是觉得狩猎在1986还不错的话请不要忘记向您QQ群和微博里的朋友推荐哦!...
持幽冥魔剑,承天道神力,修轮回之光,登王者之路,最强魔尊降世,谁与争锋!...
...