从词向量到概念发现,知识图谱让机器更加理解人类语言

原作者: 人工智能 收藏 分享 邀请

鲁迅师长教师说,“人类的悲欢并不相通,我只感觉他们吵闹”。而人工智能与人类智能之间的庞大鸿沟则首要源于说话的差别。机械说话是0,1二进制;相反,人类说话则姿势万千、丰硕多彩。若何才干让机械更好地舆解人类说话,从而为我们所用呢?

人类说话中存在年夜量的多义词、同义词等,统一个词在分歧语境下有分歧的概念,又或许明明是统一个概念却可以有多个词停止暗示。好比“我一边吃苹果,一边用苹果打德律风。”这句话中“苹果”一词呈现了两次,人们基于本身的知识可以敏捷判定出两个“苹果”所代表的分歧意思。机械可否跟人一样伶俐呢?经由过程极天信息的“文本概念辨认”东西停止辨认(如下图),经由过程概念途径可以发明,计较机也可以或许准确辨认出前一个“苹果”指生果,后一个“苹果”则代表公司品牌。

人工智能图片

“苹果”一词能否存在更多新寄义?要晓得,在现实使用中,我们往往要面临完整不熟习的范畴,怎样样疾速经由过程范畴常识练习找到一切焦点概念是重中之重。操纵极天信息Word2concept(简称W2C)概念发明东西停止辨认,成果得出“苹果”一共有三个概念成果,除了生果、公司品牌之外,还有蔬菜的概念。此外还可以发明以后练习的数据集中,“苹果”的三种概念,公司品牌所指呈现的概率是最高的,且与“诺基亚”“三星”有较高的相干度。

人工智能图片

那么,面临语义了解精准度越来越高的请求,而以后业界通用的词向量却无法处理一词多义的环境下,极天信息是若何做到让机械也具有“知识库”从而可以或许正确辨认分歧的概念呢?

现实上,自2007年以来,极天信息便对峙潜心研讨语义网(Ontology)与常识图谱(Knowledge)的构建和使用。Ontology是共享概念模子的明白的方式化标准申明(1998, Studer),其界说了概念及概念和概念之间的关系,使得人与人之间、人与计较机之间能基于共享的概念停止说话交换。历经多年研发,极天信息胜利推出通用常识图谱SemNet,并构成了“软件+方式+模子”的三位一体常识图谱办事系统,让企业可以体验到“开箱即用”的常识图谱办事,进一步下降了常识图谱构建的门槛,展开了丰硕的智能化使用。常识工程开创人Edward Feigenbaum曾说:“Knowledge is the power in AI system”。恰是得益于极天信息在常识图谱上的多年堆集,机械才干如上述所示表示如斯超卓,可以或许包管智能化使用的高精准度,进步语义了解的质量。

而常识图谱构建的根本东西之一就是W2C。操纵W2C概念发明东西,可以疾速发明新概念,以及类似概念之间的相干度,从而发明概念与概念之间的关系,终极辅佐构建范畴常识图谱。好比“奔跑”一词,经由过程W2C停止概念辨认,可以发明作为公司品牌呈现的概率达80%,作为动词呈现的概率则仅为20%;在公司品牌这一概念中,其与“宝马”的相干度又是最高的,有助于梳理出各个概念之间的关系。这关于新范畴的天然说话处置使命来说,将会带来非常可不雅的结果。

人工智能图片

总的来说,W2C概念发明东西尤其合适处置庞杂语义情况下的天然说话处置使命,利用也加倍便利与高效。此刻,极天信息将这一东西收费开放利用,但愿可以或许助推各个行业的人工智能使用加倍普遍、加倍深切。

1

鲜花

握手

雷人

路过

鸡蛋

刚表态过的朋友 (1 人)

该文章已有0人参与评论

请发表评论

全部评论

本文作者2020-3-30 04:11 PM
人工智能
粉丝1 阅读359 回复0

精彩阅读

排行榜

人工智能公众号

扫码微信公众号
我陪你畅想未来

最智能的人工智能网!
QQ:162057003
周一至周五 9:00-18:00
意见反馈:162057003@qq.com

扫一扫关注我们

Powered by Discuz! X3.4   © 2020 ( 鲁ICP备18055727号 )  |  |网站地图