请选择 进入手机版 | 继续访问电脑版

#楼主# 2020-9-13

跳转到指定楼层
自然语言处理的一般架构,如下图所示,左侧是语法层面的模块,包括中文分词、词性标注及句法解析。大家对这部分应该比较熟悉。
nlp.png

右侧则偏重于语义层面,今天我们主要来看看这部分。

1、命名实体识别主要用来识别语料中专有名词和未登录词的成词情况,如人名、地名、组织机构名称等,也包括一些特别的专名。该图中来自左侧的箭头表示命名实体识别受到中文分词和词性标注的影响。
换句话说,准确的命名实体识别是以准确的分词和词性标注为前提的。

2、语义组块用来确定一个以上的词汇构成的短语结构,即短语级别的标注,主要识别名词性短语、动词性短语、介词短语等,以及其他类型的短语结构。


3、语义角色标注是以句子中的谓语动词为中心预测出句子中各个语法成分的语义特征,是句子解析的最后一个环节,也是句子级别语义研究的重要里程碑。


语义组块、语义角色标注等分析结果,可以通过机器学习方法转换为知识库中的RDF形式,并直接用于自动问答系统。









上一篇:Word2Vec与one-hot-vector模型的区别
转播转播 分享淘帖
回复

使用道具

成为第一个回复人

AI产品经理
小黑屋|AI产品经理社 |京ICP备19051683号-1
Powered by 长弓PM   © 2019-2050