3.10.4.3.     依存句法分析

一、功能描述

·                                 依存句法分析接口可自动分析文本中的依存句法结构信息,利用句子中词与词之间的依存关系来表示词语的句法结构信息(如主谓动宾定中等结构关系),并用树状结构来表示整句的结构(如主谓宾定状补等)。

基本

·                                 显示名称:活动的显示名称。

输入

·                                 APIKey您的APIKey

·                                 SecretKey您的SecretKey

·                                 文本:待分析文本(目前仅支持GBK编码),长度不超过256字节

输出

·                                 结果词法分析结果。

选项

·                                 模型模型选择,默认值为yes(web模型)no(query模型)
Web模型:该模型的训练数据来源于全网网页数据,适用于处理网页文本等书面表达句子。query模型:该模型的训练数据来源于用户在百度的日常搜索数据,适用于处理信息需求类的搜索或口语query

三、具体步骤
1、关于如何取得APIKeySecretKey,请参考4.2.6如何调用百度云OCR

2、在使用此组件时,需要输入待分析文本,同时需要创建一个String类型的变量用于接收输出结果,输出结果如图3.10.4.3-1

3.10.4.3-1

3、输出结果详细信息如下:

·                                 log_id:本次请求的唯一标识码。

·                                 id:词的ID

·                                 word:词。

·                                 postag:词性,可参考下方的词性取值范围。

·                                 head:词的父节点ID

·                                 deprel:词与父节点的依存关系,可参考下方的依存关系标识。

词性取值范围,如图3.10.4.3-2

3.10.4.3-2

依存关系标识:

·                                 定中关系ATT:定语和中心词之间的关系,定语对中心词起修饰或限制作用。如:工人/n师傅/n(工人/n ← 师傅/n)。

·                                 数量关系QUNquantity:量词或名词同前面的数词之间的关系,该关系中,数词作修饰成分,依存于量词或名词。如:三/m/q(三/m ← /q)。

·                                 并列关系COOcoordinate:两个相同类型的词并列在一起。如:奔腾/v咆哮/v的怒江激流(奔腾/v → 咆哮/v)。

·                                 同位关系APPappositive:所指相同、句法功能也相同的两个并列的词或词组。如:我们大家 (我们大家)。

·                                 附加关系ADJadjunct:一些附属词语对名词等成分的一种补充说明,使意思更加完整,有时候去掉也不影响意思。如:约/d 二十/m /m /q /a /n (二十/m → /m,米/q → /a)。

·                                 动宾关系VOBverb-object:对于动词和宾语之间的关系定义了两个层次,一是句子的谓语动词及其宾语之间的关系,我们定为OBJ,在下面的单句依存关系中说明;二是非谓语动词及其宾语的关系,即VOB。这两种关系在结构上没有区别,只是在语法功能上,OBJ中的两个词充当句子的谓语动词和宾语,VOB中的两个词构成动宾短语,作为句子的其他修饰成分。如:历时/v /m /q /m/q(历时/v → /q)。

·                                 介宾关系POBpreposition-object:介词和宾语之间的关系,介词的属性同动词相似。如:距/p球门/n(距/p → 球门/n)。

·                                 主谓关系SBVsubject-verb:名词和动作之间的关系。如:父亲/n 逝世/v 10/m 周年/q 之际/nd(父亲/n ← 逝世/v)。

·                                 比拟关系SIMsimilarity:汉语中用于表达比喻的一种修辞结构。如:炮筒/n 似的/u 望远镜/n(炮筒/n ← 似的/u)。

·                                 时间关系TMPtemporal:时间状语和其所修饰的中心动词之间的关系。如:十点以前到公司(以前到)。

·                                 处所关系LOClocative:处所状语和其所修饰的中心动词之间的关系。如:在公园里玩耍(在玩耍)。

·                                 字结构DE:结构助词和其前面的修饰语以及后面的中心词之间的关系。如:上海/ns /u 工人/n(上海/ns ← /u,的/u ← 工人/n)。

·                                 字结构DI:在构成上同DE类似,只是在功能上不同,DI通常作状语修饰动词。如:方便/a /u 告诉/v 计算机/n(方便/a ← /u,地/u ← 告诉/v)。

·                                 字结构DEI:助词同其后的形容词或动词短语等构成字结构,对前面的动词进行补充说明。如:讲/v /u /d /a(讲/v → /u,得/u → /a)。

·                                 字结构SUO字为一结构助词,后接一宾语悬空的动词做字结构的修饰语,字经常被省略,使结构更加简洁。如:机电/b 产品/n /u /v 比重/n 稳步/d 上升/v(所/u ← /v)。

·                                 字结构BA:是主谓句的一种,句中谓语一般都是及物动词。如:我们把豹子打死了(把/p → 豹子/n)。

·                                 字结构BEI:是被动句,是主语接受动作的句子。如:豹子被我们打死了(豹子/n ← /p)。

·                                 状中结构ADVadverbial:状中结构是谓词性的中心词和其前面的修饰语之间的关系,中心词做谓语时,前面的修饰成分即为句子的状语,中心词多为动词、形容词,修饰语多为副词,介词短语等。如:连夜/d 安排/v 就位/v(连夜/d ← 安排/v)。

·                                 动补结构CMPcomplement:补语用于对核心动词的补充说明。如:做完了作业(做/v → 完)。

·                                 兼语结构DBLdouble:兼语句一般有两个动词,第二个动词是第一个动作所要表达的目的或产生的结果。如:[7]曾经/d [8]使/v [9]多少/r [10]旅游/n [11]/n [12]/v [13]/n [14]惊叹/v [15]/wp(使/n /v使/v → 惊叹/v)。

·                                 关联词CNJconjunction:关联词语是复句的有机部分。如:只要他请客,我就来。(只要请 ,就来)。

·                                 关联结构 CS(conjunctive structure):当句子中存在关联结构时,关联词所在的两个句子(或者两个部分)之间通过各部分的核心词发生依存关系CS。如:只要他请客,我就来。(请来)。

·                                 语态结构MTmood-tense:汉语中,经常用一些助词表达句子的时态和语气,这些助词分语气助词,如:吧,啊,呢等;还有时态助词,如:着,了,过。如: [12]答应/v [13]孩子/n [14]/k [15]/u [16]要求/n [17]/u [18]/wp [19]他们/r [20]/r [21]/v [22]/v [23]事业/n [24]/u [25]/wp[12]答应/v ← [17]/u[21]/v ← [24]/u)。

·                                 连谓结构VVverb-verb:连谓结构是同多项谓词性成分连用、这些成分间没有语音停顿、书面标点,也没有关联词语,没有分句间的逻辑关系,且共用一个主语。如:美国总统来华访问。(来华/v → 访问/v)。

·                                 核心HEDhead:该核心是指整个句子的核心,一般是句子的核心词和虚拟词(或ROOT)的依存关系。如:这/r 就是/v恩施/ns/d]便宜/a/u出租车/n/wp相当于/v北京/ns/u “/wp 面的/n ”/wp /wp /(就是/v ← /

·                                 前置宾语FOBfronting object:在汉语中,有时将句子的宾语前置,或移置句首,或移置主语和谓语之间,以起强调作用,我认识这个人这个人我认识。如:他什么书都读(书/n ← /v)。

·                                 双宾语DOBdouble object:动词后出现两个宾语的句子叫双宾语句,分别是直接宾语和间接宾语。如:我送她一束花。(送/v → /r,送/v → /n)。

·                                 主题TOPtopic:在表达中,我们经常会先提出一个主题性的内容,然后对其进行阐述说明;而主题部分与后面的说明部分并没有直接的语法关系,主题部分依存于后面的核心成分,且依存关系为TOP。 如:西直门,怎么走?(西直门走)。

·                                 独立结构ISindependent structure:独立成分在句子中不与其他成分产生结构关系,但意义上又是全句所必需的,具有相对独立性的一种成分。如:事情明摆着,我们能不管吗?

·                                 独立分句ICindependent clause:两个单句在结构上彼此独立,都有各自的主语和谓语。如:我是中国人,我们爱自己的祖国。(是爱)

·                                 依存分句DCdependent clause:两个单句在结构上不是各自独立的,后一个分句的主语在形式上被省略,但不是前一个分句的主语,而是存在于前一个分句的其他成分中,如宾语、主题等成分。规定后一个分句的核心词依存于前一个分句的核心词。该关系同连谓结构的区别是两个谓词是否为同一主语,如为同一主语,则为VV,否则为DC。如:大家/r/v /r “/wp 麻木/a /n ”/wp /wp /v起来/v 怪怪的/a /wp(叫/v → /v)。

·                                 叠词关系VNV verb-no-verb or verb-one-verb):如果叠词被分开了,如是 不 是看一看,那么这几个词先合并在一起,然后预存到其他词上,叠词的内部关系定义为:(1→不;不2) 。

·                                 一个词YGC:当专名或者联绵词等切散后,他们之间本身没有语法关系,应该合起来才是一个词。如:百度。

·                                 标点WP:大部分标点依存于其前面句子的核心词上,依存关系WP