Skip to content

观点抽取

插件名称: plug_opinion

插件作用:对文本进行负面和非负面进行分析,获取观点结果、观点得分

服务依赖:ckm8

观点分析模板包括一个主题分类的规则分类模板和一个基于 fastext 的褒贬二分类模板;

./data/OP/demo 目录下只包括一个配置文件,格式如下:

rule_path=../../RULECAT/edu //指向规则分类模板地址

fast_path=../../FT/edu_mod2 //指向 fasttext 的分类模板地址

其中,edu_mod2 是用 ai.trs.cn/ckm-dl 里的教育褒贬训练数据集训练生成的。

处理过程是:

对于输入的文本,先拆分成句子,调用规则分类,看是否属于给定的主题;

如果属于特定的主题,则调用褒贬二分类模板,进行分类,将分类结果累加到给定的主题下;

最后对每个主题的褒贬分类结果进行汇总计算,输出结果:

如 edu:-1.00; economy:0.5;

任务串示例

配置示例
text
:数据处理:输入字段="IR_URLTITLE",任务="plug_opinion",参数列表="++++",输出字段="观点结果"(SY_OPINION),输出字段="观点系数"(SY_OPINION_NUM);

任务串解释

  • :数据处理:输入字段="IR_URLTITLE" :
    1. 对输入的字段的文本进行观点分析
  • 任务="plug_opinion" :
    1. 任务插件固定名称:plug_opinion
  • 参数列表="++++" :
  • 输出字段="观点结果"(SY_OPINION),输出字段="观点系数"(SY_OPINION_NUM) :
    1. 观点结果对文本负面或非负面的结果作为抽取返回结果的存放字段的依据。

结果示例

{ "code": 1, "message": "操作成功", "result": "教育主题 师德师风;:-0.50;" }

数据业务研发中心