Skip to content

主题词抽取

插件名称: plug_theme

插件作用:用于从一段文本中同时抽取出主题词

任务串示例

配置示例
text
:数据处理:输入字段="IR_URLTITLE",任务="plug_theme",输出字段="主题"(SY_THEME);

任务串解释

  • :数据处理:输入字段="IR_URLTITLE" :
    1. 每一组任务串都应以 :数据处理: 开头,末尾以 ; 英文分号结尾。
    2. IR_URLTITLE 为记录字段名,多个字段使用 + 加号分割,你可以自定义从一个或多个字段值中进行抽取。文本抽取前默认会清理 html 标签、转义字符等。
  • 任务="plug_theme" :
    1. 任务插件固定名称:plug_theme
  • 输出字段="主题"(SY_THEME) :
    1. "主题" 代表输出字段的描述,此处可以自行定义。
    2. (SY_THEME)代表抽取的主题词值 输出到哪个字段上,字段可以是记录中存在的,也可以自己定义。如果字段在记录中存在,记录的原有值会被覆盖为当前值。
    3. 注意 "主题"(SY_THEME) 引号和英文括号是必须的格式。

数据业务研发中心