主题
主题词抽取
插件名称: plug_theme
插件作用:用于从一段文本中同时抽取出主题词
任务串示例
配置示例
text
:数据处理:输入字段="IR_URLTITLE",任务="plug_theme",输出字段="主题"(SY_THEME);
任务串解释
- :数据处理:输入字段="IR_URLTITLE" :
- 每一组任务串都应以 :数据处理: 开头,末尾以 ; 英文分号结尾。
- IR_URLTITLE 为记录字段名,多个字段使用 + 加号分割,你可以自定义从一个或多个字段值中进行抽取。文本抽取前默认会清理 html 标签、转义字符等。
- 任务="plug_theme" :
- 任务插件固定名称:plug_theme
- 输出字段="主题"(SY_THEME) :
- "主题" 代表输出字段的描述,此处可以自行定义。
- (SY_THEME)代表抽取的主题词值 输出到哪个字段上,字段可以是记录中存在的,也可以自己定义。如果字段在记录中存在,记录的原有值会被覆盖为当前值。
- 注意 "主题"(SY_THEME) 引号和英文括号是必须的格式。