主题
文本内容 html 过滤
插件名称: plug_filter_content
插件作用:清理文本内容中的 html 标签,注释标签,指定字符等。
服务依赖:无
任务串示例
配置示例
text
:数据处理:输入字段="IR_URLTITLE",任务="plug_filter_content",参数列表="html",输出字段="html 字符过滤"(IR_URLTITLE);
任务串解释
- :数据处理:输入字段="IR_URLTITLE" :
- 每一组任务串都应以 :数据处理: 开头,末尾以 ; 英文分号结尾。
- IR_URLTITLE 为记录字段名,此处可以为任意待过滤字段。
- 任务="plug_filter_content" :
- 任务插件固定名称:plug_filter_content
- 参数列表="html" :
- 多个参数之间使用加号 + 分割。
- "html": 代表要对文本中包含的 html 标签进行清理,你可以删除此段不适用参数配置,系统则默认只清理 html 注释标签,系统当前提供过滤正则规则为: (<!-.*?-/?>)
- 系统还支持了第 2 个参数,可以清理文本中含有的指定字符任务串示例如下: :数据处理:输入字段="IR_URLTITLE",任务="plug_filter_content",参数列表="html+[娱乐#火箭队#八卦 123]",输出字段="html 字符过滤"(IR_URLTITLE); 结果示例:输入字段:IR_URLTITLE=娱乐我爱北京天安门八卦 123 每一天 输出字段:IR_URLTITLE=我爱北京天安门每一天
- 输出字段="html 字符过滤"(IR_URLTITLE); :
- "html 字符过滤" 代表输出字段的描述,你可以任意写一个该输出字段的备注,比如 "内容清理"。
- (IR_URLTITLE) 代表清理后的结果值输出到哪个字段上,字段可以是记录中存在的,也可以自己定义。如果字段在记录中存在,记录的原有值会被覆盖为当前值。
- 注意 "html 字符过滤"(IR_URLTITLE) 引号和英文括号是必须的格式。