主题
媒体分级
插件名称: plug_media_standard
插件作用:根据域名库中媒体分级,对每条记录的站点进行分类打标。域名库信息存储在 eache 缓存中用来提高打标速度。
服务依赖:mysql 域名库表 trsom_url_dict ,【运维平台-词典管理-域名库管理】。
任务串示例
配置示例
text
:数据处理:输入字段="IR_SITENAME",任务="plug_media_standard",参数列表="OM_媒体库词典.dict+IR_SITENAME",输出字段="媒体性质"(SY_MEDIA_TYPE1),输出字段="媒体类型"(SY_MEDIA_TYPE2),输出字段="城市"(SY_MEDIA_CITY),输出字段="省份"(SY_MEDIA_PROVINCE),输出字段="大区"(SY_MEDIA_AREA),输出字段="是否校验"(SY_MEDIA_CHECKED),输出字段="国家"(SY_MEDIA_COUNTRY),输出字段="排名"(SY_MEDIA_RANK);
任务串解释
- :数据处理:输入字段="IR_SITENAME" :
- 每一组任务串都应以 :数据处理: 开头,末尾以 ; 英文分号结尾。
- IR_SITENAME 为记录字段名,此处可以任意指定,但指定字段无效,系统会根据信息类型自动筛选字段进行媒体分级,内置详情如下:
- 媒体类型为 新闻、论坛、博客、app、电子报,境外 即 SY_INFOTYPE 字段值为 1/2/3/5/7/8 时,输入字段为:IR_SITENAME (默认)
- 当媒体类型为微博,即 SY_INFOTYPE 字段值为 4 时,输入字段为:IR_ACCOUNT_UID
- 当媒体类型为微信,即 SY_INFOTYPE 字段值为 6 时,输入字段为:IR_CHANNEL
- 当媒体类型为 facebook、twitter、youtube、instagram、vk、linked 时,即 SY_INFOTYPE 字段值为 12/13/14/15/16/17 时,输入字段为:IR_ACCOUNT_UID
- 任务="plug_media_standard" :
- 任务插件固定名称:plug_media_standard
- 参数列表="OM_媒体库词典.dict+IR_SITENAME" :
- 多个参数之间使用加号 + 分割。
- 此处参数为系统内置,不可修改
- 输出字段="媒体性质"(SY_MEDIA_TYPE1),输出字段="媒体类型"(SY_MEDIA_TYPE2),输出字段="城市"(SY_MEDIA_CITY),输出字段="省份"(SY_MEDIA_PROVINCE),输出字段="大区"(SY_MEDIA_AREA),输出字段="是否校验"(SY_MEDIA_CHECKED),输出字段="国家"(SY_MEDIA_COUNTRY),输出字段="排名"(SY_MEDIA_RANK) :
- "媒体性质"、"媒体类型"、"城市"、"省份"、"大区"、"是否校验"、"国家"、"排名",代表输出字段的描述,你可以任意指定修改,但指定无效,系统已经内置结果输出。
- (SY_MEDIA_TYPE1)、(SY_MEDIA_TYPE2)、(SY_MEDIA_CITY)、(SY_MEDIA_PROVINCE)、(SY_MEDIA_AREA)、(SY_MEDIA_CHECKED)、(SY_MEDIA_COUNTRY)、(SY_MEDIA_RANK) 代表结果值输出到那个字段,你可以任意指定,但指定无效,系统已经内置结果输出。
- 当前系统内置域名打标输出如下:
含义 myql-trsom_url_dict 海贝库字段 默认值 媒体排名 rank SY_MEDIA_RANK 媒体所属国家 country SY_MEDIA_COUNTRY 是否校验 - SY_MEDIA_CHECKED 1 媒体地域 area SY_MEDIA_AREA 媒体所属省份 province SY_MEDIA_PROVINCE 媒体所属城市 city SY_MEDIA_CITY 媒体所属区县 county SY_MEDIA_COUNTY 一级分类 level1 SY_MEDIA_TYPE4 二级分类 level2 SY_MEDIA_TYPE5 三级分类 level3 SY_MEDIA_TYPE3 媒体中文名称 name_zh IR_SITENAME_ZH