主题
媒体分级 - 通用
插件名称: plug_media_standard_common
插件作用:根据域名库中媒体分级,对每条记录的站点进行分类打标。域名库信息存储在 redis 中用来提高打标速度。
服务依赖:mysql 域名库表 trsom_media ,【对应新华财经 后台管理-数据管理-域名库管理】。可根据不同项目结构配置不同的域名库,在参数中指定表名,设置海贝字段与 mysql 字段的对应关系即可。
任务串示例
配置示例
text
:数据处理:输入字段="IR_URLNAME",任务="plug_media_standard_common",参数列表="SY_MEDIA_TYPE1-industry_sector#SY_MEDIA_TYPE2-media_weight#IR_ACCOUNT_VERIFIED-certification#SY_MEDIA_COUNTRY-nation#SY_MEDIA_AREA-region#SY_MEDIA_PROVINCE-province#SY_MEDIA_CITY-city+trsom_media",输出字段="行业领域"(SY_MEDIA_TYPE1),输出字段="媒体权重"(SY_MEDIA_TYPE2),输出字段="城市"(SY_MEDIA_CITY),输出字段="省份"(SY_MEDIA_PROVINCE),输出字段="大区"(SY_MEDIA_AREA),输出字段="账号认证"(IR_ACCOUNT_VERIFIED),输出字段="国家"(SY_MEDIA_COUNTRY);
任务串解释
- :数据处理:输入字段="IR_SITENAME" :
- 每一组任务串都应以 :数据处理: 开头,末尾以 ; 英文分号结尾。
- IR_SITENAME 为记录字段名,此处可以任意指定,但指定字段无效,系统会根据信息类型自动筛选字段进行媒体分级,内置详情如下:
- 媒体类型为 新闻、论坛、博客、app、电子报,境外 即 SY_INFOTYPE 字段值为 1/2/3/5/7/8 时,输入字段为:IR_SITENAME (默认)
- 当媒体类型为微博、短视频,即 SY_INFOTYPE 字段值为 4,11 时,输入字段为:IR_ACCOUNT_UID
- 当媒体类型为微信,即 SY_INFOTYPE 字段值为 6 时,输入字段为:IR_CHANNEL
- 任务="plug_media_standard_common" :
- 任务插件固定名称:plug_media_standard_common
- 参数列表="海贝字段-mysql 字段对应关系+域名库表名" :
- 多个参数之间使用加号 + 分割。
- 海贝字段与 mysql 字段之间以中划线"-"连接,多个字段间用井号"#"分隔。
- 指定匹配的域名库表名,默认读取 application.properties 文件中 om.trs.mediaTable 指定的值。当此参数指定时,以任务配置的表名为主。
- 输出字段="行业领域"(SY_MEDIA_TYPE1),输出字段="媒体权重"(SY_MEDIA_TYPE2),输出字段="城市"(SY_MEDIA_CITY),输出字段="省份"(SY_MEDIA_PROVINCE),输出字段="大区"(SY_MEDIA_AREA),输出字段="账号认证"(IR_ACCOUNT_VERIFIED),输出字段="国家"(SY_MEDIA_COUNTRY) :
- "行业领域"、"媒体权重"、"城市"、"省份"、"大区"、"账号认证"、"国家",代表输出字段的描述,你可以任意指定修改,不会对任务结果产生影响。
- (SY_MEDIA_TYPE1)、(SY_MEDIA_TYPE2)、(SY_MEDIA_CITY)、(SY_MEDIA_PROVINCE)、(SY_MEDIA_AREA)、(IR_ACCOUNT_VERIFIED)、(SY_MEDIA_COUNTRY)代表结果值输出到那个字段,你可以任意指定,但指定无效,字段匹配与输出仅与第一个参数相关。
- 新华财经系统域名字段对应关系如下:
含义 myql-域名库 海贝库字段 默认值 行业领域 industry_sector SY_MEDIA_TYPE1 媒体权重 media_weight SY_MEDIA_TYPE2 认证类型 certification IR_ACCOUNT_VERIFIED 媒体所属国家 nation SY_MEDIA_COUNTRY 媒体地域 region SY_MEDIA_AREA 媒体所属省份 province SY_MEDIA_PROVINCE 媒体所属城市 city SY_MEDIA_CITY