Skip to content

媒体分级

插件名称: plug_media_standard

插件作用:根据域名库中媒体分级,对每条记录的站点进行分类打标。域名库信息存储在 eache 缓存中用来提高打标速度。

服务依赖:mysql 域名库表 trsom_url_dict ,【运维平台-词典管理-域名库管理】。

任务串示例

配置示例
text
:数据处理:输入字段="IR_SITENAME",任务="plug_media_standard",参数列表="OM_媒体库词典.dict+IR_SITENAME",输出字段="媒体性质"(SY_MEDIA_TYPE1),输出字段="媒体类型"(SY_MEDIA_TYPE2),输出字段="城市"(SY_MEDIA_CITY),输出字段="省份"(SY_MEDIA_PROVINCE),输出字段="大区"(SY_MEDIA_AREA),输出字段="是否校验"(SY_MEDIA_CHECKED),输出字段="国家"(SY_MEDIA_COUNTRY),输出字段="排名"(SY_MEDIA_RANK);

任务串解释

  • :数据处理:输入字段="IR_SITENAME" :
    1. 每一组任务串都应以 :数据处理: 开头,末尾以 ; 英文分号结尾。
    2. IR_SITENAME 为记录字段名,此处可以任意指定,但指定字段无效,系统会根据信息类型自动筛选字段进行媒体分级,内置详情如下:
      1. 媒体类型为 新闻、论坛、博客、app、电子报,境外 即 SY_INFOTYPE 字段值为 1/2/3/5/7/8 时,输入字段为:IR_SITENAME (默认)
      2. 当媒体类型为微博,即 SY_INFOTYPE 字段值为 4 时,输入字段为:IR_ACCOUNT_UID
      3. 当媒体类型为微信,即 SY_INFOTYPE 字段值为 6 时,输入字段为:IR_CHANNEL
      4. 当媒体类型为 facebook、twitter、youtube、instagram、vk、linked 时,即 SY_INFOTYPE 字段值为 12/13/14/15/16/17 时,输入字段为:IR_ACCOUNT_UID
  • 任务="plug_media_standard" :
    1. 任务插件固定名称:plug_media_standard
  • 参数列表="OM_媒体库词典.dict+IR_SITENAME" :
    1. 多个参数之间使用加号 + 分割。
    2. 此处参数为系统内置,不可修改
  • 输出字段="媒体性质"(SY_MEDIA_TYPE1),输出字段="媒体类型"(SY_MEDIA_TYPE2),输出字段="城市"(SY_MEDIA_CITY),输出字段="省份"(SY_MEDIA_PROVINCE),输出字段="大区"(SY_MEDIA_AREA),输出字段="是否校验"(SY_MEDIA_CHECKED),输出字段="国家"(SY_MEDIA_COUNTRY),输出字段="排名"(SY_MEDIA_RANK) :
    1. "媒体性质"、"媒体类型"、"城市"、"省份"、"大区"、"是否校验"、"国家"、"排名",代表输出字段的描述,你可以任意指定修改,但指定无效,系统已经内置结果输出。
    2. (SY_MEDIA_TYPE1)、(SY_MEDIA_TYPE2)、(SY_MEDIA_CITY)、(SY_MEDIA_PROVINCE)、(SY_MEDIA_AREA)、(SY_MEDIA_CHECKED)、(SY_MEDIA_COUNTRY)、(SY_MEDIA_RANK) 代表结果值输出到那个字段,你可以任意指定,但指定无效,系统已经内置结果输出。
    3. 当前系统内置域名打标输出如下:
      含义myql-trsom_url_dict海贝库字段默认值
      媒体排名rankSY_MEDIA_RANK
      媒体所属国家countrySY_MEDIA_COUNTRY
      是否校验-SY_MEDIA_CHECKED1
      媒体地域areaSY_MEDIA_AREA
      媒体所属省份provinceSY_MEDIA_PROVINCE
      媒体所属城市citySY_MEDIA_CITY
      媒体所属区县countySY_MEDIA_COUNTY
      一级分类level1SY_MEDIA_TYPE4
      二级分类level2SY_MEDIA_TYPE5
      三级分类level3SY_MEDIA_TYPE3
      媒体中文名称name_zhIR_SITENAME_ZH

数据业务研发中心