脚本

介绍检测条件中的脚本及其相关知识。

检测条件介绍

脚本是指自然语言脚本,是一种使用python或C++语言开发的,可用于匹配自然语言表达的匹配条件。

统一内容安全UCS解决方案预置了大量的自然语言脚本检测条件,可用于检测数字类型的数据,例如信用卡号码以及身份证号码等。脚本检测条件为此做了大量优化,因此它通常比正则表达式更加精准。脚本整合了统计学分析和决策树等技术可同时分析内容及其关联的上下文。

脚本也可用于检测软件开发设计文档以及各种源代码文件。

检测条件配置

在策略配置页面,点击添加匹配添加例外,选择脚本,可将脚本检测条件应用至策略。

脚本检测条件可配置以下项目。

  • 必现 - 选择该规则是否为必现。即如需触发策略,该规则必须命中,然后再检测其它规则。

    例如:“员工信息”策略包含多个规则,中国手机号码、中国大陆二代身份证、普通证书和合同。其中,大陆身份证号(二代)和合同两项规则设置为必现,则必须匹配大陆身份证号(二代)和合同规则,方可触发安全策略。

  • 脚本 - 点击 ,从弹出的列表中选择策略中引用的脚本。

    如需了解预置脚本模板的更多信息,参考预置数据模板

    启用脱敏数据 - 选择是否启用脱敏数据,启用后,匹配信息部分数据将以*代替,并在事件、报告和通知中展示。匹配详情及证据显示将对敏感数据信息增加干扰,不能查看脱敏数据。

  • 匹配条件 - 可选择以下匹配条件。
    配置项 解释
    最少匹配 填写最小匹配阈值,当分析内容匹配次数达到阈值,才会命中策略。勾选统计重复内容,重复的内容会被记录为多次。
    不匹配 当分析内容与关键字不同的时候,会命中策略。
    统计重复内容 关键字匹配记录统计重复次数。如果不选择此项,每个关键字最大匹配次数为1。
  • HTTP匹配属性 - 选择全部内容则匹配包括HTTP Body和HTTP Header的所有内容。 选择指定内容则可以指定匹配Body或者header。
  • Email匹配属性 - 可配置以下Email匹配属性。
    匹配 介绍
    全部内容 检测Email所有属性,包含信封(收件人地址)、首部(用户代理或者邮件服务器添加的信息,如Received、Message-ID、From、Data、Reply-To、X-Phone、X-Mailer、To和Subject)、正文(发送方发给接收方的内容,如body、attachment)。
    指定内容 指定Email检测属性,可选择正文、附件、主题、收件人、发件人、抄送接收方、密送接收方、所有邮件头或自定义邮件头。
  • 文档匹配位置 - 选择文档匹配的位置,包括文件名,页眉,正文,页脚和MetaInfo。
    注: 文档匹配位置检测仅适用于包含此类可用于文档匹配的位置属性的文件,如Word、Excel、PPT等Office类型文件。

    文件名包含邮件等包含附件的内容中,附件的文件名。

    Metainfo(默认不选中)选项用于匹配文件的Meta元数据内容。

  • 同时匹配 - 点击为同一规则设置多个其他的同时匹配例外的内容。也可以忽略同时匹配,仅使用单一的匹配例外条件。