敏感词过滤
敏感词过滤是微语客服系统的重要安全功能,能够自动检测和处理访客或客服人员发送的不当内容,包括政治敏感、色情低俗、辱骂攻击等不文明字眼,营造健康的沟通环境。
版本说明
社区版不支持,请升级到企业版或平台版。请替换licenseKey
功能概述
核心能力
-
实时过滤
- 消息发送 前自动检测敏感词
- 支持中英文及多语言敏感词识别
- 毫秒级响应,不影响聊天体验
-
智能识别
- 变体检测(如:拼音、谐音、符号替换)
- 上下文语义分析
- 多种规避手段识别
-
灵活处理
- 敏感词替换(星号、马赛克等)
- 消息拦截阻止发送
- 敏感等级分类处理
应用场景
访客端过滤
- 防止恶意骚扰:过滤辱骂、攻击性言论
- 维护平台形象:阻止色情、低俗内容
- 合规要求:符合网络安全法规要求
客服端过滤
- 规范服务用语:避免不当表达影响企业形象
- 防范法律风险:过滤可能引起纠纷的敏感表述
- 提升服务质量:引导使用专业、友好的沟通方式
敏感词分类
按内容类型分类
1. 政治敏感词
包含政治相关的敏感内容:
- 政治人物:涉及政治人物的不当言论
- 政治事件:敏感政治事件相关词汇
- 地区敏感:涉及敏感地区的争议性表述
2. 色情低俗词
包含不健康的色情内容:
- 色情描述:直接的色情描述词汇
- 性暗示:间接的性暗示内容
- 低俗用语:粗俗、不雅的表达
3. 辱骂攻击词
包含人身攻击和辱骂内容:
- 人身攻击:针对个人的恶意攻击
- 歧视言论:种族、性别、地域歧视
- 威胁恐吓:包含威胁性质的言论
4. 违法信息
包含违法违规内容:
- 欺诈信息:诈骗、虚假信息
- 违禁品:毒品、枪支等违禁物品
- 赌博相关: 赌博、博彩相关内容
按严重程度分级
高危级别
- 处理方式:直接拦截,禁止发送
- 典型内容:严重政治敏感、极端暴力内容
- 后续动作:记录日志,可能触发人工审核
中危级别
- 处理方式:替换为星号或提示词
- 典型内容:一般性辱骂、轻度色情暗示
- 后续动作:计入统计,达到阈值触发警告
低危级别
- 处理方式:仅记录,不影响发送
- 典型内容:边缘敏感词、争议性词汇
- 后续动作:用于数据分析和趋势监控
技术实现
检测算法
1. 关键词匹配
系统支持多种匹配方式:
- 精确匹配:完全匹配敏感词汇
- 模糊匹配:支持相似词汇检测
- 正则表达式匹配:支持复杂模式匹配
2. 智能变体检测
拼音替换检测:
- 示例:SB → 煞笔 → 傻X
- 检测原理:通过拼音对比识别替换词汇
符号分隔检测:
- 示例:傻*逼 → 傻@逼 → 傻 逼
- 检测原理:去除符号后进行词汇匹配
谐音替换检测:
- 示例:沙比 → 煞笔 → 傻X
- 检测原理:通过谐音词库识别替代表达
3. 语义分析
系统提供智能语义分析能力:
- 上下文分析:结合前后文判断词汇含义
- 情感倾向分析:识别消息的情感色彩
- 意图识别:判断用户的表达意图