新知一下
海量新知
5 9 7 5 7 5 1

案例解析|基于PaaS平台的静态数据脱敏实践

安华金和 | 让数据使用更安全 2021/11/25 11:35

伴随《数据安全法》《个人信息保护法》在2021年的先后施行,数据安全现已成为我国社会经济持续健康发展的重要前提和基础,亦是推动中国数据安全治理实践落地的核心要素。其中,数据脱敏技术作为必要的数据安全防护措施,受到政府、企业和组织等的广泛重视和应用。近年来,随着IT架构的不断变革与发展,PaaS平台作为云计算的重要组成部分,因其具备快速创建、灵活部署等特点,成为越来越多中大型企业客户新的计算服务模型,如何基于PaaS平台提供一套可灵活部署的数据脱敏解决方案,成为又一新的应用场景挑战。

新知达人, 案例解析|基于PaaS平台的静态数据脱敏实践

在此背景下,由 安华金和 自主研发的 静态数据脱敏系统 ,可支持基于PaaS平台虚拟化、容器化的部署方式; 通过采用Kubernetes和Docker主流技术方案,对数据脱敏系统进行统一的编排调度;同时,能够以租户模式交付资源,以容器形式交付应用,以降低用户使用数据脱敏系统的操作门槛,从而为PaaS平台中的敏感数据提供更强的数据安全保障。 目前,此方案已应用于国内某大型运营商(简称A运营商)PaaS平台,本文将就此案例进行内容分享。

背景&需求

A运营商自主研发的PaaS平台具有部署灵活、支持弹性扩展、技术生态统一共享等优点。 平台集中管理上万个集群节点,为大量业务系统提供计算资源管理、虚拟运行环境、技术组件、运营维护等服务,是客户集团内部资源规模最大、应用范围最广的PaaS平台。也正因如此, 该PaaS平台具有业务应用系统繁多、数据量庞大、数据库类型多样、部署分散等特点。 A运营商以往使用脚本脱敏的方式,但存在脱敏效率低、漏脱风险、缺乏统一分发和管理等问题,已无法满足当前平台中各租户的数据脱敏需求, 亟需建设一套基于PaaS平台可动态申请与回收、统一分发管理、各租户独立使用的数据脱敏系统 ,从而更好保障数据安全。经过对各租户实际使用场景的深入调研, 该数据脱敏系统还应满足以下需求:

1、支持PaaS平台统一身份认证对接,从而实现各租户以各自分配的账号登录脱敏系统;

2、支持数据脱敏系统授权证书的动态下发和回收功能,对PaaS平台中各租户对数据脱敏系统的使用进行统一授权和管理;

3、支持PaaS平台的Kubernetes容器编排技术,实现规模化Docker容器的组织和管理;

4、为保证系统具备持续安全运行及新功能部署的能力,数据脱敏系统需要具备统一的在线版本升级能力和在线漏洞修复机制;

5、由于各租户的业务系统使用的数据库类型和文件格式不统一,因此需要支持包括:MySQL、PostgreSQL、MariaDB、Vertica、TiDB、MongoDB、GBase、KingBase等数据库类型以及Hive、HBase等Hadoop大数据组件;同时,还应支持CSV、Excel、dmp等文件脱敏功能;

6、由于各租户业务系统的敏感数据类型不同,因此数据脱敏系统需要支持灵活的自定义脱敏规则和脱敏算法的能力,并具备高效、准确的敏感数据识别能力;

7、由于各租户的数据量较大,因此数据脱敏系统需要具备良好的脱敏性能;

8、由于脱敏后数据主要分发至开发测试部门或数据分析部门,因此脱敏后数据需要保持数据间的关联性、仿真性、合法性和一致性;

9、支持各租户在使用数据脱敏系统时审计日志的统一上传与统一管理,以满足监管与审计相关要求。

功能&优势

针对A运营商上述需求,安华金和静态数据脱敏系统支持PaaS平台容器化部署,具有敏感数据发现准、脱敏性能快、使用简单等特点, 具体包括:

1、支持与A运营商现有身份认证系统对接,实现登录账号的统一认证和统一权限管理;

2、支持统一的授权证书下发与回收机制,可对租户使用数据脱敏系统进行授权,并对使用时长进行统一管理;

3、支持Kubernetes容器编排技术,支持规模化Docker容器部署,从数据脱敏系统的镜像存储、镜像拉取、容器运行,到容器的停止、资源回收,实现全流程自动化编排部署;

4、数据脱敏系统支持统一在线升级机制——仅需在统一授权中心上传升级包,即可实现对使用中数据脱敏系统的升级,同时对镜像文件进行升级,以确保后续租户均可使用最新版本的数据脱敏系统,为数据脱敏系统的安全运行与持续更新提供有效保障;

5、数据脱敏系统支持包括:MySQL、PostgreSQL、MariaDB、Vertica、TiDB、MongoDB、GBase、KingBase等数据库类型,Hive、HBase等Hadoop大数据组件,以及CSV、Excel、dmp等文件的脱敏,租户可根据各自业务所使用的数据库或文件类型选择对应的数据源进行脱敏;

6、数据脱敏系统支持通过表达式或脚本的方式自定义敏感数据类型和脱敏算法,以满足各业务系统个性化的敏感数据自动识别与脱敏要求;

7、数据脱敏系统采用多线程并行计算的方式,可将脱敏性能发挥至最大化,以满足租户对脱敏时效性的要求;

8、数据脱敏系统内置针对常见敏感类型数据的脱敏算法,包括:仿真替换、仿真随机、字典替换、加密、遮蔽等策略,使脱敏后数据具有关联性、仿真性、合法性、一致性等特点;

9、数据脱敏系统采用Kafka消息发布订阅技术,将各租户的脱敏操作审计日志统一上传至PaaS平台的统一日志管理系统,对审计记录可视化呈现并统一管理,以满足监管与审计相关要求。

新知达人, 案例解析|基于PaaS平台的静态数据脱敏实践

安华金和静态数据脱敏系统

PaaS平台部署示意图

价值&收益

目前,安华金和数据脱敏系统已应用于A运营商某一级业务系统。 经过一段时间的使用,帮助该业务部门实现了“保障敏感数据安全、提升人员工作效率、节约投入资源成本”等需求和目标, 具体包括:

1、基于PaaS平台的动态部署方式具有快速灵活的特点,满足了各租户弹性使用数据脱敏系统的需求,为A运营商集团各部门的数据分发共享提供有效的数据安全保障;

2、数据脱敏系统的动态申请回收机制发挥了PaaS平台可动态扩缩的能力价值,同时节约了PaaS平台的计算和存储资源;

3、租户身份统一授权、统一管理,系统独立部署,且租户间独立使用各自的数据脱敏系统,做到资源和权限的完全隔离,更有效的保障相关数据安全;

4、使用敏感数据自动发现功能,帮助A运营商某业务部门自动梳理出20000余张敏感表,40000余个敏感字段,显著提高了梳理敏感数据的效率,降低敏感数据的泄露风险;

5、数据脱敏系统使用多线程并行脱敏技术,相比传统的脚本脱敏方式,其脱敏性能提升高达600%,开发测试人员能够更快地收到脱敏后数据,大大提升了数据分发的效率;

6、内置脱敏算法有效保证了脱敏后数据的关联性、仿真性、合法性和一致性,高质量的数据令开发测试人员无需调整程序即可直接使用,数据分析人员使用脱敏后数据进行分析的结果不失真,提升了人员的工作效率和质量;

7、各租户的数据脱敏操作审计记录可统一上传、统一审计、统一追溯,满足了A运营商集团对数据的安全管理要求,同时也满足了相关监管及合规性要求。

更多“数据脱敏”相关内容

更多“数据脱敏”相关内容

新知精选

更多新知精选