首页 > 动态中心 > 技术文章  >  正文

货拉拉数据加密治理实践

2023-06-15 00:00:00

文章摘要:背景在当前环境下数据安全、网络安全的重要性逐步提升。在网络安全法和个人信息保护法中也明确提出,企业需要针对敏感数据加强安全措施,敏感数据需要加密存储。针对数据加密已经有了非常成熟的技术,比如在应用侧加密,各个语言中也都有现成的加密函数,可以直接引用。但在实施数据加密过程中,我们发现面临成百上千的服务以及过亿的数据,加密的事情不仅仅是调用加密函数这样简单,而需要考虑,安全性、稳定性,以及投入成本等等

背景

在当前环境下数据安全、网络安全的重要性逐步提升。在网络安全法和个人信息保护法中也明确提出,企业需要针对敏感数据加强安全措施,敏感数据需要加密存储。针对数据加密已经有了非常成熟的技术,比如在应用侧加密,各个语言中也都有现成的加密函数,可以直接引用。

但在实施数据加密过程中,我们发现面临成百上千的服务以及过亿的数据,加密的事情不仅仅是调用加密函数这样简单,而需要考虑,安全性、稳定性,以及投入成本等等。货拉拉在推动数据加密落地过程中分为三个主要阶段,分别是数据调研、方案选型、加密改造 。

数据调研

在确定需要做数据加密后,第一阶段是展开了针对服务语言、数据存储组件、敏感数据分布的摸底调研,便于确定初步做加密的范围。

关于服务语言,一般企业内开发语言相对较统一,或者某一种是主流语言如Java、PHP、Go、Python等等,后续技术方案优先考虑企业内主流服务语言。数据存储组件,同服务语言,企业内数据存储组件较统一,按照是否结构化数据、是否持久化存储来进行摸底。

敏感数据分布调研,这部分是数据资产识别范畴,依据公司数据分类分级制度,对公司资产进行识别。优先以个人信息和重要数据的识别为主。

方案选型

方案选型是比较重要阶段,需要安全、研发架构、CI、DBA全部参与方案的讨论和选型,能多角度多立场评估方案,充分识别风险。

从数据流动过程看,各个环节有相应的加密技术,各技术的特点如下

我们结合加密要实现的目标,选取了相对较符合公司场景的加密技术来展开评估,应用层加密和数据库代理层加密。

首先是应用层加密,我们扩展了两个方向,一是统一敏感信息服务加密,二是各服务应用层加密。

统一敏感信息服务加密,是需要将敏感数据收敛至中台,减少数据落盘。

优点:数据汇总统一处理加密,也更便于后续敏感数据的统一管理;

挑战:对敏感信息服务的可靠性要求较高,且需要满足不同的业务场景;

更多待解决问题:

1)比如用户在注册前没有UserID,不能用UserID进行关联,只能用手机号用来判断其为新用户或老用户,数据将无法完全收口;

2)比如数据统一存入中台,如何进行手机号和用户之间关联关系的维护,用户修改号码,需要更改关联关系,会成为服务难点;

3)其次,数据收敛的改造成本和应用侧各自加密,成本相差无异,所以非新业务的场景,统一敏感信息服务加密并不是最优解。

各服务应用层加密,是在应用系统层面开发改造,数据入库加密,出库按需解密。

优点:处理灵活对数据库没有依赖。

挑战:涉及应用系统开发改造,工程量大,研发成本高,时间周期长。

数据库代理层加密,是在数据入库和出库时候,通过解析SQL,对传入的数据进行加密/解密,从而获得保护数据安全的效果。

优点:中间组件做数据加解密改造,上下游改动少,可扩展性更好,一定程度减少研发在应用侧的改造成本。

挑战:在高并发场景下,性能消耗较高,对业务应用稳定性影响非常大。

综上三个方案中,相对符合的是各服务应用层加密,虽然会有较高研发成本,但没有瓶颈限制,对业务的性能影响也最小。

方案选型结论是在内部发起了多轮评估达成的一致结论,期间针对较大争议点通过上升决策来处理。除此之外也对行业内其他公司的加密方案做了调研,来为内部评估提供参考。

加密改造

前期的方案选型经历了较长时间,因为一旦选定方向,再做调整会有较高成本。而在推动加密改造阶段,初期也是更多聚焦在密钥管理、加密算法、加密技术三方面上。在中后期业务接入更加关注如何平滑做加密切换。

密钥管理

首先是密钥管理,现在已经有了很多厂商提供了密钥管理服务,并且都使用硬件安全模块来托管密钥,符合监管合规。使用KMS可以让业务避免直接接触密钥,规避将密钥硬编码在代码中或者写入配置文件中带来的风险。另外KMS也采用了多重密钥的方案,如DK和KEK,避免明文数据密钥的直接暴露。

DK(Data Key,数据密钥),是直接对数据进行加密的密钥。KEK(Key Encryption Key,密钥加密密钥),是对DK进行加密的密钥。应用在本地加解密场景下的架构如下:

数据加密过程

1)生成数据明文DK和密文DK;(在KMS服务内使用KEK加密明文DK后生成的密文DK)

2)使用明文DK加密数据,产生密文数据;

3)持久化存储密文数据和密文DK;

数据解密过程

1)从持久化存储中获取密文数据密钥;

2)通过KMS对密文DK进行解密,获得明文DK;

3)使用明文DK对密文数据进行解密,获得明文数据;

KMS服务本身对密钥有生命周期的管理,包括密钥生成、轮转、禁用、删除等。除此之外在实际应用中,还需要对以下方面进行考虑:

1)密钥的分配维度

密钥的安全性和其加密的数据量成反相关,所以要尽量减少同一密钥所加密的数据量。密钥分配和加密方案相关,可以根据应用维度分配、或者数据库维度来分配。

2)密钥的轮转机制

在应用侧加解密的实践中,密钥轮转存在较高成本,所以前期可以通过合理分配密钥来降低风险,尽量规避频繁的做密钥轮转。但需要在方案设计时规划密钥轮转的能力,一方面应对因key泄漏导致的被动轮转;另一方面满足监管定期更换密钥的要求。

3)密文DK的持久化存储

数据解密时,需要从持久化存储中获取密文的数据密钥,密文的持久化存储根据加密对象的不同可以分为两类,在加密非结构化数据大文件时,采用“一话一密”模式,可以将加密后的大文件和密文DK打包一并存储;在加密结构化数据时,所加密的数据量巨大,不宜采用“一话一密”模式,需要将密文数据密钥单独存储。如果将数据密钥本身或者密钥的版本号和结构化数据的密文拼接存储,比如以下形式“b8a40b9cfa1975425f26e50fb64bc0e2&v1”,会破坏密文数据结构,给下游使用带来额外研发成本。所以针对结构化数据加密,需要分别单独存储密文和密钥。

加密算法

在选择加密算法时,需要使用更为安全的加密算法,如国密算法或者AES、RSA等;此外也需要结合业务场景,来选择更为合适的算法。

比如对称算法加解密速度较快适合大量数据的加密,而非对称算法比较慢,适合小数据量加解密或数据签名,此处根据实际业务场景选择即可。

加密技术

存量改造

推动业务做数据加密,最主要问题是针对存量数据的改造。新业务可以直接使用加解密工具实现,而存量数据加密改造,包括增量数据处理、历史数据清洗、切换过渡加密字段、以及对下游依赖和直接依赖库的影响评估等。以存量数据加密改造为例,改造步骤有下:

由此可见,在应用侧加密周期较长,且为复杂,所以需要保证尽可能提供统一技术方案,减少业务代码的改造。

一 提供加解密SDK

对常用加密算法进行统一封装,业务改造时引入SDK包,使用所提供方法进行本地加解密处理。使用原生SDK改造工程量较多,每个需加密的数据的写入和读取都需要逐一修改代码。

二 提供加解密组件

目前Java服务中大都使用Mybatis作为数据库持久层,可使用Mybatis Interceptor 拦截update、select、insert等命令,对参数和结果进行加密、解密处理。可简化代码改造,降低研发成本。仅需增加注解或配置即可。

虽然加解密组件可以简化代码改造,但也仅解决了增量数据的加、解密处理,即步骤二和步骤五的部分改造。步骤三、四、六 以及五中的灰度读能力,都无法解决。所以在业务改造中对加解密组件进行了优化。

三 加解密组件优化

在二中的加解密组件中,是用Mybatis Interceptor 拦截sql之后,仅对参数和结果进行加解密处理,而优化后的加解密组件中,对原始sql进行了修改,业务只需进行简单的配置,就能实现自动加解密功能,以及增量及存量数据加密、数据一致性校验、不一致数据修复、灰度读取加密字段、读数据双边对比等能力。

所以通过组件嵌入方式,就可以相对实现业务“免改造”,减少代码工程。

数据加密除了周期长外,还涉及研发、CI、DBA、大数据、安全等多部门配合,所以在实际改造过程中,需要统一汇总各发布环节中的检查项,业务在发布上线前需逐一check,避免因数据加密带来的风险,影响线上业务运行,这也就是在中后期更关注的平滑切换问题。在此我们分享出加解密流程中,一些共性的注意事项,希望能给大家带来一些参考意义。

增量管控

从风险管控角度考虑,越早发现风险,解决问题带来的成本将会更低,同样适用于数据加密改造。增量敏感数据的加密直接接入加解密组件即可实现,不涉及历史数据清洗、读取切换等,工程量较小。所以一定要把控好增量敏感数据监控。按照事前、事中、事后三个阶段来监控。

一 产研设计阶段(事前)

此阶段无法通过自动化工具实现,主要以安全宣导为主,比如在研发手册中增加针对敏感数据加密的管控要求、或在SDL中增加安全规范。提高研发安全意识,及早规划数据加密。

二 预发布阶段(事中)

在预发布环节的监控,依赖数据库安全审计的基础能力,可以针对STG和PRE环境下的“CREATE TABLE”以及“ALTER TABLE user ADD COLUM”等增加sql审计,进行敏感数据识别,联动告警触达加密规范。

三 生产发布阶段(事后)

如因项目进度或告警触达遗漏等原因导致,增量服务中存在未加密的敏感数据。就需要依赖数据资产识别能力,定期针对数据库资产进行扫描,识别未加密数据,再推动业务整改。

衡量指标

当作为整体项目推动数据加密时,需要设计科学的定量指标来辅助推进,需要从表、字段、数据量多维度统计,多角度观测加密进度。

但是加密覆盖率指标的统计,有关联依赖,依赖数据库敏感数据的识别、加密数据的识别,以及识别的准确率和召回率。

另外在针对存量数据加密治理的最后一个步骤为数据清除,原明文字段将会成为空字段,所以也需要增加空字段的识别能力。以更准确的计算指标。

最后

数据加密是一项和业务密切结合的事情,涉及业务线众多,周期长且复杂。但从整体数据全生命周期看,加密是其中一个环节,只有不断完善每项应对措施,才可以提升企业的防护能力,保障用户的数据安全。希望以上分享的经验,能对大家有所帮助。[作者:货拉拉安全应急响应中心, 转载FreeBuf.COM]

上一篇 : cad加密图纸如何加密只能看 不能打印复制
  • 相关推荐
  • 教育领域必看!6大防泄密软件评测与推荐,保护学生敏感数据

    在教育领域,随着信息技术的广泛应用,学生敏感数据的保护成为了一个不可忽视的重要问题。数据泄露不仅可能侵犯学生的隐私,还可能给教育机构带来严重的法律风险和声誉损失。因此,选择一款合适的防泄密软件,对于保护学生敏感数据至关重要。以下是针对教育领域精心挑选的6大防泄密软件评测与推荐。1. 洞察眼MIT系统特点与优势:①综合解...

    2024-09-07 11:23:38
  • 如何避免打印时文件数据泄露?企业怎么保障文件的安全?

    防止公司打印泄密是一个综合性的任务,需要从多个方面入手,以确保打印过程中的信息安全。以下是一些有效的措施,可以帮助公司远离打印泄密的风险:一、选择安全的打印环境专用打印机:为处理敏感信息的员工配备专用打印机,避免与其他非敏感信息混合打印。物理隔离:将打印区域与办公区域进行物理隔离,限制非授权人员进入。监控设备:在打印区...

    2024-09-06 15:34:44
  • 三种企业数据加密解决方案,你选择哪一种?数据安全升级!一文解锁

    在数字化时代,企业数据已成为最宝贵的资产之一,其安全性直接关系到企业的生存和发展。随着网络攻击和数据泄露事件频发,数据加密已成为企业数据安全战略中不可或缺的一环。公司泄密案例:事件概述:AT&T公司发生了一起大规模的数据泄露事件,约7300万客户的数据被泄露到暗网上。这些数据的时间跨度大约来自2019年或者更早的时期,...

    2024-09-06 09:56:25
  • 怎么才能将U盘里面的数据备份?四个简单好用的恢复方法

    在数字化时代,U盘作为便携式数据存储设备,广泛应用于日常生活与工作中。然而,U盘的便携性也伴随着数据丢失或损坏的风险。为了确保数据的安全性和完整性,做好U盘数据备份显得尤为重要。方法一:手动复制粘贴这是最基础也是最直接的数据备份方式。只需将U盘插入电脑,找到需要备份的文件或文件夹,使用鼠标选中后右击选择“复制”,然后在...

  • 6款巨懂小白的公司数据加密软件,榜单好物随心入!

    在数字化时代,企业数据的安全性直接关系到企业的生存与发展。然而,对于许多非技术背景的管理者和员工来说,复杂的数据加密软件往往令人望而却步。为此,我们精心挑选了6款既功能强大又易于上手的公司数据加密软件,帮助企业轻松守护数据安全。1. 洞察眼MIT系统功能亮点:①全方位数据加密:提供文件加密、邮件加密、磁盘加密等全方位的...

    2024-09-05 10:48:46
  • U盘加密:守护数据安全,五款必备加密工具分享

    在数字化时代,U盘作为便携式存储设备,广泛应用于数据传输和备份。然而,随着数据泄露和盗窃事件频发,U盘数据的安全性成为用户关注的焦点。为了保护重要数据不被非法访问和窃取,选择合适的U盘加密软件至关重要。本文将为您分享五款好用且可靠的U盘加密工具,助您轻松守护数据安全。1. 洞察眼MIT系统特点与优势:专业数据安全管理系...

    2024-09-05 08:50:50
  • 加密U盘数据|u盘加密工具有哪些?6个宝藏工具

    在数字化时代,数据安全已成为不容忽视的重要议题。U盘作为便捷的数据存储和传输工具,其安全性同样值得关注。为了确保U盘中的数据不被未授权访问或泄露,采用专业的U盘加密工具显得尤为重要。本文将为您介绍五款宝藏U盘加密工具,它们各具特色,能够满足不同用户的需求。1.洞察眼MIT系统简介:该系统是一款功能强大的终端安全管理系统...

    2024-09-04 14:46:42
  • 企事业单位数据资料如何防外泄?五大绝招各显神通

    在数字化时代,企业的数据安全已成为关乎生存与发展的核心议题。随着信息技术的飞速发展,数据泄露和丢失的风险日益增大。为了确保企业数据的安全,企业必须采取一系列有效措施来构建坚固的数据防护网。一、强化访问控制与权限管理措施解析:访问控制与权限管理是防止数据泄露的第一道防线。企业应建立严格的访问控制策略,明确不同用户、角色和...

  • 四种u盘加密技巧分享,保护保护您的数据隐私

    在数字化时代,数据的安全性与隐私保护成为了我们不可忽视的重要议题。特别是对于新手用户而言,如何在不复杂的操作下确保U盘等移动存储设备的数据安全,是一个亟待解决的问题。U盘加密方法1. 使用Windows自带的BitLockerWindows操作系统提供了BitLocker功能,可以用来加密可移动驱动器。用户可以通过控制...

  • 为什么需要终端数据防泄密,一文读懂!

    我们为什么需要使用终端防泄密呢?①随着信息技术的飞速发展和数据量的爆炸式增长,数据泄密的风险日益增加。终端设备作为数据存储和访问的主要入口,其安全性直接关系到企业整体数据的安全。②敏感数据如商业秘密、客户资料、研发成果等是企业的核心资产。一旦泄露,将对企业造成不可估量的损失。DLP系统通过全方位的数据防护,确保这些核心...

    2024-09-03 10:27:28

大家都在搜的词:

微信扫一扫联系售前工程师