Cryptography 保护数据的非加密算法

Cryptography 保护数据的非加密算法,cryptography,Cryptography,我能找到一些,但我想知道,是否有更多的算法是基于数据编码/修改而不是完全加密的。我发现的例子: 隐写术。该方法基于在消息中隐藏消息 标记化。数据在令牌化服务器中映射到表示服务器外部真实数据的随机令牌 数据扰动。据我所知,它主要用于数据库。为敏感记录添加噪波,但允许读取常规字段和公共字段,如特定日期的记录总和 还有其他类似的方法吗?如果您的目的是发布此数据,则有其他类似于数据扰动的方法,称为数据匿名化[]: 数据掩蔽使用更改的值隐藏数据。您可以创建镜像 数据库的版本,并应用修改技术,如 字符洗牌、

我能找到一些,但我想知道,是否有更多的算法是基于数据编码/修改而不是完全加密的。我发现的例子:

  • 隐写术。该方法基于在消息中隐藏消息
  • 标记化。数据在令牌化服务器中映射到表示服务器外部真实数据的随机令牌
  • 数据扰动。据我所知,它主要用于数据库。为敏感记录添加噪波,但允许读取常规字段和公共字段,如特定日期的记录总和

  • 还有其他类似的方法吗?

    如果您的目的是发布此数据,则有其他类似于数据扰动的方法,称为数据匿名化[]:

    数据掩蔽使用更改的值隐藏数据。您可以创建镜像 数据库的版本,并应用修改技术,如 字符洗牌、加密和字或字符替换。 例如,可以将值字符替换为符号,例如 “*”或“x”。数据掩蔽使逆向工程或检测成为可能 不可能

    假名化——一种数据管理和取消识别的方法 例如,将专用标识符替换为假标识符或假名 将标识符“John Smith”替换为“Mark Spencer”的示例。 假名化保留了统计准确性和数据完整性, 允许修改后的数据用于培训、开发、, 测试和分析,同时保护数据隐私

    泛化故意删除一些数据,使其更少 可识别可以将数据修改为一组范围或广泛范围 具有适当边界的区域。您可以在中删除门牌号 地址,但请确保不删除道路名称。目的 是消除一些标识符,同时保留 数据准确性

    数据交换也称为洗牌和置换,这是一种技术 用于重新排列数据集属性值,以便它们不会 与原始记录相符。交换属性(列) 包含诸如出生日期之类的标识符值, 可能比成员类型值对匿名化的影响更大。 数据扰动通过应用四舍五入数字和添加随机噪声的技术,稍微修改原始数据集。靶场 值的大小需要与扰动成比例。小基地 可能导致匿名性较弱,而较大的基数可能会降低匿名性 数据集的效用。例如,您可以将基数5用于 舍入值,如年龄或门牌号,因为它与 原值。你可以把一个门牌号乘以15 价值可以保持它的可信度。但是,使用更高的碱基(如15)可以 让年龄值看起来是假的

    合成数据通过算法生成的信息没有 与真实事件的联系。合成数据用于创建人工数据 数据集,而不是更改原始数据集或按原样使用它 以及冒着隐私和安全的风险。这个过程包括创建 基于原始数据集中发现的模式的统计模型。 可以使用标准偏差、中间值、线性回归或其他方法 生成合成数据的统计技术

    这就是你要找的吗


    编辑:添加了源代码和引用的链接。

    我正在努力理解这个问题,但也许了解“”可能会有帮助relevant@SamMason,你的回答很有帮助。如果我正确理解该机制,它具有随机化(添加噪声)和泛化(在保护单个记录的同时提供一般信息)的一些特性。另外,我不知道如何更好地设计我的问题。这不是一个复制粘贴的网站。至少提供参考。这是来自Imperva的完整副本