使用Python将英语单词转换为数字向量

使用Python将英语单词转换为数字向量,python,csv,numbers,word,Python,Csv,Numbers,Word,我有一个CSV格式的数据库,包含数百人的身份(名字、姓氏、性别、电话号码、邮政编码)。我打算隐藏名字和姓氏以保持身份。Python中有没有一种方法可以输入一个单词并将其转换为数字向量?或者,这应该使用机器学习技术来完成吗?我有Python的基本知识 随函附上数据库的一个片段 您可以将输入文本发送到哈希函数: import hashlib with open('data.csv', 'r') as csv_file: lines = csv_file.readlines() fo

我有一个CSV格式的数据库,包含数百人的身份(名字、姓氏、性别、电话号码、邮政编码)。我打算隐藏名字和姓氏以保持身份。Python中有没有一种方法可以输入一个单词并将其转换为数字向量?或者,这应该使用机器学习技术来完成吗?我有Python的基本知识

随函附上数据库的一个片段


您可以将输入文本发送到哈希函数:

import hashlib

with open('data.csv', 'r') as csv_file:
    lines = csv_file.readlines()
    for line in lines:
        hash_object = hashlib.sha256(line.encode())
        print(int(hash_object.hexdigest(), 16))

您可以为它们创建映射!如果你能展示你的数据样本,我会帮助你的!谢谢如何在所有条目(包括名字和姓氏)上循环它。正如我所提到的,我的Python技能是初步的。这只是我工作的一小部分,所以我不打算花太多时间学习编程。还有,有没有办法得到更小的数字串?您提到您的输入是一个CSV文件。因此,只需从文件中读取每一行并将其发送到哈希函数。至于输出长度,您可以从后缀中选择任意数量的数字。假设变量“output”中有一个长字符串,需要最后8位数字,然后使用output[-8:]。不过有一个警告:请确保您的ID是唯一的数字(假设您正在寻找唯一性)。@Nanda“我不打算花太多时间学习编程。”除非您可以雇用其他人,否则您必须学习编程……为了将名称转换为笔名,这是一种可怕的方式,因为md5是可逆的,并且只能有这么多的名称。如果算法/salt是已知的,则情况更糟。的确,md5不是一个好的选择,但是hashlib模块附带了大量其他无法逆转的算法。