Google cloud platform Dataprep-重音符号和特殊字符

Google cloud platform Dataprep-重音符号和特殊字符,google-cloud-platform,google-cloud-dataprep,Google Cloud Platform,Google Cloud Dataprep,如何使用dataprep中的重音符号/特殊字符解决此问题?我需要显示此信息 非常感谢您的关注。DataPrep有内置的配方,允许您删除或更改特殊字符。例如,您可以使用将重音字母更改为非重音字母,也可以将另一个字符的非识别字符替换为 下面是更改特殊字符或重音字母的步骤 添加/导入数据 根据,单击添加配方。在您的情况下,您可以执行以下一项或两项操作: 首先,如果您有重音词,请转到搜索转换>选择删除文本中的重音。然后,选择包含重音词的列。它将用重音词替换非重音词。您的数据将显示给您,以便您可以检查

如何使用dataprep中的重音符号/特殊字符解决此问题?我需要显示此信息


非常感谢您的关注。

DataPrep有内置的配方,允许您删除或更改特殊字符。例如,您可以使用将重音字母更改为非重音字母,也可以将另一个字符的非识别字符替换为

下面是更改特殊字符或重音字母的步骤

  • 添加/导入数据
  • 根据,单击添加配方。在您的情况下,您可以执行以下一项或两项操作:
  • 首先,如果您有重音词,请转到搜索转换>选择删除文本中的重音。然后,选择包含重音词的列。它将用重音词替换非重音词。您的数据将显示给您,以便您可以检查转换

    第二,如果你有一个不被认可的角色,转到搜索转换替换文本或模式>中选择要转换数据的列中查找在单引号之间写入字母/符号替换为中写入将替换的字母。最后,预览数据以查看转换

    更新:我能够将包含上述字符的.csv文件加载到DataPrep。以下是我的步骤和示例数据:

    我使用的.csv文件包含以下内容:

    Test
    Non rec. char É
    Non rec. char ç
    Accented word não
    

    在DataPrep UI主页中,单击导入数据(右上角)谷歌云存储(屏幕左侧)。然后,找到并选择您的文件(只测试导入一个文件而不是参数化),然后单击添加(+)符号。在这一步中,您已经可以看到角色,在我的例子中,我可以正常地看到它们。最后,单击导入和争论,并可视化您的数据。使用上面的数据,我能够正确地看到字符,没有任何问题。

    我尝试使用一个调整重音的函数,但它不起作用。我想这是因为它的形状,口音已经成为一种象征。你还有其他想法吗?@Therop,你能试着用替换文本或模式来代替吗?告诉我它是否对你有用。另外,您是否介意分享DataPrep未识别的符号?所以我可以做进一步的调查。我也测试了它,但它没有改变。符号是� , 在csv文件中,它是“ç”或“ç”。@therop,我上传了一个带有您提到的字符的.txt文件,它们被DataPrep识别。此外,我还能够替换它们。你能告诉我你的数据在哪里以及你是如何导入的吗?如果它来自一个文件,哪种格式?你能正确地看到文件中的字符吗?好的,我明白了。现在,如果你打开.csv文件,你能正确地看到字符“É”和“ç”吗?