Text 在google Vision OCR中识别为单个单词的特殊字符?

Text 在google Vision OCR中识别为单个单词的特殊字符?,text,google-api,ocr,google-cloud-vision,google-vision,Text,Google Api,Ocr,Google Cloud Vision,Google Vision,我试图让google vision OCR正则表达式可以搜索。我已经完成了它,当文档只包含英文字符时,它运行得非常好。但是当有其他语言的文本时,它就失败了 这是因为我在GoogleVisionWord组件中只有英文字符,如下所示 VISION_API_WORD_COUNTERS = "([a-zA-Z0-9]+)|([^a-zA-Z0-9 ])"; VISION_API_WORD_COMPONENTS = "[a-zA-Z0-9]"; VISION_API_NOT_WORD_COMPONENTS

我试图让google vision OCR正则表达式可以搜索。我已经完成了它,当文档只包含英文字符时,它运行得非常好。但是当有其他语言的文本时,它就失败了

这是因为我在GoogleVisionWord组件中只有英文字符,如下所示

VISION_API_WORD_COUNTERS = "([a-zA-Z0-9]+)|([^a-zA-Z0-9 ])";
VISION_API_WORD_COMPONENTS = "[a-zA-Z0-9]";
VISION_API_NOT_WORD_COMPONENTS = "[^a-zA-Z0-9]";
因为我不能包含所有语言的字符,所以我想包含上面的倒数。差不多

VISION_API_WORD_COMPONENTS = "[^*ALL THE SPECIAL CHARACTERS WHICH ARE IDENTIFIED AS WORD BY GOOGLE VISION*]"
例如,
[^!@$%^&*()[uu+=]

那么我在哪里可以找到所有被谷歌视觉识别为一个单独单词的特殊字符呢

反复尝试,不断添加我发现的特殊字符是一种选择。但这将是我最后的选择