Python 如何从单词边界中排除逗号

Python 如何从单词边界中排除逗号,python,regex,Python,Regex,我正试图从纯文本中解析出千/百万/亿个值。我需要从典型的单词边界中排除逗号和小数,这样1000000就不会返回多次点击。我需要我的值是排他性的,并且只匹配最高的数字。如何重新创建忽略逗号和小数的单词边界功能?word boudary\b不包括逗号,它包括:(^\w |\w$|\w\w |\w\w),\w表示:[a-zA-Z0-9_uu],并且\w与not\w类似:[^a-zA-Z0-9] 也许你需要这个:[\d,.]+ 它将匹配1000000或1000.000…单词boudary\b不包括逗号,

我正试图从纯文本中解析出千/百万/亿个值。我需要从典型的单词边界中排除逗号和小数,这样1000000就不会返回多次点击。我需要我的值是排他性的,并且只匹配最高的数字。如何重新创建忽略逗号和小数的单词边界功能?

word boudary\b不包括逗号,它包括:(^\w |\w$|\w\w |\w\w),\w表示:[a-zA-Z0-9_uu],并且\w与not\w类似:[^a-zA-Z0-9]

也许你需要这个:[\d,.]+


它将匹配1000000或1000.000…

单词boudary\b不包括逗号,它包括:(^\w |\w$|\w\w |\w\w),\w表示:[a-zA-Z0-9_uuu],并且\w以这种方式类似于not\w:[^a-zA-Z0-9_u]

也许你需要这个:[\d,.]+


它将匹配1000000或1000.000…

您可以编辑您的问题,以包括您迄今为止尝试过的正则表达式/代码吗?我可以,但如果有一个没有太多上下文的混乱正则表达式模式的庞大列表,真的会有那么大的帮助吗?对于“如何在不排除逗号和小数的情况下捕获单词”的“通用”答案可能是“捕获除空格以外的任何内容”,即
r'\S*”
。或“捕获字母数字、逗号和句号”,即
r'[\w,。]*“
。但是为了更好地针对您的特定用例给出一个答案,了解您到目前为止拥有的功能会很有帮助。谢谢您的帮助。YOGO的答案实际上为我解决了这个问题,老实说,我尝试过的模式太大、太混乱了,所以我认为不值得发布它们,因为没有人想尝试解析它们。可以吗你可以编辑你的问题,将你迄今为止尝试过的正则表达式/代码包括在内?我可以,但是如果有一个没有太多上下文的混乱正则表达式模式的大列表,真的会有那么大的帮助吗?对于“如何在不排除逗号和小数的情况下捕获单词”的“一般”答案可能是“捕获除空格以外的任何内容”“,它将是
r'\S*”
。或“捕获字母数字、逗号和句号”,即
r'[\w,.]*'
。但是为了给你一个更适合你的特定用例的答案,知道你到目前为止有什么是很有帮助的。谢谢你的帮助。YOGO的回答实际上解决了我的问题,老实说,我尝试过的模式太大太混乱了,所以我认为不值得发布它们,因为没有人想尝试解析它们。这很有效,谢谢!我有点接近正则表达式,所以我有很多东西要学习完善我的模式!这很有效,谢谢!我有点接近正则表达式,所以我有很多东西要学习完善我的模式!