Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/algorithm/12.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/amazon-s3/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Regex 从松散结构文本解析价格_Regex_Algorithm - Fatal编程技术网

Regex 从松散结构文本解析价格

Regex 从松散结构文本解析价格,regex,algorithm,Regex,Algorithm,我正在写一个脚本,解析论坛上分类广告的价格 文本的结构非常糟糕,有时有价格,有时没有。有时用户会加上一句话,说同一件商品在商店里要花100欧元,但他们卖80欧元。我想从这样的广告中得到80欧元的价格 在其他情况下,他们销售更多不同的商品,每个都有自己的价格,我想得到价格的总和。在其他情况下,他们对购买所有东西的人有特殊的价格,在这种情况下,我想得到整套的价格,通常低于所有价格的总和 现在我用一堆正则表达式和一些if-s来做。A我想知道是否有任何算法可以做这样的事情,但我不知道它们?这可能会有所帮

我正在写一个脚本,解析论坛上分类广告的价格

文本的结构非常糟糕,有时有价格,有时没有。有时用户会加上一句话,说同一件商品在商店里要花100欧元,但他们卖80欧元。我想从这样的广告中得到80欧元的价格

在其他情况下,他们销售更多不同的商品,每个都有自己的价格,我想得到价格的总和。在其他情况下,他们对购买所有东西的人有特殊的价格,在这种情况下,我想得到整套的价格,通常低于所有价格的总和

现在我用一堆正则表达式和一些if-s来做。A我想知道是否有任何算法可以做这样的事情,但我不知道它们?

这可能会有所帮助


您所说的文本分析远远超出了正则表达式,它将帮助您降低价格。你需要扫描一些短语,比如“过去是x欧元,现在是y欧元”

我建议您获得一大组真实的样本输入数据,数据越大越好,并提供您想要生产的已知价格。然后,您可以连接分析仪,查看分析仪出现故障的记录,并尝试找出原因并进行修复,直到您对结果满意为止


Lucene项目有一个分析模块,通常用于准备要索引的文本,这可能会有所帮助,您可以规范化输入并编写自己的自定义分析器来处理传入的令牌。我相信它有一个内置regex支持的标记器,但我记不清了。

这对我来说不是很“常规”。好的,谢谢。我会看一看,但可能我会继续使用更多的正则表达式和ifs:)