Nlp 文本语义预处理

Nlp 文本语义预处理,nlp,statistics,data-mining,text-processing,information-retrieval,Nlp,Statistics,Data Mining,Text Processing,Information Retrieval,假设我有一个车祸数据集。每一次事故都有使用一组摄像机和其他传感器进行的文字描述 假设现在我只有一个摄像头的数据(例如,正面摄像头),我想删除描述中与之无关的所有句子。我认为一个简单的基本解决方案是使用一个布尔检索系统,使用一组特定的关键字来删除不需要的句子,但我也不知道这是否是一个好主意,也不知道它是否可行;有人能给我一些建议吗?什么样的统计数据可能有助于研究这个问题?谢谢正则表达式可能是一种解决方案。 我创建了一个与单词“front”匹配的正则表达式,它不区分大小写,搜索front,然后用一个

假设我有一个车祸数据集。每一次事故都有使用一组摄像机和其他传感器进行的文字描述


假设现在我只有一个摄像头的数据(例如,正面摄像头),我想删除描述中与之无关的所有句子。我认为一个简单的基本解决方案是使用一个布尔检索系统,使用一组特定的关键字来删除不需要的句子,但我也不知道这是否是一个好主意,也不知道它是否可行;有人能给我一些建议吗?什么样的统计数据可能有助于研究这个问题?谢谢

正则表达式可能是一种解决方案。 我创建了一个与单词“front”匹配的正则表达式,它不区分大小写,搜索front,然后用一个或多个匹配项获取整个句子。 结果可以从一些空白处修剪。(也可以通过一些微调来删除。)

如果需要“前”、“后”、“侧”、“右”、“左”或其他,可以通过从列表中获取值的一些变量交换出单词


是的,这就是我所说的布尔检索。不幸的是,这种方法在很多情况下都失败了,因为例如,没有明确的匹配,或者因为您选择了一个模棱两可的单词作为关键字,然后删除了一个正确的句子。