Regex 是否可以使用正则表达式检测字符串中的代码?

Regex 是否可以使用正则表达式检测字符串中的代码?,regex,Regex,例如: 以下案文: Lorem ipsum dolor sit amet, eum ut vitae quidam mentitum, eu eum malorum eligendi tincidunt. Vix te vitae tamquam, mea nisl praesent ea, vis omnis postulant in import sys def fun(){print('Hello')} fun() Mea veri fierent explicari eu, ne a

例如:

以下案文:

Lorem ipsum dolor sit amet, eum ut vitae quidam mentitum, eu eum malorum eligendi tincidunt. Vix te vitae tamquam, mea nisl praesent ea, vis omnis postulant in

import sys def fun(){print('Hello')} fun()

Mea veri fierent explicari eu, ne appareat convenire mei. Dicat neglegentur definitiones nec id, sit facete cotidieque in. Intellegam referrentur cu cum, an mandamus periculis pro.
我们如何使用regex(或其他一些技术)来查找其中是否有代码)。代码可以是java/python/C/css/js等格式


(我在发帖时还注意到,如果代码格式不正确,堆栈溢出会发出警告,你知道怎么做吗?)

如果里面有代码或没有代码
你会如何识别?如果代码是用代码写的呢?我的第一反应是使用人工智能和/或统计分析。您可能需要以特定的语言为目标。试图在regex中实现这一点需要大量的手工分析和硬编码,即使你做得很好,最终也很可能会出错。但这似乎是你可以写一篇论文或10篇文章的东西,所以对于堆栈溢出的问答格式来说,这似乎太宽泛了。你可以问一下堆栈溢出是如何做到的(仅此而已),但我猜这已经在某个时候得到了回答。在散文中的任何地方检测代码,而不知道代码应该从哪里开始,这本身就很困难。至少对于像C这样的语言来说是如此,在C语言中关键字很少出现。编译器有类似的工作,但不同。他们扫描应该是代码的文本,如果不是,他们只需要抱怨。其结果是臭名昭著的“语法错误”,这比C语言更基本,但你明白了。如果您要容忍非代码,然后选择可以被视为代码的文本,那么您可能会或多或少地结束编译,当编译失败时,删除第一个“单词”,然后重试。@jwodder。没有莎士比亚!!或者厨师或者lolcode!!只是想针对一些特定的语言。
如果其中有代码或没有代码
你会如何识别?如果代码是用语言编写的呢?我的第一反应是使用人工智能和/或统计分析。您可能需要以特定的语言为目标。试图在regex中实现这一点需要大量的手工分析和硬编码,即使你做得很好,最终也很可能会出错。但这似乎是你可以写一篇论文或10篇文章的东西,所以对于堆栈溢出的问答格式来说,这似乎太宽泛了。你可以问一下堆栈溢出是如何做到的(仅此而已),但我猜这已经在某个时候得到了回答。在散文中的任何地方检测代码,而不知道代码应该从哪里开始,这本身就很困难。至少对于像C这样的语言来说是如此,在C语言中关键字很少出现。编译器有类似的工作,但不同。他们扫描应该是代码的文本,如果不是,他们只需要抱怨。其结果是臭名昭著的“语法错误”,这比C语言更基本,但你明白了。如果您要容忍非代码,然后选择可以被视为代码的文本,那么您可能会或多或少地结束编译,当编译失败时,删除第一个“单词”,然后重试。@jwodder。没有莎士比亚!!或者厨师或者lolcode!!只是想针对一些特定的语言。