Java 如何从Apache服务器日志解析IP地址？_Java_Regex

Java 如何从Apache服务器日志解析IP地址？

java regex

Java 如何从Apache服务器日志解析IP地址？,java,regex,Java,Regex,我必须从apache日志中找到常见的IP地址 12.1.12.1 9000 127.0.0.1-弗兰克[10/Oct/2000:13:55:36-0700]“获得 /apache_pb.gif HTTP/1.0“200 2326 "http://www.example.com/start.html" “Mozilla/4.08[en]（Win98；I；Nav） 12.1.12.1 9000 192.145.1.23-弗兰克[10/Oct/2000:13:55:36-0700]“获得 /apach

我必须从apache日志中找到常见的IP地址

12.1.12.1 9000 127.0.0.1-弗兰克[10/Oct/2000:13:55:36-0700]“获得 /apache_pb.gif HTTP/1.0“200 2326 "http://www.example.com/start.html" “Mozilla/4.08[en]（Win98；I；Nav）

12.1.12.1 9000 192.145.1.23-弗兰克[10/Oct/2000:13:55:36-0700]“获得 /apache_pb.gif HTTP/1.0“200 2326 "http://www.example.com/start.html" “Mozilla/4.08[en]（Win98；I；Nav）

如何使用Java中的正则表达式提取IP地址（即每行中的第三个字）？我还必须从中找到最常见的IP地址，以便找到机器人访问。

日志包含数百万行，因此regexp可能适用于此。

如果您确定它始终是第三个单词（如您所说），则可能根本不需要正则表达式。你可以通过简单的拆分来理解第三个单词

然而，已经有人问：

如果您确定它总是第三个单词（如您所说），那么您可能根本不需要正则表达式。你可以通过简单的拆分来理解第三个单词

然而，已经有人问：

这里有一个解决方案：

String str1 = "12.1.12.1 9000 127.0.0.1 - frank [10/Oct/2000:13:55:36"
            + " -0700] \"GET /apache_pb.gif HTTP/1.0\" 200 2326 "
            + "\"http://www.example.com/start.html\" \"Mozilla/4.08 "
            + "[en] (Win98; I ;Nav)\"";

String str2 = "12.1.12.1 9000 192.145.1.23 - frank [10/Oct/2000:13:55"
            + ":36 -0700] \"GET /apache_pb.gif HTTP/1.0\" 200 2326 "
            + "\"http://www.example.com/start.html\" \"Mozilla/4.08 "
            + "[en] (Win98; I ;Nav)\"";

Pattern p = Pattern.compile("\\S+\\s+\\S+\\s+(\\S+).*");

Matcher m = p.matcher(str1);
if (m.matches())
    System.out.println(m.group(1));

m = p.matcher(str2);
if (m.matches())
    System.out.println(m.group(1));

注册汇率明细：

```
\S+
```
，一个或多个非空白字符
```
\s+
```
，一个或多个空白字符
```
（\\S+）
```
组1中捕获的一个或多个非空白字符

String str1 = "12.1.12.1 9000 127.0.0.1 - frank [10/Oct/2000:13:55:36"
            + " -0700] \"GET /apache_pb.gif HTTP/1.0\" 200 2326 "
            + "\"http://www.example.com/start.html\" \"Mozilla/4.08 "
            + "[en] (Win98; I ;Nav)\"";

String str2 = "12.1.12.1 9000 192.145.1.23 - frank [10/Oct/2000:13:55"
            + ":36 -0700] \"GET /apache_pb.gif HTTP/1.0\" 200 2326 "
            + "\"http://www.example.com/start.html\" \"Mozilla/4.08 "
            + "[en] (Win98; I ;Nav)\"";

Pattern p = Pattern.compile("\\S+\\s+\\S+\\s+(\\S+).*");

Matcher m = p.matcher(str1);
if (m.matches())
    System.out.println(m.group(1));

m = p.matcher(str2);
if (m.matches())
    System.out.println(m.group(1));

```
\S+
```
，一个或多个非空白字符
```
\s+
```
，一个或多个空白字符
```
（\\S+）
```
组1中捕获的一个或多个非空白字符

LogFormat

httpd.conf

server.xml

LogFormat

httpd.conf

server.xml

String line = br.readLine();
StringTokenizer st = new StringTokenizer(line, " ");
st.nextToken();
st.nextToken();
String ip = st.nextToken();

String line = br.readLine();
StringTokenizer st = new StringTokenizer(line, " ");
st.nextToken();
st.nextToken();
String ip = st.nextToken();