Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/338.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 我能';Don’不要只拿绳子的一部分_Java - Fatal编程技术网

Java 我能';Don’不要只拿绳子的一部分

Java 我能';Don’不要只拿绳子的一部分,java,Java,我有C和java的基本知识。 我必须做一个java项目来读取这个表单中的html文件 该文件是HTML格式的,我希望在中包含相同的信息,前提是您所有的文件都具有相同的格式。在运行getText之后,您可以访问数组中的第三个和第五个元素。或者你可以解析这个文件。捕捉pre>和日期之间的所有内容。然后捕捉数据和某种形式的CA581202 JB之间的差异1978年3月22日晚上8:29 <html> <pre> Extraction of Roots by Repeated

我有C和java的基本知识。 我必须做一个java项目来读取这个表单中的html文件


该文件是HTML格式的,我希望在
中包含相同的信息,前提是您所有的文件都具有相同的格式。在运行getText之后,您可以访问数组中的第三个和第五个元素。或者你可以解析这个文件。捕捉pre>和日期之间的所有内容。然后捕捉数据和某种形式的CA581202 JB之间的差异1978年3月22日晚上8:29

<html>
<pre>


Extraction of Roots by Repeated Subtractions for Digital Computers<-- i wand to take this line the title

CACM December, 1958

Sugai, I. <--- and this line

CA581202 JB March 22, 1978  8:29 PM

2   5   2
2   5   2
2   5   2

</pre>
</html>
静态公共数组列表getText(字符串urlString){
ArrayList=新建ArrayList();
//访问该页面
试一试{
//为所需页面创建URL
URL=新URL(URL字符串);
//读取服务器返回的所有文本
BufferedReader in=新的BufferedReader(新的InputStreamReader(url.openStream());
字符串str;
而((str=in.readLine())!=null){
添加(str);
//str是一行文本;readLine()将换行符去掉
}
in.close();
}捕获(格式错误){
}捕获(IOE异常){
}          
退货清单;
}

你能准确描述一下你得到了什么吗?你想要什么?另外,您的代码似乎有点奇怪,因为您说您想要“pre”标记中的内容,但您正在使用text.split()而不是链接解析正文。请告诉我们您遇到的确切问题:您是否无法在
之间获取文本?或者你可以得到它,但你不能正确地处理文本以得到你想要的行?请具体回答您的问题,以便人们能够提供帮助我认为第一份是初步报告国际代数语言CACM Decemb A.J.Samelson但我在第二份报告中采用了和CACM Decemb A.J.Samelson,第二份报告中采用了和CACM Decemb A.J.Samelson的数字,因为他们没有作者,第三份报告后继续返回他们除标题和作者以外的任何内容谢谢,我使用了代码,split()和removeAll()都很好,谢谢你,我尝试了这段代码,放了replaceAll()和spilt(),效果很好
StringBuilder builder = new StringBuilder();
Element link;
String text,str,name,title,name2=null; 
Document doc;
File in = new File("path");
doc = Jsoup.parse(in, null);
link = doc.select("pre").first();
text = doc.body().text();
String []lines = text.split("[\r\n]+");
for (String string : lines) {
    if (builder.length() > 0) {
        builder.append(" ");
    }
    builder.append(string);
}   
str = builder.toString();
String[] strings = str.split(",");
title=strings[0];
name=strings[2];
static public ArrayList<String> getTxt(String urlString){
    ArrayList<String> list=new ArrayList<String>();
    //Access the page
    try {
        // Create a URL for the desired page
        URL url = new URL(urlString);

        // Read all the text returned by the server
        BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream()));
        String str;
        while ((str = in.readLine()) != null) {
            list.add(str);
            // str is one line of text; readLine() strips the newline character(s)
        }
        in.close();             
    } catch (MalformedURLException e) {
    } catch (IOException e) {
    }          
    return list;
}