Java拆分句子

Java拆分句子,java,twitter,split,Java,Twitter,Split,我正在为Twitter写一个程序。它将读取一条tweet并获取其中的hashtags 问题是,我分不开它。例如,“我非常喜欢电脑。”在这篇文章中,我只需要获得“电脑”部分 我曾想过通过使用#来使用split函数,但它会将句子一分为二,所以仍然不是一个解决方案。有什么想法吗?你想在#的确。在那之后,你想得到这个词。因此,在“”空间()上拆分 上述方法应该有效,但尚未进行测试 如果存在多个哈希值,则上述哈希值不起作用,请尝试以下哈希值: String string="I love #computer

我正在为Twitter写一个程序。它将读取一条tweet并获取其中的hashtags

问题是,我分不开它。例如,
“我非常喜欢电脑。”
在这篇文章中,我只需要获得
“电脑”
部分

我曾想过通过使用
#
来使用split函数,但它会将句子一分为二,所以仍然不是一个解决方案。有什么想法吗?

你想在#的确。在那之后,你想得到这个词。因此,在“”空间()上拆分

上述方法应该有效,但尚未进行测试

如果存在多个哈希值,则上述哈希值不起作用,请尝试以下哈希值:

String string="I love #computers so #much omg #lol .";
    String[] stringParts = string.split("#");

    //'delete' first element.
    String[] parts = Arrays.copyOfRange(stringParts, 1, stringParts.length);

    int i = 0;
    String[] output = new String[10];

    for(String part : parts)
    {
        if(part.contains(" "))
        {
            String[] parts2 = part.split(" ");
            output[i] = parts2[0];
            i++;
        }
    }
这段代码唯一的问题是,您需要一个空格,否则您的单词中会有不同的字符。

您确实想在#上拆分。在那之后,你想得到这个词。因此,在“”空间()上拆分

上述方法应该有效,但尚未进行测试

如果存在多个哈希值,则上述哈希值不起作用,请尝试以下哈希值:

String string="I love #computers so #much omg #lol .";
    String[] stringParts = string.split("#");

    //'delete' first element.
    String[] parts = Arrays.copyOfRange(stringParts, 1, stringParts.length);

    int i = 0;
    String[] output = new String[10];

    for(String part : parts)
    {
        if(part.contains(" "))
        {
            String[] parts2 = part.split(" ");
            output[i] = parts2[0];
            i++;
        }
    }

这段代码唯一的问题是,你需要一个空格,否则你的单词中会有不同的字符。

你最好看看如何使用正则表达式解决这个问题。。。。尝试类似(?的方法您最好看看如何使用正则表达式解决问题……尝试类似(?的方法您可以使用正则表达式从tweet获取哈希标记。类似于:

    String sentence = "I love #computers and #something_Else so much";

    Pattern p = Pattern.compile("#\\S+");

    List<String> hashTags = new ArrayList<>();

    Matcher matcher = p.matcher(sentence);
    while (matcher.find()) {
        hashTags.add(matcher.group(0));
    }

    System.out.println(hashTags);
String-sense=“我非常喜欢电脑和其他东西”;
Pattern p=Pattern.compile(“#\\S+”);
List hashTags=new ArrayList();
Matcher-Matcher=p.Matcher(句子);
while(matcher.find()){
hashTags.add(matcher.group(0));
}
System.out.println(hashTags);

您可以使用正则表达式从tweet获取哈希标记。类似于:

    String sentence = "I love #computers and #something_Else so much";

    Pattern p = Pattern.compile("#\\S+");

    List<String> hashTags = new ArrayList<>();

    Matcher matcher = p.matcher(sentence);
    while (matcher.find()) {
        hashTags.add(matcher.group(0));
    }

    System.out.println(hashTags);
String-sense=“我非常喜欢电脑和其他东西”;
Pattern p=Pattern.compile(“#\\S+”);
List hashTags=new ArrayList();
Matcher-Matcher=p.Matcher(句子);
while(matcher.find()){
hashTags.add(matcher.group(0));
}
System.out.println(hashTags);

请添加到目前为止您编写的代码您先用#拆分代码,然后再用空格拆分代码如何使用基本索引of和子字符串请添加到目前为止您编写的代码您先用#拆分代码,然后再用空格拆分代码如何使用基本索引of和子字符串呢et喜欢“我非常喜欢电脑”,包括不止一个“#”字符?那么像“我非常喜欢电脑”这样的推特呢,包括不止一个“#”字符?