Java 如何将输入字符串拆分为相应的utf字符?
我必须用java语言拆分输入文本文件(印地语)的字符串。 有没有办法做到这一点?我试着把它拆分成单个字符,但这并不能解决这个问题。例如:Java 如何将输入字符串拆分为相应的utf字符?,java,hindi,Java,Hindi,我必须用java语言拆分输入文本文件(印地语)的字符串。 有没有办法做到这一点?我试着把它拆分成单个字符,但这并不能解决这个问题。例如: मुझे बहुत सारा काम करना है| 那么输出应该是 मु झे ब हु त सा रा का म क र ना है 试试这个 String s = new String("मुझे बहुत सारा काम करना है"); for(int i =0 ;i<
मुझे बहुत सारा काम करना है|
那么输出应该是
मु
झे
ब
हु
त
सा
रा
का
म
क
र
ना
है
试试这个
String s = new String("मुझे बहुत सारा काम करना है");
for(int i =0 ;i<s.length();i++){
System.out.println(s.charAt(i));
}
String s=新字符串(“मुझे बहुत सारा काम करना है");
对于(int i=0;i这将解决您的问题
BufferedReader in = null;
try {
in = new BufferedReader(new FileReader("your text file path goes here"));
String read = null;
while ((read = in.readLine()) != null) {
String[] splited = read.split("\\s+");
for (String part : splited) {
System.out.println(part);
}
}
} catch (IOException e) {
System.out.println("There was a problem: " + e);
e.printStackTrace();
} finally {
try {
in.close();
} catch (Exception e) {
}
}
}
注意:-提供文件读取器的完整文件路径。在Java中处理的所有字符串数据类型都是“Unicode”,因此您可能会得到意外的结果
您可以参考。我认为,这似乎是类似的问题告诉我们您的workLatin和Devanagari是不同的。您的代码将给出类似的输出म ु झ े ब ह ु त स ा र ा क ा म क र न ा ह ै | <代码>。但实际值应为
मु झे ब हु त सा रा का म क र ना है |` . 对此,您应该使用不同的算法或正则表达式。