Java 基于Ç的字符串拆分;

Java 基于Ç的字符串拆分;,java,string-split,Java,String Split,我想根据切分(带cedilla的拉丁文大写字母C)拆分一个字符串 到目前为止,我已经尝试了string.split,Splitter.on(模式)。split(行) Ch有unicode 00C7如果您的java源文件是UTF-8格式,那么它可以完美地工作: String[] token = s.split("Ç"); 如果没有,请使用 String[] token = s.split("\u00C7"); // Ç 但是它的可读性要差得多如果您的java源文件是UTF-8格式的,那么它可以

我想根据切分(带cedilla的拉丁文大写字母C)拆分一个字符串 到目前为止,我已经尝试了string.split,Splitter.on(模式)。split(行)


Ch有unicode 00C7

如果您的java源文件是UTF-8格式,那么它可以完美地工作:

String[] token = s.split("Ç");
如果没有,请使用

String[] token = s.split("\u00C7"); // Ç

但是它的可读性要差得多

如果您的java源文件是UTF-8格式的,那么它可以完美地工作:

String[] token = s.split("Ç");
如果没有,请使用

String[] token = s.split("\u00C7"); // Ç
但是它的可读性要差得多

试试看

String s = "I want to split a string based on Ç (Latin Capital letter C with cedilla) so far i have tried string.split, Splitter.on(pattern).split(line)\n" +
        "\n" +
        "Ç has unicode 00C7";
for(String part: s.split("Ç"))
    System.out.println("["+part+"]");
印刷品

[I want to split a string based on ]
[ (Latin Capital letter C with cedilla) so far i have tried string.split, Splitter.on(pattern).split(line)

]
[ has unicode 00C7]
试一试

印刷品

[I want to split a string based on ]
[ (Latin Capital letter C with cedilla) so far i have tried string.split, Splitter.on(pattern).split(line)

]
[ has unicode 00C7]

发布您想要拆分的字符串、您尝试的代码及其结果,将获得更好的响应。发布您想要拆分的字符串、您尝试的代码及其结果,将获得更好的响应。我已经尝试了这两种方法,我必须在unix上执行,但它不起作用。我的输入看起来像somenumber?somenumber,根据我掌握的信息?是哪个unix不能读取我在linux上测试了这个,没问题。。。你确定你得到的字符代码和阅读过程吗?您是如何获取字符串的?@zuxqoj您的字符编码不正确,或者您的文件不包含您认为的字符。除了要拆分的字符之外,没有什么特别的,我看不出有任何理由怀疑这是问题的原因。好的,所以问题在于我读取文件的方式,我是按字符而不是按字节读取文件。嗯,我已经尝试了这两种方法,我必须在unix上执行,但它不起作用。我的输入看起来像somenumber?somenumber,根据我掌握的信息?是哪个unix不能读取我在linux上测试了这个,没问题。。。你确定你得到的字符代码和阅读过程吗?您是如何获取字符串的?@zuxqoj您的字符编码不正确,或者您的文件不包含您认为的字符。除了要拆分的字符之外,没有什么特别的,我看不出有任何理由怀疑这是问题的原因。好的,问题在于我读取文件的方式,我是按字符而不是按字节读取文件