是Java';s URI.resolve在相对URI包含空路径时与RFC 3986不兼容?
我认为Java的URI.resolve方法的定义和实现与不兼容。我知道Java API定义了该方法的工作方式,如果现在对其进行更改,将破坏现有的应用程序,但我的问题是:有人能证实我的理解,即该方法与RFC 3986不兼容吗? 我正在使用这个问题中的示例:,我将在这里复制:是Java';s URI.resolve在相对URI包含空路径时与RFC 3986不兼容?,java,uri,query-string,relative-url,rfc3986,Java,Uri,Query String,Relative Url,Rfc3986,我认为Java的URI.resolve方法的定义和实现与不兼容。我知道Java API定义了该方法的工作方式,如果现在对其进行更改,将破坏现有的应用程序,但我的问题是:有人能证实我的理解,即该方法与RFC 3986不兼容吗? 我正在使用这个问题中的示例:,我将在这里复制: 我正在尝试使用JDK java.net.URI构建URI。 我想在绝对URI对象后面附加一个查询(字符串)。例如: URI base = new URI("http://example.com/something/more/
我正在尝试使用JDK java.net.URI构建URI。 我想在绝对URI对象后面附加一个查询(字符串)。例如:
URI base = new URI("http://example.com/something/more/long");
String queryString = "query=http://local:282/rand&action=aaaa";
URI query = new URI(null, null, null, queryString, null);
URI result = base.resolve(query);
理论(或我认为)是决心应该回归:
http://example.com/something/more/long?query=http://local:282/rand&action=aaaa
但我得到的是:
http://example.com/something/more/?query=http://local:282/rand&action=aaaa
我对的理解是,如果相对URI的路径为空,则将使用基本URI的整个路径:
if (R.path == "") then
T.path = Base.path;
if defined(R.query) then
T.query = R.query;
else
T.query = Base.query;
endif;
仅当指定了路径时,相对路径才会与基本路径合并:
else
if (R.path starts-with "/") then
T.path = remove_dot_segments(R.path);
else
T.path = merge(Base.path, R.path);
T.path = remove_dot_segments(T.path);
endif;
T.query = R.query;
endif;
但是Java实现始终进行合并,即使路径为空:
String cp = (child.path == null) ? "" : child.path;
if ((cp.length() > 0) && (cp.charAt(0) == '/')) {
// 5.2 (5): Child path is absolute
ru.path = child.path;
} else {
// 5.2 (6): Resolve relative path
ru.path = resolvePath(base.path, cp, base.isAbsolute());
}
如果我的阅读是正确的,要从RFC伪代码中获得此行为,可以在查询字符串之前的相对URI中放置一个点作为路径,根据我在网页中使用相对URI作为链接的经验,这是我所期望的:
transform(Base="http://example.com/something/more/long", R=".?query")
=> T="http://example.com/something/more/?query"
但我希望,在网页中,“to”?query“页面上的链接会转到“”,而不是“”——换句话说,与RFC一致,但与Java实现不一致
我对RFC的理解是否正确,Java方法是否与之不一致,或者我是否遗漏了什么?对我来说,没有差异。使用Java行为 在RFC2396 5.2.6a中 除了基本URI的路径组件的最后一段之外,其他所有部分都复制到缓冲区。换句话说,最后一个(最右边)斜杠字符之后的任何字符(如果有)都被排除在外。 在RFC3986 5.2.3中
返回一个由引用的路径组件组成的字符串,该引用的路径组件附加到基本URI路径的最后一段以外的所有部分(即,排除基本URI路径中最右边/”后面的任何字符,或者排除整个基本URI路径(如果它不包含任何“/”字符)是的,我同意
URI.resolve(URI)
方法与RFC 3986不兼容。原始问题本身提供了大量的研究,有助于得出这一结论。首先,让我们澄清所有的困惑
正如Raedwald所解释的(在现已删除的答案中),以/
结尾或不以结尾的基本路径之间存在区别:
fizz
相对于/foo/bar
是:/foo/fizz
fizz
相对于/foo/bar/
是:/foo/bar/fizz
虽然正确,但这并不是一个完整的答案,因为原始问题不是询问a(即上面的“fizz”)。相反,问题涉及相对URI引用的分离。URI类接受五个不同的字符串参数,除了queryString
参数外,其他所有参数都作为null
传递。(请注意,Java接受空字符串作为路径参数,这在逻辑上会导致“空”路径组件,因为“尽管如此”。)这在后面将很重要
Sajan Chandran在一份声明中指出,文档记录的是实现,而不是问题的主题。前者在2005年被后者淘汰。URI类Javadoc没有提到较新的RFC可能会被解释为其不兼容的更多证据。让我们再多谈一些:
- 是一个公开问题,建议该类“应针对RFC 3986进行更新”。其中的一条评论警告“RFC3986并非完全向后”
与2396兼容”
- 以前曾尝试更新URI类的某些部分以符合RFC3986,例如,但后来尝试破坏向后兼容性(另请参见JDK邮件列表)
- 虽然路径“merge”逻辑听起来很相似,但是在较新的RFC中指定的伪代码与。在伪代码中,当相对URI的路径为空时,生成的目标路径将按原样从基本URI复制“在这些条件下不会执行逻辑。与该规范相反,Java的URI实现在最后一个
/
字符后修剪基本路径,如问题中所述
如果您想要RFC 3986行为,则可以使用URI类的替代方案。Java EE 6实现提供了,它(在Jersey 1.18中)的行为似乎与您预期的一样(见下文)。就编码不同的URI组件而言,它至少声称知道RFC
在J2EE之外,Spring3.0引入了专门为“基于RFC3986的编码和解码”而编写的文档。不幸的是,Spring3.1不推荐使用某些功能并引入了,但它没有记录对任何特定RFC的遵从性
测试程序,演示不同的行为:
import java.net.*;
import java.util.*;
import java.util.function.*;
import javax.ws.rs.core.UriBuilder; // using Jersey 1.18
public class StackOverflow22203111 {
private URI withResolveURI(URI base, String targetQuery) {
URI reference = queryOnlyURI(targetQuery);
return base.resolve(reference);
}
private URI withUriBuilderReplaceQuery(URI base, String targetQuery) {
UriBuilder builder = UriBuilder.fromUri(base);
return builder.replaceQuery(targetQuery).build();
}
private URI withUriBuilderMergeURI(URI base, String targetQuery) {
URI reference = queryOnlyURI(targetQuery);
UriBuilder builder = UriBuilder.fromUri(base);
return builder.uri(reference).build();
}
public static void main(String... args) throws Exception {
final URI base = new URI("http://example.com/something/more/long");
final String queryString = "query=http://local:282/rand&action=aaaa";
final String expected =
"http://example.com/something/more/long?query=http://local:282/rand&action=aaaa";
StackOverflow22203111 test = new StackOverflow22203111();
Map<String, BiFunction<URI, String, URI>> strategies = new LinkedHashMap<>();
strategies.put("URI.resolve(URI)", test::withResolveURI);
strategies.put("UriBuilder.replaceQuery(String)", test::withUriBuilderReplaceQuery);
strategies.put("UriBuilder.uri(URI)", test::withUriBuilderMergeURI);
strategies.forEach((name, method) -> {
System.out.println(name);
URI result = method.apply(base, queryString);
if (expected.equals(result.toString())) {
System.out.println(" MATCHES: " + result);
}
else {
System.out.println(" EXPECTED: " + expected);
System.out.println(" but WAS: " + result);
}
});
}
private URI queryOnlyURI(String queryString)
{
try {
String scheme = null;
String authority = null;
String path = null;
String fragment = null;
return new URI(scheme, authority, path, queryString, fragment);
}
catch (URISyntaxException syntaxError) {
throw new IllegalStateException("unexpected", syntaxError);
}
}
}
如果您希望从URI.resolve()
中获得更好的行为,并且不希望在程序中包含另一个较大的依赖项,那么我发现以下代码在我的要求范围内运行良好:
公共URI解析(URI基,URI相对){
if(Strings.isNullOrEmpty(base.getPath()))
base=新URI(base.getScheme(),base.getAuthority(),“/”,
base.getQuery(),base.getFragment();
if(Strings.isNullOrEmpty(uri.getPath()))
uri=新uri(uri.getScheme(),uri.getAuthority(),base.getPath(),
uri.getQuery(),uri.getFragment());
返回base.resolve(uri);
}
唯一非JDK的东西是来自Guava的字符串
,为了可读性-如果没有Guava,用您自己的1行方法替换
脚注: