是Java';s URI.resolve在相对URI包含空路径时与RFC 3986不兼容?

是Java';s URI.resolve在相对URI包含空路径时与RFC 3986不兼容?,java,uri,query-string,relative-url,rfc3986,Java,Uri,Query String,Relative Url,Rfc3986,我认为Java的URI.resolve方法的定义和实现与不兼容。我知道Java API定义了该方法的工作方式,如果现在对其进行更改,将破坏现有的应用程序,但我的问题是:有人能证实我的理解,即该方法与RFC 3986不兼容吗? 我正在使用这个问题中的示例:,我将在这里复制: 我正在尝试使用JDK java.net.URI构建URI。 我想在绝对URI对象后面附加一个查询(字符串)。例如: URI base = new URI("http://example.com/something/more/

我认为Java的URI.resolve方法的定义和实现与不兼容。我知道Java API定义了该方法的工作方式,如果现在对其进行更改,将破坏现有的应用程序,但我的问题是:有人能证实我的理解,即该方法与RFC 3986不兼容吗?

我正在使用这个问题中的示例:,我将在这里复制:


我正在尝试使用JDK java.net.URI构建URI。 我想在绝对URI对象后面附加一个查询(字符串)。例如:

URI base = new URI("http://example.com/something/more/long");
String queryString = "query=http://local:282/rand&action=aaaa";
URI query = new URI(null, null, null, queryString, null);
URI result = base.resolve(query);
理论(或我认为)是决心应该回归:

http://example.com/something/more/long?query=http://local:282/rand&action=aaaa
但我得到的是:

http://example.com/something/more/?query=http://local:282/rand&action=aaaa

我对的理解是,如果相对URI的路径为空,则将使用基本URI的整个路径:

        if (R.path == "") then
           T.path = Base.path;
           if defined(R.query) then
              T.query = R.query;
           else
              T.query = Base.query;
           endif;
仅当指定了路径时,相对路径才会与基本路径合并:

        else
           if (R.path starts-with "/") then
              T.path = remove_dot_segments(R.path);
           else
              T.path = merge(Base.path, R.path);
              T.path = remove_dot_segments(T.path);
           endif;
           T.query = R.query;
        endif;
但是Java实现始终进行合并,即使路径为空:

    String cp = (child.path == null) ? "" : child.path;
    if ((cp.length() > 0) && (cp.charAt(0) == '/')) {
      // 5.2 (5): Child path is absolute
      ru.path = child.path;
    } else {
      // 5.2 (6): Resolve relative path
      ru.path = resolvePath(base.path, cp, base.isAbsolute());
    }
如果我的阅读是正确的,要从RFC伪代码中获得此行为,可以在查询字符串之前的相对URI中放置一个点作为路径,根据我在网页中使用相对URI作为链接的经验,这是我所期望的:

transform(Base="http://example.com/something/more/long", R=".?query")
    => T="http://example.com/something/more/?query"
但我希望,在网页中,“to”?query“页面上的链接会转到“”,而不是“”——换句话说,与RFC一致,但与Java实现不一致


我对RFC的理解是否正确,Java方法是否与之不一致,或者我是否遗漏了什么?

对我来说,没有差异。使用Java行为

在RFC2396 5.2.6a中

除了基本URI的路径组件的最后一段之外,其他所有部分都复制到缓冲区。换句话说,最后一个(最右边)斜杠字符之后的任何字符(如果有)都被排除在外。

在RFC3986 5.2.3中


返回一个由引用的路径组件组成的字符串,该引用的路径组件附加到基本URI路径的最后一段以外的所有部分(即,排除基本URI路径中最右边/”后面的任何字符,或者排除整个基本URI路径(如果它不包含任何“/”字符)是的,我同意
URI.resolve(URI)
方法与RFC 3986不兼容。

原始问题本身提供了大量的研究,有助于得出这一结论。首先,让我们澄清所有的困惑

正如Raedwald所解释的(在现已删除的答案中),以
/
结尾或不以
结尾的基本路径之间存在区别:

  • fizz
    相对于
    /foo/bar
    是:
    /foo/fizz
  • fizz
    相对于
    /foo/bar/
    是:
    /foo/bar/fizz
虽然正确,但这并不是一个完整的答案,因为原始问题不是询问a(即上面的“fizz”)。相反,问题涉及相对URI引用的分离。URI类接受五个不同的字符串参数,除了
queryString
参数外,其他所有参数都作为
null
传递。(请注意,Java接受空字符串作为路径参数,这在逻辑上会导致“空”路径组件,因为“尽管如此”。)这在后面将很重要

Sajan Chandran在一份声明中指出,文档记录的是实现,而不是问题的主题。前者在2005年被后者淘汰。URI类Javadoc没有提到较新的RFC可能会被解释为其不兼容的更多证据。让我们再多谈一些:

  • 是一个公开问题,建议该类“应针对RFC 3986进行更新”。其中的一条评论警告“RFC3986并非完全向后” 与2396兼容”

  • 以前曾尝试更新URI类的某些部分以符合RFC3986,例如,但后来尝试破坏向后兼容性(另请参见JDK邮件列表)

  • 虽然路径“merge”逻辑听起来很相似,但是在较新的RFC中指定的伪代码与。在伪代码中,当相对URI的路径为空时,生成的目标路径将按原样从基本URI复制“在这些条件下不会执行逻辑。与该规范相反,Java的URI实现在最后一个
    /
    字符后修剪基本路径,如问题中所述

如果您想要RFC 3986行为,则可以使用URI类的替代方案。Java EE 6实现提供了,它(在Jersey 1.18中)的行为似乎与您预期的一样(见下文)。就编码不同的URI组件而言,它至少声称知道RFC

在J2EE之外,Spring3.0引入了专门为“基于RFC3986的编码和解码”而编写的文档。不幸的是,Spring3.1不推荐使用某些功能并引入了,但它没有记录对任何特定RFC的遵从性


测试程序,演示不同的行为:

import java.net.*;
import java.util.*;
import java.util.function.*;
import javax.ws.rs.core.UriBuilder; // using Jersey 1.18

public class StackOverflow22203111 {

    private URI withResolveURI(URI base, String targetQuery) {
        URI reference = queryOnlyURI(targetQuery);
        return base.resolve(reference);
    }
 
    private URI withUriBuilderReplaceQuery(URI base, String targetQuery) {
        UriBuilder builder = UriBuilder.fromUri(base);
        return builder.replaceQuery(targetQuery).build();
    }

    private URI withUriBuilderMergeURI(URI base, String targetQuery) {
        URI reference = queryOnlyURI(targetQuery);
        UriBuilder builder = UriBuilder.fromUri(base);
        return builder.uri(reference).build();
    }

    public static void main(String... args) throws Exception {

        final URI base = new URI("http://example.com/something/more/long");
        final String queryString = "query=http://local:282/rand&action=aaaa";
        final String expected =
            "http://example.com/something/more/long?query=http://local:282/rand&action=aaaa";

        StackOverflow22203111 test = new StackOverflow22203111();
        Map<String, BiFunction<URI, String, URI>> strategies = new LinkedHashMap<>();
        strategies.put("URI.resolve(URI)", test::withResolveURI);
        strategies.put("UriBuilder.replaceQuery(String)", test::withUriBuilderReplaceQuery);
        strategies.put("UriBuilder.uri(URI)", test::withUriBuilderMergeURI);

        strategies.forEach((name, method) -> {
            System.out.println(name);
            URI result = method.apply(base, queryString);
            if (expected.equals(result.toString())) {
                System.out.println("   MATCHES: " + result);
            }
            else {
                System.out.println("  EXPECTED: " + expected);
                System.out.println("   but WAS: " + result);
            }
        });
    }

    private URI queryOnlyURI(String queryString)
    {
        try {
            String scheme = null;
            String authority = null;
            String path = null;
            String fragment = null;
            return new URI(scheme, authority, path, queryString, fragment);
        }
        catch (URISyntaxException syntaxError) {
            throw new IllegalStateException("unexpected", syntaxError);
        }
    }
}
如果您希望从
URI.resolve()
中获得更好的行为,并且不希望在程序中包含另一个较大的依赖项,那么我发现以下代码在我的要求范围内运行良好:

公共URI解析(URI基,URI相对){ if(Strings.isNullOrEmpty(base.getPath())) base=新URI(base.getScheme(),base.getAuthority(),“/”, base.getQuery(),base.getFragment(); if(Strings.isNullOrEmpty(uri.getPath())) uri=新uri(uri.getScheme(),uri.getAuthority(),base.getPath(), uri.getQuery(),uri.getFragment()); 返回base.resolve(uri); }
唯一非JDK的东西是来自Guava的
字符串
,为了可读性-如果没有Guava,用您自己的1行方法替换

脚注:
  • 我不能说那不是我的错