Java 类文件常量池中缺少类

Java 类文件常量池中缺少类,java,bytecode,bcel,Java,Bytecode,Bcel,我使用字节码分析来获取类文件的所有导入类(使用BCEL)。现在,当我阅读常量池时,并不是所有导入的类都被称为常量类(请参阅),而只是常量类Utf8。我现在的问题是:我不能仅仅依靠常量池中的常量类条目来读取导入的文件吗?我真的需要看每一个条目并猜测它是否是一个类名吗?这在我看来并不是在每种情况下都是正确的。或者我必须通读整个字节码吗? 关于请参阅 简而言之:类结构指向UTF8条目 (或者您是说并非所有引用的类都由类和名称条目表示?) FWIW,注意不要仅仅依靠这些信息来确定依赖关系,因为类可以动

我使用字节码分析来获取类文件的所有导入类(使用BCEL)。现在,当我阅读常量池时,并不是所有导入的类都被称为常量类(请参阅),而只是常量类Utf8。我现在的问题是:我不能仅仅依靠常量池中的常量类条目来读取导入的文件吗?我真的需要看每一个条目并猜测它是否是一个类名吗?这在我看来并不是在每种情况下都是正确的。或者我必须通读整个字节码吗? 关于

请参阅

简而言之:类结构指向UTF8条目

(或者您是说并非所有引用的类都由类和名称条目表示?)



FWIW,注意不要仅仅依靠这些信息来确定依赖关系,因为类可以动态加载,并且可能根本不会出现。

不,单独使用常量类信息条目来发现对其他类/接口的依赖关系是不正确的。如果您正在解析您信任的输入文件,或者您可以容忍错误信息,那么您可以只解析常量池,只有一种情况除外。要获得关于任意输入的精确信息,您需要解析整个类文件。(我假设“依赖项”是指那些类或接口,如果没有这些类或接口,加载或链接类可能会导致异常,如中所述。这不包括通过
class.forName
或其他反射方式获得的类。)

考虑下面的类

public class Main {
    public static void main(String[] args) {
        identity(null);
    }
    public static Object identity(Foo x) {
        return x;
    }
}
javap-p-v Main.class
打印:

Classfile /C:/Users/jbosboom/Documents/stackoverflow/build/classes/Main.class
  Last modified Jul 2, 2014; size 346 bytes
  MD5 checksum 2237cda2a15a58382b0fb98d6afacc7e
  Compiled from "Main.java"
public class Main
  SourceFile: "Main.java"
  minor version: 0
  major version: 52
  flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
   #1 = Methodref          #3.#17         //  java/lang/Object."<init>":()V
   #2 = Class              #18            //  Main
   #3 = Class              #19            //  java/lang/Object
   #4 = Utf8               <init>
   #5 = Utf8               ()V
   #6 = Utf8               Code
   #7 = Utf8               LineNumberTable
   #8 = Utf8               LocalVariableTable
   #9 = Utf8               this
  #10 = Utf8               LMain;
  #11 = Utf8               identity
  #12 = Utf8               (LFoo;)Ljava/lang/Object;
  #13 = Utf8               x
  #14 = Utf8               LAAA;
  #15 = Utf8               SourceFile
  #16 = Utf8               Main.java
  #17 = NameAndType        #4:#5          //  "<init>":()V
  #18 = Utf8               Main
  #19 = Utf8               java/lang/Object
  #20 = Utf8               java/lang/Thread
  #21 = Class              #20            //  java/lang/Thread
  #21 = Utf8               (LBar;)LFakename;
{
  public Main();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: invokespecial #1                  // Method java/lang/Object."<init>":()V
         4: return
      LineNumberTable:
        line 6: 0
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0       5     0  this   LMain;

  public static java.lang.Object identity(Foo);
    descriptor: (LFoo;)Ljava/lang/Object;
    flags: ACC_PUBLIC, ACC_STATIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: areturn
      LineNumberTable:
        line 11: 0
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0       2     0     x   LAAA;
}
Classfile/C:/Users/jbosboom/Documents/stackoverflow/build/classes/Main.class
最后修改日期:2014年7月2日;大小346字节
MD5校验和2237cda2a15a58382b0fb98d6afacc7e
从“Main.java”编译
公共班机
源文件:“Main.java”
次要版本:0
主要版本:52
旗帜:ACC_公共、ACC_超级
固定池:
#1=Methodref#3.#17//java/lang/Object.“:()V
#2=等级#18//Main
#3=类#19//java/lang/Object
#4=Utf8
#5=Utf8()V
#6=Utf8代码
#7=Utf8行号表
#8=Utf8 LocalVariableTable
#9=Utf8此
#10=Utf8 LMain;
#11=Utf8标识
#12=Utf8(LFoo;)Ljava/lang/Object;
#13=Utf8 x
#14=Utf8 LAAA;
#15=Utf8源文件
#16=Utf8 Main.java
#17=名称和类型#4:#5/“”:()V
#18=Utf8主
#19=Utf8 java/lang/Object
#20=Utf8 java/lang/Thread
#21=类#20//java/lang/Thread
#21=Utf8(LBar;)LFakename;
{
公用干管();
描述符:()V
旗帜:ACC_PUBLIC
代码:
堆栈=1,局部变量=1,参数大小=1
0:aload_0
1:invokespecial#1//方法java/lang/Object。“:()V
4:返回
LineNumberTable:
第6行:0
LocalVariableTable:
起始长度插槽名称签名
0 5 0这一天;
公共静态java.lang.Object标识(Foo);
描述符:(LFoo;)Ljava/lang/Object;
标志:ACC_公共,ACC_静态
代码:
堆栈=1,局部变量=1,参数大小=1
0:aload_0
1:轮到你了
LineNumberTable:
第11行:0
LocalVariableTable:
起始长度插槽名称签名
020xlaaa;
}
Foo
,作为方法
identity
的参数引用,不会作为常量类信息条目出现在常量池中。它确实出现在
标识的方法描述符中(条目#12)。字段描述符也可以引用不显示为常量\u类\u信息项的类。因此,要单独从常量池中查找所有依赖项,需要查看所有UTF8条目

角落案例:某些UTF8条目可能存在,以供常量\字符串\信息条目引用。重复的UTF8条目将被合并,因此一个UTF8条目可能是方法描述符、字符串文字,或者两者兼而有之。如果您只是在解析常量池,那么您必须忍受这种模糊性(可能是过度接近并将其视为依赖项)

如果您相信输入是由您控制下的行为良好的Java编译器生成的,那么您可以解析所有UTF8条目,注意字符串角的大小写,并在此处停止阅读。如果您需要防御攻击者提供您的工具手工制作的类文件(例如,您正在编写反编译器,而攻击者想要阻止反编译),则需要解析整个类文件。下面是一些潜在问题的例子

  • 条目#20为
    Main
    未使用的类命名。JVM可能会也可能不会尝试解析此引用(允许延迟加载和急切加载)。由于该类存在,无论哪种方式,都不会引发错误,因此这个额外的条目是无害的,但它会使查看常量池的工具误以为线程是一个依赖项
  • 条目#21是一个未使用的方法描述符,它引用了两个虚构的类。由于未使用此描述符,因此不会引发任何错误,但同样,信任常量池的工具将对其进行解析
  • 条目#14是指虚构类的字段描述符。这个条目实际上由LineNumberTable属性使用,但是JVM没有检查这个调试信息,所以这个引用是无害的,但可能会愚弄工具
  • 我没有这个例子,但是InnerClasses属性引用常量类信息条目,并且没有检查与其他类文件的一致性(per,尽管是在非规范性注释中)。这些引用不会阻止加载或链接,但会混淆工具