如何随心所欲调试HotSpot VM源代码?(改造为CMakeLists项目)原创
常有小伙伴问我是怎么调试HotSpot VM源代码的,我之前通过视频和文章介绍过一种大家都用的调试方法,如下:
文章地址:第1.2篇-调试HotSpot VM源代码(配视频)
视频地址:https://space.bilibili.com/27533329
网上所有的文章都介绍的是这种方式,先将HotSpot VM编译为动态链接库并生成对应的调试符号文件,然后在IDE中加载启动器这个二进制文件进行调试。不过这种方式对我这种频繁查看和修改HotSpot VM源代码的人来说有一些不方便。主要体现在如下几个方面:
(1)有些函数链接不过去,这个是正常的,因为没有被IDE识别为合法的Makefile项目。另外还有一些其它原因,如HotSpot VM源代码中包含有针对主流操作系统和CPU架构的不同实现,此时的IDE并不知道要跳转到哪个实现;
(2)崩溃的问题,在Ubuntu16.04 x86_64位操作系统上进行调试时,CLion频繁崩溃,Eclipse有时也会崩溃,无语,Visual Studio Code没有经常用,不知道。
第一个问题促使我下决心将HotSpot VM这个Makefile项目改为CMakeLists项目,因为CLion在我改造那时候还不支持创建Makefile项目,对CMakeLists项目支持的较好。
第二个问题在将CMakeLists项目改造完成后,突然有一次调试如下一行代码时遇到卡顿问题:
调用函数mmap()为堆分配内存时,传递了一个参数PROT_NONE,这个表示映射的保护级别,PROT_NONE表示该映射不能被访问。所以如果在调试模式下,即使读取地址也会卡死,不过有些情况下会崩溃。我们将这个参数改为PROT_READ|PROT_WRITE(可读可写)即可。
我怀疑在CLion和Eclipse上崩溃也和这个有很大关系,不过我后来并没有试过原来的那种调试方式。
下面将HotSpot VM项目更改为一个合法的、能被CLion识别的CMakeLists项目,CLion识别后就不会有源代码报红的情况,也不会出现链接不过去的情况,如果有,那在CLion上是无法编译出虚拟机的动态链接库的。
1、按常见方式编译出OpenJDK
具体的编译可以参考我之前录制的视频和写的文章,如下:
第1.1篇-在Ubuntu 16.04上编译OpenJDK8的源代码(配视频)
编译时可参考官方文档:openjdk/README-builds.html
需要说明的是,要想启动Java应用程序,除了HotSpot VM外,还要有JDK类库以及一系列的、针对特定CPU和操作系统编译出的动态链接库,这些动态链接库大部分都是native方法的实现。由于我只编译HotSpot VM为动态链接库,所以还需要按之前的方式将除libjvm.so外的其它运行时环境准备好。我们自己编译libjvm.so并替换掉之前编译好的libjvm.so即可。
2、调整HotSpot VM源代码目录
HotSpot VM调整目录前
HotSpot VM调整目录后
左侧为HotSpot VM调整前的目录结构,右侧是我调整后的源代码目录。因为我只研究HotSpot VM在Linux下的x86_64位实现,所以删除了其它平台和CPU架构下的实现,只保留了linux、linux_x86和x86目录,并将所有的源代码都放在了src目录下。目录怎么调整无所谓,不过需要将其中每个源文件的引用路径都更正一遍才行。
原share目录中存储着共同的代码,如果要在共同代码中需要引入特定CPU架构和操作系统的实现时,可通过如下宏来实现:
源代码位置:openjdk/hotspot/src/share/vm/runtime/os.hpp
#ifdef TARGET_OS_FAMILY_linux
# include "os_linux.hpp"
# include "os_posix.hpp"
#endif
#ifdef TARGET_OS_FAMILY_solaris
# include "os_solaris.hpp"
# include "os_posix.hpp"
#endif
#ifdef TARGET_OS_FAMILY_windows
# include "os_windows.hpp"
#endif
#ifdef TARGET_OS_FAMILY_bsd
# include "os_posix.hpp"
# include "os_bsd.hpp"
#endif
遇到类似如上的代码,可直接删除宏判断,保留特定的文件引用即可。如:
# include "os_linux.hpp"
# include "os_posix.hpp"
在share目录中的代码还有许多使用宏来选择编译特定的代码片段,如下:
源代码位置:openjdk/hotspot/src/share/interpreter/interpreterRuntime.cpp
#if defined(IA32) || defined(AMD64) || defined(ARM)
// 相关的实现
#endif
可以选择删除宏,保留特定的代码片段,不过由于这样的宏太多,所以这可以直接在CMakeLists.txt文件中定义相关的宏即可,如下:
add_definitions(-DAMD64 -D_LP64 -DCOMPILER1 -DCOMPILER2 -DINCLUDE_ALL_GCS -DASSERT -DVM_LITTLE_ENDIAN -D_GNU_SOURCE -DLINUX -DINCLUDE_JVMTI=1)
根据宏来选择对应的代码。
另外,如果某些文件缺失,需要从之前编译好的目录下搜索出对应的文件,然后放到对应目录中即可。
3、编写CMakeLists文件内容
具体内容如下:
cmake_minimum_required(VERSION 3.15)
project(jvm)
enable_language(C ASM)
set(CMAKE_C_STANDARD 99)
set(CMAKE_CXX_STANDARD 98)
add_compile_options(-fpermissive)
# 用到了操作系统线程,编译时需要加参数-pthread
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -pthread")
# 将汇编文件和C++源代码一起编译
SET(ASM_OPTIONS "-x assembler-with-cpp")
SET(CMAKE_ASM_FLAGS "${CFLAGS} ${ASM_OPTIONS}")
# 针对操作系统和CPU架构定义了一些宏
add_definitions(-DAMD64 -D_LP64 -DCOMPILER1 -DCOMPILER2 -DINCLUDE_ALL_GCS -DASSERT -DVM_LITTLE_ENDIAN -D_GNU_SOURCE -DLINUX -DINCLUDE_JVMTI=1)
# 将编译出的动态链接库libjvm.so替换之前编译出的libjvm.so动态链接库
set(CMAKE_LIBRARY_OUTPUT_DIRECTORY /media/mazhi/system2-ssd/openjdks/updated/openjdk/build/linux-x86_64-normal-server-slowdebug/jdk/lib/amd64/server)
aux_source_directory(./src/a** SOURCE_FILES)
aux_source_directory(./src/c1 SOURCE_FILES)
aux_source_directory(./src/ci SOURCE_FILES)
aux_source_directory(./src/classfile SOURCE_FILES)
aux_source_directory(./src/code SOURCE_FILES)
aux_source_directory(./src/compiler SOURCE_FILES)
aux_source_directory(./src/gc_implementation SOURCE_FILES)
aux_source_directory(./src/gc_implementation/concurrentMarkSweep SOURCE_FILES)
aux_source_directory(./src/gc_implementation/g1 SOURCE_FILES)
aux_source_directory(./src/gc_implementation/parallelScavenge SOURCE_FILES)
aux_source_directory(./src/gc_implementation/parNew SOURCE_FILES)
aux_source_directory(./src/gc_implementation/shared SOURCE_FILES)
aux_source_directory(./src/gc_interface SOURCE_FILES)
aux_source_directory(./src/interpreter SOURCE_FILES)
aux_source_directory(./src/libadt SOURCE_FILES)
aux_source_directory(./src/linux SOURCE_FILES)
aux_source_directory(./src/linux_x86 SOURCE_FILES)
aux_source_directory(./src/memory SOURCE_FILES)
aux_source_directory(./src/oops SOURCE_FILES)
aux_source_directory(./src/opto SOURCE_FILES)
aux_source_directory(./src/posix SOURCE_FILES)
aux_source_directory(./src/precompiled SOURCE_FILES)
aux_source_directory(./src/prims SOURCE_FILES)
aux_source_directory(./src/prims/wbtestmethods SOURCE_FILES)
aux_source_directory(./src/runtime SOURCE_FILES)
aux_source_directory(./src/services SOURCE_FILES)
aux_source_directory(./src/trace SOURCE_FILES)
aux_source_directory(./src/utilities SOURCE_FILES)
aux_source_directory(./src/x86 SOURCE_FILES)
aux_source_directory(./src/tracefiles SOURCE_FILES)
aux_source_directory(./src/adfiles SOURCE_FILES)
add_library(${PROJECT_NAME} SHARED ${SOURCE_FILES} ./src/linux_x86/linux_x86_64.s)
将以.s结尾的汇编文件和.cpp源代码一起编译,最终会将编译出的libjvm.so动态链接库放到指定的目录下,替换之前编译出的libjvm.so文件。
4、编写虚拟机启动逻辑
HotSpot VM的启动逻辑在之前也有介绍过,如下:
第1.4篇-HotSpot VM的启动过程(配视频进行源码分析)
不过因为要考虑跨平台兼容以及用户输入等一系列因素,所以这个启动逻辑太繁琐,我们直接在CMakeLists项目中创建一个main.cpp文件,简化这个启动逻辑,如下:
#include <iostream>
#include "src/prims/jni.h"
#include <stdlib.h>
#include <string.h>
#include <stdio.h>
#include <unistd.h>
#include "dlfcn.h"
#include "src/include/jni.h"
typedef jint (JNICALL *CreateJavaVM_t)(JavaVM **pvm, void **env, void *args);
typedef jint (JNICALL *GetDefaultJavaVMInitArgs_t)(void *args);
typedef jint (JNICALL *GetCreatedJavaVMs_t)(JavaVM **vmBuf, jsize bufLen, jsize *nVMs);
typedef struct {
CreateJavaVM_t CreateJavaVM;
GetDefaultJavaVMInitArgs_t GetDefaultJavaVMInitArgs;
GetCreatedJavaVMs_t GetCreatedJavaVMs;
} InvocationFunctions;
typedef jclass (JNICALL FindClassFromBootLoader_t(JNIEnv *env,
const char *name));
static FindClassFromBootLoader_t *findBootClass = NULL;
jclass FindBootStrapClass(JNIEnv *env, const char* classname){
if (findBootClass == NULL) {
findBootClass = (FindClassFromBootLoader_t *)dlsym(RTLD_DEFAULT,"JVM_FindClassFromBootLoader");
if (findBootClass == NULL) {
return NULL;
}
}
return findBootClass(env, classname);
}
jboolean
LoadJavaVM(const char *jvmpath, InvocationFunctions *ifn){
void *libjvm;
// dlopen() 函数以指定模式打开指定的动态链接库文件
libjvm = dlopen(jvmpath, RTLD_NOW + RTLD_GLOBAL);
if (libjvm == NULL) {
std::cout << ::dlerror() << std::endl;
return JNI_FALSE;
}
// dlsym() 函数在动态链接库中查找指定的符号,并返回符号对应的地址
ifn->CreateJavaVM = (CreateJavaVM_t)
dlsym(libjvm, "JNI_CreateJavaVM");
if (ifn->CreateJavaVM == NULL) {
return JNI_FALSE;
}
ifn->GetDefaultJavaVMInitArgs = (GetDefaultJavaVMInitArgs_t)
dlsym(libjvm, "JNI_GetDefaultJavaVMInitArgs");
if (ifn->GetDefaultJavaVMInitArgs == NULL) {
return JNI_FALSE;
}
ifn->GetCreatedJavaVMs = (GetCreatedJavaVMs_t)
dlsym(libjvm, "JNI_GetCreatedJavaVMs");
if (ifn->GetCreatedJavaVMs == NULL) {
return JNI_FALSE;
}
}
static jclass helperClass = NULL;
jclass GetLauncherHelperClass(JNIEnv *env){
if (helperClass == NULL) {
helperClass = FindBootStrapClass(env,"sun/launcher/LauncherHelper");
}
return helperClass;
}
static jclass GetApplicationClass(JNIEnv *env){
jmethodID mid;
jobject result;
jclass cls = GetLauncherHelperClass(env);
mid = env->GetStaticMethodID(cls,"getApplicationClass","()Ljava/lang/Class;");
return static_cast<jclass>(env->CallStaticObjectMethod(cls, mid));
}
static jmethodID makePlatformStringMID = NULL;
static jstring NewPlatformString(JNIEnv *env, char *s)
{
int len = (int)strlen(s);
jbyteArray ary;
jclass cls = GetLauncherHelperClass(env);
if (s == NULL){
return 0;
}
ary = (env)->NewByteArray(len);
if (ary != 0) {
jstring str = 0;
(env)->SetByteArrayRegion(ary, 0, len, (jbyte *)s);
if (!(env)->ExceptionOccurred()) {
if (makePlatformStringMID == NULL) {
makePlatformStringMID = (env)->GetStaticMethodID(cls, "makePlatformString", "(Z[B)Ljava/lang/String;");
}
str = static_cast<jstring>((env)->CallStaticObjectMethod(cls, makePlatformStringMID, JNI_TRUE, ary));
(env)->DeleteLocalRef(ary);
return str;
}
}
return 0;
}
static jclass LoadMainClass(JNIEnv *env, int mode, char *name){
jmethodID mid;
jstring str;
jobject result;
jlong start, end;
jclass cls ;
cls = GetLauncherHelperClass(env);
mid = (env)->GetStaticMethodID(cls,"checkAndLoadMain","(ZILjava/lang/String;)Ljava/lang/Class;");
str = NewPlatformString(env, name); // 这里的name为主类的名称,如com.test/Test
result = env->CallStaticObjectMethod(cls, mid, JNI_TRUE, mode, str);
return (jclass)result;
}
jobjectArray
NewPlatformStringArray(JNIEnv *env, char **strv, int strc)
{
jclass cls;
jobjectArray ary;
int i;
cls = FindBootStrapClass(env, "java/lang/String");
ary = (env)->NewObjectArray( strc, cls, 0);
for (i = 0; i < strc; i++) {
jstring str = NewPlatformString(env, *strv++);
(env)->SetObjectArrayElement(ary, i, str);
(env)->DeleteLocalRef(str);
}
return ary;
}
int main() {
int count = 5;
JavaVMOption *options = (JavaVMOption *)malloc( count * sizeof(JavaVMOption));
int numOptions = 0;
options[numOptions].optionString = "-Djava.class.path=.";
options[numOptions++].extraInfo = NULL;
options[numOptions].optionString = "-Djava.class.path=.:/media/mazhi/sourcecode/workspace/projectjava/projectjava01/target/mazhimazh-0.0.1-SNAPSHOT-jar-with-dependencies.jar";
options[numOptions++].extraInfo = NULL;
options[numOptions].optionString = "-Dsun.java.command=com.test/TestInlineMethod";
options[numOptions++].extraInfo = NULL;
options[numOptions].optionString = "-Dsun.java.launcher=SUN_STANDARD";
options[numOptions++].extraInfo = NULL;
char *substr = "-Dsun.java.launcher.pid=";
char *pid_prop_str = (char *)malloc(strlen(substr) + 10 + 1);
sprintf(pid_prop_str, "%s%d", substr, getpid());
options[numOptions].optionString = substr;
options[numOptions++].extraInfo = NULL;
// 为启动虚拟机传递的参数
JavaVMInitArgs args = {
65538,
count,
options,
true
};
JavaVM *vm = 0;
JNIEnv *env = 0;
InvocationFunctions ifn;
ifn.CreateJavaVM = 0;
ifn.GetDefaultJavaVMInitArgs = 0;
// 加载动态链接库并查找相关的符号
char *jvmpath = "/media/mazhi/system2-ssd/openjdks/updated/openjdk/build/linux-x86_64-normal-server-slowdebug/jdk/lib/amd64/server/libjvm.so";
LoadJavaVM(jvmpath,&ifn);
// 创建一个虚拟机实例,目录不能以直接调用的方式启动虚拟机HotSpot
// jint r = JNI_CreateJavaVM(&vm, (void **)&env, &args);
jint r = ifn.CreateJavaVM(&vm, (void **)&env, &args);
free(options);
if(r == JNI_OK){
printf("success");
}
// 查找Java主类
char* what = "com.test/TestInlineMethod";
jclass mainClass = LoadMainClass(env, 1, what);
// 找到Java主类main()方法对应的唯一ID
jmethodID mainID = env->GetStaticMethodID(mainClass, "main", "([Ljava/lang/String;)V");
// 为应用程序传递的参数
jobjectArray mainArgs = NewPlatformStringArray(env, 0, NULL);
// 调用Java的main()方法
env->CallStaticVoidMethod(mainClass, mainID, mainArgs);
return 0;
}
由于我们现在还不能在main()中直接调用HotSpot VM源代码函数的方式启动,所以在编译好了libjvm.so库后,在CMakeLists.txt文件中注释掉编译动态链接库的逻辑(注释掉aux_source_directory和add_library即可),加上编译可执行程序的逻辑即可,如下:
add_executable(${PROJECT_NAME} main.cpp)
target_link_libraries(${PROJECT_NAME} dl pthread)
运行main()函数即可开启断点调试。
如有对虚拟机感兴趣的,可扫码群,加过虚拟机群的就不要再加入了。
本人最近准备出一个手写Hotspot VM的课程,超级硬核,从0开始写HotSpot VM,将HotSpot VM所有核心的实现全部走一遍,如感兴趣,速速入群。