String拼接出现null?你看到的分析可是错的
前言
String类型真是个神奇的存在,动不动就会出现一些迷惑人的错误。今天看到一篇文中提到当String的值为null时,进行字符串相加拼接,会出现把null当做字符串拼接的现象。
比如下面这段代码:
String s = null;
s = s + "hello";
System.out.println(s + " world");
你预期的结果可能是“hello world”,但实际的结果是“nullhello world”,神奇吧。
其实这倒没什么,实践一下就可以看到结果。但当你好奇心作祟,在网上搜为什么时,你看到的答案可能是错的。
我在搜索时,看到访问量上万的文章给出的解释竟然错误的。为了排除一些误导,特意为大家分析一下原因。
错误的原因分析
如果对上述问题进行搜索,你可能看到的答案是:
s + " world" 等价于 s = String.valueOf(s)+"word";
然后附带valueOf方法:
public static String valueOf(Object obj) {
return (obj == null) ? "null" : obj.toString();
}
你信了吗?如果信了可能真的就错了。下面我们就来分析分析为什么错了。
Java编译器的优化
我们知道,当我们写下面的代码时Java编译器会为我们做一些优化:
String a = "Hello ";
String b = "World";
System.out.println(a + b);
如何优化的?上面这段代码经过编译器优化之后,等价于:
StringBuilder sb = new StringBuilder();
sb.append("Hello ");
sb.append("World");
String result = sb.toString();
System.out.println(result);
也就是说,加号操作会被优化基于StringBuilder的操作,而并不是上面提到的String.valueOf操作。
那么,上面为null的情况也就等价于下面的操作了:
StringBuilder sb = new StringBuilder(null);
sb.append("hello");
sb.append(" world");
String result = sb.toString();
System.out.println(result);
此时,我们再看一下StringBuilder(null)这个构造方法的底层实现,最终调到它的父类AbstractStringBuilder中的append方法:
public AbstractStringBuilder append(String str) {
if (str == null)
return appendNull();
int len = str.length();
ensureCapacityInternal(count + len);
str.getChars(0, len, value, count);
count += len;
return this;
}
对应的appendNull方法实现为:
private AbstractStringBuilder appendNull() {
int c = count;
ensureCapacityInternal(c + 4);
final char[] value = this.value;
value[c++] = 'n';
value[c++] = 'u';
value[c++] = 'l';
value[c++] = 'l';
count = c;
return this;
}
在appendNull方法中就是将null当做字符串“null”来处理了。这也就是为什么会在拼接中出现null的原因。
字节码追踪
针对上述示例,如果你想看编译器是如何处理的,可以通过javap -c 命令来查看对应字节码:
通过字节码可以看出,基本上与上面的分析的一致。所以说,尽信书不如无书。
拓展问题
解决了上述问题,再来看看,如果我们单纯的就打印null是怎么输出的?
String s = null;
System.out.println(s);
执行上述程序,控制台打印null,这个null是哪儿来的呢?直接看println的底层实现:
public void print(String s) {
if (s == null) {
s = "null";
}
write(s);
}
最终调用到了print方法,如果为null,则打印null字符串。
支持,还没有出现最初的valueOf方法,那么valueOf方法在什么场景下会用到呢?在对象为Object类型时:
Object s = null;
String s1 = String.valueOf(s);
System.out.println(s1);
也就是说在明确调用valueOf方法时,此时s1的值直接是null字符串。
再拓展一下,针对一些基础类型的包装类,比如Integer、Double等:
Integer i = null;
System.out.println(i);
上述代码的处理又不太一样,println方法实现如下:
public void println(Object x) {
String s = String.valueOf(x);
synchronized (this) {
print(s);
newLine();
}
}
也就是说先对对应的Object对象调用valueOf,回到上面的示例,如果Object为null,该方法返回null字符串,后续打印机直接为null。
小结
字符串拼接是很常见的问题,一不小心会出现将null给拼接上的情况。而这状况的出现又牵扯到Java编译器的优化,是不是很有意思?而且正如最开始所述,当我们在网络上搜索资料时也要辨证的去看待答案的准确性。
文章转载自公众号:程序员新视界