网站建设核心优势,微信推广平台怎么找,网站建设与维护试卷,化妆品网站开发可行性1 概述
String应该是Java使用最多的类吧#xff0c;很少有Java程序没有使用到String的。在Java中创建对象是一件挺耗费性能的事#xff0c;而且我们又经常使用相同的String对象#xff0c;那么创建这些相同的对象不是白白浪费性能吗。所以就有了StringTable这一特殊的存在很少有Java程序没有使用到String的。在Java中创建对象是一件挺耗费性能的事而且我们又经常使用相同的String对象那么创建这些相同的对象不是白白浪费性能吗。所以就有了StringTable这一特殊的存在StringTable叫做字符串常量池用于存放字符串常量这样当我们使用相同的字符串对象时就可以直接从StringTable中获取而不用重新创建对象。
2 String类
String表示字符串类型使用一对引起来表示String声明为final的不可被继承 String实现了Serializable接口表示字符串是支持序列化的。 String类实现了Comparable接口表示String可以比较大小。
2.1 String的不可变性
String代表不可变的字符序列。简称不可变性。
当对字符串重新赋值时需要重写指定内存区域赋值不能使用原有的value进行赋值。当对现有的字符串进行连接操作时也需要重新指定内存区域赋值不能使用原有的value进行赋值。当调用String的replace()方法修改指定字符或字符串时也需要重新指定内存区域赋值不能使用原有的value进行赋值。
通过字面量的方式区别于new给一个字符串赋值此时的字符串值声明在字符串常量池中。
字符串常量池是不会存储相同内容的字符串的。String的字符串常量池是一个固定大小的Hashtable默认值大小长度是1009。如果放进字符串常量池的String非常多就会造成Hash冲突严重从而导致链表会很长而链表长了后直接会造成的影响就是当调用String.intern时性能会大幅下降。
使用-XX:StringTablesize可设置StringTable的长度
在JDK1.6中StringTable是固定的就是1009的长度所以如果常量池中的字符串过多就会导致效率下降很快。StringTablesize设置没有要求在JDK1.7中StringTable的长度默认值是60013StringTablesize设置没有要求在JDK1.8中设置StringTable长度的话1009是可以设置的最小值
2.2 String的内存分配
Java语言中有8种基本数据类型和一种比较特殊的类型String。这些类型为了使它们在运行过程中速度更快、更节省内存都提供了一种常量池的概念。
常量池就类似一个Java系统级别提供的缓存。8种基本数据类型的常量池都是系统协调的String类型的常量池比较特殊。它的主要使用方法有两种。
● 直接使用双引号声明出来的String对象会直接存储在常量池中。 ● 如果不是用双引号声明的String对象可以使用String提供的intern()方法将字符串放到字符串常量池中。
Java 6及以前字符串常量池存放在永久代Java 7中 Oracle的工程师对字符串池的逻辑做了很大的改变即将字符串常量池的位置调整到Java堆内 ● 所有的字符串都保存在堆Heap中和其他普通对象一样这样可以让你在进行调优应用时仅需要调整堆大小就可以了。 ● 字符串常量池概念原本使用得比较多但是这个改动使得我们有足够的理由让我们重新考虑在Java 7中使用String.intern()。 StringTable为什么要调整 这是因为方法区默认空间小和垃圾回收频率低
官网说明https://www.oracle.com/java/technologies/javase/jdk7-relnotes.html#jdk7changes
在JDK 7中内部字符串不再分配在Java堆的永久代中而是分配在Java堆的主要部分称为年轻代和老年代与应用程序创建的其他对象一起。这种变化将导致更多的数据驻留在主Java堆中而更少的数据在永久代中因此可能需要调整堆的大小。大多数应用程序将看到由于这一变化而导致的堆使用的相对较小的差异但加载许多类或大量使用String.intern()方法的大型应用程序将看到更明显的差异。
3.3 String 的拼接操作
常量与常量的拼接结果在常量池原理是编译期优化编译期间就将与常量的拼接结果保存到常量池。
常量池中不会存在相同内容的变量只要其中有一个是变量结果就在堆中。即如果拼接符号的前后出现了变量则相当于在堆空间中new String()创建String对象变量拼接的原理是StringBuilder。
如果拼接的结果调用intern()方法则主动将常量池中还没有的字符串对象放入池中并返回此对象地址。
3.1 常量拼接
举例 public static void test1() {// 都是常量前端编译期会进行代码优化// 通过idea直接看对应的反编译的class文件会显示 String s1 abc; 说明做了代码优化String s1 a b c; String s2 abc; // true有上述可知s1和s2实际上指向字符串常量池中的同一个值System.out.println(s1 s2); }通过jclasslib查看字节码
3.2 变量拼接
举例1
public static void test5() {String s1 javaEE;String s2 hadoop;String s3 javaEEhadoop;String s4 javaEE hadoop; String s5 s1 hadoop;String s6 javaEE s2;String s7 s1 s2;System.out.println(s3 s4); // true 编译期优化System.out.println(s3 s5); // false s1是变量不能编译期优化System.out.println(s3 s6); // false s2是变量不能编译期优化System.out.println(s3 s7); // false s1、s2都是变量System.out.println(s5 s6); // false s5、s6 不同的对象实例System.out.println(s5 s7); // false s5、s7 不同的对象实例System.out.println(s6 s7); // false s6、s7 不同的对象实例String s8 s6.intern();System.out.println(s3 s8); // true intern之后s8和s3一样指向字符串常量池中的javaEEhadoop
}执行结果
举例2 Testpublic void test3(){String s1 a;String s2 b;String s3 ab;/*如下的s1 s2 的执行细节(变量s是我临时定义的① StringBuilder s new StringBuilder();② s.append(a)③ s.append(b)④ s.toString() -- 约等于 new String(ab)补充在jdk5.0之后使用的是StringBuilder,在jdk5.0之前使用的是StringBuffer*/String s4 s1 s2;//System.out.println(s3 s4);//false}执行结果 通过jclasslib查看字节码
字符串拼接操作不一定使用的是StringBuilder。如果拼接符号左右两边都是字符串常量或常量引用则仍然使用编译期优化即非StringBuilder的方式。
针对于final修饰类、方法、基本数据类型、引用数据类型的量的结构时能使用上final的时候建议使用上。 Testpublic void test4(){final String s1 a;final String s2 b;String s3 ab;String s4 s1 s2;System.out.println(s3 s4);//true}举例3
public void test6(){String s0 beijing;String s1 bei;String s2 jing;String s3 s1 s2;System.out.println(s0 s3); // false s3指向对象实例s0指向字符串常量池中的beijingString s7 shanxi;final String s4 shan;final String s5 xi;String s6 s4 s5;System.out.println(s6 s7); // true s4和s5是final修饰的编译期就能确定s6的值了
}对应的字节码
使用final修饰即为变量。如s3行的s1和s2会通过new StringBuilder进行拼接使用final修饰即为常量。会在编译器进行代码优化。在实际开发中能够使用final的尽量使用
通过StringBuilder的append()的方式添加字符串的效率要远高于使用String的字符串拼接方式
StringBuilder的append()的方式自始至终中只创建过一个StringBuilder的对象使用String的字符串拼接方式创建过多个StringBuilder和String的对象内存中由于创建了较多的StringBuilder和String的对象内存占用更大如果进行GC需要花费额外的时间。
代码示例 Testpublic void test6(){method1(100000);method2(100000);}public void method1(int highLevel){long start System.currentTimeMillis();String src ;for(int i 0;i highLevel;i){src src a;//每次循环都会创建一个StringBuilder、String}long end System.currentTimeMillis();System.out.println(花费的时间为 (end - start));}public void method2(int highLevel){long start System.currentTimeMillis();//只需要创建一个StringBuilderStringBuilder src new StringBuilder();for (int i 0; i highLevel; i) {src.append(a);}long end System.currentTimeMillis();System.out.println(花费的时间为 (end - start));}执行效率对比 使用StringBuilder改进的空间在实际开发中如果基本确定要前前后后添加的字符串长度不高于某个限定值highLevel的情况下,建议使用构造器实例化
StringBuilder s new StringBuilder(highLevel);//new char[highLevel]2.4 String在jdk9中存储结构变更
String在jdk8及以前内部定义了final char[] value用于存储字符串数据。JDK9时改为byte[]。 官网说明地址http://openjdk.java.net/jeps/254 动机 目前String类的实现将字符存储在一个char数组中每个字符使用两个字节16位。从许多不同的应用中收集到的数据表明字符串是堆使用的主要组成部分此外大多数字符串对象只包含Latin-1字符。这些字符只需要一个字节的存储空间因此这些字符串对象的内部字符数组中有一半的空间没有被使用。 说明 我们建议将String类的内部表示方法从UTF-16字符数组改为字节数组加编码标志域。新的String类将根据字符串的内容以ISO-8859-1/Latin-1每个字符一个字节或UTF-16每个字符两个字节的方式存储字符编码。编码标志将表明使用的是哪种编码。
与字符串相关的类如AbstractStringBuilder、StringBuilder和StringBuffer将被更新以使用相同的表示方法HotSpot VM的内在字符串操作也是如此。
这纯粹是一个实现上的变化对现有的公共接口没有变化。目前没有计划增加任何新的公共API或其他接口。
迄今为止所做的原型设计工作证实了内存占用的预期减少GC活动的大幅减少以及在某些角落情况下的轻微性能倒退。
结论String再也不用char[] 来存储了改成了byte [] 加上编码标记节约了一些空间
public final class String implements java.io.Serializable, ComparableString, CharSequence {Stableprivate final byte[] value;
}3 String类的intern()方法
3.1 方法作用
当调用intern方法时如果字符串常量池里已经包含了一个与这个String对象相等的字符串正如equals(Object)方法所确定的那么池子里的字符串会被返回。否则这个String对象被添加到池中并返回这个String对象的引用。
由此可见对于任何两个字符串s和t当且仅当s.equals(t)为真时s.intern() t.intern()为真。
所有字面字符串和以字符串为值的常量表达式都是interned。返回一个与此字符串内容相同的字符串但保证是来自一个唯一的字符串池。intern是一个native方法调用的是底层C的方法。
public native String intern();如果不是用双引号声明的String对象可以使用String提供的intern方法它会从字符串常量池中查询当前字符串是否存在若不存在就会将当前字符串放入字符串常量池中。
也就是说如果在任意字符串上调用String.intern方法那么其返回结果所指向的那个类实例必须和直接以常量形式出现的字符串实例完全相同。因此下列表达式的值必定是true
new String(abc).intern() abc通俗点讲Interned string就是确保字符串在内存里只有一份拷贝这样可以节约内存空间加快字符串操作任务的执行速度。注意这个值会被存放在字符串内部池String Intern Pool 3.2 JDK6 vs JDK7/8的对比
Java 6及以前字符串常量池存放在永久代Java 7开始中 Oracle的工程师对字符串池的逻辑做了很大的改变即将字符串常量池的位置调整到Java堆内。其中intern方法实现也对应修改了。
/*** ① String s new String(1)* 创建了两个对象* 堆空间中一个new对象* 字符串常量池中一个字符串常量1注意此时字符串常量池中已有1* ② s.intern()由于字符串常量池中已存在1* * s 指向的是堆空间中的对象地址* s2 指向的是堆空间中常量池中1的地址* 所以不相等*/
String s new String(1);
s.intern();
String s2 1;
System.out.println(ss2); // jdk1.6 false jdk7/8 false/** ① String s3 new String(1) new String(1)* 等价于new String11但是常量池中并不生成字符串11** ② s3.intern()* 由于此时常量池中并无11所以把s3中记录的对象的地址存入常量池* 所以s3 和 s4 指向的都是一个地址
*/
String s3 new String(1) new String(1);
s3.intern();
String s4 11;
System.out.println(s3s4); //jdk1.6 false jdk7/8 true执行步骤示例图 总结String的intern()的使用
JDK1.6中将这个字符串对象尝试放入字符串常量池。
如果字符串常量池中有则并不会放入。返回已有的字符串常量池中的对象的地址如果没有会把此对象复制一份放入字符串常量池并返回字符串常量池中的对象地址
JDK1.7起将这个字符串对象尝试放入字符串常量池。
如果串池中有则并不会放入。返回已有的字符串常量池中的对象的地址如果没有则会把对象的引用地址复制一份放入串池并返回字符串常量池中的引用地址
举例1 举例2
3.3 空间效率测试
从空间角度测试是否使用intern方法的效率
public class StringIntern2 {static final int MAX_COUNT 1000 * 10000;static final String[] arr new String[MAX_COUNT];public static void main(String[] args) {Integer [] data new Integer[]{1,2,3,4,5,6,7,8,9,10};long start System.currentTimeMillis();for (int i 0; i MAX_COUNT; i) {// arr[i] new String(String.valueOf(data[i%data.length]));arr[i] new String(String.valueOf(data[i%data.length])).intern();}long end System.currentTimeMillis();System.out.println(花费的时间为 (end - start));try {Thread.sleep(1000000);} catch (Exception e) {e.getStackTrace();}}
}没有用intern的运行结果 通过visualvm查看内存中的字符串对象数量和字节大小
使用了intern的运行结果 通过visualvm查看内存中的字符串对象数量和字节大小
结论对于程序中大量使用存在的字符串时尤其存在很多已经重复的字符串时使用intern()方法能够节省内存空间。
实际应用中例如一个大型的网站平台需要内存中存储大量的字符串。比如社交网站很多人都存储北京市、海淀区等信息。这时候如果字符串都调用intern()方法就会很明显降低内存的大小。
4 G1垃圾收集器的String去重操作
目前许多大规模的Java应用程序在内存上遇到了瓶颈。测量表明在这些类型的应用程序中大约25%的Java堆实时数据集被’String’对象所消耗。此外这些 String 对象中大约有一半是重复的其中重复意味着 string1.equals(string2) 是真的。在堆上有重复的String’对象从本质上讲只是一种内存的浪费。这个项目将在G1垃圾收集器中实现自动和持续的String’重复数据删除以避免浪费内存减少内存占用。
注意这里说的重复指的是在堆中的数据而不是常量池中的因为常量池中的本身就不会重复
背景对许多Java应用有大的也有小的做的测试得出以下结果
● 堆存活数据集合里面string对象占了25% ● 堆存活数据集合里面重复的string对象有13.5% ● String对象的平均长度是45
许多大规模的Java应用的瓶颈在于内存测试表明在这些类型的应用里面Java堆中存活的数据集合差不多25%是String对象。更进一步这里面差不多一半String对象是重复的重复的意思是说 string1.equals(string2) true。堆上存在重复的String对象必然是一种内存的浪费。这个项目将在G1垃圾收集器中实现自动持续对重复的String对象进行去重这样就能避免浪费内存。
实现
当垃圾收集器工作的时候会访问堆上存活的对象。对每一个访问的对象都会检查是否是候选的要去重的String对象如果是把这个对象的一个引用插入到队列中等待后续的处理。一个去重的线程在后台运行处理这个队列。处理队列的一个元素意味着从队列删除这个元素然后尝试去重它引用的String对象。使用一个hashtable来记录所有的被String对象使用的不重复的char数组。当去重的时候会查这个hashtable来看堆上是否已经存在一个一模一样的char数组。如果存在String对象会被调整引用那个数组释放对原来的数组的引用最终会被垃圾收集器回收掉。如果查找失败char数组会被插入到hashtable这样以后的时候就可以共享这个数组了。
命令行选项
# 开启String去重默认是不开启的需要手动开启。
UseStringDeduplication(bool)
# 打印详细的去重统计信息
PrintStringDeduplicationStatistics(bool)
# 达到这个年龄的String对象被认为是去重的候选对象
StringpeDuplicationAgeThreshold(uintx)笔记总结自视频教程尚硅谷宋红康JVM全套教程详解java虚拟机 参考 1.《深入理解Java虚拟机》第2版 2.https://zhuanlan.zhihu.com/p/260939453