第1章 Java性能调优概述
本章将对性能优化技术进行整体性概述,让读者了解性能的概念和性能优化的基本思路和方法。掌握这些内容,有助于读者对性能问题进行系统分析。
本章涉及的主要知识点有:
? 评价性能的主要指标;
? 木桶原理的概念及其在性能优化中的应用;
? Amdahl定律的含义;
? 性能调优的层次;
? 系统优化的一般步骤和注意事项。
1.1 性 能 概 述
为什么程序总是那么慢?它现在到底在干什么?时间都耗费在哪里了?也许,你经常会抱怨这些问题。如果是这样,那么说明你的程序出现了性能问题。和功能性问题相比,性能问题在有些情况下可能并不算什么太大的问题,将就将就,也就过去了。但是,严重的性能问题会导致程序瘫痪、假死,直至崩溃。本节就先来认识性能的各种表现和指标。
1.1.1 看懂程序的性能
对于客户端程序而言,拙劣的性能会严重影响用户体验。界面停顿、抖动、响应迟钝等问题会遭到用户不停地抱怨。一个典型的例子就是Eclipse IDE工具在执行Full GC时会出现程序“假死”现象,相信这一定被不少开发人员所诟病。对于服务器程序来说,性能问题则更为重要。相信不少后台服务器软件都有各自的性能目标,以Web服务器为例,服务器的响应时间和吞吐量就是两个重要的性能参数。当服务器承受巨大的访问压力时,可能出现响应时间变长、吞吐量下降,甚至抛出内存溢出异常而崩溃等问题。这些问题,都是性能调优需要解决的。
一般来说,程序的性能可以有以下几个方面的表现。
? 执行速度:程序的反应是否迅速,响应时间是否足够短。
? 内存分配:内存分配是否合理,是否过多地消耗内存或者存在泄漏。
? 启动时间:程序从运行到可以正常处理业务需要花费多长时间。
? 负载承受能力:当系统压力上升时,系统的执行速度和响应时间的上升曲线是否平缓。
1.1.2 性能的参考指标
为了能够科学地进行性能分析,对性能指标进行定量评测是非常重要的。目前,可以用于定量评测的性能指标有:
? 执行时间:一段代码从开始运行到运行结束所使用的时间。
? CPU时间:函数或者线程占用CPU的时间。
? 内存分配:程序在运行时占用的内存空间。
? 磁盘吞吐量:描述I/O的使用情况。
? 网络吞吐量:描述网络的使用情况。
? 响应时间:系统对某用户行为或者事件做出响应的时间。响应时间越短,性能越好。
1.1.3 木桶原理与性能瓶颈
木桶原理又称短板理论,其核心思想是一只木桶盛水的多少,并不取决于桶壁上*高的那块木板,而是取决于桶壁上*短的那块木板,如图1.1所示。
将这个理论应用到系统性能优化上可以这么理解,即使系统拥有充足的内存资源和CPU资源,但是,如果磁盘I/O性能低下,那么系统的总体性能是取决于当前*慢的磁盘I/O速度,而不是当前*优越的CPU或者内存。在这种情况下,如果需要进一步提升系统性能,优化内存或者CPU资源是毫无用处的,只有提高磁盘I/O性能才能对系统的整体性能进行优化。此时,磁盘I/O就是系统的性能瓶颈。
?注意:根据木桶原理,系统的*终性能取决于系统中性能表现*差的组件。因此,为了提升系统的整体性能,必须对系统中表现*差的组件进行优化,而不是对系统中表现良好的组件进行优化。
根据应用的特点不同,任何计算机资源都有可能成为系统瓶颈。其中,*有可能成为系统瓶颈的计算资源有:
? 磁盘I/O:由于磁盘I/O读写的速度比内存慢很多,程序在运行过程中,如果需要等待磁盘I/O完成,那么低效的I/O操作会拖累整个系统。
? 网络操作:对网络数据进行读写的情况与磁盘I/O类似,由于网络环境的不确定性,尤其是对互联网上数据的读写,网络操作的速度可能比本地磁盘I/O更慢,因此,如不加特殊处理,也极可能成为系统瓶颈。
? CPU:对计算资源要求较高的应用,由于其长时间、不间断地大量占用CPU资源,那么对CPU的争夺将导致性能问题。例如,科学计算、3D渲染等对CPU需求量大的应用便是如此。
? 异常:对Java应用来说,异常的捕获和处理是非常消耗资源的。如果程序高频率地进行异常处理,则整体性能便会有明显下降。
? 数据库:大部分应用程序都离不开数据库,而海量数据的读写操作往往是相当费时的。应用程序需要等待数据库操作完成并返回结果,那么缓慢的同步操作将成为系统瓶颈。
? 锁竞争:对高并发程序来说,如果存在激烈的锁竞争,对性能无疑是极大的打击。锁竞争将会明显增加线程上下文切换的开销,而且这些开销都是与应用需求无关的系统开销,白白占用宝贵的CPU资源,却不带来任何好处。
? 内存:一般来说,只要应用程序设计合理,内存在读写速度上不太可能成为性能瓶颈。除非应用程序进行了高频率的内存交换和扫描,但这种情况比较少见。内存制约系统性能*有可能出现的情况是内存容量不足。与磁盘相比,内存的容量似乎小得可怜,这意味着应用软件只能尽可能将常用的核心数据读入内存,这在一定程度上降低了系统性能。
1.1.4 Amdahl定律
Amdahl定律是计算机科学中非常重要的定律,它定义了串行系统并行化后的加速比的计算公式和理论上限。
加速比定义如下:
加速比=优化前系统耗时/优化后系统耗时
即所谓的加速比,就是优化前系统耗时与优化后系统耗时的比值。加速比越高,表明优化效果越明显。
Amdahl定律给出了加速比与系统并行度和处理器数量的关系。设加速比为Speedup,系统内必须串行化的程序比重为F,CPU处理器的数量为N,则有
根据这个公式可知,如果CPU处理器的数量趋于无穷,那么加速比与系统的串行化率成反比,如果系统中必须有50%的代码串行执行,那么系统的*大加速比为2。
假设有一程序分为5个步骤执行,每个执行步骤花费100个时间单位。其中,只有步骤2和步骤5可以进行并行,步骤1、3、4必须串行,如图1.2所示。在全串行的情况下,系统合计耗时500个时间单位。
图1.2 串行工作流程
若将步骤2和步骤5并行化,假设在双核处理器上,则有如图1.3所示的处理流程。在这种情况下,步骤2和步骤5的耗时将为50个时间单位,故系统整体耗时为400个时间单位。根据加速比的定义有:
加速比=优化前系统耗时/优化后系统耗时=500/400=1.25
或者使用Amdahl定律给出的加速比公式。由于5个步骤中,3个步骤必须串行,因此其串行化比重为3/5=0.6,即F=0.6,且双核处理器的处理器个数N为2。代入公式得:
加速比=1/(0.6 (1-0.6)/2)=1.25
图1.3 双核处理器上的并行化
在**情况下,假设并行处理器个数为无穷大,则有如图1.4所示的处理过程。步骤2和步骤5的处理时间趋于0。即使这样,系统整体耗时依然大于300个时间单位,即加速比的极限为500/300=1.67。
使用加速比计算公式,N趋于无穷大,有Speedup=1/F,且F=0.6,故有Speedup=1.67。
图1.4 **情况下的并行化
由此可见,为了提高系统的速度,仅增加CPU处理器的数量并不一定能起到有效的作用。需要从根本上修改程序的串行行为,提高系统内可并行化的模块比重,在此基础上合理增加并行处理器的数量,才能以*小的投入得到*大的加速比。
?注意:根据Amdahl定律,使用多核CPU对系统进行优化,优化的效果取决于CPU的数量及系统中串行化程序的比重。CPU数量越多,串行化比重越低,则优化效果越好。仅提高CPU数量而不降低程序的串行化比重,则无法提高系统性能。
1.2 性能调优的层次
为了提升系统性能,开发人员可以从系统的各个角度和层次对系统进行优化。除了*常见的代码优化外,在软件架构、JVM虚拟机、数据库及操作系统几个层面可以通过各种手段进行调优,从而在整体上提升系统的性能。
1.2.1 设计调优
设计调优处于所有调优手段的上层,它往往需要在软件开发之前进行。在软件开发之初,软件架构师就应该评估系统可能存在的各种潜在问题,并给出合理的设计方案。由于软件设计和架构对软件整体质量有决定性的影响,所以,设计调优对系统性能的影响也是*大的。如果说代码优化、JVM优化都是对系统在微观层面上“量”的优化,那么设计优化就是对系统在宏观层面上“质”的优化。
设计优化的一大显著特点是,它可以规避某一个组件的性能问题,而非改良该组件的实现。例如,系统中组件A需要等待某事件E才能触发一个行为。如果组件A通过循环监控不断监测事件E是否发生,其监测行为必然会占用部分系统资源,因此,开发人员必须在监测频率和资源消耗间取得平衡。如果监测频率太低,虽然减少了资源消耗,但是系统实时反应性就会降低。如果进行代码层的调优,就需要优化监测方法的实现以及求得一个*为恰当的监测频率。
而若将此问题预留在设计层解决,便可以使用事件通知的方式将系统行为进行倒置。例如,使用将在第2章中提到的观察者模式,在事件E发生的时刻,由事件E通知组件A,从而触发组件A的行为。这种设计方法弃用了存在性能隐患的循环监控,从根本上解决了这一问题。
从某种程度上说,设计优化直接决定了系统的整体品质。如果在设计层考虑不周,留下太多问题隐患,那么这些“质”上的问题,也许无法再通过代码层的优化进行弥补。因此,开发人员必须在软件设计之初,要认真、仔细地考虑软件系统的性能问题。
进行设计优化时,设计人员必须熟悉常用的软件设计方法、设计模式、基本性能组件和常用的优化思想,并将其有机地集成在软件系统中。
?注意:一个良好的系统设计可以规避很多潜在的性能问题。因此,尽可能多花一些时间在系统设计上,这是创建高性能程序的关键。
1.2.2 代码调优
代码调优是在软件开发过程中或者在软件开发完成后,软件维护过程中进行的对程序代码的改进和优化。代码优化涉及诸多编码技巧,需要开发人员熟悉相关语言的API,并在合适的场景中正确使用相关API或类库。同时,对算法和数据结构的灵活使用,也是代码优化的重要内容。
虽然代码优化是从微观上对性能进行调整,但是一个“好”的实现和一个“坏”的实现对系统的影响也是非常大的。例如,同样作为List的实现,LinkedList和ArrayList在随机访问上的性能却相差几个数量级。又如,同样是文件读写的实现,使用Stream方式与Java NIO方式,其性能可能又会相差一个数量级。
因此,与设计优化相比,虽然笔者将代码优化称为在微观层面上的优化,但它却是对系统性能产生*直接影响的优化方法。
1.2.3 JVM调优
由于Java软件总是运行在JVM虚拟机之上,因此对JVM虚拟机进行优化也能在一定程度上提升Java程序的性能。JVM调优通常可以在软件开发后期进行,如在软件开发完成或者在软件开发的某一里程碑阶段进行。
作为Java软件的运行平台,JVM的各项参数如JVM的堆大小和垃圾回收策略等,将会直接影响Java程序的性能。
要进行JVM层面的调优,需要开发人员对JVM的运行原理和基本内存结构有一定了解,例如堆内存的结构、GC的种类等,然后依据应用程序的特点,设置合理的JVM启动参数。
1.2.4 数据库调优
对绝大部分应用系统而言,数据库是必不可少的一部分。Java程序可以使用JDBC的方式连接数据库。对数据库的调优可以分为以下3个部分:
? 在应用层对SQL语句进行优化;
? 对数据库进行优化;
? 对数据库软件进行优化。
在应用层优化数据库访问,涉及大量的编程技巧。例如,当使用JDBC进行查询时,对于大量拥有相同结构的SQL查询,可以使用PreparedStatement代替Statement,提高数据库的查询效率;在Select语句中,显示指定要查询的列名,避免使用星号“*”。
在对数据库进行优化时,主要目的是建立一个具有良好表结构的数据库。例如,为了提高多表级联查询效率,可以合理地使用冗余字段;对于大表,可以使用行的水平切割或者类似于Oracle分区表的技术;为了提高数据库的查询效率,可以建立有效且合理的索引。
对于数据库软件的优化,根据不同的数据库,如Oracle、MySQL或SQL Server,都拥有不同的方式。以Oracle为例,设置合理大小的共享池、缓存缓冲区或者PGA,对Oracle的运行性能都有很大的影响。
鉴于本书的讨论范围,数据库优化将不作为本书的阐述**。
1.2.5 操作系统调优
作为软件运行的基础平台,操作系统的性能对应用系统也有较大的影响。不同类型的操作系统,调优的手段和参数可能会有所不同。例如,在主流UNIX系统中,共享内存段、信号量、共享内存*大值(shmmax)、共享内存*小值(shmmin)等都是可以进行优化的系统资源。此外,如*大文件句柄数、虚拟内存大小、磁盘的块大小等参数都可能对软件的性能产生影响。图1.5展示了在Windows平台上配置虚拟内存的界面。
?说明:操作系统的性能调优不在本书的讨论范围内,有兴趣的读者可以参考相关书籍。
1.3 基本调优策略和手段
存在性能问题的系统,十有八九是由某一系统瓶颈导致的。只要找到该性能瓶颈,分析瓶颈的形成原因,对症下药,使用合理的方法解决系统瓶颈,就能从根本上提升性能。所以,系统性能优化的*主要目的就是查找并解决性能瓶颈问题。但值得注意的是,性能优化往往会涉及对原有的实现进行较大的修改,因此很难保证这些修改不引发新的问题。所以,在性能优化前,需要对性能优化的目标和使用的方法进行统筹安排。
1.3.1 优化的一般步骤
对软件系统进行优化,首先需要有明确的性能目标,清楚地指出优化的对象和*终目的。其次,需要在目标平台上对软件进行测试,通过各种性能监控和统计工具,观测和确认当前系统是否已经达到相关目标,若已经达到,则没有必要再进行优化;若尚未达到优化目标,则需要查找当前的性能瓶颈。
可能成为性能瓶颈的因素很多,如磁盘I/O、网络I/O和CPU。当找到性能瓶颈后,首先需要定位相关代码,确认是否在软件实现上存在问题或者具有优化的空间。若存在优化空间,则进行代码优化;否则需要考虑进行JVM层、数据库层或者操作系统的优化,甚至可以考虑修改原有设计,或者提升硬件性能。
当优化完成后,需要在目标平台上进行确认测试。若达到性能目标,则优化过程结束;否则需要再次查找系统瓶颈,如此反复,如图1.6所示。
图1.6 性能优化的一般步骤
1.3.2 系统优化的注意事项
性能优化虽然能提升软件的性能,但是优化过程往往伴随着一些风险和弊端。例如,为了优化某一段代码的实现,就需要重写原有的算法,而这就很可能引入新的Bug。重新实现新的功能模块同时也意味着需要重新对其进行完整的功能性测试,使优化前所做的测试工作变得毫无意义。而且,优化后的代码与优化前的代码相比,可能会比较晦涩难懂,在一定程度上影响了系统的可维护性。因此,软件优化需要在软件功能、正确性和可维护性之间取得平衡,而不应该过分地追求软件性能。
在进行优化前,必须要有明确的已知问题和性能目标,决不可为了“优化”而“优化”。因此在动手前,必须知道自己要干什么。任何优化都是为了解决具体的软件问题,如果软件已经可以正常工作,在没有性能问题暴露前,只是凭着主观臆断对某些模块进行性能改进,从软件规范化开发的角度来说是非常冒险的。因为修改后的新代码没有经过完整的测试,软件质量就没有保障。而且,优化后的性能提升幅度可能并不足以让***值得如此费尽心机。因此,在进行软件优化时,必须要进行慎重的评估。
?注意:性能调优必须有明确的目标,不要为了调优而调优。如果当前程序并没有明显的性能问题,盲目地进行调优,其风险可能远远大于收益。
1.4 小 结
通过本章的学习,读者应该了解性能的基本概念及常用的参考指标。此外,本章还较为详细地介绍了与性能调优相关的两个重要理论——木桶原理和Amdahl定律。
根据木桶原理,系统的*终性能总是由系统中性能*差的组件决定的,因此,改善该组件的性能对提升系统整体性能有重要的作用。而根据Amdahl定律可以知道,只是增加处理器数量对提升系统性能并没有太大的实际意义,还必须同时提高程序的并行化比重。
本章还简要介绍了在软件开发和维护过程中可以进行性能优化的各个阶段。例如,在软件的设计阶段,需要选用合理的软件结构和性能组件;在编码阶段,需要提高代码的执行效率;对于Java应用程序,在系统的运行期,还需要设置合理的JVM虚拟机参数;同时,优化数据库和操作系统也对系统整体性能有直接影响。
在本章的*后还简要介绍了性能优化的一般步骤和注意事项。