面试宝典1：程序性能优化

Posted in Uncategorized by Kenny Yuan on 2010/04/29

开场白：最近公司招人，接触了一批形形色色的工程师，但感觉绝大多数人基础都很差，在某次TL的讨论之后，就想到了写一个《面试宝典》系列。

卷首语：这个《面试宝典》名字是我一贯的标题党风格，其实在内容上都是很简单、很基础的——都是那种“不知道这些就别出来混”的知识点。所以，高手/牛人可以到此打住了——端咖啡——送客~~~

作/译序：此文可能会持续更新直到补充得比较完整为止，有什么要补充的欢迎留言

基础原则之万能利器：Profiling

如何测量距离？——直尺/游标卡尺/卷尺/etc
如何测量电压？——电压表/万用表
如何测量时间？——钟表/秒表
如何测量温度？——温度计
如何测量质量？——天平/台秤/etc
如何测量程序性能？——Profiler !

是的，Profiler就是这么一件又基础又重要的工具（小标题里的“万能”当然是标题党了，千万别真的相信）。要回答“程序为什么慢/什么地方慢/到底有多慢”等问题，离不开Profiler，就像测量长度离不开尺子一样。 (嗯，那位要测地月距离的，别抬杠了，请移步回你的实验室吧，我知道你是rocket scientist，高科技呢:)

可以使用软件Profiler，也可以使用硬件来做Profiling（DSO/Logic Analyzer/Hybrid DSO/Timer），在什么都没有的情况下，至少也可以输出Log或者用其它方式来达到Profiling的目的。
一般来说，测量工具对被测目标应该没有影响（或者极小），但是软件的Profiler却对被测目标有一定程度的影响——以此为代价，换来的是方便和廉价（免费）。

在系统外部对性能进行测试，也是一种测量性能的方式，只不过它所测量的粒度很大，不能用于分析源码，只能用于比较不同源码的优劣。

如何进行性能优化？

基本原则

原则：使用Profiler来找出最影响性能的那些程序，重点优化它们
分类：基本知识
提示：时刻记心间

原则：无论尝试了何种优化，都要使用profiler来测量这种优化
分类：基本知识
提示：时刻记心间

原则：一九原则
分类：基本知识
提示：运行中的软件有一种典型情况：10%的程序占了90%的运行时间，优化的重点是这10%的程序（10%和90%为约数）。应当使用Profiler来找出它们，改进它们并继续用Profiler测量改进的效果——在没有明显的性能热点的时候，就要考虑换一种思路进行优化了：比如使用“硬件优化”（参见下文）。在切换了设计和体系结构后，之前做的profiling也有可能会失效，要重新进行测量，每一种判断和决策必须得到证据的支持。

原则：Amdahl定律
分类：基本知识
提示：活学活用Amdahl思想（原本此定律是讲并行计算的）——在知道了“要优化的部分”占“整体”的比例之后，对于此次优化来说，最高可能的加速比也就可以计算出来了。所以不能过多期望，要多多开辟新战场。

原则：benchmark是个宝
分类：基本知识
提示：从来就没有可以代表所有程序的“典型程序”，所以要想在各种情况下均取得较好的性能，就需要使用benchmark方式对性能进行测量。

硬件优化

原则：使用更快的设备/通讯协议
分类：硬件优化
提示：有时候需要尝试跳出软件优化的框框来想问题
范例：使用SSD代替机械硬盘，在IO速率上你能提高2－5倍（在无RAID的情况下），在寻道时间上你能提高4个数量级（WOW!）

原则：对硬件友好
分类：硬件优化
范例：利用SIMD指令（如视频编码器）；对Cache友好（数据Cache和指令Cache）；对流水线友好（比如threaded code，削减分枝预测失误。注意这里的thread不是“线程”，是“线索化”）；使用硬盘的外圈以达到更大的速度；

原则：利用硬件加速
分类：硬件优化
范例：使用D3D/OpenGL（哪怕是2D图形），使用GPU计算（如FFT），使用DMA不使用PIO，使用ASIC代替CPU进行专用计算（如常见的视频编解码专用芯片，还有加解密芯片），使用DSP对高负载数据进行处理（或预处理）

设计优化

原则：使用分布式计算
分类：设计优化
范例：使用~~Hardoop~~Hadoop；使用Memcached

原则：改进业务逻辑
分类：设计优化
范例：Google Chrome会扫描鼠标指针所在的位置，取得鼠标指针下的URL，然后去解析这些URL中的domain name（于是OS的DNS cache得到了warmup）；对于某个name A，一组相关的names也会被送去解析（比如上次打开name A中的页面时，用到了其它的name B, C, D，那么这次也把name B, C, D送去解析）

原则：批量操作
分类：设计优化
备注：可以是业务逻辑优化，也可以去尝试利用底层提供的批操作机制（如writev）。批操作之后是否真的在性能上有提高，需要实测数据的支持。

原则：减少用户空间/内核空间的切换和数据交换
分类：设计优化
范例：例如在设计时就考虑去使用futex和zero-copy之类的技术，在特定场合下“有奇效”（嗯，前面这句话好有卖大力丸的感觉……）

原则：对输入进行缓存
分类：设计优化，缓存
范例：依靠CPU Cache/阵列Cache/磁盘Cache/磁盘/操作系统Cache/程序管理的Cache/专用Cache服务器等，对输入进行缓存，以加快速度

原则：对中间结果进行缓存
分类：设计优化，缓存
范例：预装载/索引/suffix tree

原则：对输出进行缓存
分类：设计优化，缓存
范例：使用buffer批量输出（匹配软件计算速度和设备的速度）

原则：空间换时间
分类：设计优化

原则：使用内存池
分类：设计优化，内存
提示：可以用类似slab的方式来优化可预期的内存使用

原则：使用更好/更合适的GC算法
分类：设计优化，内存

原则：控制内存交换
分类：设计优化，内存

原则：吸收掉不必要的界面更新
分类：设计优化，GUI

原则：只重绘更新的区域
分类：设计优化，GUI

原则：对可视化的结果进行缓存
分类：设计优化，GUI
备注：中间结果缓存的一个特例

原则：parallelism–利用多CPU/多核心
分类：设计优化，并行

原则：利用并发(concurrency)
分类：设计优化，并行
提示：在单CPU上跑并发也能提高性能
范例：线程池

原则：选取合适的锁类型
分类：设计优化，并行，锁
范例：使用Futex/读写锁/seq锁/RCU

原则：使用消息
分类：设计优化，并行，锁
备注：可以减少共享数据和锁

原则：使用异步模型
分类：设计优化，并行，锁
范例：使用epoll/kqueue等；nginx

原则：消除锁
分类：设计优化，并行，锁
提示：试用无锁的算法/数据结构（如Ring Buffer）/算法

原则：使用FP Paradigm
分类：设计优化，并行
提示：彪悍的FP不需要提示

算法优化

（其实算法往往是包含在设计中的）

原则：使用更优的算法，减小算法的阶
分类：算法优化
范例：使用BM/Sunday算法代替BF算法

原则：减小算法的常量（BigOO）
分类：算法优化
范例：使用sentry来编写double link list

原则：处理好Big Omega和BigO，使算法在“最坏的时候也不要太坏”
分类：算法优化
范例：quick sort，避免O(N*N)的情况

原则：使用更优的数据结构
分类：算法优化
范例：AVL Tree–>Hash Table–>Ternary Search Tree
备注：其实有些重复，主要是为了区分狭义的“算法”和“数据结构”

原则：寻找并行化算法
分类：算法优化
备注：和前面的parallelism有些重复，这个更多的是指可并行的算法而不是其它意义上的并行

小技巧

原则：编译器优化
分类：小技巧
范例：使用Intel的编译器，使用Intel的性能库IPP
备注：注意Proebsting定律

原则：树递归–>尾递归
分类：小技巧
备注：在许多语言中，尾递归是不需要栈的，自动转换成迭代了（例如在erlang中用尾递归实现无限循环）

原则：少用小技巧，以免妨碍大粒度上的性能优化
分类：小技巧
提示：主要是指那些影响并行计算的小技巧，或者那些没有使用profiler进行测量就草率进行的盲目优化

原则：远离“神话”
分类：小技巧
提示：有些流传的关于优化的神化不足信，“是骡子是马拉出来骝骝”，一切在profiler下见真章
范例：比如“大块内存分配非常慢”的神话（甚至有过一个人估计数量级的时候说：分配10M内存至少要1秒钟），比如“虚函数导致效率低”的神话，比如“解释运行比编译慢”的神话，等等

原则：使用Lazy Evaluation
分类：小技巧

原则：避免大对象复制
分类：小技巧
范例：RVO/RVal Ref

原则：预译码/编译成本地代码
分类：小技巧，解释器和VM
范例：PYC/HipHop

原则：混合使用各有优势的语言
分类：小技巧
范例：C里使用汇编；Python里使用C模块；

原则：使用二进制优化器
分类：小技巧
范例：JIT就是最出名的一种二进制优化；Win32SDK的BitBlt()函数也是；

……

重温：无论尝试了何种优化，都要使用profiler来测量这种优化
分类：红宝书
提示：时刻记心间

（2010年10月29日更新）

鸣谢：感谢Guancheng指出问题

参见：性能优化的方法和技巧（这是一个文章系列）

图片来自http://www.brendangregg.com/linuxperf.html

Tagged with: interview, zhuangbility

9 comments

9 Responses

Subscribe to comments with RSS.

Tweets that mention 面试宝典1：程序性能优化 « CS巴别塔 -- Topsy.com said, on 2010/04/30 at 13:22

[…] This post was mentioned on Twitter by Dai Jun. Dai Jun said: [GReader Share]面试宝典1：程序性能优化 http://goo.gl/wEFj […]

Reply
Guancheng said, on 2010/05/01 at 22:41

好文章！没有扎实的功力不可能总结的这么全面

另指出一个小typo：Harhoop应是Hadoop

Reply
- Kenny Yuan said, on 2010/05/02 at 18:50
  
  多谢订正，手爪爪抽筋的结果。平时的确很少打这个词（没实际用过），我一直当成是hardoop了
  
  Reply
Fred said, on 2010/06/25 at 00:09

http://blog.vgod.tw/2009/05/21/usability/

费兹定律相关原创乃是此人强文

Reply
- Kenny Yuan said, on 2010/06/25 at 10:15
  
  是的，我也知道是那哥们科普的（不是原创，原创时那哥们儿还没出生呢），但是我故意找了一个简体转载的
  我的个人体会是：看繁体的太累，还不如看英文……
  
  Reply
程序性能优化 | Thinking In Linux said, on 2010/09/12 at 20:22

[…] 本文转自：CS巴别塔此条目发表在 programming 分类目录，贴了 programming 标签。将固定链接加入收藏夹。 ← 让美女时钟做你的桌面 […]

Reply
egmkang said, on 2010/09/18 at 10:51

比较靠谱
有了Profile数据,剩下的基本上都能摸着门路

Reply
评《最容易被人忽略的基本代码优化技术》 | 孩子气 | C++, Lua, 大连,程序员 said, on 2010/10/07 at 09:30

[…] 4）取得数据以后对系统做逐步改进。这一步要注意的是每一步改进都要尽可能的独立、可回退，每做一步改进都要做一次新的Profiling，保证修改以后的代码真正有了速度上的提升。如果对性能提升效果不明显，就不要引入这个修改，哪怕你在上面投入了很多精力，要敢于舍弃。另外做代码优化要着眼全局，不能局部优化了，但是整体运行速度下降。另外要注意对于每一次修改，应该有相应的测试手段保证修改不会影响系统运行。基本上这些优化代码都会引入一些新的bug。关于性能优化，有一篇很不错的文章可以参考https://csbabel.wordpress.com/2010/04/29/interviewbible-1-speed-optimization/ […]

Reply
Brock said, on 2011/09/15 at 00:22

Hello, outstanding site. Is extremely good design. I just got finished cosmetic courses and wish to initial my own personal web site. Thanks for the good article!

Reply

CS巴别塔(1)

面试宝典1：程序性能优化

基础原则之万能利器：Profiling

如何进行性能优化？

基本原则

硬件优化

设计优化

算法优化

小技巧

9 Responses

Leave a reply to Tweets that mention 面试宝典1：程序性能优化 « CS巴别塔 -- Topsy.com Cancel reply

My Avatar

Pages

Top Posts of Last Week

Recent Posts

Archives

Tag Cloud

Category Cloud

Meta

My Recent Tweets

CS巴别塔(1)

面试宝典1：程序性能优化

基础原则之万能利器：Profiling

如何进行性能优化？

基本原则

硬件优化

设计优化

算法优化

小技巧

Share this:

Related

9 Responses

Leave a reply to Tweets that mention 面试宝典1：程序性能优化 « CS巴别塔 -- Topsy.com Cancel reply

My Avatar

Pages

Top Posts of Last Week

Recent Posts

Archives

Tag Cloud

Category Cloud

Meta

My Recent Tweets