https://www.cnblogs.com/me115/archive/2011/02/16/1956134.html
https://www.cnblogs.com/me115/p/4707251.html
# 程序优化的5个方向
80/20法则:程序执行中,80%的时间消耗在20%的代码上。
优化前,我们首先得找到这20%的关键路径;
各种语言都有专门的工具来找到这20%的关键路径,比如C++经常用到的gprof;
在关键路径上对耗时的计算进行优化;
主要的优化方向为:
减少重复计算、预先计算、延后计算、降低计算代价、不计算;
## 减少重复计算
典型的例子如缓存,将之前相同的计算(查数据库,读写文件)存下来,等待下一次继续使用;
适用场景:计算结果有有效期,过段时间后需要再次计算;
## 预先计算
对于关键路径中比较耗时的计算,预先计算出来,节省每次计算的成本;
### 预先计算出对照表
关键路径中需要用到的映射关系对照表,将对照表预先计算,在关键路径中直接取用;
### 将计算提前到初始化期间
比如,内存分配耗时,将其提前到初始化的时间分配,建立内存池;
### 将计算提前到编译期间
比如:使用常量表达式,在编译期间将最终值计算出来,节省这部分的运行时开销;
相关技术:模版元编程;
适用场景:计算出来的值一直有效,无需再次计算;
## 延迟计算
将计算耗时延迟到后期,这样,对于异常情况或其它分支情况,在中途就转换,不用再计算;
### 有较多分支条件
将最耗时的计算延后,这样,可能很多场景在中途就转到其它分支上,不用计算;
### 判断条件中的技巧:a||b a&&b
如果判断条件比较耗时,将更耗时的放在后面计算;这样,对于a||b,当a成立时,b就不用再计算了;延迟计算的好处在于可能可以不用计算;
适用场景:分支条件场景;
## 降低计算代价
这是通常能想到的最直接的优化手段,如何能够直接降低计算的代价;
### 内存申请从堆上改为栈上
动态内存分配昂贵,将内存分配从堆上改为栈上;
### 降低灵活性
使用自定制版本的函数代替库函数;
### 使用更低级的指令或语言改写;
在C++中嵌入汇编语言;
使用SSE2等指令集;
### 使用更优的算法或数据结构;
操作STL容器时,STL中的算法一般比自己手写的算法要高效,尽量使用STL的算法来替换我们的手写算法;
参考:
《STL区间成员函数及区间算法总结》
《高效的使用STL》
适用场景:这类优化一般是以降低代码可读性为代价的(STL的除外),用于优化的最后阶段;
## 不计算
优化的终极方案,不计算;
### 业务发现
用不到的业务逻辑,废弃的业务逻辑,仍然存在关键路径中的还在执行的;痛快的删除它;
### 却掉临时对象开销
在我们的代码中,可能会有些临时对象是不知不觉的,而消除临时对象,将节省这部分开销;
参考:《消除临时对象》
以上是单线程关键路径的优化,接下来,我们聊聊扩展到多核,在多线程上的优化;
- 程序优化
- vtune
- linux性能监控软件Perf
- 系统级性能分析工具perf的介绍与使用
- perf的二级命令
- 全局性概况
- 全局细节
- 最常用功能perf record
- 可视化工具perf timechart
- perf引入的overhead
- perf stat
- gprof
- 三种Linux性能分析工具的比较
- perf+gprof+gprof2dot+graphviz进行性能分析热点
- 英特尔多核平台编程优化大赛报告
- 内存操作
- mmap
- mmap的分类
- 深入理解内存映射mmap
- 计算机底层知识拾遗(九)深入理解内存映射mmap
- 内核驱动mmap Handler利用技术(一)
- Windows内存管理机制及C++内存分配实例
- Linux内存管理初探
- Windows CPU信息查看
- Linux CPU信息查看
- 预留大内存
- Linux下试验大页面映射
- /dev/mem
- Linux中通过/dev/mem操控物理地址
- /dev/mem分析
- 用法举例
- Linux下直接读写物理地址内存
- 查看内存信息
- Cache Memory
- 页面缓存
- 查看各级cache信息的方法
- dmidecode命令查看cache size
- CPU Cache 机制以及 Cache miss
- ARM体系关闭mmu和cache
- CR0-4寄存器介绍
- 查看CR0,CR2,CR3的值
- Linux 下如何禁用CPU cache
- 7个示例科普CPU Cache
- 第一个例子的C代码
- 其中之一
- Linux 从虚拟地址到物理地址
- 内存测试例子
- 每个程序员都应该了解的内存
- Part 1
- 程序员能够做什么
- 3 CPU caches
- 6 What Programmers Can Do
- VirtualAlloc
- Large-Page Support
- Some remarks on VirtualAlloc and MEM_LARGE_PAGES
- DMA
- MOV和MOVS的效率问题?如何高效的拷贝内存 中的数据
- how to use movntdqa to avoid cache pollution
- 计算机底层知识拾遗(一)理解虚拟内存机制
- How to access the control registers cr0,cr2,cr3 from a program
- 细说Cache-L1/L2/L3/TLB
- what-is-the-meaning-of-non-temporal-memory-accesses-in-x86
- How can the L1, L2, L3 CPU caches be turned off on modern x86/amd64 chips?
- UA list
- GDB
- 程序运行参数
- Linux下GDB的多线程调试
- CMake
- CMake快速入门教程:实战
- cmake打印变量值
- function
- source_group
- cmake_parse_arguments
- 编译.S文件
- add_definitions
- CMake添加-g编译选项
- Debug模式下启动
- Mysql
- Mysql联合查询union和union all的使用介绍
- MySQL数据库导入错误:ERROR 1064 (42000) 和 ERROR at line xx: Unknown command '\Z'.
- 解决MYSQL数据库 Table ‘xxx’ is marked as crashed and should be repaired 145错误
- C/C++
- c语言中static的作用
- strlen和sizeof有什么区别?
- printf
- Libuv中文文档之线程
- RapidJSON
- gcc/g++ 实战之编译的四个过程
- __thread
- TARGET_LINK_LIBRARIES
- MAP_HUGETLB
- 使用Intel格式的汇编
- __m128i
- emmintrin.h
- _mm_stream_si128
- _mm_stream_load_si128
- _mm_load_si128
- _mm_xor_si128
- _mm_store_si128
- _mm_cvtsi128_si64
- Intel SSE指令集
- _mm_set_epi64x
- _mm_aesenc_si128
- _umul128
- _mm_malloc
- reinterpret_cast
- strlen
- 读取UTF-8的txt文件发现开头的多三个字节的问题
- PHP
- php计算函数执行时间的方法
- 框架
- Json Rpc远程调用框架
- PHP多进程
- PHP CLI模式下的多进程应用
- php多进程总结
- 优化
- PHP7 优化
- 让你的PHP7更快(GCC PGO)
- PHP的性能演进(从PHP5.0到PHP7.1的性能全评测)
- PHP字符串全排列算法
- 获取服务器基本信息
- cookie
- phpstudy2018 安装xdebug扩展
- 软件下载
- PHP mysqli_error() 函数
- PHP Session 变量
- curl
- curl_getinfo
- 获取请求头
- PHP使用CURL获取302跳转后的地址实例
- PHP基于cURL实现自动模拟登录
- PHP获取远程图片大小(CURL实现)
- CURL模拟登录
- curl模拟登录提交(从目录中获取文件)
- CURL HTTPS
- curl帮v
- rename
- copy
- JSON
- json_encode
- json_decode
- json_last_error_msg
- json_last_error
- PHP json_encode中文乱码解决方法
- var_dump
- PHPStorm与Xdebug设置
- Xdebug原理以notepad为例
- str_pad
- pack
- PHP二进制与字符串之间的相互转换
- PHP执行系统命令(简介及方法)
- 函数
- 十进制转二进制
- 字符串到ASSCI
- 字符串转二进制
- 合并两个表
- 图像识别
- Tesseract
- 虚拟机
- vmware下Kali 2.0安装VMware Tools
- 安装 VMware tools出现“正在进行简易安装时,无法手动启动VMware tools安装”
- 爬虫
- 有哪些好的数据来源或者大数据平台?
- Cygwin
- Git 常用命令
- 排列组合
- 含重复元素序列的全排列
- 全排列的非递归和递归实现(含重复元素)
- GitBook
- 编辑环境
- visual studio code
- 2名数学家或发现史上最快超大乘法运算法,欲破解困扰人类近半个世纪的问题
- 系统预定义常量
- 指令集
- SSE
- _MSC_VER
- msys2
- 安装cmake
- MSYS2 更新源
- 讲Cmake msys32使用问题解答 CXX CMAKE_C_COMPILER配置详解
- VirtualBox
- 解决virtualbox只能安装32位系统的问题
- Ubuntu
- 使用AES-NI的编译参数
- debian下安装内核源码的方法
- tar.xz结尾的文件的解压方法
- Linux命令
- insmod
- fatal error: openssl/bio.h
- 准备module的编译环境(kali)
- Ubuntu/Debian 之内核模块开发准备
- dmesg的详细用法
- Linux系统开机自动加载驱动module
- linux /Module 浅析(转载)
- Kali
- 找回gpedit
- Enable the Lock Pages in Memory Option (Windows)
- TLA
- 双系统
- 显卡
- 显示no CUDA的解决过程
