💎一站式轻松地调用各大LLM模型接口,支持GPT4、智谱、豆包、星火、月之暗面及文生图、文生视频 广告
| TPS、QPS、RT | | | | --- | --- | --- | | TPS | 吞吐量 | 也叫事务数/秒,指系统在单位时间内处理请求的数量 | | | 并发量 | 系统可以同时承载的正常使用系统功能的用户的数量 | | RT | 响应时间 | 指系统对请求作出响应的时间 | | QPS | 每秒查询率 | 对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准 | | QPS计算 | | | --- | --- | >原理:每天80%的访问集中在20%的时间里,这20%时间叫做峰值时间 公式:( 总PV数 * 80% ) / ( 每天秒数 * 20% ) = 峰值时间每秒请求数(QPS) 机器:峰值时间每秒QPS / 单台机器的QPS = 需要的机器 问:每天300w PV 的在单台机器上,这台机器需要多少QPS? 答:( 3000000 * 0.8 ) / (86400 * 0.2 ) = 139 (QPS) 问:如果一台机器的QPS是58,需要几台机器来支持? 答:139 / 58 = 3 qps = 日活/86400*4