php多进程总结 · 软件开发

https://www.cnblogs.com/leezhxing/p/5223289.html **多进程--fork** 场景：日常任务中，有时需要通过php脚本执行一些日志分析，队列处理等任务，当数据量比较大时，可以使用多进程来处理。准备：php多进程需要pcntl，posix扩展支持，可以通过 php - m 查看，没安装的话需要重新编译php，加上参数`--enable-pcntl，posix一般默认会有。` 注意：　　多进程实现只能在cli模式下，在web服务器环境下，会出现无法预期的结果,我测试``报错：`Call to undefined function: pcntl_fork()` `` 一个错误 pcntl\_fork causing “errno=32 Broken pipe” #474 ，看https://github.com/phpredis/phpredis/issues/474 注意两点：如果是在循环中创建子进程,那么子进程中最后要exit,防止子进程进入循环。子进程中的打开连接不能拷贝，使用的还是主进程的，需要用多例模式。 pcntl\_fork: 　　一次调用两次返回，在父进程中返回子进程pid，在子进程中返回0，出错返回-1。 pcntl\_wait ( int &$status \[, int $options \] )：　　阻塞当前进程，直到任意一个子进程退出或收到一个结束当前进程的信号,注意是结束当前进程的信号,子进程结束发送的SIGCHLD不算。使用$status返回子进程的状态码，并可以指定第二个参数来说明是否以阻塞状态调用阻塞方式调用的，函数返回值为子进程的pid,如果没有子进程返回值为-1；非阻塞方式调用，函数还可以在有子进程在运行但没有结束的子进程时返回0。 pcntl\_waitpid ( int $pid , int &$status \[, int $options \] ) 功能同pcntl\_wait，区别为waitpid为等待指定pid的子进程。当pid为-1时pcntl\_waitpid与pcntl\_wait 一样。在pcntl\_wait和pcntl\_waitpid两个函数中的$status中存了子进程的状态信息。检测是否是cli模式 ~~~ /** 确保这个函数只能运行在SHELL中 */ if (substr(php_sapi_name(), 0, 3) !== 'cli') { 　　die("cli mode only"); } ~~~ SHELL脚本实现多进程（Qbus的多进程就是这样实现的，只不过用上了nohup 和 & 改为守护进程）： [![复制代码](https://common.cnblogs.com/images/copycode.gif)](javascript:void(0); "复制代码") ~~~ #!/bin/bash for((i=1;i<=8;i++)) do /usr/local/bin/php multiprocessTest.php & done wait ~~~ [![复制代码](https://common.cnblogs.com/images/copycode.gif)](javascript:void(0); "复制代码") 上面的shell程序，列了一个很简单的多进程程序，用一个for循环，实现了8进程并发来跑multiprocessTest.php这个程序。最后的wait语句，也可以使主进程，再等待所有进程都执行完后再往下执行的需求。这个程序是没有问题的，很多现有的代码也都这样实现，但是这个程序的并发数是不可控的，即我们无法根据机器的核数去调度每一个进程的开关。若我们的机器有8核或者更多，上面的程序是没有问题的，所有核都能充分利用，并且互相之间，没有争抢资源的情况出现。但我们的机器要没有8核的话会是什么情况，同一时间运行的进程数多于核数，那么系统就会出现进程分配调度的问题，争抢资源也跟着相应而来，一个进程不能保证独立连续的执行，所有的进程运行会听从系统的调度，这样就会有更多的不确定因素出现。一个始终保持固定个数的子进程在跑的例子 [![复制代码](https://common.cnblogs.com/images/copycode.gif)](javascript:void(0); "复制代码") ~~~ <?php //最大的子进程数量 $maxChildPro = 8; //当前的子进程数量 $curChildPro = 0; //当子进程退出时，会触发该函数,当前子进程数-1 function sig_handler($sig) { global $curChildPro; switch ($sig) { case SIGCHLD: echo 'SIGCHLD', PHP_EOL; $curChildPro--; break; } } //配合pcntl_signal使用，简单的说，是为了让系统产生时间云，让信号捕捉函数能够捕捉到信号量 declare(ticks = 1); //注册子进程退出时调用的函数。SIGCHLD：在一个进程终止或者停止时，将SIGCHLD信号发送给其父进程。 pcntl_signal(SIGCHLD, "sig_handler"); while (true) { $curChildPro++; $pid = pcntl_fork(); if ($pid) { //父进程运行代码,达到上限时父进程阻塞等待任一子进程退出后while循环继续 if ($curChildPro >= $maxChildPro) { pcntl_wait($status); } } else { //子进程运行代码 $s = rand(2, 6); sleep($s); echo "child sleep $s second quit", PHP_EOL; exit; } } ~~~ [![复制代码](https://common.cnblogs.com/images/copycode.gif)](javascript:void(0); "复制代码") 一个使用waitpid函数等待全部子进程退出，防止僵尸进程的例子 [![复制代码](https://common.cnblogs.com/images/copycode.gif)](javascript:void(0); "复制代码") ~~~ <?php $childs = array(); // Fork10个子进程 for ($i = 0; $i < 10; $i++) { $pid = pcntl_fork(); if ($pid == -1) die('Could not fork'); if ($pid) { echo "parent \n"; $childs[] = $pid; } else { // Sleep $i+1 (s). 子进程可以得到$i参数 sleep($i + 1); // 子进程需要exit,防止子进程也进入for循环 exit(); } } while (count($childs) > 0) { foreach ($childs as $key => $pid) { $res = pcntl_waitpid($pid, $status, WNOHANG); //-1代表error, 大于0代表子进程已退出,返回的是子进程的pid,非阻塞时0代表没取到退出子进程 if ($res == -1 || $res > 0) unset($childs[$key]); } sleep(1); } ~~~ [![复制代码](https://common.cnblogs.com/images/copycode.gif)](javascript:void(0); "复制代码") 一个实际的例子，php实现并发log拷贝 [![复制代码](https://common.cnblogs.com/images/copycode.gif)](javascript:void(0); "复制代码") ~~~ <?php function _fetchLog() { $password = $this->_getPassword(); $online_log_path = NginxConf::getArchiveDir($this->_stat_day); $task_log_path = QFrameConfig::getConfig('LOG_PATH'); $children = array(); $success = true; foreach($this->_server_list as $host => $value) { $local_dir = $this->_prepareLocalDir($host); $task_log = "$task_log_path/fetch_log.$host"; $cmd = "sshpass -p $password rsync -av -e 'ssh -o StrictHostKeyChecking=no' $host:$online_log_path/* $local_dir >> $task_log 2>&1"; $pid = pcntl_fork(); if(-1 === $pid) { LogSvc::log('stat_pv_by_citycode_error', 'could not fork'); exit('could not fork'); } else if(0 === $pid) { system($cmd, $return_value); if(0 !== $return_value) { LogSvc::log('stat_pv_by_citycode_error', "rsync $host error"); } exit($return_value); } else { $children[$pid] = 1; } } while(!empty($children)) { $pid = pcntl_waitpid(-1, $status, WNOHANG); if(0 === $pid) { sleep(1); } else { if(0 !== pcntl_wexitstatus($status)) { $success = false; } unset($children[$pid]); } } return $success; } ~~~ [![复制代码](https://common.cnblogs.com/images/copycode.gif)](javascript:void(0); "复制代码") * * * **多进程--信号** 同类信号只能存储一个，多余的自动丢弃可以发送小于0的值代表发给全部子进程，包括自己，其实是一个组的进程。 PCNTL使用ticks来作为信号处理机制（signal handle callback mechanism），可以最小程度地降低处理异步事件时的负载。何谓ticks？Tick 是一个在代码段中解释器每执行 N 条低级语句就会发生的事件，这个代码段需要通过declare来指定。　　　　pcntl\_signal ( int $signo , callback $handler \[, bool $restart\_syscalls \] ) //为某个SIG注册一个处理函数 ``posix_kill(posix_getpid(), SIGHUP); `为自己生成SIGHUP信号` `` `` ` declare(ticks = 1); //php < 5.3` `` **pcntl\_signal\_dispatch** ( void ) 调用每个等待信号通过[pcntl\_signal()](http://php.net/manual/zh/function.pcntl-signal.php) 安装的处理器。说明一下：`pcntl_signal()`函数仅仅是注册信号和它的处理方法，真正接收到信号并调用其处理方法的是`pcntl_signal_dispatch()`函数必须在循环里调用，为了检测是否有新的信号等待dispatching。 `pcntl_signal_dispatch()` 　　　　　　这个函数是PHP 5.3以上才支持的，如果你的PHP版本大于5.3，建议使用这个方法调用信号处理器。5.3以下的版本需要在注册信号之前加一句：`declare(ticks = 1);`表示每执行一条低级指令，就检查一次信号，如果检测到注册的信号，就调用其信号处理器。 pcntl\_alarm ( int $seconds ) 设置一个$seconds秒后发送SIGALRM信号的计数器 5.发送信号： posix\_kill(): 向进程发送信号。 SIGINT : 通过键盘CTRL+C. SIGTERM : 有时候进程失去响应了还会执行`kill [PID]`命令，未加任何其他参数的话，程序会接收到一个SIGTERM信号。程序收到上面两个信号的时候，默认都会结束执行，可以通过注册信号改变默认行为。一个注册信号处理器的例子，得到结论： sleep函数会被信号唤醒，不再休眠，返回唤醒时剩余的秒数对于说法同类信号只能存储一个，多余的自动丢弃，测试发现多次CTRL+C后，进程会先唤醒sleep，再唤醒usleep，当执行到pcntl\_signal\_dispatch时，会一次输出多个“SIGINT”，不知道存储一个是不是只的是什么地方。 [![复制代码](https://common.cnblogs.com/images/copycode.gif)](javascript:void(0); "复制代码") ~~~ <?php // 定义一个处理器，接收到SIGINT信号后只输出一行信息 function signalHandler($signal) { if ($signal == SIGINT) { echo 'SIGINT', PHP_EOL; } } // 信号注册：当接收到SIGINT信号时，调用signalHandler()函数 pcntl_signal(SIGINT, 'signalHandler'); /** * PHP < 5.3 使用 * 配合pcntl_signal使用,表示每执行一条低级指令，就检查一次信号，如果检测到注册的信号，就调用其信号处理器。 */ if (!function_exists("pcntl_signal_dispatch")) { declare(ticks=1); } while (true) { $s = sleep(10); echo $s, PHP_EOL; //信号会唤醒sleep,返回剩余的秒数。 // do something for ($i = 0; $i < 5; $i++) { echo $i . PHP_EOL; usleep(100000); } /** * PHP >= 5.3 * 调用已安装的信号处理器 * 必须在循环里调用，为了检测是否有新的信号等待dispatching。 */ if (!function_exists("pcntl_signal_dispatch")) { pcntl_signal_dispatch(); } } ~~~ [![复制代码](https://common.cnblogs.com/images/copycode.gif)](javascript:void(0); "复制代码") 一个隔5s发一个信号的例子，通过pcntl\_alarm实现 [![复制代码](https://common.cnblogs.com/images/copycode.gif)](javascript:void(0); "复制代码") ~~~ <?php declare(ticks = 1); function signal_handler($signal) { print "Caught SIGALRM\n"; pcntl_alarm(5); } pcntl_signal(SIGALRM, "signal_handler", true); pcntl_alarm(5); for(;;) { } ~~~ [![复制代码](https://common.cnblogs.com/images/copycode.gif)](javascript:void(0); "复制代码") 一个通过发送信号杀死进程的例子，信号可以发给自己也可以发给其他进程。 [![复制代码](https://common.cnblogs.com/images/copycode.gif)](javascript:void(0); "复制代码") ~~~ <?php /** * 父进程通过pcntl_wait等待子进程退出 * 子进程通过信号kill自己,也可以在父进程中发送kil信号结束子进程 */ //生成子进程 $pid = pcntl_fork(); if($pid == -1){ die('could not fork'); }else{ if($pid){ $status = 0; //阻塞父进程，直到子进程结束，不适合需要长时间运行的脚本. //可使用pcntl_wait($status, WNOHANG)实现非阻塞式 pcntl_wait($status); exit; }else{ //结束当前子进程，以防止生成僵尸进程 if(function_exists("posix_kill")){ posix_kill(getmypid(), SIGTERM); }else{ system('kill -9'. getmypid()); } exit; } } ~~~ [![复制代码](https://common.cnblogs.com/images/copycode.gif)](javascript:void(0); "复制代码") * * * **多进程--僵尸进程** 当子进程比父进程先退出，但是父进程还在运行中并且可能很长一段时间不会退出，子进程就变成了僵尸进程。然后内核会找到这个僵尸进程的PPID,给这个PPID发送一个SIGCHLD信号。如果父进程中没有通过pcntl\_wait或者pcntl\_waitpid函数处理，并且没有通过posix\_kill发送退出信号给子进程，那么这个子进程就彻底僵尸了。 ps aux查看到时Z（zombie）状态。一般需要在父进程结束前回收子进程先，pcntl\_wait()函数会将父进程挂起，直到一个子进程退出。如果父进程先挂了，子进程会被1号进程接管，当子进程结束时1号进程会自动回收。所以关闭僵尸进程的另一种方法就是关闭他们的父进程。子进程如何得知父进程退出： 1. 当父进程退出时，会有一个INIT进程来领养这个子进程。这个INIT进程的进程号为1，所以子进程可以通过使用getppid()来取得当前父进程的pid。如果返回的是1，表明父进程已经变为INIT进程，则原进程已经推出。 2. 使用kill函数，php中是posix\_kill，向原有的父进程发送空信号（kill(pid, 0)）。使用这个方法对某个进程的存在性进行检查，而不会真的发送信号。所以，如果这个函数返回-1表示父进程已经退出。僵尸进程：在UNIX 系统中，一个进程结束了，但是他的父进程没有等待（调用wait / waitpid）他，那么他将变成一个僵尸进程。僵尸进程是一个早已死亡的进程，但在进程表（processs table）中仍占了一个位置（slot）。僵尸进程不及时回收，会在系统中占用一个进程表项，如果这种僵尸进程过多，最后系统就没有可以用的进程表项，于是也无法再运行其它的程序。任何进程在退出前（exit退出）都会变为僵尸进程。用于保存进程的状态等信息。为什么呢？子进程的结束和父进程的运行是一个异步过程，即父进程永远无法预测子进程到底什么时候结束。那么会不会因为父进程太忙来不及 wait 子进程，或者说不知道子进程什么时候结束，而丢失子进程结束时的状态信息呢？不会。因为UNIX提供了一种机制可以保证，只要父进程想知道子进程结束时的状态信息，就可以得到。这种机制就是：当子进程走完了自己的生命周期后，它会执行exit（）系统调用，内核释放该进程所有的资源，包括打开的文件，占用的内存等。但是仍然为其保留一定的信息（包括进程号the process ID，退出码exit code，退出状态the terminationstatus of the process，运行时间the amount of CPU time taken by the process等），这些数据会一直保留到系统将它传递给它的父进程为止，直到父进程通过wait / waitpid来取时才释放。预防僵尸进程（1）父进程通过wait和waitpid等函数等待子进程结束，这会导致父进程挂起。它不适合子进程需要长时间运行的情况(会导致超时)。执行wait（）或waitpid（）系统调用，则子进程在终止后会立即把它在进程表中的数据返回给父进程，此时系统会立即删除该进入点。在这种情形下就不会产生defunct进程。（2）如果父进程很忙，那么可以用signal函数为SIGCHLD安装handler。在子进程结束后，父进程会收到该信号，可以在handler中调用wait回收。（3）如果父进程不关心子进程什么时候结束，那么可以用signal（SIGCLD, SIG\_IGN）或signal（SIGCHLD, SIG\_IGN）通知内核，自己对子进程的结束不感兴趣，那么子进程结束后，内核会回收，并不再给父进程发送信号（4）fork两次，父进程fork一个子进程，然后继续工作，子进程fork一个孙进程后退出，那么孙进程被init接管，孙进程结束后，init会回收。不过子进程的回收还要自己做。查看和清零僵尸进程：测试发现通过 ps -ef 和 aux 是不能看到僵尸进程的。需要通过top命令实时看到当前系统的僵尸进程个数。 ![](file:///C:/Users/lizhe/AppData/Local/YNote/data/sina2166797151/111faca45e8240b7baeea9761b1d77dc/clipboard.png) 用ps命令查看僵尸进程： ~~~ ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]' ~~~ ~~~ 命令注解：　　-A 参数列出所有进程　　-o 自定义输出字段我们设定显示字段为 stat（状态）, ppid（进程父id）, pid(进程id)，cmd（命令）这四个参数 ~~~ ~~~ 状态为 z或者Z 的进程为僵尸进程，所以我们使用grep抓取stat状态为zZ进程 ~~~ ~~~ 运行结果如下： ~~~ ![](file:///C:/Users/lizhe/AppData/Local/YNote/data/sina2166797151/3e5588f268e94b58899759c8709571d8/clipboard.png) ~~~ 这时，可以使用 kill -HUP 5255 杀掉这个进程。如果再次查看僵尸进程还存在，可以kill -HUP 5253（父进程）。 ~~~ ~~~ 如果有多个僵尸进程，可以通过 ~~~ ~~~ ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]'|awk 'print{$2}'|xargs kill -9 ~~~ ~~~ 处理。 ~~~ * * * **多进程--进程间通信（IPC）** 管道用于承载进程之间的通讯数据。为了方便理解，可以将管道比作文件，进程A将数据写到管道P中，然后进程B从管道P中读取数据。php提供的管道操作 API与操作文件的API基本一样，除了创建管道使用posix\_mkfifo函数，读写等操作均与文件操作函数相同。当然，你可以直接使用文件模拟管道，但是那样无法使用管道的特性了。管道的例子：[http://www.cnblogs.com/bourneli/archive/2012/07/06/2579893.html](http://www.cnblogs.com/bourneli/archive/2012/07/06/2579893.html) * * * **多进程--守护进程** nohup 守护进程项目的Qbus实现百度nohup 百度守护进程 php写守护进程：[http://blog.csdn.net/tengzhaorong/article/details/9764655](http://blog.csdn.net/tengzhaorong/article/details/9764655) * * * **多进程--socket实现简单TCP server** 韩天峰：[http://rango.swoole.com/archives/48](http://rango.swoole.com/archives/48) 上边的是接收端，可以把Qframe中的发送写上，，测试成功否。 [![复制代码](https://common.cnblogs.com/images/copycode.gif)](javascript:void(0); "复制代码") ~~~ <?php static public function sendSDKMsg($version) {/*{{{*/ if(!self::sendRandChance(self::EA_LAST_TIME_KEY.":".$version)) return false; $fp = @fsockopen( "udp://".self::UDP_HOST , self::UDP_PORT , $errno ); if( !$fp ) return false; stream_set_timeout( $fp , 0 , 100 ); stream_set_blocking( $fp , 0 ); $sysinfo = posix_uname(); $msg = $version." - ".$sysinfo['nodename']." - ".date('Y-m-d H:i:s',time()); $res = fwrite( $fp , $msg ); fclose($fp); }/*}}}*/ static public function sendRandChance($key) {/*{{{*/ $now = microtime(true); if(function_exists("eaccelerator_get")) { $lastInserTime = eaccelerator_get($key); if(!$lastInserTime) $lastInserTime = 0; if( ($now - $lastInserTime) < self::SEND_INTERVAL ) return false; eaccelerator_put($key, $now); return true; }else if(function_exists("apc_fetch")) { $lastInserTime = apc_fetch($key); if(!$lastInserTime) $lastInserTime = 0; if( ($now - $lastInserTime) < self::SEND_INTERVAL ) return false; apc_store($key, $now); return true; } $rand = rand(1,60); if((time()%60 == $rand) && rand(0,20) == 3) { return true; } return false; }/*}}}*/ ~~~ [![复制代码](https://common.cnblogs.com/images/copycode.gif)](javascript:void(0); "复制代码")