摘要:什么是生成器(yield)?做Python或者其他語言的小伙伴,對于生成器應該不陌生。但很多PHP開發(fā)者或許都不知道生成器這個功能,可能是因為生...
什么是生成器(yield)?做Python或者其他語言的小伙伴,對于生成器應該不陌生。但很多PHP開發(fā)者或許都不知道生成器這個功能,可能是因為生成器是PHP 5.5.0才引入的功能,也可以是生成器作用不是很明顯。但是,生成器功能的確非常有用。
(PHP 5 >= 5.5.0, PHP 7)
生成器提供了一種更容易的方法來實現(xiàn)簡單的對象迭代,相比較定義類實現(xiàn) Iterator 接口的方式,性能開銷和復雜性大大降低。
生成器允許你在 foreach 代碼塊中寫代碼來迭代一組數(shù)據(jù)而不需要在內(nèi)存中創(chuàng)建一個數(shù)組, 那會使你的內(nèi)存達到上限,或者會占據(jù)可觀的處理時間。相反,你可以寫一個生成器函數(shù),就像一個普通的自定義函數(shù)一樣, 和普通函數(shù)只返回一次不同的是, 生成器可以根據(jù)需要 yield 多次,以便生成需要迭代的值。
直接講概念估計你聽完還是一頭霧水,所以我們先來說說優(yōu)點,也許能勾起你的興趣。那么生成器有哪些優(yōu)點,如下:
優(yōu)點:
1.生成器會對PHP應用的性能有非常大的影響
2.PHP代碼運行時節(jié)省大量的內(nèi)存
3.比較適合計算大量的數(shù)據(jù)
首先,放下生成器概念的包袱,來看一個簡單的PHP函數(shù):
function createRange($number){ $data = []; for($i=0;$i<$number;$i++){ $data[] = time(); } return $data; }
這是一個非常常見的PHP函數(shù),我們在處理一些數(shù)組的時候經(jīng)常會使用。這里的代碼也非常簡單:
我們創(chuàng)建一個函數(shù)。
函數(shù)內(nèi)包含一個for循環(huán),我們循環(huán)的把當前時間放到$data里面
for循環(huán)執(zhí)行完畢,把$data返回出去。
下面沒完,我們繼續(xù)。我們再寫一個函數(shù),把這個函數(shù)的返回值循環(huán)打印出來:
$result = createRange(10); // 這里調(diào)用上面我們創(chuàng)建的函數(shù) foreach($result as $value){ sleep(1);//這里停頓1秒,我們后續(xù)有用 echo $value.'<br />'; }
我們在瀏覽器里面看一下運行結果:
這里非常完美,沒有任何問題。(當然 sleep(1) 效果你們看不出來)
我們注意到,在調(diào)用函數(shù) createRange 的時候給 $number 的傳值是10,一個很小的數(shù)字。假設,現(xiàn)在傳遞一個值10000000(1000萬)。
那么,在函數(shù) createRange 里面,for循環(huán)就需要執(zhí)行1000萬次。且有1000萬個值被放到 $data 里面,而$data數(shù)組在是被放在內(nèi)存內(nèi)。所以,在調(diào)用函數(shù)時候會占用大量內(nèi)存。這里,生成器就可以大顯身手了。
我們直接修改代碼,你們注意觀察:
function createRange($number){ for($i=0;$i<$number;$i++){ yield time(); } }
看下這段和剛剛很像的代碼,我們刪除了數(shù)組 $data ,而且也沒有返回任何內(nèi)容,而是在 time() 之前使用了一個關鍵字yield。
我們再運行一下第二段代碼:
$result = createRange(10); // 這里調(diào)用上面我們創(chuàng)建的函數(shù) foreach($result as $value){ sleep(1); echo $value.'<br />'; }
我們奇跡般的發(fā)現(xiàn)了,輸出的值和第一次沒有使用生成器的不一樣。這里的值(時間戳)中間間隔了1秒。
這里的間隔一秒其實就是 sleep(1) 造成的后果。但是為什么第一次沒有間隔?那是因為:
未使用生成器時: createRange 函數(shù)內(nèi)的 for 循環(huán)結果被很快放到 $data 中,并且立即返回。所以, foreach 循環(huán)的是一個固定的數(shù)組。
使用生成器時: createRange 的值不是一次性快速生成,而是依賴于 foreach 循環(huán)。 foreach 循環(huán)一次, for 執(zhí)行一次。
到這里,你應該對生成器有點兒頭緒。
我們來還原一下代碼執(zhí)行過程:
首先調(diào)用 createRange 函數(shù),傳入?yún)?shù)10,但是 for 值執(zhí)行了一次然后停止了,并且告訴 foreach 第一次循環(huán)可以用的值。
foreach 開始對 $result 循環(huán),進來首先 sleep(1) ,然后開始使用 for 給的一個值執(zhí)行輸出。
foreach 準備第二次循環(huán),開始第二次循環(huán)之前,它向 for 循環(huán)又請求了一次。
for 循環(huán)于是又執(zhí)行了一次,將生成的時間戳告訴 foreach .
foreach 拿到第二個值,并且輸出。由于 foreach 中 sleep(1) ,所以, for 循環(huán)延遲了1秒生成當前時間
所以,整個代碼執(zhí)行中,始終只有一個記錄值參與循環(huán),內(nèi)存中也只有一條信息。
無論開始傳入的 $number 有多大,由于并不會立即生成所有結果集,所以內(nèi)存始終是一條循環(huán)的值。
概念理解
到這里,你應該已經(jīng)大概理解什么是生成器了。下面我們來說下生成器原理。
首先明確一個概念:生成器yield關鍵字不是返回值,他的專業(yè)術語叫產(chǎn)出值,只是生成一個值。
那么代碼中 foreach 循環(huán)的是什么?其實是PHP在使用生成器的時候,會返回一個 Generator 類的對象。 foreach 可以對該對象進行迭代,每一次迭代,PHP會通過 Generator 實例計算出下一次需要迭代的值。這樣 foreach 就知道下一次需要迭代的值了。
而且,在運行中 for 循環(huán)執(zhí)行后,會立即停止。等待 foreach 下次循環(huán)時候再次和 for 索要下次的值的時候,循環(huán)才會再執(zhí)行一次,然后立即再次停止。直到不滿足條件不執(zhí)行結束。
實際開發(fā)應用
很多PHP開發(fā)者不了解生成器,其實主要是不了解應用領域。那么,生成器在實際開發(fā)中有哪些應用?
1.讀取超大文件
PHP開發(fā)很多時候都要讀取大文件,比如csv文件、text文件,或者一些日志文件。這些文件如果很大,比如5個G。這時,直接一次性把所有的內(nèi)容讀取到內(nèi)存中計算不太現(xiàn)實。
這里生成器就可以派上用場啦。簡單看個例子:讀取text文件
這是第1行 這是第2行 這是第3行 這是第4行 這是第5行 這是第6行 這是第7行 這是第8行 這是第9行 這是第10行
我們創(chuàng)建一個text文本文檔,并在其中輸入幾行文字,示范讀取。
<?php header("content-type:text/html;charset=utf-8"); function readTxt(){ # code... $handle = fopen("./test.txt", 'rb'); while (feof($handle)===false) { # code... yield fgets($handle); } fclose($handle); } foreach (readTxt() as $key => $value) { # code... echo $value.'<br />'; }
通過上圖的輸出結果我們可以看出代碼完全正常。
但是,背后的代碼執(zhí)行規(guī)則卻一點兒也不一樣。使用生成器讀取文件,第一次讀取了第一行,第二次讀取了第二行,以此類推,每次被加載到內(nèi)存中的文字只有一行,大大的減小了內(nèi)存的使用。
這樣,即使讀取上G的文本也不用擔心,完全可以像讀取很小文件一樣編寫代碼。
2.百萬級別的訪問量
yield提供了一種更容易的方法來實現(xiàn)簡單的迭代對象,相比較定義類實現(xiàn) Iterator 接口的方式,性能開銷和復雜性大大降低。
yield生成器允許你 在 foreach 代碼塊中寫代碼來迭代一組數(shù)據(jù)而不需要在內(nèi)存中創(chuàng)建一個數(shù)組。
示例1:
/** * 計算平方數(shù)列 * @param $start * @param $stop * @return Generator */ function squares($start, $stop) { if($start < $stop) { for($i = $start; $i <= $stop; $i++){ yield $i => $i * $i; } }else{ for($i = $start; $i >= $stop; $i--){ yield $i => $i * $i; //迭代生成數(shù)組: 鍵=>值 } } } foreach (squares(3, 15) as $n => $square) { echo $n.'squared is'.$square.'<br>'; } 輸出: 3 squared is 9 4 squared is 16 5 squared is 25 ...
示例2:
比如從數(shù)據(jù)庫取出數(shù)億條數(shù)據(jù),這個時候要求用一次請求加響應返回所有值該怎么辦呢?獲取所有值,然后輸出,這樣肯定不行,因為會造成PHP內(nèi)存溢出的,因為數(shù)據(jù)量太大了。如果這時候用yield就可以將數(shù)據(jù)分段獲取,理論上這樣是可以取出無限的數(shù)據(jù)的。
一般的獲取方式 :
數(shù)據(jù)庫連接..... $sql = "select * from `user` limit 0,500000000"; $stat = $pdo->query($sql); $data = $stat->fetchAll(); //mysql buffered query遍歷巨大的查詢結果導致的內(nèi)存溢出 var_dump($data);
yield獲取方式:
數(shù)據(jù)庫連接..... function db_get(){ $sql = "select * from `user` limit 0,500000000"; $stat = $pdo->query($sql); while ($row = $stat->fetch()) { yield $row; } } foreach (db_get() as $row) { var_dump($row); }
網(wǎng)友評論:
2020-06-06 12:03:31 回復