二、PHP四種序列化方案橫向?qū)Ρ?/strong>
數(shù)據(jù)的序列化是一個非常有用的功能,然而目測很多人跟我一樣,在剛接觸這玩意的時候壓根就不理解這貨色到底是干啥用的,反正老師說了,實在理解不了就先背過再說。
其實將數(shù)據(jù)序列化的作用無外乎有兩個:
- 方便傳輸
- 方便存儲
方便存儲如何理解呢?比如我們有個PHP對象或者一個PHP數(shù)組需要存儲到數(shù)據(jù)庫甚至文件中,這顯然是不可能的,這個時候必須要將PHP對象或者PHP數(shù)組序列化后再執(zhí)行存儲操作。不過這將PHP數(shù)組序列化后存起來還能理解,這對象也能存儲?。窟@操作是否過于風(fēng)騷?少年,這一點兒都不風(fēng)騷。有些時候?qū)ο笾苯哟鎯ζ饋?,用的時候只需要簡單的反序列化后就可以投產(chǎn)使用了,避免了new一次帶來的性能耗費。
方便傳輸如何理解呢?其實序列化在傳輸中應(yīng)用的相對更多更常見些許。最簡單的一個例子,一個碼前端的碼了一個ajax找你給TA提供一個API,那么這個時候你倆得商量返回什么數(shù)據(jù),比如json或者xml,甚至你倆自己作死約定私有數(shù)據(jù)格式。比如在一個比較典型的服務(wù)架構(gòu)中,網(wǎng)關(guān)服務(wù)器和內(nèi)部RPC服務(wù)器之間通過msgpack傳遞數(shù)據(jù)。這都是典型的序列化為了傳輸?shù)牡湫蛻?yīng)用案例。
這里序列化的概念可能更為廣泛和籠統(tǒng)一些,包括傳統(tǒng)的serialize、json、msgpack、protobuf等。( 如果你覺得序列化這個稱呼不太嚴謹?shù)脑?,可以用encode來代替;反序列化則用decode來代替。反正我就用統(tǒng)統(tǒng)用序列化和反序列化來稱呼了,如果你覺得實在不舒服,可以順著網(wǎng)線來砍我?。?/p>
實際上,從更高的層面看,數(shù)據(jù)的序列化可以分為兩種:
- 文本序列化,常見如json、serialize、xml等
- 二進制序列化,常見如msgpack、protobuf、thrift等
一般說來,考驗序列化技術(shù)的性能指標一共有兩個,一個是序列化的速度,一個是序列化后數(shù)據(jù)的大小,自然是序列化速度越快、序列化后的數(shù)據(jù)越小為佳。就目前來看,protobuf、msgpack等二進制序列化無論是速度上還是數(shù)據(jù)大小上,都要比文本序列化更好。不過話說回來,文本序列化有更好的可讀性,一眼就能瞪出來數(shù)據(jù)內(nèi)容大概是啥玩意。
今天帶到這里的這里的有四個具體的方案,這四種方案都是簡單粗暴、開箱即用類型的,我們分別測試感受下,看哪個更適合我們。
參會的四個哥們:PHP內(nèi)置的serialize、PHP內(nèi)置的JSON解析器、PHP擴展JSOND、PHP擴展msgpack。其中前三個都是文本類型的,msgpack則是二進制類型的。
JSOND作為PHP內(nèi)置的JSON解析器的高級版本,坊間一直傳聞速度上要比內(nèi)置的更牛X一些,作為擴展,這貨需要額外安裝,附送地址:https://pecl.php.net/get/jsond-1.4.0.tgz。
msgpack是一個鳥哥等人搞的一套二進制序列化工具,slogan就是“It's like JSON.but fast and small.”,附送地址:https://pecl.php.net/get/msgpack-2.0.2.tgz
1、serialize用法
serialize(),序列化方法。
unserialize(),反序列化方法。
2、json用法
json_encode(),沒啥好說的吧?
json_decode(),沒啥好說的吧?
3、jsond用法
jsond_encode(),和json_encode()一樣,后面多個字母d而已。
jsond_decode(),和json_decode()一樣,后面多個字母d而已。
4、msgpack用法
msgpack_pack(),序列化方法。
msgpack_unpack(),反序列化方法。
測試代碼如下:
<?php
// 故意搞了一個還算大的php數(shù)組,更容易看出差距來
$arr
=
array
(
array
(
'uid'
=> 22193123,
'gender'
=>
'famale'
,
'username'
=>
'elarity'
,
'password'
=> md5(
'www123'
),
'relation'
=>
array
(
array
(
'uid'
=> 22193123,
'gender'
=>
'famale'
,
'username'
=>
'elarity'
,
'password'
=> md5(
'www123'
),
),
array
(
'uid'
=> 22193123,
'gender'
=>
'famale'
,
'username'
=>
'elarity'
,
'password'
=> md5(
'www123'
),
),
array
(
'uid'
=> 22193123,
'gender'
=>
'famale'
,
'username'
=>
'elarity'
,
'password'
=> md5(
'www123'
),
),
array
(
'uid'
=> 22193123,
'gender'
=>
'famale'
,
'username'
=>
'elarity'
,
'password'
=> md5(
'www123'
),
),
array
(
'uid'
=> 22193123,
'gender'
=>
'famale'
,
'username'
=>
'elarity'
,
'password'
=> md5(
'www123'
),
),
array
(
'uid'
=> 22193123,
'gender'
=>
'famale'
,
'username'
=>
'elarity'
,
'password'
=> md5(
'www123'
),
),
array
(
'uid'
=> 22193123,
'gender'
=>
'famale'
,
'username'
=>
'elarity'
,
'password'
=> md5(
'www123'
),
),
array
(
'uid'
=> 22193123,
'gender'
=>
'famale'
,
'username'
=>
'elarity'
,
'password'
=> md5(
'www123'
),
),
array
(
'uid'
=> 22193123,
'gender'
=>
'famale'
,
'username'
=>
'elarity'
,
'password'
=> md5(
'www123'
),
),
),
)
);
// 每種序列化方案都執(zhí)行100000次
$counter
= 100000;
// json序列化方案,執(zhí)行100000次
echo
PHP_EOL.PHP_EOL;
$start
= microtime( true );
for
(
$i
= 1;
$i
<=
$counter
;
$i
++ ){
$json
= json_encode(
$arr
);
}
$size
=
strlen
(
$json
);
$end
= microtime( true );
$cost_time
=
$end
-
$start
;
echo
"json_encode : 耗費時間為{$cost_time} , 數(shù)據(jù)體積為{$size}"
.PHP_EOL;
// jsond序列化方案,執(zhí)行100000次
$start
= microtime( true );
for
(
$i
= 1;
$i
<=
$counter
;
$i
++ ){
$jsond
= jsond_encode(
$arr
);
}
$size
=
strlen
(
$jsond
);
$end
= microtime( true );
$cost_time
=
$end
-
$start
;
echo
"jsond_encode : 耗費時間為{$cost_time} , 數(shù)據(jù)體積為{$size}"
.PHP_EOL;
// serialize序列化方案,執(zhí)行100000次
$start
= microtime( true );
for
(
$i
= 1;
$i
<=
$counter
;
$i
++ ){
$serialize
= serialize(
$arr
);
}
$size
=
strlen
(
$serialize
);
$end
= microtime( true );
$cost_time
=
$end
-
$start
;
echo
"serialize : 耗費時間為{$cost_time} , 數(shù)據(jù)體積為{$size}"
.PHP_EOL;
// msgpack序列化方案,執(zhí)行100000次
$start
= microtime( true );
for
(
$i
= 1;
$i
<=
$counter
;
$i
++ ){
$msgpack
= msgpack_pack(
$arr
);
}
$size
=
strlen
(
$msgpack
);
$end
= microtime( true );
$cost_time
=
$end
-
$start
;
echo
"msgpack耗費時間為 : {$cost_time} , 數(shù)據(jù)體積為{$size}"
.PHP_EOL;
echo
PHP_EOL.PHP_EOL;
將文件保存為test.php,然后php test.php執(zhí)行,結(jié)果如下圖所示:
總結(jié)一下:
- jsond確實是要比json快一些的
- 總有刁民張嘴就來json要比serialize()快
- serialize()數(shù)據(jù)體積確實大(因為還保留了數(shù)據(jù)類型說明)
- msgpack最佳???不知道昂,你們自己感受