先說下遇到問題:1.php沒有內置unicode_ecode函數可以直接使用
2.網上很多資料都是用$str
= iconv(
$encoding
,
'UCS-2'
,
$str
);
window下轉換出來的是正常的,但在Linux下轉換出來的兩個字符是相反的,用在線unicode轉換工具出來的結果是亂碼。
UCS-2的編碼規則:
windows下默認是UCS-2LE。
linux下默認是UCS-2BE。用iconv(指定UCS-2)來轉換生成的是UCS-2BE的unicode,但可能php環境配置會導致不是UCS-2BE。
windows和linux等多個平台對 UCS-2 的理解不同(UCS-2LE,UCS-2BE),所以為了統一需要直接指定為UCS-2BE。
即把:$str
= iconv(
$encoding
,
'UCS-2'
,
$str
); 改為$str = iconv($encoding, 'UCS-2BE', $str);
親測轉換出來的unicode可以正常轉換的
下面是本人親測可以使用的函數
function unicode_decode($name)
{
// 轉換編碼,將Unicode編碼轉換成可以瀏覽的utf-8編碼
//$pattern = ‘/([\w]+)|(\\\u([\w]{4}))/i’;
$pattern = ‘/(\\\u([\w]{4}))|([\w]+)|(“)|(:)|(,)|(\\\n)|(-)|({)|(})|( )/i’; //這個位置比上面的多了幾個,是因為不這樣,那些字符就被替換掉了
preg_match_all($pattern, $name, $matches);
if (!empty($matches))
{
$name = ”;
for ($j = 0; $j < count($matches[0]); $j++)
{
$str = $matches[0][$j];
if (strpos($str, ‘\\u’) === 0)
{
$code = base_convert(substr($str, 2, 2), 16, 10);
$code2 = base_convert(substr($str, 4), 16, 10);
$c = chr($code).chr($code2);
$c = iconv(‘UCS-2BE’, ‘UTF-8’, $c);
$name .= $c;
}
else
{
$name .= $str;
}
}
}
return $name;
}
下方是調用的
$datareule = unicode_decode($data);
//下方替換,是因為轉換的時候,被過濾掉了,需要替換回來
$datareule = str_replace(“br”, “<br \/>”, “$datareule”);
$datareule = str_replace(“nbsp”, “ ”, “$datareule”);
$datareule = str_replace(“middotmiddotmiddot”, “…”, “$datareule”);
$datareule = str_replace(“\\n”, “”, “$datareule”);
發布者:彬彬筆記,轉載請註明出處:https://www.binbinbiji.com/zh-hant/php/2141.html