关于文件编码的检测,百度一下一大把都是,但是确实没有能用的、很多人建议 mb_detect_encoding 检测,可是不知为何我这不成功,什么都没输出、看到有人写了个增强版,用 BOM 判断的,我果断就无视了,这东西完全不靠谱、最终根据PHP手册里 mb_detect_encoding 函数下方的例子,自己写了一个检测函数,
还包括自动检测编码并按指点编码读取文件的函数、源码献上。
<?php<BR> /**<BR>* 检测文件编码<BR> * @param string $file 文件路径<BR>* @return string|null 返回 编码名 或 null<BR>*/<BR> function detect_encoding($file) {<BR> $list = array('GBK', 'UTF-8', 'UTF-16LE', 'UTF-16BE', 'ISO-8859-1');<BR> $str <b style="color:transparent">本文来源gao@!dai!ma.com搞$$代^@码!网!</b><strong>搞gaodaima代码</strong>= file_get_contents($file);<BR> foreach ($list as $item) {<BR> $tmp = mb_convert_encoding($str, $item, $item);<BR> if (md5($tmp) == md5($str)) {<BR> return $item;<BR> }<BR> }<BR> return null;<BR>}</P><P>/**<BR>* 自动解析编码读入文件<BR>* @param string $file 文件路径<BR>* @param string $charset 读取编码<BR>* @return string 返回读取内容<BR>*/<BR>function auto_read($file, $charset='UTF-8') {<BR> $list = array('GBK', 'UTF-8', 'UTF-16LE', 'UTF-16BE', 'ISO-8859-1');<BR> $str = file_get_contents($file);<BR> foreach ($list as $item) {<BR> $tmp = mb_convert_encoding($str, $item, $item);<BR> if (md5($tmp) == md5($str)) {<BR> return mb_convert_encoding($str, $charset, $item);<BR> }<BR> }<BR> return "";<BR>}<BR>