• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

HTML实体与网页编码

前端 程序员 7年前 (2018-06-21) 162次浏览 已收录 0个评论

汉字都转化为了html实体(十进制表示的Unicode编码),这样做的好处就是不管网页的编码是什么,都可以正常的显示汉字,而不会出现乱码,当然也适用于其他字符集。

php中我们可以用mbstring的mb_convert_encoding函数实现这个正向及反向的转化。
如:

mb_convert_encoding ("你好", "HTML-ENTITIES", "gb2312");    //输出:你好
mb_convert_encoding ("你好", "gb2312", "HTML-ENTITIES");    //输出:你好 
 

如果需要对整个页面转化,则只需要在php文件的头部加上这三行代码:

http://www.gaodaima.com/54637.htmlHTML实体与网页编码

mb_internal_encoding("gb2312");  // 这里的gb2312是你网站原来的编码
mb_http_output("HTML-ENTITIES");
ob_start('mb_output_handler');
 

Asp版 可以用下面这个函数来实现这个转化:

Function htmlentities(str)
    For i = 1 to Len(str)
        char = mid(str, i, 1)
        If AscW(char) > 0 then
            htmlentities = htmlentities & "&#" & Ascw(char) & ";"
        Else
            htmlentities = htmlentities & "&#" & (65536 + ascW(char)) & ";"
        End if
    Next
End Function 

js

 function htmlentities(str)
 {
      var r = "";
      for( i=0; i<str.length; i++ )
      {
           temp = str.charCodeAt(i);
           r += "&#"+temp+";";
      }
     
     //  也可以用一句正则表达式解决
     // r = str.replace(/[/d/D]/g, function($0) { return "&#" + $0.charCodeAt(0) + ";"; });
     return r;
 }

asp.net (c#) 版
 private string GetHtmlEntities(string str)
  {
      string r = string.Empty;
       for (int i = 0; i < str.Length; i++)
       {
            r += "&#"+Char.ConvertToUtf32(str,i)+";";
       }
       return r;
 }

相关文档:网页中常用HTML字符实体

欢迎大家阅读《HTML实体与网页编码》,跪求各位点评,若觉得好的话请收藏本文,by 搞代码


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:HTML实体与网页编码

喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址