• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

MySQL 中怎么存储 emoji_mysql

mysql 搞代码 7年前 (2018-06-09) 200次浏览 已收录 0个评论

mysql 中如何存储 emoji ?
MySQL 中如何存储 emoji ?

问题还原

使用 erlang 存储一些特殊字符串到 MySQL 的时候,却没法读出来。经检查,这些字符串的二进制格式如下:

<<240,159,152,134,240,159,152,144>>
查看二进制的 unicode 是什么?

14> unicode:characters_to_list(<<240,159,152,134,240,159,152,144>>).
[128518,128528]
15> erlang:integer_to_list(128518,16).%%查看十六进制
“1F606”
16> erlang:integer_to_list(128528,16).
“1F610”
明显,1F606 和 1F610 超过了常见 unicode 字符串 0000-FFFF 的表达范围。

1F606 和 1F610 代表什么?

根据 unicode 官网上的说明,这是一种 emoji(表情符号),具体的展示形式与厂商有关。

MySQL 上存储失败的原因

目前来说,多数 MySQL 都是以 utf8 存储,注意 MySQL 的 utf8 和我们所说的传统 utf8 有点区别。MySQL 的 utf8 编码规定了最多只能有 3 个字节,而 emoji 的 unicode 已经超过了 3 个字节,因此 MySQL 的 utf8 无法识别与存储 emoji。

为此可以查阅 MySQL 中关于 unicode 支持的资料,从中可以得知 MySQL 在 5.5 后开始支持 utf8mb4,这种编码支持 1 ~ 4 个字节,这种编码可以表示 emoji。

另外 utf8mb4 向下兼容 utf8。

解决方案

将 MySQL 中对应的字段改成 utf8mb4 编码:

ALTER TABLE t1
  DEFAULT CHARACTER SET utf8mb4,
  MODIFY col1 CHAR(10)
    CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL,
  MODIFY col2 CHAR(10)
    CHARACTER SET utf8mb4 COLLATE utf8mb4_bin NOT NULL;

将连接库的连接编码改为 utf8mb4,下面兄弟连(www.lampbrother.net)就以 erlang 的连接库 emysql 为例:

emysql:add_pool(pool,[{size,1},{user,”user”},{password,”password”},{host,”host”},{port,3306},{encoding,utf8mb4}]).
%%或者
emysql:add_pool(pool,1,”user”,”password”,”host”,3306,undefined, utf8mb4).
为了建表方便,可以修改 my.cnf:

# 服务器字符集
[mysql]
default-character-set=utf8mb4
[mysqld]
character-set-server=utf8mb4

欢迎大家阅读《MySQL 中怎么存储 emoji_mysql》,跪求各位点评,by 搞代码


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:MySQL 中怎么存储 emoji_mysql

喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址