• 已解决 73482 个问题
  • 已帮助 5993 位优秀工程师

什么是utf-8

7943603 2018-06-24 浏览量:1476
不要抄书或者网络用自己的理解解释下.
0 0 收起

我来回答

上传资料:
选择文件 文件大小不超过15M(格式支持:doc、ppt、xls、pdf、zip、rar、txt)
最佳答案
  • 最近也在看字符编码,简单说下我的理解,utf-8是unicode的一种实现,unicode是一种标准,把全世界的所有字符囊括进来,utf-8只是它的一种实现,还有utf-16,utf-32,汉字的编码咱们国家有GBK,GB2312,等等,实际使用如果是汉字就用GBK就可以,如果是其它国家的语言考虑用unicode编码吧
    • 发布于 2018-06-25
    • 举报
    • 评论 4
    • 1
    • 0
xdsnet 回复了 skawu:国标是gb18030 回复
skawu 回复了 xdsnet: GB2312-80字符集,中文名国家标准字符集,GBK字符集,中文名国家标准扩展字符集,GB18030-2000字符集,包含GBK字符集和CJK Ext-A 全部6582个汉字,共计27533个汉字,GB18030-2005字符集,在GB13030-2000的基础上,增加了CJK Ext-B的36862个汉字,以及其它的一些汉字,共计70244个汉字。 回复
xdsnet 回复了 skawu:https://baike.baidu.com/item/gb18030 所以现在的国标应该是gb18030,因为gbk已经被gb18030取代了。标准规范如果有更新的,就应该采用更新的。 回复
skawu 回复了 xdsnet:GBK已经700多k了,21003个汉字,平常使用的汉字都包括了,个人觉得已经够用了,没有采用gb18030,如果项目所需要的汉字超过GBK范围肯定要用最新的标准 回复

其他答案 数量:10
  • 是UTF-8(8-bit Unicode Transformation Format),其实它是Unicode的一种具体表达(面向存储和传输),要说UTF-8不能不说Unicode,Unicode采用32bit来编码字符,所以有足够的空间,满足大多数(全球)语音编码而不冲突的需要,其还兼容ASCII编码,解决了全球字符编码交换的问题,是现代系统最常用的编码体系之一。但它存在一个大的问题是,对诸如英语语言字符的编码存储存在极大的浪费,因为英语其实用ASCII,这样8bit的编码体系就够了,而标准的Unicode是32bit的,其中24bit都是0,存在极大的浪费,对此,就推出了UTF-8,这个对存储和传输更友好的Unicode编码体实现,它对每个字符的具体编码(码表)是和Unicode一一对应的,但在传输和存储时分成了3种类型,对于原来的ASCII低于127的编码,采用8bit,和ASCII一致(其实只有7bit有效,高位为0),然后其上的Unicode字符编码分别有对应的2字节、3字节、4字节的UTF-8编码。这样协调了编码统一和存储、传输友好。
    • 发布于2018-06-24
    • 举报
    • 评论 0
    • 0
    • 0

  • 一种字符编码格式,是大家都在用的一种统一格式,让各种文件存储、传输后,在其他地区也能完整看到。
    • 发布于2018-06-24
    • 举报
    • 评论 0
    • 0
    • 0

  • 就是一种编码格式,将各种字符用16进制的形式来表示,方便存储
    • 发布于2018-06-24
    • 举报
    • 评论 0
    • 0
    • 0

  • 简单来说就是计算机储存字符的一种规则,就是一串二进制对应一个字符,把所有的字符对应起来就是字符集了。每种字符集都有不一样
    • 发布于2018-06-24
    • 举报
    • 评论 0
    • 0
    • 0

  • UTF-8是国际通用的一套字符编码集,包含世界上所有字符,所有国家的字符都包含在里面。

    • 发布于2018-06-24
    • 举报
    • 评论 0
    • 0
    • 0

  • TF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码,由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码Unicode字符。用在网页上可以统一页面显示中文简体繁体及其它语言(如英文,日文,韩文)。
    • 发布于2018-06-24
    • 举报
    • 评论 0
    • 0
    • 0

  • 这只是一种编码的标准,所有使用这个编码的都可以使用相同的方式进行解析
    • 发布于2018-06-25
    • 举报
    • 评论 0
    • 0
    • 0

  • UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。
    
    GBK包含全部中文字符;UTF-8则包含全世界所有国家需要用到的字符。
    
    GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准)
    UTF-8编码的文字可以在各国各种支持UTF8字符集的浏览器上显示。
    比如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,而无需他们下载IE的中文语言支持包。 所以,对于英文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。
    
    UTF8是国际编码,它的通用性比较好,外国人也可以浏览论坛,GBK是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大~
    • 发布于2018-06-29
    • 举报
    • 评论 0
    • 0
    • 0

  • 就是一种通用的编码格式,全世界所有语言的字符都包括在里面
    • 发布于2018-07-19
    • 举报
    • 评论 0
    • 0
    • 0

相关问题

问题达人换一批

什么是utf-8