登录 用户中心() [退出] 后台管理 注册
   
您的位置: 首页 >> NEWBT免费邮箱 >> 主题: 开发日志8: gb18030 字符集及多分段的带字符集属性标题     [回主站]     [分站链接]
开发日志8: gb18030 字符集及多分段的带字符集属性标题
浏览(408 + ) 作者: clq  发表于 2017-12-26 11:02:14   编辑 关键字:

开发日志8: gb18030 字符集及多分段的带字符集属性标题

这个标题很是拗口,首先是 gb18030 字符集,一直以来 gbk 的支持各个软件就不太好,以 gb2312 为多. 用 gb18030 的非常少,
最近用某个很主流的邮箱 web 版本发送中文邮件时意外的没解码出来,一看,它既没有用最流行的 utf8 也没有用常见的 gbk/gb2312 ,尝试用 gbk 去解码居然是错误的.
查了不少资料才知道,原来 gb18030 是使用 utf8 这样的编码方式来填充了 gbk 这样的数据 ... 估计大家还是没听懂 .. 简单来说,这是一个中文版本的 utf8 -- 虽然 utf8 中
已经有中文了 ... 从技术上来说这很无聊,不过从文化传承的严肃性来说我是支持有一个独立的国家字符集的,毕竟老外不可能真正了解中文.
要支持这个字符集对于现在的开发语言来说也很容易,搞清楚原因,添加支持就行了.

另外还同时解决了多个 =? .. ?= 对包括的中文标题的解码,这个古怪的标识其实是有 rfc 标准的,不过 rfc 嘛一向不严谨,所以很多 "自由发挥" 的邮件系统的中文标题真有点难解码.
我手头的 golang 版本就不行,以前写 eemail 的时候用的 mail2000 控件也不行,这次我用了个简单的方法来解决: 既然 golang 不支持多个但支持单个解码,那我就把多个的标题
分割成单个的标题数组就行了. 这种方法的问题主要在于某些特殊的标题会被分割,不过比起很多解码不出的中文标题,还是好多了.



[2017-12-26 11:04:01 最后更新]


总数:0 页次:1/0 首页 尾页  
总数:0 页次:1/0 首页 尾页  


所在合集/目录



发表评论:
文本/html模式切换 插入图片 文本/html模式切换


附件:



NEWBT官方QQ群1: 276678893
可求档连环画,漫画;询问文本处理大师等软件使用技巧;求档softhub软件下载及使用技巧.
但不可"开车",严禁国家敏感话题,不可求档涉及版权的文档软件.
验证问题说明申请入群原因即可.

Copyright © 2005-2020 clq, All Rights Reserved
版权所有
桂ICP备15002303号-1