Ubuntu 12.04下unzip 解压中文乱码解决办法

作者:袖梨 2022-06-30

unzip 解压中文乱码..我在公司写的一些文档…传到网盘里,打包DOwn下来为%name.zip 这种格式的文件,自然是unzip去解压,可是解压出来的文件却乱码了,立刻判定是字符编码的问题,解决起来没什么难度.


微软的CP936通常被视为等同GBK,连 IANA 也以“CP936”为“GBK”之别名。事实上比较起来, GBK 定义之字符较 CP936 多出95字(15个非汉字及80个汉字),皆为其时未收入 ISO 10646 / Unicode 之符号:非汉字包括异体字符号、十二个表意文字描述字符(Ideographic Description Characters)及 GB 5007.1-85《信息交换用汉字 24×24 点阵字模集》附录对 GB 2312 增加,但 Unicode 未收之拼音符号“ḿ”和“ǹ”[4][5];汉字包括未收入 ISO 10646 的《简化字总表》汉字52个、《康熙字典》及《辞海》汉字部件28个[4]。CP936中的这95字分配到了Unicode的私有区域[6][7],现已全部收于新版 Unicode。——–> 摘至 《维基百科》

解决办法有两种:

1、指定字符集使用unzip解压压缩包(碎念:建议使用第一种方法…..):

###可以选择使用GBK 或 GB18030###
mr_liu@i-it:~/i-it-info$ unzip -O CP936 Apache.zip
 

2、将for unzip的字符集参数加入环境变量

Config-Path -- > : mr_liu@i-it:~/i-it-info$ cat /etc/environment    (加入下面两行,有关Unzip的环境变量定义可以参考man手册 临近尾部部分!)
  UNZIP="-O CP936"
  ZIPINFO="-O CP936"

相关文章

精彩推荐