本文主要介绍linux系统下文件编码的视图和转换方法。这是linux入门学习的基础知识,需要的朋友可以参考一下。





如果你需要操作文件的Windows下的Linux,你可能会经常遇到文件编码转换的问题。在Windows的默认文件格式是GBK(GB2312),和Linux的一般utf-8.below是介绍如何看待Linux文件的编码和如何进行编码转换到一个文件。

查看文件编码
查看Linux中的文件编码可以通过以下方式完成:
(1)。文件编码可以直接查看

复制代码如下:一、查看文件编码
可以显示文件编码格式。
如果您只想查看其他已编码的文件,或者解决使用动态视图查看文件的问题,那么您可以
以下内容添加到~ vimrc文件 /:

复制代码如下:集编码= UTF-8 fileencodings = UCS BOM,UTF-8,cp936
这样,vim可以自动识别(自动识别文件编码UTF-8或GBK编码的文件),事实上,是基于fileencodings的编码列表。如果没有合适的代码被发现,它将打开Latin-1(ASCII码)的编码。
(2)。Enca(如果你不在你的系统,安装这个命令可以使用sudo yum install -Y封装安装)查看文件编码

复制代码代码如下:$封装文件名
文件名:通用转换格式为8位;
CRLF行终止符
需要说明的是,在确定一些GBK编码封装的文件不是很好,而且当他们被发现时,他们就会出现:
无法识别的编码

文件编码转换
因为现在的Linux,Windows的原始文件都在GBK编码,所以复制到Linux是随机码,文件内容可以转换为iconv,但是中国的许多文件名仍然是乱码,找到一条命令,可以将文件名编码,即convmv。
convmv命令的详细参数如

复制代码如下:convmv -f GBK -t UTF-8 *. mp3
但这个命令是不真实的,你可以看到比较之前和之后的转换。如果你想转换为真实的,具有

复制代码如下:convmv -f GBK T UTF-8,具有MP3 *。
的F参数指出编码转换之前,和T是转换代码。不该犯的错误。否则,它可能是一个烂摊子。一个参数是有用的。这是递归转换当前目录下的所有子目录R。
*需要安装convmv-1.10-1.el5.noarch.rpm
一个更好的傻瓜式的命令行工具封装,不仅能智能识别文件的编码,而且还支持批量转换,U3000 U3000
(1)。安装

复制代码如下:$ sudo apt-get install封装
(2)。查看当前文件编码

复制代码如下:l zh_cn ip.txt封装
国家标准GB2312简体中文;包围/混合与非文本数据
(3)。转换命令的格式如下所示
l当前语言封装美元x目标编码文件名
例如,把所有的文件的当前目录下为UTF-8

复制代码代码如下:封装-我zh_cn X UTF-8 *
检查文件的代码
复制代码如下:l zh_cn文件封装
转换文件编码为UTF-8编码
复制代码如下:封装-我zh_cn X UTF-8文件
如果您不想覆盖原始文件,您可以这样做
复制代码如下:封装-我zh_cn X UTF-8文件2