如果使用 StreamWriter 创建的文本,都是默认带 BOM ,如果需要创建一个不带BOM的文件,请看本文。
因为有很多个编码,打开一个文件,很难判断这个文件是什么编码。所以微软就在文件的开始写入4个byte,来告诉程序这个文件是什么格式。需要知道,这个 BOM 是微软定义的,所以在很多的系统是没有 BOM 的,所以保存了一个 xml 文件,可以在其他系统读取就出错了,他们不知道 BOM 。
下面就来提供一个简单的方法创建不带 BOM 的文件。因为和编码有关系,所以只需要替换 StreamWriter 的编码就会好了,下面提供两个方法创建编码。
Encoding utf8WithoutBom = new UTF8Encoding(false);
Encoding isoLatin1Encoding = Encoding.GetEncoding("ISO-8859-1");
建议使用第一个方法,创建编码就可以开始写文件
下面是把 GBK 编码的文件读取然后转换为 UTF8 的代码,代码可以直接运行,当然需要修改文件为自己的文件。
static void Main(string[] args)
{
var file = new FileInfo("E:\\博客\\创建不带BOM 的UTF8.txt");
string str = "";
using (StreamReader stream = new StreamReader(file.FullName, Encoding.GetEncoding("GBK")))
{
str = stream.ReadToEnd();
}
Encoding utf8WithoutBom = new UTF8Encoding(false);
using (StreamWriter stream = new StreamWriter(file.FullName, false, utf8WithoutBom))
{
stream.Write(str);
}
}
参见:http://stackoverflow.com/questions/2502990/create-text-file-without-bom
本文会经常更新,请阅读原文: https://dotnet-campus.github.io//post/%E5%88%9B%E5%BB%BA%E4%B8%8D%E5%B8%A6BOM-%E7%9A%84UTF8.html ,以避免陈旧错误知识的误导,同时有更好的阅读体验。
本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。欢迎转载、使用、重新发布,但务必保留文章署名 lindexi (包含链接: https://dotnet-campus.github.io/ ),不得用于商业目的,基于本文修改后的作品务必以相同的许可发布。如有任何疑问,请 与我联系 。