C#怎么判断一个文件的编码格式是UTF-8 without BOM的啊

创建时间：2016-08-14 投稿人：浏览次数：2240

文本文件的开头头三个字节存放编码格式，这三个字节就叫做 BOM。

当头部开始的两个字节为 0xff 0xfe 0x41 时，是Unicode的小尾编码；
当头部的两个字节为 0xfe 0xff 0x00 时，是Unicode的大尾编码；
当头部两个字节为 0xef 0xbb 0xbf 时，是Unicode的UTF-8编码；
当它不为这些时，则是ANSI编码。
判断是ANSI还是无BOM的UTF-8还得多一步，

http://blog.csdn.net/ybhjx/article/details/52205831

C#写文件时指定是否有BOM：
1）下面的代码是UTF-8 without BOM:

var utf8WithoutBom = new System.Text.UTF8Encoding(false);
using (var sink = new StreamWriter("Foobar.txt", false, utf8WithoutBom))
{
sink.WriteLine("...");
}

2）下面是C#在写文件时指定BOM头的代码：
var utf8WithBom = new System.Text.UTF8Encoding(true);  // 用true来指定包含bom

StreamWriter swr = null;
try
{
    swr = new StreamWriter("okbase.txt", false, utf8WithBom);
    swr.Write("hello okbase.net!");
}
catch(Exception e)
{
}
finally
{
    if (swr != null)
    {
        swr.Close();
        swr.Dispose();
    }
}

声明：该文观点仅代表作者本人，入门客AI创业平台信息发布平台仅提供信息存储空间服务，如有疑问请联系rumenke@qq.com。

上一篇： EasyTouch中虚拟摇杆的使用EasyJoystick
下一篇： C++变量与指针

热门文章: 如何替换字符数组中的某...; U3D打Android包的设置; C# 编码转换 UTF8转GB2312 GB2312...; EasyTouch中虚拟摇杆的使用Eas...; C#怎么判断一个文件的编码...; C++变量与指针

最新文章: C#怎么判断一个文件的编码...; EasyTouch中虚拟摇杆的使用Eas...; C# 编码转换 UTF8转GB2312 GB2312...; U3D打Android包的设置; 如何替换字符数组中的某...; c# 一维数组和二维数组的定...