博客动态

Hi！！欢迎来到Jerry Coding！2025年 CSDN资源免积分下载网页版上线，让你轻松GET想要的资源！

扫一扫关注我

More

关于

New

RSS

标签云

网站建设 rest-framework 物联网课程设计 git Nginx Linux CSDN免积分下载 AI Virtualenv winform bootstrap3 ckeditor MySQL ESP8266 12306余票 tkinter C#自动升级器 cdn加速微信助手爬虫 cocos pycharm 瞎扯扯 django pyqt OCR图像识别在线工具 C# django-allauth sqlite ESP32

网站友链

C# httpwebrequest 抓取html乱码("gb2312")

2020年4月8日 Jerry 10564 2020年4月8日

C# 使用httpwebrequest抓取一个网页，返回一直乱码？修改编码格式也没有解决，看看怎么搞！

问题：

C# httpwebrequest 抓取网页返回乱码。

代码：

public void GetHtml()
{
    try
    {
        string url = "http://kaijiang.500.com";
        HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);
        HttpWebResponse response = (HttpWebResponse)request.GetResponse();

        Stream stream;
        StreamReader sr;

        stream = response.GetResponseStream();
        sr = new StreamReader(stream, Encoding.UTF8);

        string strHtml = sr.ReadToEnd();

        stream.Close();
        sr.Close();
        Console.WriteLine(strHtml);
    }
    catch (WebException e)
    {
        e.StackTrace.ToString();
        return;
    }
}

返回乱码：

开始解决：

1、那肯定是编码不对啊，改一下就完了呗。

看下网页的编码，是 gb2312

而代码里面的编码是UTF8，于是把编码改成了gb2312:

sr = new StreamReader(stream, Encoding.GetEncoding("gb2312"));

然而并没有解决啊！！！！！换成了另外一种乱码

接下来就开始尝试各种编码。。。

。。。。

都没有解决，最后搜到了一种处理方法，直接上代码：

 public void GetHtml()
{
    try
    {
        string url = "http://kaijiang.500.com";
        HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);
        HttpWebResponse response = (HttpWebResponse)request.GetResponse();

        Stream stream;
        StreamReader sr;

        if (response.ContentEncoding == "gzip")
        {
            stream = new GZipStream(response.GetResponseStream(), CompressionMode.Decompress);
            sr = new StreamReader(stream, Encoding.GetEncoding("gb2312"));
        }
        else 
        {
            stream = response.GetResponseStream();
            sr = new StreamReader(stream, Encoding.UTF8);
        }

        string strHtml = sr.ReadToEnd();

        stream.Close();
        sr.Close();
        Console.WriteLine(strHtml);
    }
    catch (WebException e)
    {
        e.StackTrace.ToString();
        return;
    }
}