- Content-Encoding -- http 中可以大幅节省带宽的压缩选项

您的位置：首页 >> 程序员学前班[不再更新，只读] >> 主题: Content-Encoding -- http 中可以大幅节省带宽的压缩选项 [回主站] [分站链接]

您的位置：首页 >> 程序员学前班[不再更新，只读] >> 主题: Content-Encoding -- http 中可以大幅节省带宽的压缩选项 [最新] [回主站]

标题

Content-Encoding -- http 中可以大幅节省带宽的压缩选项

clq

浏览(171) + 2010-09-25 16:16:30 发表编辑

关键字:

[2024-07-08 03:13:46 最后更新]
Content-Encoding -- http 中可以大幅节省带宽的压缩选项

来自一个 "php 压缩页面" 的搜索.

clq

2010-9-25 16:20:40 发表编辑

来自 http://www.weberdev.com/get_example-1842.html
据说"这是catoc的一段很早以前的代码，是在weblogs.com看到的，他利用了zlib的函数，对传输的内容进行了压缩，测试表明，对于10k以上的页面，会产生效果，而且页面越大，效果越明显……"
--------------------------------------------------
<?
/********************************************************************
** Title.........: PHP4 HTTP Compression Speeds up the Web
** Version.......: 1.11
** Author........: catoc <catoc@163.net>
** Filename......: gzdoc.php
** Last changed..: 14/02/2000
** Requirments...: PHP4 >= 4.0.1
** PHP was configured with --with-zlib[=DIR]
** Notes.........: Dynamic Content Acceleration compresses
** the data transmission data on the fly
** code by sun jin hu (catoc) <catoc@163.net>
** Most newer browsers since 1998/1999 have
** been equipped to support the HTTP 1.1
** standard known as "content-encoding."
** Essentially the browser indicates to the
** server that it can accept "content encoding"
** and if the server is capable it will then
** compress the data and transmit it. The
** browser decompresses it and then renders
** the page.
** PHP 4.0.4 supports built-in HTTP compression.
** Version 1.11 cleaning code.
** Usage........:
** No space before the beginning of the first '<?' tag.
** ------------Start of file----------
** |<?
** | include('gzdoc.php');
** |?>
** |<HTML>
** |... the page ...
** |</HTML>
** |<?
** | gzdocout();
** |?>
** -------------End of file-----------
*******************************************************************/
ob_start();
ob_implicit_flush(0);
function GzDocOut(){
global $HTTP_ACCEPT_ENCODING, $DEBUG;
$DEBUG = ($DEBUG) ? $DEBUG : 1;
if(preg_match('/(x-gzip|gzip)/', $HTTP_ACCEPT_ENCODING, $EncodeArr)){
$ENCODING = $EncodeArr[1];
$Contents = ob_get_contents();
ob_end_clean();
header("Content-Encoding: $ENCODING");
$Contents .= ($DEBUG) ? "\n" : '';
if($DEBUG == 2){
$Contents .= "\n';
$Contents .= "\n';
}
$Size = strlen($Contents);
$Crc = crc32($Contents);
$Contents = gzcompress($Contents);
print pack('c*',0x1f,0x8b,0x08,0x00,0x00,0x00,0x00,0x00);
print substr($Contents, 0, strlen($Contents) - 4);
print pack('V*',$Crc,$Size);
exit;
}else{
print ($DEBUG) ? '' : '';
ob_end_flush();
exit;
}
}
?>

clq

2010-9-25 16:22:11 发表编辑

原理是比较简单的,见 http://topic.csdn.net/u/20090406/10/b521dd9f-5e36-404a-b169-48e69361aabf.html
--------------------------------------------------
请问http网页中的Content-Encoding: gzip，查看了网上的一些资料后，在服务器传过来的数据中,在/r/n/r/n后就是压缩的数据，用c#自带的gzipstream直接解压这部分数据时出现幻数错误，请问怎么解决。

zzxap
(风语者)

C# code


最近使用gzip压缩进行文件传递，在网上找了些关于gzip压缩的帖子，发现都有问题，于是我又查msdn，希望能找到一些sample来参考，找是找到了，但是我发现仍旧是有问题，于是我就找msdn例子的bug。

下面是我测试通过的代码，供大家参考：

private byte[] CompressFile(FileStream fs)
        {
            byte[] buffer = new byte[fs.Length];
            fs.Read(buffer, 0, (int)fs.Length);
            MemoryStream ms = new MemoryStream();

            GZipStream gZipStream = new GZipStream(ms, CompressionMode.Compress);
           
            gZipStream.Write(buffer,0,buffer.Length);
            
            gZipStream.Close();
            ms.Flush();
           byte[] data= ms.ToArray();
            ms.Close();
            return data;
        }
       
        private void DecompressFile(byte[] stream, string file)
        {
            MemoryStream ms = new MemoryStream(stream);
            GZipStream gzipStream = null;
            FileStream fs = null;
            try
            {
                 gzipStream = new GZipStream(ms, CompressionMode.Decompress);
                 fs = new FileStream(file, FileMode.Create, FileAccess.Write, FileShare.Write);
                 int length = ReadAllBytesFromStream(gzipStream, fs);
          
                 fs.Flush();
            }
            catch (Exception e)
            {

            }
            finally
            {
                ms.Close();
                fs.Close();
                gzipStream.Close();
            }
                
            }
       
        private static int ReadAllBytesFromStream(Stream stream, FileStream fs)
        {
            
            int offset = 0;
            int totalCount = 0;
            while (true)
            {
                byte[] buffer = new byte[1000];
                int bytesRead = stream.Read(buffer, 0, 1000);
                if (bytesRead == 0)
                {
                    break;
                }
                fs.Write(buffer, 0, bytesRead);
                offset += bytesRead;
                totalCount += bytesRead;
            }
            return totalCount;
        }

clq

2010-9-25 16:38:18 发表编辑

Example 4.

<?php
ob_start();//打开缓冲区
?>
php页面的全部输出
<?
$content = ob_get_contents();//取得php页面输出的全部内容
$fp = fopen(“output00001.html”, “w”); //创建一个文件，并打开，准备写入
fwrite($fp, $content); //把php页面的内容全部写入output00001.html，然后……
fclose($fp);
?>

这样，所谓的静态模版就很容易的被实现了……

--------------------------------------------------

用PHP控制浏览器cache obstart()函数详解

php 2009-11-12 13:09:06 阅读48 评论0 字号：大中小订阅

引用

小波波的用PHP控制浏览器cache obstart()函数详解
Output Control 函数可以让你自由控制脚本中数据的输出。它非常地有用，特别是对于：当你想在数据已经输出后，再输出文件头的情况。输出控制函数不对使用 header() 或 setcookie(), 发送的文件头信息产生影响,只对那些类似于 echo() 和 PHP 代码的数据块有作用。

我们先举一个简单的例子，让大家对Output Control有一个大致的印象：
Example 1.

<?php
ob_start(); //打开缓冲区
echo \"Hellon\"; //输出
header(“location:index.php”); //把浏览器重定向到index.php
ob_end_flush();//输出全部内容到浏览器
?>

所有对header()函数有了解的人都知道，这个函数会发送一段文件头给浏览器，但是如果在使用这个函数之前已经有了任何输出（包括空输出，比如空格，回车和换行）就会提示出错。如果我们去掉第一行的ob_start()，再执行此程序，我们会发现得到了一条错误提示：“Header had all ready send by”！但是加上ob_start，就不会提示出错，原因是当打开了缓冲区，echo后面的字符不会输出到浏览器，而是保留在服务器，直到你使用 flush或者ob_end_flush才会输出，所以并不会有任何文件头输出的错误！

一、相关函数简介：

1、Flush：刷新缓冲区的内容，输出。
函数格式：flush()
说明：这个函数经常使用，效率很高。
2、ob_start ：打开输出缓冲区
函数格式：void ob_start(void)
说明：当缓冲区激活时，所有来自PHP程序的非文件头信息均不会发送，而是保存在内部缓冲区。为了输出缓冲区的内容，可以使用ob_end_flush()或flush()输出缓冲区的内容。
3 、ob_get_contents ：返回内部缓冲区的内容。
使用方法：string ob_get_contents(void)
说明：这个函数会返回当前缓冲区中的内容，如果输出缓冲区没有激活，则返回 FALSE 。
4、ob_get_length：返回内部缓冲区的长度。
使用方法：int ob_get_length(void)
说明：这个函数会返回当前缓冲区中的长度；和ob_get_contents一样，如果输出缓冲区没有激活。则返回 FALSE。
5、ob_end_flush ：发送内部缓冲区的内容到浏览器，并且关闭输出缓冲区。
使用方法：void ob_end_flush(void)
说明：这个函数发送输出缓冲区的内容（如果有的话）。
6、ob_end_clean：删除内部缓冲区的内容，并且关闭内部缓冲区
使用方法：void ob_end_clean(void)
说明：这个函数不会输出内部缓冲区的内容而是把它删除！
7、ob_implicit_flush：打开或关闭绝对刷新
使用方法：void ob_implicit_flush ([int flag])
说明：使用过Perl的人都知道$|=x的意义，这个字符串可以打开/关闭缓冲区，而ob_implicit_flush函数也和那个一样，默认为关闭缓冲区，打开绝对输出后，每个脚本输出都直接发送到浏览器，不再需要调用 flush()

二、深入了解：

1. 关于Flush函数：
这个函数在PHP3中就出现了，是一个效率很高的函数，他有一个非常有用的功能就是刷新browser的cache.我们举一个运行效果非常明显的例子来说明flush.

Example 2.

<?php
for($i = 1; $i <= 300; $i++ ) print(“ “);
// 这一句话非常关键，cache的结构使得它的内容只有达到一定的大小才能从浏览器里输出
// 换言之，如果cache的内容不达到一定的大小，它是不会在程序执行完毕前输出的。经
// 过测试，我发现这个大小的底限是256个字符长。这意味着cache以后接收的内容都会
// 源源不断的被发送出去。
For($j = 1; $j <= 20; $j++) {
echo $j.”
”;
flush(); //这一部会使cache新增的内容被挤出去，显示到浏览器上
sleep(1); //让程序“睡”一秒钟，会让你把效果看得更清楚
}
?>

注：如果在程序的首部加入ob_implicit_flush()打开绝对刷新,就可以在程序中不再使用flush(),这样做的好处是：提高效率！

2. 关于ob系列函数：
我想先引用我的好朋友y10k的一个例子：

Example 3.
比如你用得到服务器和客户端的设置信息，但是这个信息会因为客户端的不同而不同，如果想要保存phpinfo()函数的输出怎么办呢？在没有缓冲区控制之前，可以说一点办法也没有，但是有了缓冲区的控制，我们可以轻松的解决：

<?php
ob_start(); //打开缓冲区
phpinfo(); //使用phpinfo函数
$info=ob_get_contents(); //得到缓冲区的内容并且赋值给$info
$file=fopen(\'info.txt\',\'w\'); //打开文件info.txt
fwrite($file,$info); //写入信息到info.txt
fclose($file); //关闭文件info.txt
?>

用以上的方法，就可以把不同用户的phpinfo信息保存下来，这在以前恐怕没有办法办到！其实上面就是将一些“过程”转化为“函数”的方法！
或许有人会问：“难道就这个样子吗？还有没有其他用途？”当然有了，比如笔者论坛的PHP 语法加亮显示就和这个有关（PHP默认的语法加亮显示函数会直接输出，不能保存结果，如果在每次调用都显示恐怕会很浪费CPU，笔者的论坛就把语法加亮函数显示的结果用控制缓冲区的方法保留了），大家如果感兴趣的话可以来看看http://www.zphp.com/bbs/！

可能现在大家对ob_start()的功能有了一定的了解，上面的一个例子看似简单，但实际上已经掌握了使用ob_start()的要点。

<1>.使用ob_start打开browser的cache，这样可以保证cache的内容在你调用flush(),ob_end_flush()（或程序执行完毕）之前不会被输出。
<2>. 现在的你应该知道你所拥有的优势：可以在任何输出内容后面使用header,setcookie以及session，这是ob_start一个很大的特点；也可以使用ob_start的参数，在cache被写入后，然后自动运行命令，比如ob_start(\”ob_gzhandler\”)；而我们最常用的做法是用ob_get_contents()得到cache中的内容，然后再进行处理……
<3>.当处理完毕后，我们可以使用各种方法输出，flush(),ob_end_flush(),以及等到程序执行完毕后的自动输出。当然，如果你用的是ob_get_contents()，那么就要你自己控制输出方式了。

来，让我们看看能用ob系列函数做些什么……

一、静态模版技术

简介：所谓静态模版技术就是通过某种方式，使得用户在client端得到的是由PHP产生的html页面。如果这个html页面不会再被更新，那么当另外的用户再次浏览此页面时，程序将不会再调用PHP以及相关的数据库，对于某些信息量比较大的网站，例如sina,163,sohu。类似这种的技术带来的好处是非常巨大的。

我所知道的实现静态输出的有两种办法：
<1>.通过y10k修改的phplib的一个叫template.inc.php类实现。
<2>.使用ob系列函数实现。
对于第一种方法，因为不是这篇文章所要研究的问题，所以不再赘述。
我们现在来看一看第二种方法的具体实现：

Example 4.

<?php
ob_start();//打开缓冲区
?>
php页面的全部输出
<?
$content = ob_get_contents();//取得php页面输出的全部内容
$fp = fopen(“output00001.html”, “w”); //创建一个文件，并打开，准备写入
fwrite($fp, $content); //把php页面的内容全部写入output00001.html，然后……
fclose($fp);
?>

这样，所谓的静态模版就很容易的被实现了……

二、捕捉输出

以上的Example 4.是一种最简单的情况，你还可以在写入前对$content进行操作……
你可以设法捕捉一些关键字，然后去对它进行再处理，比如Example 3.所述的PHP语法高亮显示。个人认为，这个功能是此函数最大的精华所在，它可以解决各种各样的问题，但需要你有足够的想象力……

Example 5.

<?php
Function run_code($code) {
If($code) {
ob_start();
eval($code);
$contents = ob_get_contents();
ob_end_clean();
}else {
echo “错误！没有输出”;
exit();
}
return $contents;
}
?>

以上这个例子的用途不是很大，不过很典型$code的本身就是一个含有变量的输出页面，而这个例子用eval把$code中的变量替换，然后对输出结果再进行输出捕捉，再一次的进行处理……

Example 6. 加快传输
......

clq

2010-9-25 16:41:01 发表编辑

标题: 使用php4加速网络传输。

<?
/***************************************
** Title.........: PHP4 HTTP Compression Speeds up the Web
** Version.......: 1.10
** Author........: catoc <catoc@163.net>
** Filename......: gzdoc.php
** Last changed..: 25/08/2000
** Requirments...: PHP4 >= 4.0.1
** PHP was configured with --with-zlib[=DIR]
** Notes.........: Dynamic Content Acceleration compresses
** the data transmission data on the fly
** code by sun jin hu (catoc) <catoc@163.net>
** Most newer browsers since 1998/1999 have
** been equipped to support the HTTP 1.1
** standard known as "content-encoding."
** Essentially the browser indicates to the
** server that it can accept "content encoding"
** and if the server is capable it will then
** compress the data and transmit it. The
** browser decompresses it and then renders
** the page.
** Useage........:
** No space before the beginning of the first '<?' tag
.
** ------------Start of file----------
** |<?
** | include('gzdoc.php');
** | print "Start output !!";
** |?>
** |<HTML>
** |... the page ...
** |</HTML>
** |<?
** | gzdocout();
** |?>
** -------------End of file-----------
***************************************/
ob_start();
ob_implicit_flush(0);
function GetHeader(){
 $headers = getallheaders();
 while (list($header, $value) = each($headers)) {
 $Message .= "$header: $value ";
 }
 return $Message;
}
function CheckCanGzip(){
 global $HTTP_ACCEPT_ENCODING, $PHP_SELF, $Wget, $REMOTE_ADDR,
$S_UserName;
 if (connection_timeout() || connection_aborted()){
 return 0;
 }
 if ((strpos('catoc'.$HTTP_ACCEPT_ENCODING, 'gzip')) || $Wget =
= 'Y'){
 if (strpos('catoc'.$HTTP_ACCEPT_ENCODING, 'x-gzip')){

 $ENCODING = "x-gzip";
 $Error_Msg = str_replace(' ','',GetHeader()
);
 $Error_Msg .= "Time: ".date("Y-m-d H:i:s")."
";
 $Error_Msg .= "Remote-Address: ".$REMOTE_ADDR.
" ";
 //mail('your@none.net', "User have x-gzip outp
ut in file $PHP_SELF!!!", $Error_Msg);
 }else{
 $ENCODING = "gzip";
 }
 return $ENCODING;
 }else{
 return 0;
 }
}
function GzDocOut(){
 global $PHP_SELF, $CatocGz, $REMOTE_ADDR, $S_UserName;
 $ENCODING = CheckCanGzip();
 if ($ENCODING){
 print "  ";
 $Contents = ob_get_contents();
 ob_end_clean();
 if ($CatocGz == 'Y'){
 print "Not compress lenth: ".strlen($Contents)
." ";
 print "Compressed lenth: ".strlen(gzcompress($
Contents))." ";
 exit;
 }else{
 header("Content-Encoding: $ENCODING");
 }
 print pack('cccccccc',0x1f,0x8b,0x08,0x00,0x00,0x00,0x
00,0x00);
 $Size = strlen($Contents);
 $Crc = crc32($Contents);
 $Contents = gzcompress($Contents);
 $Contents = substr($Contents, 0, strlen($Contents) - 4
);
 print $Contents;
 print pack('V',$Crc);
 print pack('V',$Size);
 exit;
 }else{
 ob_end_flush();
 $Error_Msg = str_replace(' ','',GetHeader());
 $Error_Msg .= "Time: ".date("Y-m-d H:i:s")." ";
 $Error_Msg .= "Remote-Address: ".$REMOTE_ADDR." ";
 //mail('your@none.net', "User can not use gzip output
in file $PHP_SELF!!!", $Error_Msg);
 exit;
 }
}
?>

clq

2010-9-25 16:45:17 发表编辑

tomcat 可以动态加入
--------------------------------------------------
这个工作不是我做的我还真不知道怎么配的

我们本机开发环境就是普通的 tomcat
tomcat下开启动态压缩是

Java代码

compression="on"
compressionMinSize="2048"
noCompressionUserAgents="gozilla, traviata"
compressableMimeType="text/html,text/xml,text/javascript"

   compression="on" 
   compressionMinSize="2048" 
   noCompressionUserAgents="gozilla, traviata" 
   compressableMimeType="text/html,text/xml,text/javascript"

给文件加失效我们用的是应用服务器里设置的（我不知道怎么设置我们服务器用的websphere） tomcat如果不结合apache好像不支持

自己做也可以做过滤
然后对所有 *.js的请求加header

response.setDateHeader("Expires", (System.currentTimeMillis() + 一很长很长的long型));

clq

2010-9-25 17:13:14 发表编辑

http://www.tsnc.edu.cn/default/tsnc_wgrj/doc/pythonhtml/html/http_web_services/gzip_compression.html
--------------------------------------------------

11.8. 处理压缩数据

你要支持的最后一个重要的 HTTP 特性是压缩。许多 web 服务具有发送压缩数据的能力，这可以将网络线路上传输的大量数据消减 60% 以上。这尤其适用于 XML web 服务，因为 XML 数据的压缩率可以很高。

服务器不会为你发送压缩数据，除非你告诉服务器你可以处理压缩数据。

例 11.14. 告诉服务器你想获得压缩数据

>>> import urllib2, httplib
>>> httplib.HTTPConnection.debuglevel = 1
>>> request = urllib2.Request('http://diveintomark.org/xml/atom.xml')
>>> request.add_header('Accept-encoding', 'gzip')        
>>> opener = urllib2.build_opener()
>>> f = opener.open(request)
connect: (diveintomark.org, 80)
send: '
GET /xml/atom.xml HTTP/1.0
Host: diveintomark.org
User-agent: Python-urllib/2.1
Accept-encoding: gzip                                    
'
reply: 'HTTP/1.1 200 OK\r\n'
header: Date: Thu, 15 Apr 2004 22:24:39 GMT
header: Server: Apache/2.0.49 (Debian GNU/Linux)
header: Last-Modified: Thu, 15 Apr 2004 19:45:21 GMT
header: ETag: "e842a-3e53-55d97640"
header: Accept-Ranges: bytes
header: Vary: Accept-Encoding
header: Content-Encoding: gzip                           
header: Content-Length: 6289                             
header: Connection: close
header: Content-Type: application/atom+xml

	这是关键：一创建了 `Request` 对象，就添加一个 `Accept-encoding` 头信息告诉服务器你能接受 gzip 压缩数据。`gzip` 是你使用的压缩算法的名称。理论上你可以使用其它的压缩算法，但是 `gzip` 是 web 服务器上使用率高达 99% 的一种。
	这是你的头信息传越网络线路的过程。
	这是服务器的返回信息：`Content-Encoding: gzip` 头信息意味着你要回得的数据已经被 gzip 压缩了。
	`Content-Length` 头信息是已压缩数据的长度，并非解压缩数据的长度。一会儿你会看到，实际的解压缩数据长度为 15955，因此 gzip 压缩节省了 60% 以上的网络带宽！

例 11.15. 解压缩数据

>>> compresseddata = f.read()                              
>>> len(compresseddata)
6289
>>> import StringIO
>>> compressedstream = StringIO.StringIO(compresseddata)   
>>> import gzip
>>> gzipper = gzip.GzipFile(fileobj=compressedstream)      
>>> data = gzipper.read()                                  
>>> print data                                             
<?xml version="1.0" encoding="iso-8859-1"?>
<feed version="0.3"
  xmlns="http://purl.org/atom/ns#"
  xmlns:dc="http://purl.org/dc/elements/1.1/"
  xml:lang="en">
  <title mode="escaped">dive into mark</title>
  <link rel="alternate" type="text/html" href="http://diveintomark.org/"/>
  <-- rest of feed omitted for brevity -->
>>> len(data)
15955

	继续上面的例子，`f` 是一个从 URL 开启器返回的类文件对象。使用它的 `read()` 方法将正常地获得非压缩数据，但是因为这个数据已经被 gzip 压缩过，所以这只是获得你想要的最终数据的第一步。
	好吧，只是先得有点儿凌乱的步骤。Python 有一个 `gzip` 模块，它能读取 (当然也能写入) 磁盘上的 gzip 压缩文件。但是磁盘上还没有文件，只在内存里有一个 gzip 压缩缓冲区，并且你不想仅仅为了解压缩而写出一个临时文件。那么怎么做来从内存数据 (`compresseddata`) 创建类文件对象呢？这需要使用 `StringIO` 模块。你首次看到 `StringIO` 模块是在上一章，但现在你会发现它的另一种用法。
	现在你可以创建 `GzipFile` 的一个实例，并且告诉它其中的 “文件” 是一个类文件对象 `compressedstream`。
	这是做所有工作的一行：从 `GzipFile` 中 “读取” 将会解压缩数据。感到奇妙吗？是的，它确实解压缩了数据。`gzipper` 是一个类文件对象，它代表一个 gzip 压缩文件。尽管这个 “文件” 并非一个磁盘上的真实文件；但 `gzipper` 还是从你用 `StringIO` 包装了压缩数据的类文件对象中 “读取” 数据，而它仅仅是内存中的变量 `compresseddata`。压缩的数据来自哪呢？最初你从远程 HTTP 服务器下载它，通过从用 `urllib2.build_opener` 创建的类文件对象中 “读取”。令人吃惊吧，这就是所有的步骤。链条上的每一步都完全不知道上一步在造假。
	看看吧，实际的数据 (实际为 15955 bytes)。

“等等!” 我听见你在叫。“还能更简单吗！” 我知道你在想什么。你在，既然 opener.open 返回一个类文件对象，那么为什么不抛弃中间件 StringIO 而通过 f 直接访问 GzipFile 呢？OK，或许你没想到，但是别为此担心，因为那样无法工作。

例 11.16. 从服务器直接解压缩数据

>>> f = opener.open(request)                  
>>> f.headers.get('Content-Encoding')         
'gzip'
>>> data = gzip.GzipFile(fileobj=f).read()    
Traceback (most recent call last):
  File "<stdin>", line 1, in ?
  File "c:\python23\lib\gzip.py", line 217, in read
    self._read(readsize)
  File "c:\python23\lib\gzip.py", line 252, in _read
    pos = self.fileobj.tell()   # Save current position
AttributeError: addinfourl instance has no attribute 'tell'

	继续前面的例子，你已经有一个设置了 `Accept-encoding: gzip` 头信息的 `Request` 对象。
	简单地打开请求将获得你的头信息 (虽然还没下载任何数据)。正如你从 `Content-Encoding` 头信息所看到的，这个数据被要求用 gzip 压缩发送。
	从 `opener.open` 返回了一个类文件对象，从头信息中你可以获知，你将获得 gzip 压缩数据。为什么不简单地通过那个类文件对象直接访问 `GzipFile` 呢？当你从 `GzipFile` 实例 “读取” 时，它将从远程 HTTP 服务器 “读取” 被压缩的数据并且立即解压缩。这是个好主意，但是不行。由 gzip 压缩的工作方式所致，`GzipFile` 需要存储其位置并在压缩文件上往返游走。当 “文件” 是来自远程服务器的字节流时无法工作；你能用它做的所有工作就是一次返回一个字节流，而不是在字节流上往返。所以使用 `StringIO` 这种看上去不太优雅的手段是最好的解决方案：下载压缩的数据，用 `StringIO` 创建一个类文件对象，并从中解压缩数据

NEWBT官方QQ群1: 276678893
可求档连环画,漫画;询问文本处理大师等软件使用技巧;求档softhub软件下载及使用技巧.
但不可"开车",严禁国家敏感话题,不可求档涉及版权的文档软件.
验证问题说明申请入群原因即可.