虚拟化容器,大数据,DBA,中间件,监控。

Varnish解决带参数的URL可能造成多份缓存的问题

07 10月
作者:admin|分类:系统运维

Varnish解决带参数的URL可能造成多份缓存的问题



当Varnish遇到带参数的URL(这些参数还经常变)的时候,通常会存在同一个真正的URL存放多份缓存及缓存命中率低的情况,根据官方网站的文档说明,可以在sub_recv中加入如下段解决。

        if (req.url ~ ".(jpg|gif|png)\?.*") {
            set req.url = regsub(req.url, "\?.*", "");
        }

但当实际设置了以后仍然会出现URL参数变化后Varnish返回miss,这说明Varnish实际上还是以全部req.url作为hash进行缓存的。有兴趣的同学可以自己试试:)

我想了很久,最后终于发现这个重置了以后的req.url并没有作为sub_hash中hash key进行缓存,于是做了如下变通终于实现了按照不带参数的URL进行缓存以达到提高缓存命中率和避免多份缓存的目的。

其实配置的方法很简单,即

sub_hash {
    if (req.url ~ ".(jpg|gif|png)\?.*") {
        set req.hash += regsub(req.url, "\?.*", "");
    }
    else {
        set req.hash += req.url;
    }
    hash;
}

Varnish 2.0.2和2.0.3版本都有这个问题,我已在官方网站报了bug,见http://varnish.projects.linpro.no/ticket/465 各位有兴趣的也可关注一下:)

更新: 在sub_recv中set req.url = regsub(req.url, "\?.*", "");即可,不用再在hash中添加

在header中添加cache的命中状态的方法(在sub_deliver中添加)

        if (obj.hits > 0) {
                set resp.http.X-Cache = "Server-6-HIT";
        } else {
                set resp.http.X-Cache = "Server-6-MISS";
        }

替换到后端的URL请求

sub vcl_miss {
        if (req.request == "PURGE") {
                error 404 "Not in cache.";
        }
        set bereq.url = regsub(req.url, "\?.*", "");
        fetch;
}

浏览1948 评论0
返回
目录
返回
首页
在CentOS5.2上搭建DNS服务器 Varnish无法分配内存导致自动重启子进程的问题