详解php伪造Referer请求反盗链资源


Posted in PHP onJanuary 24, 2019

有些产品为了防止自己的产品被盗链访问,会采用反盗链措施,如封闭型生态的音乐网站和视频网站,他们已经为了版权付费,自然不希望你免费使用他们的资源。但因为很多人专门研究盗链,因此我们也需要了解下盗链、反盗链和逃避反盗链的原理。

盗链

引用百度百科对盗链的定义:

盗链是指服务提供商自己不提供服务的内容,通过技术手段绕过其它有利益的最终用户界面(如广告),直接在自己的网站上向最终用户提供其它服务提供商的服务内容,骗取最终用户的浏览和点击率。受益者不提供资源或提供很少的资源,而真正的服务提供商却得不到任何的收益。

常规盗链

我们知道,网站提供服务是向服务端请求一个 html 文件,这个文件中包含有 css/js 文件,也包含 img/video 标签,这些静态资源会在 html 文件加载时,依次的发起请求并填充在指定位置上,从而完成整个页面的加载。

详解php伪造Referer请求反盗链资源

因此只要拿到这个图片的 URL 并嵌入我们自己的 html 文件中,就能在我们的网站上访问,由于资源是不同的 HTTP 请求独立访问的,因此我们也能过滤源站的 html 文件。这就是最简单的盗链。

危害:在用户访问时,并没有在访问被盗链网站,但是依然会占用该网站的带宽资源,而带宽是要给运营商付费的。同时,该网站的广告、周边、宣传等资源并不会被用户访问到。

分布式盗链

分布式盗链比较复杂,需要在服务端部署专门的程序,并不针对单个网站或单个 url ,而是对全网的所有有用的资源进行盗取,并存储在自己的数据库中,并在用户实际访问时,完全转换为自己的流量。

危害:自己通过劳动、金钱、版权付费得到的资源,被盗链网站免费使用,如网店摄影图、期刊、电视剧等。并因此导致自己的会员、服务无法实现盈利。

反盗链分类

我们了解了盗链对源站的危害后,自然要通过一些手段来阻止这种行为维护自己的利益。

加水印

这是最简单的方法,通过后端程序批量对图片等资源加上水印,这样在盗链的同时,也在为自己的网站做宣传,有时甚至会主动寻求这种盗链。

资源重命名

因为盗链是通过指定的url,这个 url 中一定包含该资源的路径和名称,因此通过不定期的更改文件或目录的名称,能够快速避免盗链,但也会导致正在下载的资源被中断。

限制引用页

http 请求的头部信息中,有一个字段: referer ,它代表这个请求是从哪个页面发起的,如果是单独在页面中打开或者服务端请求的,则这个字段为空。因此我们可以通过 referer 这个字段的值做限制,如果是自己认可的页面,则返回资源,否则,禁止该请求。但是由于每次都要打开一个白名单的文件做 url 匹配,因此会降低性能。

加密认证

在客户端通过将用户认证的信息和资源的名称进行组合后加密,将加密的字符串作为 url 的参数发起请求,在服务端进行解密并认证通过后,才会返回请求的资源。这个方式主要用于防范分布式盗链。

反盗链程序

上面的3种反盗链方式,我们常用的是第三种,通过 referer 属性来完成反盗链,今天也主要分享这一种方法的反盗链与防反盗链。

后端程序限制

这种限制需要消耗服务端计算资源,因此不如 Nginx 限制常用。

$from = parse_url($_SERVER['HTTP_REFERER']);
if ($from['host']!='xxx.com' && $from['host']!='www.xxx.com') {
  die('你丫在盗链');
}

Nginx 限制

通过修改 nginx 配置文件可以做到,修改完成后记得重启 nginx

// 这里指定需要防盗链的资源,如gif/jpg等
location ~* \.(gif|jpg|png|jpeg)$ {
  // 设置资源的过期时间
  expires 30d;
  // 设置合法的引用页,也就是防盗链的白名单;
  // none blocked保证用户在新页面打开时依然能够打开,如果不希望用户能够保存删掉这两项
  valid_referers none blocked *.hugao8.com *.baidu.com *.google.com;
  // 对于非法的引用页,可以重写图片,也可以直接返回403或404页面
  if ($invalid_referer) {
    rewrite ^/http://www.it300.com/static/images/404.jpg;
    #return 404;
  }
}

Referer-Policy

Referer 首部包含了当前请求页面的来源页面的地址,即表示当前页面是通过此来源页面里的链接进入的。服务端一般使用 Referer 首部识别访问来源,可能会以此进行统计分析、日志记录以及缓存优化等。

Referer 属性出现在请求头中,也在请求头中被设置,但是在浏览器的安全策略里,该值无法被 js 所指定:

$.ajax({
    url: 'http://www.baidu.com',
    beforeSend(xhr) {
      // 在发送ajax请求前设置header头部
      xhr.setRequestHeader("Referer", "http://translate.google.com/");
      xhr.setRequestHeader("User-Agent", "stagefright/1.2 (Linux;Android 5.0)");
    },
    success(data) {
      console.log(data);
    },
    error(err) {
      console.log(err);
    }
});

然而浏览器会报错:

详解php伪造Referer请求反盗链资源

那么 Referer 是怎么被自动设置的呢?这个得看 Referer-Policy属性 是怎么定义的:

  • no-referrer : 整个 Referer 首部会被移除。访问来源信息不随着请求一起发送。
  • no-referrer-when-downgrade (默认值): 在没有指定任何策略的情况下用户代理的默认行为。在同等安全级别的情况下,引用页面的地址会被发送(HTTPS->HTTPS),但是在降级的情况下不会被发送 (HTTPS->HTTP)。
  • origin : 在任何情况下,仅发送文件的源作为引用地址。例如 https://example.com/page.html 会将 https://example.com/ 作为引用地址。
  • origin-when-cross-origin : 对于同源的请求,会发送完整的URL作为引用地址,但是对于非同源请求仅发送文件的源。
  • same-origin : 对于同源的请求会发送引用地址,但是对于非同源请求则不发送引用地址信息。
  • strict-origin : 在同等安全级别的情况下,发送文件的源作为引用地址(HTTPS->HTTPS),但是在降级的情况下不会发送 (HTTPS->HTTP)。
  • strict-origin-when-cross-origin : 对于同源的请求,会发送完整的URL作为引用地址;在同等安全级别的情况下,发送文件的源作为引用地址(HTTPS->HTTPS);在降级的情况下不发送此首部 (HTTPS->HTTP)。
  • unsafe-url : 无论是同源请求还是非同源请求,都发送完整的 URL(移除参数信息之后)作为引用地址。

这个值可以通过三种方式来设置:

<meta name="referrer" content="origin">
<a href="http://example.com" rel="external nofollow" rel="external nofollow" referrerpolicy="origin">
<a href="http://example.com" rel="external nofollow" rel="external nofollow" rel="noreferrer">

防反盗链

前端 JS 不能在头部设置 Referer 字段,和跨域一样是因为浏览器的安全策略,那么同样的在服务端进行请求就不会有这些限制,我们在服务端请求时就可以自由的修改 Referer 字段。

我们通过简单的 PHP 例子来完成这个功能:

<?php
$url = 'http://t11.baidu.com/it/u=3008889497,862090385&fm=77';
$refer = 'https://www.baidu.com';
$ch = curl_init();
//以url的形式 进行请求
curl_setopt($ch, CURLOPT_URL, $url);
//以文件流的形式 进行返回 不直接输出到浏览器
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
//浏览器发起请求 超时设置
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 30);
//伪造来源地址 
curl_setopt ($ch, CURLOPT_REFERER, $refer);
$file = curl_exec($ch);
curl_close($ch);
header('Content-Type: text/html');
// 对图片进行base64编码,然后返回给前端展示
$file = base64_encode($file);
echo "<img src='data:image/jpeg;base64,{$file}' />";
?>

我们第一次请求注释了 伪造来源地址 这一行,第二次请求不注释这一行,这样可以验证执行结果:

详解php伪造Referer请求反盗链资源

详解php伪造Referer请求反盗链资源

总结

盗链和反盗链是一个对立面,技术不断升级,最终的目标也是为了开放资源和保护知识产权。在互联网生态里,我们通过反盗链保护我们的利益,也使用防反盗链的这种方式来扩大我们的内容,无论站在哪一方,都需要做到知己知彼。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

PHP 相关文章推荐
使用php+Ajax实现唯一校验实现代码[简单应用]
Nov 29 PHP
解析关于wamp启动是80端口被占用的问题
Jun 21 PHP
smarty模板引擎之配置文件数据和保留数据
Mar 30 PHP
php动态变量定义及使用
Jun 10 PHP
PHPStrom中实用的功能和快捷键大全
Sep 23 PHP
腾讯CMEM的PHP扩展编译安装方法
Sep 25 PHP
php防止CC攻击代码 php防止网页频繁刷新
Dec 21 PHP
php PDO判断连接是否可用的实现方法
Apr 03 PHP
关于 Laravel Redis 多个进程同时取队列问题详解
Dec 25 PHP
PhpStorm本地断点调试的方法步骤
May 21 PHP
ThinkPHP3.2.3框架实现的空模块、空控制器、空操作,跳转到错误404页面图文详解
Apr 03 PHP
php数组函数array_push()、array_pop()及array_shift()简单用法示例
Jan 26 PHP
PHP的mysqli_stat()函数讲解
Jan 23 #PHP
PHP的mysqli_ssl_set()函数讲解
Jan 23 #PHP
PHP的mysqli_sqlstate()函数讲解
Jan 23 #PHP
PHP的mysqli_set_charset()函数讲解
Jan 23 #PHP
PHP的mysqli_select_db()函数讲解
Jan 23 #PHP
PHP的mysqli_rollback()函数讲解
Jan 23 #PHP
PHP单元测试框架PHPUnit用法详解
Jan 23 #PHP
You might like
PHP 函数执行效率的小比较
2010/10/17 PHP
解析php函数method_exists()与is_callable()的区别
2013/06/21 PHP
如何使用php输出时间格式
2013/08/31 PHP
PHP使用strtotime获取上个月、下个月、本月的日期
2015/12/30 PHP
PHP实现的oracle分页函数实例
2016/01/25 PHP
PHP开发中csrf攻击的简单演示和防范
2017/05/07 PHP
浅谈thinkphp5 instance 的简单实现
2017/07/30 PHP
PHP从零开始打造自己的MVC框架之入口文件实现方法详解
2019/06/03 PHP
ASP 过滤数组重复数据函数(加强版)
2010/05/31 Javascript
超酷的网页音乐播放器DewPlayer使用方法
2010/12/18 Javascript
图片无缝滚动代码(向左/向下/向上)
2013/04/10 Javascript
PhantomJS快速入门教程(服务器端的 JavaScript API 的 WebKit)
2015/08/06 Javascript
利用JS屏蔽页面中的Enter按键提交表单的方法
2016/11/25 Javascript
原生的强大DOM选择器querySelector介绍
2016/12/21 Javascript
javascript 中iframe高度自适应(同域)实例详解
2017/05/16 Javascript
基于ajax和jsonp的原生封装(实例)
2017/10/16 Javascript
JS跳转手机站url的若干注意事项
2017/10/18 Javascript
vue实现点击展开点击收起效果
2018/04/27 Javascript
详解如何使用webpack打包多页jquery项目
2019/02/01 jQuery
JS实现音乐钢琴特效
2020/01/06 Javascript
原生js实现九宫格拖拽换位
2021/01/26 Javascript
详解python3百度指数抓取实例
2016/12/12 Python
详解python 模拟豆瓣登录(豆瓣6.0)
2019/04/18 Python
python实现局域网内实时通信代码
2019/12/22 Python
Pandas时间序列:时期(period)及其算术运算详解
2020/02/25 Python
Python pip使用超时问题解决方案
2020/08/03 Python
用python写PDF转换器的实现
2020/10/29 Python
一款纯css3实现的响应式导航
2014/10/31 HTML / CSS
canvas 基础之图像处理的使用
2020/04/10 HTML / CSS
锐步香港官方网上商店:Reebok香港
2020/11/05 全球购物
师范生的个人求职信范文
2014/01/04 职场文书
大学军训通讯稿
2014/01/13 职场文书
周年庆典邀请函范文
2014/01/23 职场文书
病假证明模板
2015/06/19 职场文书
2019年怎样才能撰写出优秀的自荐信
2019/03/25 职场文书
Elasticsearch 批量操作
2022/04/19 Python