PHP获取搜索引擎关键字来源的函数(支持百度和谷歌等搜索引擎)


Posted in PHP onOctober 03, 2012

最近遇到一个项目,客户需要一个功能,一个商品销售下单需要知道用户下单是从哪个途径来的,认为客服软件(53客服)和站长统计只能满足工作时间,及晚上下班和周六日休息,客服不在线,用户下单会不知道该订单的具体来源,所以嘛,又只能通过网站功能来增加一字段,获取来源关键字,如何获取来源关键字,代码发在下面,里面包含(百度、谷歌、雅虎、搜狗、搜搜、必应、有道)几大搜索引擎的获取方法,代码中均注明,希望对你有帮助,分享一下

代码如下:

<?php 
//获取来自搜索引擎入站时的关键词 
function get_keyword($url,$kw_start) 
{ 
$start=stripos($url,$kw_start); 
$url=substr($url,$start+strlen($kw_start)); 
$start=stripos($url,'&'); 
if ($start>0) 
{ 
$start=stripos($url,'&'); 
$s_s_keyword=substr($url,0,$start); 
} 
else 
{ 
$s_s_keyword=substr($url,0); 
} 
return $s_s_keyword; 
} $url=isset($_SERVER['HTTP_REFERER'])?$_SERVER['HTTP_REFERER']:'';//获取入站url。 
$search_1="google.com"; //q= utf8 
$search_2="baidu.com"; //wd= gbk 
$search_3="yahoo.cn"; //q= utf8 
$search_4="sogou.com"; //query= gbk 
$search_5="soso.com"; //w= gbk 
$search_6="bing.com"; //q= utf8 
$search_7="youdao.com"; //q= utf8 
$google=preg_match("/\b{$search_1}\b/",$url);//记录匹配情况,用于入站判断。 
$baidu=preg_match("/\b{$search_2}\b/",$url); 
$yahoo=preg_match("/\b{$search_3}\b/",$url); 
$sogou=preg_match("/\b{$search_4}\b/",$url); 
$soso=preg_match("/\b{$search_5}\b/",$url); 
$bing=preg_match("/\b{$search_6}\b/",$url); 
$youdao=preg_match("/\b{$search_7}\b/",$url); 
$s_s_keyword=""; 
$bul=$_SERVER['HTTP_REFERER']; 
//获取没参数域名 
preg_match('@^(?:http://)?([^/]+)@i',$bul,$matches); 
$burl=$matches[1]; 
//匹配域名设置 
$curl="www.netxu.com"; 
if($burl!=$curl){ 
if ($google) 
{//来自google 
$s_s_keyword=get_keyword($url,'q=');//关键词前的字符为"q="。 
$s_s_keyword=urldecode($s_s_keyword); 
$urlname="谷歌:"; 
$_SESSION["urlname"]=$urlname; 
$_SESSION["s_s_keyword"]=$s_s_keyword; 
//$s_s_keyword=iconv("GBK","UTF-8",$s_s_keyword);//引擎为gbk 
} 
else if($baidu) 
{//来自百度 
$s_s_keyword=get_keyword($url,'wd=');//关键词前的字符为"wd="。 
$s_s_keyword=urldecode($s_s_keyword); 
$s_s_keyword=iconv("GBK","UTF-8",$s_s_keyword);//引擎为gbk 
$urlname="百度:"; 
$_SESSION["urlname"]=$urlname; 
$_SESSION["s_s_keyword"]=$s_s_keyword; 
} 
else if($yahoo) 
{//来自雅虎 
$s_s_keyword=get_keyword($url,'q=');//关键词前的字符为"q="。 
$s_s_keyword=urldecode($s_s_keyword); 
//$s_s_keyword=iconv("GBK","UTF-8",$s_s_keyword);//引擎为gbk 
$urlname="雅虎:"; 
$_SESSION["urlname"]=$urlname; 
$_SESSION["s_s_keyword"]=$s_s_keyword; 
} 
else if($sogou) 
{//来自搜狗 
$s_s_keyword=get_keyword($url,'query=');//关键词前的字符为"query="。 
$s_s_keyword=urldecode($s_s_keyword); 
$s_s_keyword=iconv("GBK","UTF-8",$s_s_keyword);//引擎为gbk 
$urlname="搜狗:"; 
$_SESSION["urlname"]=$urlname; 
$_SESSION["s_s_keyword"]=$s_s_keyword; 
} 
else if($soso) 
{//来自搜搜 
$s_s_keyword=get_keyword($url,'w=');//关键词前的字符为"w="。 
$s_s_keyword=urldecode($s_s_keyword); 
$s_s_keyword=iconv("GBK","UTF-8",$s_s_keyword);//引擎为gbk 
$urlname="搜搜:"; 
$_SESSION["urlname"]=$urlname; 
$_SESSION["s_s_keyword"]=$s_s_keyword; 
} 
else if($bing) 
{//来自必应 
$s_s_keyword=get_keyword($url,'q=');//关键词前的字符为"q="。 
$s_s_keyword=urldecode($s_s_keyword); 
//$s_s_keyword=iconv("GBK","UTF-8",$s_s_keyword);//引擎为gbk 
$urlname="必应:"; 
$_SESSION["urlname"]=$urlname; 
$_SESSION["s_s_keyword"]=$s_s_keyword; 
} 
else if($youdao) 
{//来自有道 
$s_s_keyword=get_keyword($url,'q=');//关键词前的字符为"q="。 
$s_s_keyword=urldecode($s_s_keyword); 
//$s_s_keyword=iconv("GBK","UTF-8",$s_s_keyword);//引擎为gbk 
$urlname="有道:"; 
$_SESSION["urlname"]=$urlname; 
$_SESSION["s_s_keyword"]=$s_s_keyword; 
} 
else{ 
$urlname=$burl; 
$s_s_keyword=""; 
$_SESSION["urlname"]=$urlname; 
$_SESSION["s_s_keyword"]=$s_s_keyword; 
} 
$s_urlname=$urlname; 
$s_urlkey=$s_s_keyword; 
} 
else{ 
$s_urlname=$_SESSION["urlname"]; 
$s_urlkey=$_SESSION["s_s_keyword"]; 
} 
?>

有一点要记住,由于各搜索引擎的页面编码不一样,有的是GBK,有的是UTF8,所以在获取时会有不同对字符编码的转换
转载请注明:http://www.netxu.com/program/12.html

下面是另外一个函数,也可以参考下

<?php 
$_SERVER['HTTP_REFERER']='http://www.baidu.com/s?wd=https://3water.com'; 
echo save_www_iiwnet_com_keyword('http://www.baidu.com/s?wd=https://3water.com','http://www.baidu.com/s?wd=https://3water.com'); 
function save_www_iiwnet_com_keyword($domain,$path){ 
if(strpos($domain, 'google.com.tw')!==false && preg_match('/q=([^&]*)/i',$path,$regs)){ 
$searchengine = 'GOOGLE TAIWAN'; 
$keywords = urldecode($regs[1]); // google taiwan 
} 
if(strpos($domain,'google.cn')!==false && preg_match('/q=([^&]*)/i',$path,$regs)){ 
$searchengine = 'GOOGLE CHINA'; 
$keywords = urldecode($regs[1]); // google china 
} 
if(strpos($domain,'google.com')!==false && preg_match('/q=([^&]*)/i',$path,$regs)){ 
$searchengine = 'GOOGLE'; 
$keywords = urldecode($regs[1]); // google 
}elseif(strpos($domain,'baidu.')!==false && preg_match('/wd=([^&]*)/i',$path,$regs)){ 
$searchengine = 'BAIDU'; 
$keywords = urldecode($regs[1]); // baidu 
}elseif(strpos($domain,'baidu.')!==false && preg_match('/word=([^&]*)/i',$path,$regs)){ 
$searchengine = 'BAIDU'; 
$keywords = urldecode($regs[1]); // baidu 
}elseif(strpos($domain,'114.vnet.cn')!== false && preg_match('/kw=([^&]*)/i',$path,$regs)){ 
$searchengine = 'CT114'; 
$keywords = urldecode($regs[1]); // ct114 
}elseif(strpos($domain,'iask.com')!==false && preg_match('/k=([^&]*)/i',$path,$regs)){ 
$searchengine = 'IASK'; 
$keywords = urldecode($regs[1]); // iask 
}elseif(strpos($domain,'soso.com')!==false && preg_match('/w=([^&]*)/i',$path,$regs)){ 
$searchengine = 'SOSO'; 
$keywords = urldecode($regs[1]); // soso 
}elseif(strpos($domain, 'sogou.com')!==false && preg_match('/query=([^&]*)/i',$path,$regs)){ 
$searchengine = 'SOGOU'; 
$keywords = urldecode($regs[1]); // sogou 
}elseif(strpos($domain,'so.163.com')!==false && preg_match('/q=([^&]*)/i',$path,$regs)){ 
$searchengine = 'NETEASE'; 
$keywords = urldecode($regs[1]); // netease 
}elseif(strpos($domain,'yodao.com')!== false && preg_match('/q=([^&]*)/i',$path,$regs)){ 
$searchengine = 'YODAO'; 
$keywords = urldecode($regs[1]); // yodao 
}elseif(strpos($domain,'zhongsou.com')!==false && preg_match('/word=([^&]*)/i',$path,$regs)){ 
$searchengine = 'ZHONGSOU'; 
$keywords = urldecode($regs[1]); // zhongsou 
}elseif(strpos($domain,'search.tom.com')!==false && preg_match('/w=([^&]*)/i',$path,$regs)){ 
$searchengine = 'TOM'; 
$keywords = urldecode($regs[1]); // tom 
}elseif(strpos($domain,'live.com')!==false && preg_match('/q=([^&]*)/i',$path,$regs)){ 
$searchengine = 'MSLIVE'; 
$keywords = urldecode($regs[1]); // MSLIVE 
}elseif(strpos($domain, 'tw.search.yahoo.com')!==false && preg_match('/p=([^&]*)/i',$path,$regs)){ 
$searchengine = 'YAHOO TAIWAN'; 
$keywords = urldecode($regs[1]); // yahoo taiwan 
}elseif(strpos($domain,'cn.yahoo.')!==false && preg_match('/p=([^&]*)/i',$path,$regs)){ 
$searchengine = 'YAHOO CHINA'; 
$keywords = urldecode($regs[1]); // yahoo china 
}elseif(strpos($domain,'yahoo.')!==false && preg_match('/p=([^&]*)/i',$path,$regs)){ 
$searchengine = 'YAHOO'; 
$keywords = urldecode($regs[1]); // yahoo 
}elseif(strpos($domain,'msn.com.tw')!==false && preg_match('/q=([^&]*)/i',$path,$regs)){ 
$searchengine = 'MSN TAIWAN'; 
$keywords = urldecode($regs[1]); // msn taiwan 
}elseif(strpos($domain,'msn.com.cn')!==false && preg_match('/q=([^&]*)/i',$path,$regs)){ 
$searchengine = 'MSN CHINA'; 
$keywords = urldecode($regs[1]); // msn china 
}elseif(strpos($domain,'msn.com')!==false && preg_match('/q=([^&]*)/i',$path,$regs)){ 
$searchengine = 'MSN'; 
$keywords = urldecode($regs[1]); // msn 
} 
return $keywords; 
}
PHP 相关文章推荐
PHP 面向对象 PHP5 中的常量
May 05 PHP
php HandlerSocket的使用
May 02 PHP
分享下页面关键字抓取www.icbase.com站点代码(带asp.net参数的)
Jan 30 PHP
CI框架装载器Loader.php源码分析
Nov 04 PHP
基于CakePHP实现的简单博客系统实例
Jun 28 PHP
PHP实现的线索二叉树及二叉树遍历方法详解
Apr 25 PHP
在Thinkphp中使用ajax实现无刷新分页的方法
Oct 25 PHP
OAuth认证协议中的HMACSHA1加密算法(实例)
Oct 25 PHP
PHP基于双向链表与排序操作实现的会员排名功能示例
Dec 26 PHP
PHP Pipeline 实现中间件的示例代码
Apr 26 PHP
php自动加载代码实例详解
Feb 26 PHP
Swoole扩展的6种模式深入详解
Mar 04 PHP
PHP HTML JavaScript MySQL代码如何互相传值的方法分享
Sep 30 #PHP
ThinkPHP3.0略缩图不能保存到子目录的解决方法
Sep 30 #PHP
用PHP实现 上一篇、下一篇的代码
Sep 29 #PHP
php中长文章分页显示实现代码
Sep 29 #PHP
PHP实现下载功能的代码
Sep 29 #PHP
php流量统计功能的实现代码
Sep 29 #PHP
Zend的AutoLoad机制介绍
Sep 27 #PHP
You might like
php导出word格式数据的代码实例
2013/11/25 PHP
php中apc缓存使用示例
2013/12/25 PHP
PHP模板引擎Smarty内建函数foreach,foreachelse用法分析
2016/04/11 PHP
PHP二维数组实现去除重复项的方法【保留各个键值】
2017/12/21 PHP
PHP按符号截取字符串的指定部分的实现方法
2018/09/10 PHP
swoole锁的机制代码实例讲解
2021/03/04 PHP
Google排名中的10个最著名的 JavaScript库
2010/04/27 Javascript
javascript开发中因空格引发的错误
2010/11/08 Javascript
JavaScript可否多线程? 深入理解JavaScript定时机制
2012/05/23 Javascript
jquery 延迟执行实例介绍
2013/08/20 Javascript
jQuery 获取/设置/删除DOM元素的属性以a元素为例
2014/05/23 Javascript
javascript实现的字符串与十六进制表示字符串相互转换方法
2015/07/17 Javascript
详解angular用$sce服务来过滤HTML标签
2017/04/11 Javascript
nodejs+mongodb+vue前后台配置ueditor的示例代码
2018/01/02 NodeJs
解决ng-repeat产生的ng-model中取不到值的问题
2018/10/02 Javascript
vuejs简单验证码功能完整示例
2019/01/08 Javascript
vue组件间的参数传递实例详解
2019/04/26 Javascript
详解Vue+ElementUI从零开始搭建自己的网站(一、环境搭建)
2019/04/30 Javascript
简单了解vue中父子组件如何相互传递值(基础向)
2019/07/12 Javascript
js实现简易ATM功能
2020/10/27 Javascript
详解Python2.x中对Unicode编码的使用
2015/04/03 Python
Python3访问并下载网页内容的方法
2015/07/28 Python
python定时利用QQ邮件发送天气预报的实例
2017/11/17 Python
用Django实现一个可运行的区块链应用
2018/03/08 Python
10分钟教你用Python实现微信自动回复功能
2018/11/28 Python
python 实现GUI(图形用户界面)编程详解
2019/07/17 Python
Django框架视图层URL映射与反向解析实例分析
2019/07/29 Python
介绍一下Linux内核的排队自旋锁
2014/01/04 面试题
群众路线教育党课主持词
2014/04/01 职场文书
医院护士党的群众路线教育实践活动对照检查材料思想汇报
2014/10/04 职场文书
2015年六一儿童节活动方案
2015/05/05 职场文书
军训心得体会范文(2016最新篇)
2016/01/11 职场文书
2016年社区“6.26”禁毒日宣传活动总结
2016/04/05 职场文书
Python 阶乘详解
2021/10/05 Python
详解TypeScript的基础类型
2022/02/18 Javascript
windows server2016安装oracle 11g的图文教程
2022/07/15 Servers