新浪新闻小偷


Posted in PHP onOctober 09, 2006

新浪新闻小偷 1.

<html>
<head>
<meta http-equiv="Refresh" content="60">
<META HTTP-EQUIV="Pragma" CONTENT="no-cache">
<meta http-equiv="Content-Type" content="text/html"; charset="??????">
<title>新浪_新闻抓取程序</title>
</head>
<body>

<center><img src="pic.gif"></center>
<?
$host="127.0.0.1"; // MYSQL 主机名
$namesql="????"; // MYSQL 用户名
$passsql="????"; // MYSQL 密码
$lib="news"; // 数据库名
$table="news"; // 数据库表名
$filename="http://news.sina.com.cn/news1000/index.shtml"; // 抓取的新闻页
$keytop="新闻开始"; // 新闻开始关键词
$keybottom="新闻结束"; // 新闻结束关键词

$conn=mysql_connect($host,$namesql,$passsql);
mysql_select_db($lib,$conn);

$fp=fopen($filename,"r",1);
$flag=0; $add=""; $found=0; $end=0; $i=0; $temp[4]="";
while(!$end==1){
while(!$flag==1){
$word=fgetc($fp);
$add=$add.$word;
if($word=='<' and strlen($add)==1){ $flag=0; }
if($word=='<' and strlen($add)!=1){ $flag=1; $add=substr($add,0,strlen($add)-1); }
if($word=='>'){ $flag=1; } }

if(strchr($add,$keytop)){ $found=1; }
if(strchr($add,$keybottom)){ $found=0; $end=1; }
if(((strchr($add,'<')==True and strchr($add,'href')==True) or strchr($add,'<')==False) and $found==1){ $text[$i]=$add; $i++; }
if($word=='<' and $flag==1){ $add=$word; $flag=0; } else { $add=""; $flag=0; } }
fclose($fp);

for($i=1;$i<sizeof($text)-1;$i+=5){
$temp[1]=$text[$i+1]; $temp[2]=$text[$i+2]; $temp[3]=$text[$i+3]; $temp[4]=$text[$i+4];
$ins="select * from $table where TITLE='$temp[3]'";
$list=mysql_query($ins,$conn);
@$count=mysql_num_rows($list);
if($count==0){
$ins="insert into $table(TYPE,URL,TITLE,DATE) values ('$temp[1]','$temp[2]','$temp[3]','$temp[4]')";
$list=mysql_query($ins,$conn); } }
mysql_close($conn);
?>

</body>
</html>

2.<?
$handle = fopen("http://news.sina.com.cn/news1000/","r");
$sign = 0;
while(!feof($handle))
{
$message = fgets($handle,512);
if($sign == 1)
{
print("$message");
}
if(ereg("新闻开始",$message,$result))
{
$sign = 1;
}
else if(ereg("新闻结束",$message,$result))
{
$sign = 0;
}
}
fclose($handle);
?>

PHP 相关文章推荐
劣质的PHP代码简化
Feb 08 PHP
php 读取文件头判断文件类型的实现代码
Aug 05 PHP
教你如何解密 “ PHP 神盾解密工具 ”
Jun 20 PHP
thinkphp缓存技术详解
Dec 09 PHP
php中将一个对象保存到Session中的方法
Mar 13 PHP
php查询mysql数据库并将结果保存到数组的方法
Mar 18 PHP
php实现源代码加密的方法
Jul 11 PHP
php加密之discuz内容经典加密方式实例详解
Feb 04 PHP
ThinkPHP3.2.3框架实现的空模块、空控制器、空操作,跳转到错误404页面图文详解
Apr 03 PHP
laravel-admin的图片删除实例
Sep 30 PHP
laravel框架使用FormRequest进行表单验证,验证异常返回JSON操作示例
Feb 18 PHP
TP5框架实现签到功能的方法分析
Apr 05 PHP
如何使用PHP获取网络上文件
Oct 09 #PHP
用PHP动态创建Flash动画
Oct 09 #PHP
一个odbc连mssql分页的类
Oct 09 #PHP
拼音码表的生成
Oct 09 #PHP
用PHP和MySQL保存和输出图片
Oct 09 #PHP
PHP生成带有雪花背景的验证码
Oct 09 #PHP
一个可查询所有表的“通用”查询分页类
Oct 09 #PHP
You might like
PHP4实际应用经验篇(5)
2006/10/09 PHP
《PHP边学边教》(02.Apache+PHP环境配置――下篇)
2006/12/13 PHP
phpmail类发送邮件函数代码
2012/02/20 PHP
php中unlink()、mkdir()、rmdir()等方法的使用介绍
2012/12/21 PHP
七款最流行的PHP本地服务器分享
2013/02/19 PHP
浅谈php中mysql与mysqli的区别分析
2013/06/10 PHP
PHP中array_slice函数用法实例详解
2014/11/25 PHP
PHP版本如何选择?应该使用哪个版本?
2015/05/13 PHP
PHP程序员不应该忽略的3点
2015/10/09 PHP
PHP实现十进制、二进制、八进制和十六进制转换相关函数用法分析
2017/04/25 PHP
PHP实现基于栈的后缀表达式求值功能
2017/11/10 PHP
PHP给源代码加密的几种方法汇总(推荐)
2018/02/06 PHP
PHP程序员简单的开展服务治理架构操作详解(三)
2020/05/14 PHP
JavaScript语言中的Literal Syntax特性分析
2007/03/08 Javascript
jquery 插件 人性化的消息显示
2008/01/21 Javascript
AngularJS基础学习笔记之简单介绍
2015/05/10 Javascript
javascript实现模拟时钟的方法
2015/05/13 Javascript
基于JavaScript实现瀑布流效果(循环渐近)
2016/01/27 Javascript
AngularJS中处理多个promise的方式
2016/02/02 Javascript
关于js二维数组和多维数组的定义声明(详解)
2016/10/02 Javascript
javascript事件捕获机制【深入分析IE和DOM中的事件模型】
2016/12/15 Javascript
基于vue实现分页/翻页组件paginator示例
2017/03/09 Javascript
微信小程序 页面跳转事件绑定的实例详解
2017/09/20 Javascript
Angular2+如何去除url中的#号详解
2017/12/20 Javascript
react router4+redux实现路由权限控制的方法
2018/05/03 Javascript
微信小程序调用微信支付接口的实现方法
2019/04/29 Javascript
Python实现找出数组中第2大数字的方法示例
2018/03/26 Python
Python3 使用cookiejar管理cookie的方法
2018/12/28 Python
python opencv调用笔记本摄像头
2019/08/28 Python
Django配置MySQL数据库的完整步骤
2019/09/07 Python
施华洛世奇西班牙官网:SWAROVSKI西班牙
2019/06/06 全球购物
员工拾金不昧表扬信
2014/01/09 职场文书
档案接收函格式
2015/01/30 职场文书
现实表现证明材料
2015/06/19 职场文书
早安问候语大全
2015/11/10 职场文书
九年级英语教学反思
2016/02/15 职场文书