新浪新闻小偷


Posted in PHP onOctober 09, 2006

新浪新闻小偷 1.

<html>
<head>
<meta http-equiv="Refresh" content="60">
<META HTTP-EQUIV="Pragma" CONTENT="no-cache">
<meta http-equiv="Content-Type" content="text/html"; charset="??????">
<title>新浪_新闻抓取程序</title>
</head>
<body>

<center><img src="pic.gif"></center>
<?
$host="127.0.0.1"; // MYSQL 主机名
$namesql="????"; // MYSQL 用户名
$passsql="????"; // MYSQL 密码
$lib="news"; // 数据库名
$table="news"; // 数据库表名
$filename="http://news.sina.com.cn/news1000/index.shtml"; // 抓取的新闻页
$keytop="新闻开始"; // 新闻开始关键词
$keybottom="新闻结束"; // 新闻结束关键词

$conn=mysql_connect($host,$namesql,$passsql);
mysql_select_db($lib,$conn);

$fp=fopen($filename,"r",1);
$flag=0; $add=""; $found=0; $end=0; $i=0; $temp[4]="";
while(!$end==1){
while(!$flag==1){
$word=fgetc($fp);
$add=$add.$word;
if($word=='<' and strlen($add)==1){ $flag=0; }
if($word=='<' and strlen($add)!=1){ $flag=1; $add=substr($add,0,strlen($add)-1); }
if($word=='>'){ $flag=1; } }

if(strchr($add,$keytop)){ $found=1; }
if(strchr($add,$keybottom)){ $found=0; $end=1; }
if(((strchr($add,'<')==True and strchr($add,'href')==True) or strchr($add,'<')==False) and $found==1){ $text[$i]=$add; $i++; }
if($word=='<' and $flag==1){ $add=$word; $flag=0; } else { $add=""; $flag=0; } }
fclose($fp);

for($i=1;$i<sizeof($text)-1;$i+=5){
$temp[1]=$text[$i+1]; $temp[2]=$text[$i+2]; $temp[3]=$text[$i+3]; $temp[4]=$text[$i+4];
$ins="select * from $table where TITLE='$temp[3]'";
$list=mysql_query($ins,$conn);
@$count=mysql_num_rows($list);
if($count==0){
$ins="insert into $table(TYPE,URL,TITLE,DATE) values ('$temp[1]','$temp[2]','$temp[3]','$temp[4]')";
$list=mysql_query($ins,$conn); } }
mysql_close($conn);
?>

</body>
</html>

2.<?
$handle = fopen("http://news.sina.com.cn/news1000/","r");
$sign = 0;
while(!feof($handle))
{
$message = fgets($handle,512);
if($sign == 1)
{
print("$message");
}
if(ereg("新闻开始",$message,$result))
{
$sign = 1;
}
else if(ereg("新闻结束",$message,$result))
{
$sign = 0;
}
}
fclose($handle);
?>

PHP 相关文章推荐
PHP 程序员也要学会使用“异常”
Jun 16 PHP
在PHP中操作Excel实例代码
Apr 29 PHP
php 随机记录mysql rand()造成CPU 100%的解决办法
May 18 PHP
discuz程序的PHP加密函数原理分析
Aug 05 PHP
深入解析PHP的引用计数机制
Jun 14 PHP
php 解压rar文件及zip文件的方法
May 05 PHP
教你如何用php实现LOL数据远程获取
Jun 10 PHP
php获取url参数方法总结
Nov 13 PHP
PHP实现的简单三角形、矩形周长面积计算器分享
Nov 18 PHP
thinkPHP学习笔记之安装配置篇
Mar 05 PHP
thinkPHP js文件中U方法不被解析问题的解决方法
Dec 05 PHP
PHP自定义递归函数实现数组转JSON功能【支持GBK编码】
Jul 17 PHP
如何使用PHP获取网络上文件
Oct 09 #PHP
用PHP动态创建Flash动画
Oct 09 #PHP
一个odbc连mssql分页的类
Oct 09 #PHP
拼音码表的生成
Oct 09 #PHP
用PHP和MySQL保存和输出图片
Oct 09 #PHP
PHP生成带有雪花背景的验证码
Oct 09 #PHP
一个可查询所有表的“通用”查询分页类
Oct 09 #PHP
You might like
用php过滤危险html代码的函数
2008/07/22 PHP
Windows7下PHP开发环境安装配置图文方法
2010/05/20 PHP
windows下zendframework项目环境搭建(通过命令行配置)
2012/12/06 PHP
PHP静态调用非静态方法的应用分析
2013/05/02 PHP
php数组声明、遍历、数组全局变量使用小结
2013/06/05 PHP
php调用自己java程序的方法详解
2016/05/13 PHP
一个简单的JavaScript Map实例(分享)
2016/08/03 Javascript
AngularJS实现数据列表的增加、删除和上移下移等功能实例
2016/09/05 Javascript
Vue自定义过滤器格式化数字三位加一逗号实现代码
2018/03/23 Javascript
基于Vue-cli快速搭建项目的完整步骤
2018/11/03 Javascript
vue 表单验证按钮事件交由父组件触发的方法
2018/12/17 Javascript
使用express获取微信小程序二维码小记
2019/05/21 Javascript
Vue.js实现备忘录功能
2019/06/26 Javascript
微信公众号平台接口开发 菜单管理的实现
2019/08/14 Javascript
微信小程序网络请求实现过程解析
2019/11/06 Javascript
[05:35]DOTA2英雄梦之声_第13期_拉比克
2014/06/21 DOTA
CentOS 6.X系统下升级Python2.6到Python2.7 的方法
2016/10/12 Python
python3爬取淘宝信息代码分析
2018/02/10 Python
python如何为创建大量实例节省内存
2018/03/20 Python
Python基于生成器迭代实现的八皇后问题示例
2018/05/23 Python
python ChainMap 合并字典的实现步骤
2019/06/11 Python
pycharm创建scrapy项目教程及遇到的坑解析
2019/08/15 Python
关于python3中setup.py小概念解析
2019/08/22 Python
HTML5 Web Database 数据库的SQL语句的使用方法
2012/12/09 HTML / CSS
Linux中如何设置Java环境变量(Ubuntu)
2016/07/24 面试题
AJax面试题
2014/11/25 面试题
生态养殖创业计划书
2014/05/06 职场文书
2014年师德承诺书
2014/05/23 职场文书
员工2014年度工作总结
2014/12/09 职场文书
党员示范岗材料
2014/12/19 职场文书
煤矿安全保证书
2015/02/27 职场文书
2015年行政工作总结范文
2015/04/09 职场文书
2015年勤工助学工作总结
2015/04/29 职场文书
新年晚会主持词开场白
2015/05/28 职场文书
Redis 持久化 RDB 与 AOF的执行过程
2021/11/07 Redis
解决Vmware虚拟机安装centos8报错“Section %Packages Does Not End With %End. Pane Is Dead”
2022/06/01 Servers