基于续篇的php数据存储的简单存储

在最后一篇文章中,我们收集了新闻信息页面的列表数据,接下来要做的是从数据库中读取所收集的URL并在页面上爬行。

创建一个新的内容表

但是,重要的是要注意,URL不能通过id增加方法收集,因为在数据表中可能存在ID不连续性,例如id = 9和id = 11。当收集id = 10时,url是空的,这可能会导致空字段的收集。

这里使用的一种技巧是数据库的查询语句。当我们收集第一个数据时,我们决定数据库中是否有大于id的ID号。如果有一个,阅读一个,查询信息,重复上述工作。

具体代码如下:


< PHP

include_once(conn.php );
$id =(int)$ _get { 'id' };
$select;
结果= mysql_query美元($ SQL);
行= mysql_fetch_array美元($结果); / /得到相应的URL地址
$content = file_get_contents($行{ 'url});
$模式。*)/单位;
preg_match(美元美元美元模式、内容、信息); / /存储信息的内容
$ $ = $行{ 1 }。;
回声$ = $ { 0 }。;

插入数据库
添加到内容(标题,内容)值;
mysql_query($添加);

$ SQL2 =SELECT * FROM列表ID > $id订单ID ASC限制1;
2 = mysql_query美元(约合SQL2);
$ row2 = mysql_fetch_array($ 2); / /得到相应的URL地址
如果($ row2 { 'id' }){

}

>






这类新闻我们想收集图书馆的内容,接下来只需要整理一些数据。