搜索
系统检测到您的用户名不符合规范:

PHP获取页面中指定内容的类

浏览:3446 发布日期:2016年04月16日 分类:用法示例
本节内容:
一个获取页面中指定内容的php类。
实现的功能:
1,获取内容中的url,email,image。
2,替换内容中的url,email,image。

形如这样的内容:
url:<a href="url">xxx</a>
email:admin#admincom
image:<img src="image">
该类都可以获取到。
1,类文件 Grep.class.php
代码示例:
<?php
/** grep class
* Date: 2013年06月15日
* Author: fdipzone
* Ver: 1.0
* Edit: 黑帽联盟www.heimaolianmeng.com
* Func:
*
* set: 设置内容
* get: 返回指定的内容
* replace: 返回替换后的内容
* get_pattern 根据type返回pattern
*/

class Grep{ // class start
private $_pattern = array(
'url' => '/<a.*?href="((http(s)?:\/\/).*?)".*?/si',
'email' => '/([\w\-\.]+@[\w\-\.]+(\.\w+))/',
'image' => '/<img.*?src=\"(http:\/\/.+\.(jpg|jpeg|gif|bmp|png))\">/i'
);

private $_content = ''; // 源内容

/* 設置搜尋的內容
* @param String $content
*/
public function set($content=''){
$this->_content = $content;
}

/* 获取指定内容
* @param String $type
* @param int $unique 0:all 1:unique
* @return Array
*/
public function get($type='', $unique=0){
$type = strtolower($type);

if($this->_content=='' || !in_array($type, array_keys($this->_pattern))){
return array();
}

$pattern = $this->get_pattern($type); // 获取pattern
preg_match_all($pattern, $this->_content, $matches);
return isset($matches[1])? ( $unique==0? $matches[1] : array_unique($matches[1]) ) : array();
}

/* 获取替换后的内容
* @param String $type
* @param String $callback
* @return String
*/
public function replace($type='', $callback=''){
$type = strtolower($type);
if($this->_content=='' || !in_array($type, array_keys($this->_pattern)) || $callback==''){
return $this->_content;
}
$pattern = $this->get_pattern($type);
return preg_replace_callback($pattern, $callback, $this->_content);
}

/* 根据type获取pattern
* @param String $type
* @return String
*/
private function get_pattern($type){
return $this->_pattern[$type];
}

} // class end
?>


2,测试示例 demo.php
代码示例:
<?php
/**
* 获取页面中的指定内容
* by 黑帽联盟www.heimaolianmeng.com
*/
header('content-type:text/htm;charset=utf8');

require('Grep.class.php');
$content = file_get_contents('http://www.heimaolianmeng.com/sitemap/');

$obj = new Grep();
$obj->set($content);

$url = $obj->get('url', 0);
$email = $obj->get('email', 1);
$image = $obj->get('image', 1);

print_r($url);
print_r($email);
print_r($image);

$url_new = $obj->replace('url', 'replace_url');
echo $url_new;

function replace_url($matches){
return isset($matches[1])? ''.$matches[1].'' : '';
}
?>
收藏
落落007
积分:101 等级:LV1
热点推荐
(追記) (追記ここまで)
最新更新

我们

合作

网站

信息

ThinkPHP 是一个免费开源的,快速、简单的面向对象的 轻量级PHP开发框架 ,创立于2006年初,遵循Apache2开源协议发布,是为了敏捷WEB应用开发和简化企业应用开发而诞生的。ThinkPHP从诞生以来一直秉承简洁实用的设计原则,在保持出色的性能和至简的代码的同时,也注重易用性。并且拥有众多的原创功能和特性,在社区团队的积极参与下,在易用性、扩展性和性能方面不断优化和改进,已经成长为国内最领先和最具影响力的WEB应用开发框架,众多的典型案例确保可以稳定用于商业以及门户级的开发。

AltStyle によって変換されたページ (->オリジナル) /