王新阳

wangxinyang

PHP生成静态页面

用PHP输出静态页面有2种方法
一种是利用模板技术,另一种是用ob系列函数。两种方法,看起来都差不多,但是实际上,却是不同的。


第一种:利用模板
目前PHP的模板可以说是很多了,有功能强大的smarty,还有简单易用的smarttemplate等。
它们每一种模板,都有一个获取输出内容的函数。我们生成静态页面的方法,就是利用了这个函数。用这个方法的优点是,代码比较清晰,可读性好。
这里我用smarty做例子,说明如何生成静态页


<?php
require('smarty/Smarty.class.php');
$t = new Smarty;
$t->assign("title","Hello World!");
$content = $t->fetch("templates/index.htm");
//这里的 fetch() 就是获取输出内容的函数,现在$content变量里面,就是要显示的内容了
$fp = fopen("archives/2005/05/19/0001.html", "wb");
fwrite($fp, $content);
fclose($fp);
?>


第二种方法:利用ob系列的函数
这里用到的函数主要是 ob_start(), ob_end_flush(), ob_get_content(),
其中ob_start()是打开浏览器缓冲区的意思,打开缓冲后,所有来自PHP程序的非文件头信息均不会发送,而是保存在内部缓冲区,直到你使用了ob_end_flush()。而这里最重要的一个函数,就是ob_get_contents(),这个函数的作用是获取缓冲区的内容,相当于上面的那个fetch(),道理一样的。代码:


<?php
ob_start();
$fp = fopen("ip.html", "wb");
fwrite($fp, ob_get_contents());//取得php页面输出的全部内容
fclose($fp);
ob_end_clean();
?>

PHP遍历文件件

<?php
$dir = '.';
//当前目录
list_file($dir);
function list_file($dir)
{
    $list = scandir($dir);
    // 得到该文件下的所有文件和文件夹
    foreach ($list as $file) {
        //遍历
        $file_location = $dir . '/' . $file;
        //生成路径
        if (is_dir($file_location) && $file != '.' && $file != '..') {
            //判断是不是文件夹
            echo "------------------------sign in {$file_location}------------------";
            echo '<br>';
            list_file($file_location);
        } else {
            echo is_file($dir . '/' . $file) ? $dir . '/' . $file . '<br>' : '';
        }
    }
}

如遇文件名显示乱码,可用mb_convert_encoding 或 iconv 转换

文本内容return array()的使用

方法一:
a.txt或a.php内容:
return array(
    0 => 'hello',
    1 => 'world',
);

调用:
<?php
$arr = eval(file_get_contents('a.txt'));
?>


方法二:
a.php内容:

<?php
return array(
    0 => 'hello',
    1 => 'world',
);
?>

调用:
<?php
$arr = @include $path.'a.php';
?>

PHP保存远程文件到本地

echo httpcopy("http://www.baidu.com/img/baidu_sylogo1.gif");

function httpcopy($url, $file="", $timeout=60) {
	$file = empty($file) ? pathinfo($url,PATHINFO_BASENAME) : $file;
	$dir = pathinfo($file,PATHINFO_DIRNAME);
	!is_dir($dir) && @mkdir($dir,0755,true);
	$url = str_replace(" ","%20",$url);

	if(function_exists('curl_init')) {
		$ch = curl_init();
		curl_setopt($ch, CURLOPT_URL, $url);
		curl_setopt($ch, CURLOPT_TIMEOUT, $timeout);
		curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
		$temp = curl_exec($ch);
		if(!curl_error($ch)){
			$dest = fopen($file, 'wb');
			fwrite($dest, $temp);
			fclose($dest);
			return $file;
		}else{
			return false;
		}
	}elseif(function_exists('copy')) {
		$opts = array(
			"http"=>array(
			"method"=>"GET",
			"header"=>"",
			"timeout"=>$timeout)
		);
		$context = stream_context_create($opts);
		if(@copy($url, $file, $context)) {
			//$http_response_header
			return $file;
		} else {
			return false;
		}
	}else{
		$temp=fopen($url,'rb');
		if($temp){
			$newf=fopen($file,'wb');
			if($newf){
				while(!feof($temp)){
					fwrite($newf,fread($temp,1024*8),1024*8);
				}
			}
			if($temp){
				fclose($temp);
			}
			if($newf){
				fclose($newf);
			}
			return $file;
		}
	}
}

简单的PHP采集示例

<?php
header('Content-type: text/html; charset=utf-8');
set_time_limit(900);
$a=<<<EOD
复制html内容到这里
EOD;
//获取需要的链接
preg_match_all('/\\/chapter\\/110701\\/\\d+\\.html/i', $a, $arr);
//得到完整链接地址
$arr = explode(',', 'http://vip.book.sina.com.cn' . implode(',http://vip.book.sina.com.cn', $arr[0]));
$b = '文章正文内容开始前面的html';
$c = '/正则匹配章节标题和章节内容之间的html,如果此部门内容没有时间等不同的字符,可以直接用str_replace而不是preg_replace';
$e = '文章正文内容结束后面的html';
$result = '';
//要获取的文章内容
$txt = fopen('e:/web/abc.txt', 'wb');
ob_start();
for ($i = 0; $i < count($arr); $i++) {
	$result = '';
	$str = file_get_contents($arr[$i]);
	//也可以用curl
	$str = explode($b, $str);
	$str = explode($e, count($str) > 1 ? $str[1] : $str[0]);
	$str = explode('</h1>', $str[0], 2);
	$result = $str[0] . "\r\n";
	$str = preg_replace($c, '', $str[1]);
	$str = str_replace('<p>', '', $str);
	$str = str_replace('</p>', "\r\n", $str);
	$result .= $str;
	fwrite($txt, $result);
	echo str_replace("\r\n", '<br />', $result);
	flush();
}
fclose($txt);


file_get_contents()抓取 https 地址时出错:
SSL operation failed with code 1. OpenSSL Error message

原因是证书校验不通过,可以设置忽略证书校验:

$option=array(
	'ssl'=>array('verify_peer' => false, 'verify_peer_name' => false)
);
$stream=stream_context_create($option);
file_get_contents($url, false, $stream);

PHP curl示例

cur进行https请求时,如果出现 curl: (35) SSL connect error
一般是发起请求的服务器ssl_version为 NSS 需要改为 openSSL

/**
 * 通过curl请求远程数据
 * @param string $url
 * @param string $request_method 默认GET
 * @param array $post_data 默认null
 * @param string $do_what http_build_query(发送多组数组时必须使用此项)/json_encode
 * @param array $option_array 批量设置特殊选项
 * @param bool return_with_curlinfo 是否返回curlinfo信息
 * 用下面的方式批量设置curl选项(选项有多种类型,参考:https://www.php.net/manual/zh/function.curl-setopt )
 * $option_array=array(
		CURLOPT_HTTPHEADER=>array(
			'Connection: keep-alive',
			'Content-Type: application/json; charset=utf-8',
		),
		CURLOPT_TIMEOUT => 3,
	);
 * @return FALSE | string
 */
function my_curl($url, $request_method='GET', $post_data=NULL, $do_what='', $option_array=array(), $return_with_curlinfo=false){
	is_url($url) OR $url=(is_https()?'https://':'http://').$_SERVER['HTTP_HOST'].$url;
	is_array($option_array) OR $option_array=array();
	if($post_data){
		switch($do_what){
			case 'json_encode': //需要发送json数据时,对数组或对象进行json编码(微信开发此处不能包含中文,否则会有:不合法的请求字符,不能包含\uxxxx格式的字符)
				$post_data = json_encode($post_data);
				$option_array[CURLOPT_HTTPHEADER][] = 'Content-length: '.strlen($post_data);
				$option_array[CURLOPT_HTTPHEADER][] = 'Content-Type: application/json; charset=utf-8';
				break;
			case 'http_build_query':
				$post_data = http_build_query($post_data); //对数组或对象使用http_build_query()以提高兼容性
				$option_array[CURLOPT_HTTPHEADER][] = 'Content-length: '.strlen($post_data);
				break;
			default:
		}
	}
	
	$ch = curl_init();
	curl_setopt($ch, CURLOPT_URL, $url);
	curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); //curl_exec执行成功则返回结果(默认返回true),失败返回false
	curl_setopt($ch, CURLOPT_HEADER, false); //启用时会将头文件的信息作为数据流输出
	in_array(CURLOPT_CONNECTTIMEOUT, $option_array) OR curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 5); //连接超时时间
	in_array(CURLOPT_TIMEOUT, $option_array) OR curl_setopt($ch, CURLOPT_TIMEOUT, 30); //数据接收的最大时间
	strtoupper($request_method)=='POST' AND curl_setopt($ch, CURLOPT_POST, true); //POST方式时添加
	if(strpos(strtolower($url), 'https://')===0){
		curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); //https请求时跳过cURL验证对等证书
		curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false); //https请求时跳过cURL验证域名
	}
	$post_data AND curl_setopt($ch, CURLOPT_POSTFIELDS, $post_data);
	count($option_array) AND curl_setopt_array($ch, $option_array);
	$output = curl_exec($ch);
	
	$outinfo = curl_getinfo($ch);
	$err_no = curl_errno($ch);
	$curl_error = $err_no ?  'curl: '.curl_error($ch)." $err_no" : ''; //失败时返回当前会话最后一次错误的字符串
	curl_close($ch);
	if($return_with_curlinfo){
		if($err_no){
			log_message('error', $err_no.', '.$curl_error);
			return array('data'=>FALSE, 'info'=>$outinfo);
		}else{
			return array('data'=>$output, 'info'=>$outinfo);
		}
	}else{
		if($err_no){
			log_message('error', $err_no.', '.$curl_error);
			return FALSE;
		}else{
			return $output;
		}
	}
}

PHP基础知识

● array get_defined_constants ([ bool $categorize = false ] )
返回当前所有已定义的常量名和值,$categorize=true 时返回常量分类后的多维数组

json_encode($value, $flag)
对变量主要是数组进行 JSON 编码

json_encode($data, JSON_UNESCAPED_UNICODE | JSON_UNESCAPED_SLASHES);

JSON_ERROR_NONE (int)
没有错误发生。
JSON_ERROR_DEPTH (int)
到达了最大堆栈深度。
JSON_ERROR_STATE_MISMATCH (int)
出现了下溢(underflow)或者模式不匹配。
JSON_ERROR_CTRL_CHAR (int)
控制字符错误,可能是编码不对。
JSON_ERROR_SYNTAX (int)
语法错误。
JSON_ERROR_UTF8 (int)
异常的 UTF-8 字符,也许是因为不正确的编码。
JSON_ERROR_RECURSION (int)
传递给 json_encode() 函数的对象或数组包含了递归引用,导致无法被编码。如果打开了 JSON_PARTIAL_OUTPUT_ON_ERROR 选项,则牵涉到递归引用的数据会转换成 null 后返回。
JSON_ERROR_INF_OR_NAN (int)
传递给 json_encode() 函数的参数中包含了 NAN 或 INF,导致编码出错。如果打开了 JSON_PARTIAL_OUTPUT_ON_ERROR 选项,则牵涉到对应不可编码的数字,会转换成数字 0 后返回。
JSON_ERROR_UNSUPPORTED_TYPE (int)
传递了不支持的数据类型给 json_encode() 函数,比如 resource。如果打开了 JSON_PARTIAL_OUTPUT_ON_ERROR 选项,则对于不支持的数据类型,会转换成 null 后返回。
JSON_ERROR_INVALID_PROPERTY_NAME (int)
A key starting with \u0000 character was in the string passed to json_decode() when decoding a JSON object into a PHP object.
JSON_ERROR_UTF16 (int)
Single unpaired UTF-16 surrogate in unicode escape contained in the JSON string passed to json_encode().
下面的常量可以和 json_decode() 的 form 选项结合使用。

JSON_BIGINT_AS_STRING (int)
将大数字编码成原始字符原来的值。
JSON_OBJECT_AS_ARRAY (int)
将 JSON 对象作为数组解码。当调用 json_decode() 且第二个参数为 true 时此选项会自动添加。
下面的常量可以和 json_encode() 的 form 选项结合使用。

JSON_HEX_TAG (int)
所有的 < 和 > 转换成 \u003C 和 \u003E。
JSON_HEX_AMP (int)
所有的 & 转换成 \u0026。
JSON_HEX_APOS (int)
所有的 ' 转换成 \u0027。
JSON_HEX_QUOT (int)
所有的 " 转换成 \u0022。
JSON_FORCE_OBJECT (int)
使一个非关联数组输出一个类(Object)而非数组。 在数组为空而接受者需要一个类(Object)的时候尤其有用。
JSON_NUMERIC_CHECK (int)
将所有数字字符串编码成数字(numbers)。
JSON_PRETTY_PRINT (int)
用空白字符格式化返回的数据。
JSON_UNESCAPED_SLASHES (int)
不要编码 /。
JSON_UNESCAPED_UNICODE (int)
以字面编码多字节 Unicode 字符(默认是编码成 \uXXXX)。
JSON_PARTIAL_OUTPUT_ON_ERROR (int)
用不可编码的值来代替失败。
JSON_PRESERVE_ZERO_FRACTION (int)
确保 float 值始终编码为为 float 值。
JSON_UNESCAPED_LINE_TERMINATORS (int)
The line terminators are kept unescaped when JSON_UNESCAPED_UNICODE is supplied. It uses the same behaviour as it was before PHP 7.1 without this constant. Available since PHP 7.1.0.
下面的常量可以和 json_decode() 及 json_encode() 的 form 选项结合使用。

JSON_INVALID_UTF8_IGNORE (int)
忽略无效的 UTF-8 字符。自 PHP 7.2.0 起生效。
JSON_INVALID_UTF8_SUBSTITUTE (int)
将无效 UTF-8 字符转换为 \0xfffd(Unicode 字符"虚缺号")。自 PHP 7.2.0 起生效。
JSON_THROW_ON_ERROR (int)
如果发生错误则会抛出 JsonException,而不是通过 json_last_error() 和 json_last_error_msg() 检索设置到全局的错误状态。JSON_PARTIAL_OUTPUT_ON_ERROR 优先于 JSON_THROW_ON_ERROR。自 PHP 7.3.0 起生效。

json_decode(string $json [, bool $assoc)
对 JSON 格式的字符串进行编码
当参数$assoc为 TRUE 时,将返回 array 而非 object 。

serialize(mixed $value)
产生一个可存储的值的表示,主要是把数组转换成字符串,便于传递
结果默认已经转义,无须再用 addslashes()

unserialize(string $str)
从已存储的表示中创建 PHP 的值,主要是把字符串还原成数组

● array get_defined_vars   — 获取由所有已定义变量所组成的数组

● array get_defined_functions — 获取所有已经定义的函数

● array get_loaded_extensions — 获取所有可用的模块

● array get_extension_funcs — 获取指定模块的可用函数,传入的参数(模块名称)必须是小写
  print_r(get_extension_funcs("gd"));
  print_r(get_extension_funcs("xml")); 

● array get_defined_constants — 获取关联数组的名字所有的常量和他们的价值

● array get_declared_classes — 获取由已定义类的名字所组成的数组

● get_included_files() 和 get_required_files()  — 返回被 include 和 require 文件名的 array

● 用 PHP_EOL 代替写入文本文件的回车换行(windows系统为 \r\n ,unix系统为 \n ,MAC 为 \r ,MAC OS X 为 \n

file_put_contents($file, $data, FILE_APPEND | LOCK_EX) 
  FILE_APPEND | LOCK_EX 追加方式写入,且写入时锁定

int memory_get_usage ([ bool $real_usage = false ] )
返回当前分配给你的 PHP 脚本的内存量,单位是字节(byte)。
int memory_get_peak_usage ([ bool $real_usage = false ] )
返回分配给你的 PHP 脚本的内存峰值字节数。
如果设置为 TRUE 可以获取从系统分配到的真实内存尺寸。 如果未设置,或者设置为 FALSE,仅会报告 emalloc() 使用的内存。

几个 PHP 的"魔术常量"

名称说明
__LINE__文件中的当前行号。
__FILE__文件的完整路径和文件名。如果用在被包含文件中,则返回被包含的文件名。自 PHP 4.0.2 起,__FILE__ 总是包含一个绝对路径(如果是符号连接,则是解析后的绝对路径),而在此之前的版本有时会包含一个相对路径。
__DIR__文件所在的目录。如果用在被包括文件中,则返回被包括的文件所在的目录。它等价于 dirname(__FILE__)。除非是根目录,否则目录中名不包括末尾的斜杠。(PHP 5.3.0中新增) =
__FUNCTION__函数名称(PHP 4.3.0 新加)。自 PHP 5 起本常量返回该函数被定义时的名字(区分大小写)。在 PHP 4 中该值总是小写字母的。
__CLASS__类的名称(PHP 4.3.0 新加)。自 PHP 5 起本常量返回该类被定义时的名字(区分大小写)。在 PHP 4 中该值总是小写字母的。类名包括其被声明的作用区域(例如 Foo\Bar)。注意自 PHP 5.4 起 __CLASS__ 对 trait 也起作用。当用在 trait 方法中时,__CLASS__ 是调用 trait 方法的类的名字。
__TRAIT__Trait 的名字(PHP 5.4.0 新加)。自 PHP 5.4 起此常量返回 trait 被定义时的名字(区分大小写)。Trait 名包括其被声明的作用区域(例如 Foo\Bar)。
__METHOD__类的方法名(PHP 5.0.0 新加)。返回该方法被定义时的名字(区分大小写)。
__NAMESPACE__当前命名空间的名称(区分大小写)。此常量是在编译时定义的(PHP 5.3.0 新增)。

PHP函数处理函数


CodeIgniter命名规则

1、类文件的命名必须以大写字母开头,其他文件(配置文件,视图,一般的脚本文件等)的命名是全小写。类文件的名称必须和类的名称保持一致,例如,如果你有一个类名为 Myclass , 那么文件名应该是 Myclass.php 。

2、类名(core、libraries、helpers)必须以大写字母开头,多个单词之间使用下划线分割,不要使用驼峰命名法。

3、扩展类需要加前缀MY_(可以在application/config/config.php中自定义$config['subclass_prefix']),类名首字母大写,如扩展核心类CI_Controller:
class MY_Controller extends CI_Controller{}

4、类的方法应该使用全小写,并且应该明确指出该方法的功能,最好包含一个动词。 避免使用冗长的名称,多个单词之间使用下划线分割。

5、辅助函数的文件名全小写,但扩展CI自带的辅助函数需要加config中自定义的前缀MY_。如扩展array_helper.php的文件名应该为 MY_array_helper.php

6、变量的命名规则和类方法的命名规则非常接近,使用全小写,使用下划线分割, 并且应该明确指出该变量的用途。非常短的无意义的变量只应该在 for 循环中作为迭代器使用。

7、控制器放在子目录中,如 application/controllers/Product/Tv.php 中方法 detail() ,访问地址为: index.php/Product/tv/detail 子目录名大小写必须与实际一致(windows系统可不区分)

http://codeigniter.org.cn/user_guide/general/styleguide.html

PHP函数用法

1、string number_format ( float $number , int $decimals = 0 , string $dec_point = "." , string $thousands_sep = "," )
  本函数可以接受1个、2个或者4个参数(注意:不能是3个):


2、int strtotime(string $time [, int $now = time() ])
  时间运算

<?php
echo strtotime("now"), "\n";
echo strtotime("10 September 2000"), "\n";
echo strtotime("+1 day 2010-01-01 12:20:25"), "\n";
echo strtotime("+1 day"), "\n";
echo strtotime("+1 week"), "\n";
echo strtotime("+1 week 2 days 4 hours 2 seconds"), "\n";
echo strtotime("next Thursday"), "\n";
echo strtotime("last Monday"), "\n";
?>

3、
file_get_contents ( string $filename [, bool $use_include_path = false [, resource $context [, int $offset = -1 [, int$maxlen ]]]] ) : string
把文件读入一个字符串。将在参数 offset 所指定的位置开始读取长度为 maxlen 的内容。如果失败,file_get_contents() 将返回 FALSE。
file_get_contents() 函数是用来将文件的内容读入到一个字符串中的首选方法。
如果操作系统支持还会使用内存映射技术来增强性能。如果要打开有特殊字符的 URL (比如说有空格),就需要使用 urlencode() 进行 URL 编码。

设置 file_get_contents() 的超时时间:

//设置超时参数
$opts=array(
        "http"=>array(
                "method"=>"GET",
                "timeout"=>3
                ),
        );
////创建数据流上下文
$context = stream_context_create($opts);
//$url请求的地址,例如:
$result =file_get_contents($url, false, $context);
//伪造header,可用于fopen/file_get_contents
//个别网站伪造referer反而打不开图片,如 https://mmbiz.qlogo.cn/mmbiz_jpg/lpbWiblialBFNfHKQM7hLhCW2f4QwVYHGhxxHa6ZHjS6IcAd0yBG9FpX4qINm2bJ7AhQdyQbibQIQ6juCUcfLiaZMA/0?wx_fmt=jpeg
$opts = array(
	'http' => array(
		'header' => "User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36\r\n".
			Referer: ".($source_parse_url['scheme'].'://'.$source_parse_url['host'].$source_parse_url['path'])."\r\n",
	),
);
$context = stream_context_create($opts);
$result =file_get_contents($url, false, $context);

更多参考: https://www.cnblogs.com/Renyi-Fan/p/9642301.html

4、iconv ( string $in_charset , string $out_charset , string $str ) 把字符串按要求的字符编码来转换
如果你在 out_charset 后添加了字符串 //TRANSLIT,将启用转写(transliteration)功能。这个意思是,当一个字符不能被目标字符集所表示时,它可以通过一个或多个形似的字符来近似表达。 如果你添加了字符串 //IGNORE,不能以目标字符集表达的字符将被默默丢弃。 否则,会导致一个 E_NOTICE并返回 FALSE。

iconv("utf-8","gbk//TRANSLIT",$str); //utf-8转gbk
iconv("utf-8","gbk//IGNORE",$str);
iconv("utf-8","gbk",$str);
iconv("gbk","utf-8",$str); //gbk转utf-8


CI知识汇总

1、程序执行时间
  在视图中用 echo $this->benchmark->elapsed_time(); 或 {elapsed_time}

2、显示内存消耗
  在视图中用 echo $this->benchmark->memory_usage(); 或 {memory_usage}

3、

2025-04-04 星期五 农历三月初七