正则表达式学习笔记

2008年04月12日 21时48分

本站文章如未特殊注明,均为原创,严禁转载。

  最近在学习正则,一些比较有用的东西怕忘记,记下来,比较乱,想一条记录一条:

//匹配文本,这个偶尔比较好用,但是要小心字符中包含\E
$str = '[a-z]';
$str = preg_replace('/\G[a-z]\E/', '', $str);
echo $str; //打印空,全被替换掉了,相关大概就是preg_quote功能
//给匹配结果命名,这样在匹配结果中就可以用这个名称来获取值
$str = 'abc123abc';
preg_match('/(?P<num>\d+)/', $str, $arr);
echo $arr['num']; //相当于echo $arr[1]
//仅用于分组的括号,匹配内容不会被变量捕获,有时候需要这样提高执行效率
$str = 'abc123abc';
preg_match('/abc(?:\d+)/', $str, $arr);
echo $arr[1]; //除了$arr[0]外没有$arr[1]了,不会赋予\1
//插入的好帮手,向前、向后锚点搜索位置,每3位添加一个逗号
$str = 'fdfad123456789fdfd';
$str = preg_replace('/(?<=\d)(?=(\d{3})+(?!\d))/', ',', $str);
echo $str; //打印 fdfad123,456,789fdfd
//以最少的结果匹配
$str = 123456;
preg_match('/\d+/', $str, $arr);
echo $arr[0]; //是人都知道是123456吧
preg_match('/\d+?/', $str, $arr);
echo $arr[0]; //这次是1
//一个比较有用的,可以判断前面的是否有匹配过,比如下边的例子,可以忽略等号右边是否有单引号双引号或者什么都没有
$str = <<<HTML
<font size=12></font>
<font size='13'></font>
<font size="14"></font>
<font size="15></font>
HTML;
preg_match_all('/<font\s+size=([\'"]?)(\d+)\1[^>]*>/', $str, $arr);
print_r($arr);
/*
Array
(
    [0] => 12
    [1] => 13
    [2] => 14
)
*/
//部分模式修饰符,模式修饰符也可以放在表达式中的
//这里匹配符合XHTML规范的style里的颜色值,大写的STYLE被忽略了,但是里面的color可以大小写无所谓
$str = '<b style="COLOR:red"></b><b STYLE="color:blue"></b><b style="color:green"></b>';
preg_match_all('/style=([\'"]?)(?i)color:(\w+)\1(?-i)/', $str, $arr);
print_r($arr[2])
//也可以把匹配内容放到里面,用:隔开,就不用写结束(?-i)
//preg_match_all('/style=([\'"]?)(?i:color:(\w+))\1/', $str, $arr);
//再看一例子
$str = '<B>Style</B>';
preg_match('/<B>(?i:style)<\/B>/', $str, $arr);
print_r($arr); //可以匹配到
$str = '<B>Style</b>';
preg_match('/<B>(?i:style)<\/B>/', $str, $arr);
print_r($arr); //什么都没匹配到
//单词检索,可惜只能用在英文
$str = 'I\'m a teacher';
preg_match_all('/\b[a-z]+\b/i', $str, $arr);
print_r($arr)
//u修饰符,按unicode匹配
$str = '你您';
$str = preg_replace('/[你您]/', 'you', $str);
echo $str; //被拆开了,打印4次you
//看下面加上u修饰符后的效果,该修饰符需要编码utf-8否则会报错
//我的文本都是gb2312,所以要转成utf-8
$str = iconv('gb2312', 'utf-8', '你您');
$regex = iconv('gb2312', 'utf-8', '/[你您]/u');
$str = preg_replace($regex, 'you', $str);
echo $str; //打印2次you
//x模式修饰符,可以忽略空白和加注释
$str = 'test Test';
preg_match('/test  #只匹配小写的test/x', $str, $arr);
print_r($arr);
//排除环视(?<!...) (?!...)、忽略优先 *? +? ?? 的复合使用
$str = 'test <B>test1<B> test2</B>';
preg_match('/<B>(?:.(?<!<B>))*<\/B>/i', $str, $arr);
//或者 preg_match('/<B>(?:(?!<B>).)*<\/B>/i', $str, $arr);
print_r($arr)
//当时这样写应付不了 $str = 'test <B>test1<B> test2</B> test3</B>';
//改写一下正则既可 preg_match_all('/<B>(?:(?!<\/?B>).)*<\/B>/i', $str, $arr);
//根据上面来完成一个最简单的UBB替换
$str = 'test [b]test1[b] test2[/b] test3[/b]test';
$str = preg_replace('/\[B\]((?:(?!\[\/?B\]).)*)\[\/B\]/i', '<b>\1</b>', $str);
$str = preg_replace('/\[B\]((?:(?!\[\/?B\]).)*)\[\/B\]/i', '<b>\1</b>', $str);
print_r($str)
//如果已经确认回朔并不会有匹配结果,可以使用固化分组来放弃备用状态提高效率
$str = 'Subject';
preg_match('/(\w+):/', $str, $arr);
//用以下方法代替
//在第一组匹配规则匹配到文本末尾t时匹配结束,启用第二组匹配规则:并不会找到结果,所以这个时候回朔查找,但是\w不会包含:,所以可以直接放弃,
preg_match('/(?>\w+):/', $str, $arr);

JSON在PHP中的应用

2007年10月07日 19时47分

本站文章如未特殊注明,均为原创,严禁转载。

  互联网的今天,AJAX已经不是什么陌生的词汇了。说起AJAX,可能会立即想起因RSS而兴起的XML。XML的解析,恐怕已经不是什么难题了,特别是PHP5,大量的XML解析器的涌现,如最轻量级的SimpleXML。不过对于AJAX来说,XML的解析更倾向于前台Javascript的支持度。我想所有解析过XML的人,都会因树和节点而头大。不可否认,XML是很不错的数据存储方式,但是其灵活恰恰造成了其解析的困难。当然,这里所指的困难,是相对于本文的主角--JSON而言。
  JSON为何物?我就不重复概念了。通俗的说,它是一种数据的存储格式,就像PHP序列化后的字符串一样。它是一种数据描述。比如我们将一个数组序列化后存放,就可以很容易的反序列化后应用。JSON也是如此,只不过他搭建的是客户端Javascript和服务端PHP的交互桥梁。我们用PHP生成JSON后的字符串,然后把这个字符串传给前台Javascript,Javascirpt就可以很容易的将其反JSON然后应用。说通俗点,它真的很像数组。
  言归正传,如何使用JSON。PHP5.2开始内置了JSON的支持。当然,如果低于这个版本的话,那么市面上有很多PHP版本的实现,随便下一个用就OK啦。现在主要是说说PHP内置支持的JSON。很简单,两个函数:json_encodejson_decode(跟序列化很像啦)。一个编码,一个解码。先看看编码的使用:

<?php
$arr = array(
    'name' => '陈毅鑫',
    'nick' => '深空',
    'contact' => array(
        'email' => 'shenkong at qq dot com',
        'website' => 'http://www.chenyixin.com',
    )
);
$json_string = json_encode($arr);
echo $json_string;
?>
  很简单的将一个数组JSON了。需要指出的是,在非UTF-8编码下,中文字符将不可被encode,结果会出来空值,所以,如果你使用gb2312编写PHP代码,那么就需要将包含中文的内容使用iconv或者mb转为UTF-8再进行json_encode,上面输出结果如下:

{"name":"\u9648\u6bc5\u946b","nick":"\u6df1\u7a7a","contact":{"email":"shenkong at qq dot com","website":"http:\/\/www.chenyixin.com"}}
  我都说了和序列化很像,你还不信。编码后就要解码,PHP提供了相应的函数json_decode,json_decode执行后,将会得到一个对象,操作如下:

<?php
$arr = array(
    'name' => '陈毅鑫',
    'nick' => '深空',
    'contact' => array(
        'email' => 'shenkong at qq dot com',
        'website' => 'http://www.chenyixin.com',
    )
);
$json_string = json_encode($arr);
$obj = json_decode($json_string);
print_r($obj);
?>
  访问对象内的属性会吧?$obj->name,这样子的,当然,也可以把它转位数组,方便调用啦:

$json_string = json_encode($arr);
$obj = json_decode($json_string);
$arr = (array) $obj;
print_r($arr);
  PHP转来转去的用途不是特别大,除了缓存生成,感觉还不如直接存数组呢,不过,当你和前台交互的时候,它的作用就出来咯,下面看看我怎么用Javascript来使用这段字符:

<script type="text/javascript">
var arr = {"name":"\u9648\u6bc5\u946b","nick":"\u6df1\u7a7a","contact":{"email":"shenkong at qq dot com","website":"http:\/\/www.chenyixin.com"}};
alert(arr.name)
</script>
  上面中,直接将这个字符串赋给一个变量,它就变成一个Javascript数组了(专业化术语应该不叫数组,不过由于PHP的习惯问题,我就一直叫数组好了,方便理解)。这样,可以很方便的对arr进行遍历或者任意做你想做的事情了。写到这里,好像都没提到AJAX哦?是哦,联想一下,如果服务端返回的responseText用JSON过的字符串代替XML的话,前台Javascript处理起来是不是很方便呢?狗皮膏药就是这样用的。
  其实写到这里,除了数据的存储格式不太一样外,JSON和XML也没什么太大区别哦,不过下面我说的一点。虽然和XML没多大关系,不过,可以说明JSON更大范围的应用,那就是,跨域的数据调用。由于安全性问题,AJAX不支持跨域调用,这样要调用不同域名下的数据,很麻烦哦,虽然有解决方案(stone在他的讲座上提到过了代理啊什么的虽然听不懂但是知道能解决)。我写两个文件,足以展示跨域调用了。
  主调文件index.html
<script type="text/javascript">
function getProfile(str) {
    var arr = str;
    document.getElementById('nick').innerHTML = arr.nick;
}
</script>
<body><div id="nick"></div></body>
<script type="text/javascript" src="http://www.openphp.cn/demo/profile.php"></script>
  被调文件profile.php
<?php
$arr = array(
    'name' => '陈毅鑫',
    'nick' => '深空',
    'contact' => array(
        'email' => 'shenkong at qq dot com',
        'website' => 'http://www.chenyixin.com',
    )
);
$json_string = json_encode($arr);
echo "getProfile($json_string)";
?>
  很显然,当index.html调用profile.php时,JSON字符串生成,并作为参数传入getProfile,然后将昵称插入到div中,这样一次跨域数据交互就完成了,是不是特别简单。既然JSON这么简单易用而且好用,还等什么呢?^_^

多数据库支持的应用程序设计

2007年10月07日 09时32分

本站文章如未特殊注明,均为原创,严禁转载。

  以前做PHP应用,多数是单数据库数据查询和更新,顶多也是主从数据库的支持,实现起来相对简单。主从数据库的问题在于,当会话存储在数据库的时候,同步将可能出现问题,也就是说有可能出现会话的中断。所以我想在主从数据库设计上,应该将所有会话相关表进行特殊对待。即:所有的会话数据表都可以更新和查询,当一个用户访问站点的时候,即将此用户绑定到指定数据库,所有会话访问和查询操作都对此数据库进行。会话表不做同步,其他非会话类更新也从主数据库更新。这样做其实也逃脱不了会话更新时候的数据库切换,所以如果不想麻烦,还是将会话存放在文本中进行的好。
  分数据库设计,将可能从压力性能上会提升几个档次,当然单次执行效率不会比单数据库来的高的,毕竟存在着数据库切换的效率问题。分库以及主从数据库搭配是可以比较好改善数据库并发瓶颈的方案。原则:大数据量,分库;大访问量,主从。很多时候,都是这两者并行(本文不讨论cache)。
  我想,如果要实现分库以及主从关系,那么数据库服务器数量将是非常可观,在应用程序中随时切换到某一台服务器,将是非常头痛的问题,配置更换,变量名称,是不是会有一大堆呢?如何寻找更好的解决方案将是本文谈论的话题。
  首先是分库使得数据库颇多的问题。什么情况下分库?或许有些人还搞不明白为什么要分库,我就简要说一下自己的经验猜测。比如一个博客程序,一般设计是将日志存放在一张日志表中。假设是一个多用户博客,那么将会关联一个uid,如果数据量不大,这样设计是没有问题的,但是当日志量巨大,一天有几十万条日志记录录入的时候,而且访问量也比较可观的时候,我想不可能每个用户来访问日志列表,都去从这包含几千万条日志记录的数据表中去找那么几条,效率可见一斑。这个时候就该考虑到分库的问题。如何分?有一个很简单的分表方法,即,根据uid段,将日志记录在各个数据库中,当然,这个分布还是需要根据以往统计结果做出调整的,因为用户日志分布肯定不是均匀的。设置好uid段,然后根据uid索引到指定数据库配置,创建一个数据库对象即可。配置信息可能如下:

$configs['db_info']['blog'][0] = array(
    'db_host' => '192.168.0.1',
    'db_name' => 'blog',
    'db_user' => 'root',
    'db_pass' => '',
);
$configs['db_info']['blog'][1] = array(
    'db_host' => '192.168.0.2',
    'db_name' => 'blog',
    'db_user' => 'root',
    'db_pass' => '',
);
$configs['db_info']['blog'][2] = array(
    'db_host' => '192.168.0.2',
    'db_name' => 'blog',
    'db_user' => 'root',
    'db_pass' => '',
);
//...还有很多
  至于选择哪一台服务器,只需要根据uid做一个简单的匹配就可以了。
  再谈到的就是主从数据库了。什么情况下使用主从数据库?比如某个名人博客,访问量相当的大,已经没有办法把他的数据再进行拆分了,这个时候就得考虑主从数据库服务器了,使用多台数据库来分流。这样要适用主从和分库,可能上面配置信息得稍微改动一下。
$configs['db_info']['blog'][0]['master'] = array(
    'db_host' => '192.168.0.1',
    'db_name' => 'blog',
    'db_user' => 'root',
    'db_pass' => '',
);
$configs['db_info']['blog'][0]['slave'][0] = array(
    'db_host' => '192.168.0.2',
    'db_name' => 'blog',
    'db_user' => 'root',
    'db_pass' => '',
);
$configs['db_info']['blog'][0]['slave'][1] = array(
    'db_host' => '192.168.0.3',
    'db_name' => 'blog',
    'db_user' => 'root',
    'db_pass' => '',
);
$configs['db_info']['blog'][1]['master'] = array(
    'db_host' => '192.168.0.4',
    'db_name' => 'blog',
    'db_user' => 'root',
    'db_pass' => '',
);
$configs['db_info']['blog'][1]['slave'][0] = array(
    'db_host' => '192.168.0.5',
    'db_name' => 'blog',
    'db_user' => 'root',
    'db_pass' => '',
);
$configs['db_info']['blog'][1]['slave'][1] = array(
    'db_host' => '192.168.0.6',
    'db_name' => 'blog',
    'db_user' => 'root',
    'db_pass' => '',
);
$configs['db_info']['session'][0]['master'] = array(
    'db_host' => '192.168.0.7',
    'db_name' => 'session',
    'db_user' => 'root',
    'db_pass' => '',
);
$configs['db_info']['session'][1]['master'] = array(
    'db_host' => '192.168.0.8',
    'db_name' => 'session',
    'db_user' => 'root',
    'db_pass' => '',
);
  写到这里,我想都应该知道如何分表和分配你的数据库了吧,接下去我就来说一下如何轻松的读取这样的配置信息,如何将这些配置融入你的数据库驱动中。首先以单例摸式创建DB类:
<?php
if (!defined("DB_FETCH_ASSOC")) {
    define("DB_FETCH_ASSOC", 1);
}

if (!defined("DB_FETCH_ROW")) {
    define("DB_FETCH_ROW", 2);
}

if (!defined("DB_FETCH_ARRAY")) {
    define("DB_FETCH_ARRAY", 3);
}

if (!defined("DB_FETCH_DEFAULT")) {
    define("DB_FETCH_DEFAULT", DB_FETCH_ASSOC);
}
class DB {
    function DB($dsn, $db_key, $p_conn, $fetch_mode) {
        $this->dsn        = $dsn;
        $this->db_key     = $db_key;
        $this->sql        = '';
        $this->sqls       = array();
        $this->u_sqls     = array();
        $this->q_sqls     = array();
        $this->u_conn     = null;
        $this->q_conn     = null;
        $this->p_conn     = $p_conn;
        $this->fecth_mode = $fetch_mode;
        $this->query_num  = 0;
        $this->update_num = 0;
    }

    function &init(& $dsn, $db_key, $p_conn = false, $fetch_mode = DB_FETCH_DEFAULT) {
        static $db;
        $db_key = explode('.', $db_key);
        $db_key = "['" . implode("']['" , $db_key) . "']";
        eval('$flag = isset($db' . $db_key . ');');
        eval("\$db_info = \$dsn['db_info']" . $db_key . ";");
        if (!$flag) {
            $obj = new DB($db_info, $db_key, $p_conn, $fetch_mode);
            eval('$db' . $db_key . ' = $obj;');
            unset($obj);
        }
        return $db;
    }
}
$db = &DB::init($configs, 'blog.0');
print_r($db);
?>
  从上面打印结果可以看出,blog数据库集群的第一组数据库服务器被载入到$this->dsn中了。这个下面就是简单的数据COPY的主从服务器,所以可以使用随机数来指定到某一台服务器。以下是一个简单的随机数实现:
class DB {
    //....

    function connectDB($type = "master") {
        if ($type == "master") {
            $db_host = $this->dsn["master"]["db_host"];
            $db_name = $this->dsn["master"]["db_name"];
            $db_user = $this->dsn["master"]["db_user"];
            $db_pass = $this->dsn["master"]["db_pass"];
            $this->u_conn = mysqli_connect($db_host, $db_user, $db_pass);
            $this->selectDB($db_name, $this->conn);
            if (!$this->u_conn) {
                $message = "Update DataBase Connect False : ($db_host, $db_user, ******) !";
                $this->error($message, 0);
            }
        } else {
            if (empty($_COOKIE[$_configs['cookie_prefix'] . 'db_no'])) {
                $db_no = array_rand($this->dsn["db_info"]["slave"]);
            } else {
                $db_no = $_COOKIE[$_configs['cookie_prefix'] . 'db_no'];
            }
            $db_info = $this->dsn["slave"][$db_no];
            $db_host = $db_info["db_host"];
            $db_name = $db_info["db_name"];
            $db_user = $db_info["db_user"];
            $db_pass = $db_info["db_pass"];
            $this->q_conn = mysqli_connect($db_host, $db_user, $db_pass);

            if (!$this->q_conn) {
                if (!$this->u_conn) {
                    $this->connectDB();
                }
                $this->q_conn = $this->u_conn;
                if (!$this->q_conn) {
                    $message = "Query DataBase Connect False : ($db_host, $db_user, ******) !";
                    $this->error($message, 0);
                }
            } else {
                $this->selectDB($db_name, $this->q_conn);
            }
        }
    }

    function selectDB($db_name, $conn) {
        if ($db_name != null) {
            if(! mysqli_select_db($conn, $db_name)) {
                $code = mysqli_errno($conn);
                $message = mysqli_error($conn);
                $this->error($message, $code);
            }
            return true;
        }
        return false;
    }

    function query($sql, $limit = 1, $quick = false) {
        if ($limit != null) {
            $sql = $sql . " LIMIT " . $limit;
        }
        $this->sqls[] = $sql;
        $this->q_sqls[] = $sql;
        $this->sql = $sql;

        if (empty($this->q_conn)) {
            $this->connectDB("slave");
        }
        $this->qrs = mysqli_query($this->q_conn, $sql, $quick ? MYSQLI_USE_RESULT : MYSQLI_STORE_RESULT);
        if (!$this->qrs) {
            $code = mysqli_errno($this->q_conn);
            $message = mysqli_error($this->q_conn);
            $this->error($message, $code);
        }
        $this->query_num++;
        return $this->qrs;
    }

    function update($sql) {
        $this->sql = $sql;
        $this->sqls[] = $this->sql;
        $this->u_sqls[] = $this->sql;
        if ($this->u_conn == null) {
            $this->connectDB("master");
        }

        $this->urs = mysqli_query($this->u_conn, $sql, MYSQLI_USE_RESULT);
        $this->update_num++;

        if (!$this->urs) {
            return false;
        } else {
            return true;
        }
    }
}
  至此,基本框架已经出来了,来看看调用方法:
<?php
// 连接到第一组会话服务器
$db = &DB::init($configs, 'session.0');
//  执行一次查询
$db['session'][0]->query('SELECT ...');

//  再次连接BLOG服务器
$db = &DB::init($configs, 'blog.1');
//  执行一次更新
$db['blog'][1]->update('UPDATE ...');

//  再次调用会话更新
$db['session'][0]->update('INSERT ...');
?>

PHP会话(Session)使用入门

2007年10月05日 09时45分

本站文章如未特殊注明,均为原创,严禁转载。

  对比起 Cookie,Session 是存储在服务器端的会话,相对安全,并且不像 Cookie 那样有存储长度限制,本文简单介绍 Session 的使用。

  由于 Session 是以文本文件形式存储在服务器端的,所以不怕客户端修改 Session 内容。实际上在服务器端的 Session 文件,PHP 自动修改 Session 文件的权限,只保留了系统读和写权限,而且不能通过 ftp 修改,所以安全得多。

  对于 Cookie 来说,假设我们要验证用户是否登陆,就必须在 Cookie 中保存用户名和密码(可能是 md5 加密后字符串),并在每次请求页面的时候进行验证。如果用户名和密码存储在数据库,每次都要执行一次数据库查询,给数据库造成多余的负担。因为我们并不能只做一次验证。为什么呢?因为客户端 Cookie 中的信息是有可能被修改的。假如你存储 $admin 变量来表示用户是否登陆,$admin 为 true 的时候表示登陆,为 false 的时候表示未登录,在第一次通过验证后将 $admin 等于 true 存储在 Cookie,下次就不用验证了,这样对么?错了,假如有人伪造一个值为 true 的 $admin 变量那不是就立即取的了管理权限么?非常的不安全。

  而 Session 就不同了,Session 是存储在服务器端的,远程用户没办法修改 Session 文件的内容,因此我们可以单纯存储一个 $admin 变量来判断是否登陆,首次验证通过后设置 $admin 值为 true,以后判断该值是否为 true,假如不是,转入登陆界面,这样就可以减少很多数据库操作了。而且可以减少每次为了验证 Cookie 而传递密码的不安全性了(Session 验证只需要传递一次,假如你没有使用 SSL 安全协议的话)。即使密码进行了 md5 加密,也是很容易被截获的。

  当然使用 Session 还有很多优点,比如控制容易,可以按照用户自定义存储等(存储于数据库)。我这里就不多说了。

  Session 在 php.ini 是否需要设置呢?一般不需要的,因为并不是每个人都有修改 php.ini 的权限,默认 Session 的存放路径是服务器的系统临时文件夹,我们可以自定义存放在自己的文件夹里,这个稍后我会介绍。

  开始介绍如何创建 Session。非常简单,真的。

  启动 Session 会话,并创建一个 $admin 变量:

<?php 
//  启动 Session 
session_start(); 
//  声明一个名为 admin 的变量,并赋空值。 
$_SESSION["admin"] = null; 
?>
  如果你使用了 Seesion,或者该 PHP 文件要调用 Session 变量,那么就必须在调用 Session 之前启动它,使用 session_start() 函数。其它都不需要你设置了,PHP 自动完成 Session 文件的创建。

  执行完这个程序后,我们可以到系统临时文件夹找到这个 Session 文件,一般文件名形如:sess_4c83638b3b0dbf65583181c2f89168ec,后面是 32 位编码后的随机字符串。用编辑器打开它,看一下它的内容:

admin|N; 一般该内容是这样的结构:

变量名|类型:长度:值;   并用分号隔开每个变量。有些是可以省略的,比如长度和类型。

  我们来看一下验证程序,假设数据库存储的是用户名和 md5 加密后的密码:

login.php
<?php 
//  表单提交后... 
$posts = $_POST; 
//  清除一些空白符号 
foreach ($posts as $key => $value) {
    $posts[$key] = trim($value); 
} 
$password = md5($posts["password"]); 
$username = $posts["username"]; 

$query = "SELECT `username` FROM `user` WHERE `password` = '$password' AND `username` = '$username'"; 
//  取得查询结果 
$userInfo = $DB->getRow($query); 

if (!empty($userInfo)) { 
    //  当验证通过后,启动 Session 
    session_start(); 
    //  注册登陆成功的 admin 变量,并赋值 true 
    $_SESSION["admin"] = true;  
} else { 
    die("用户名密码错误"); 
} 
?>
  我们在需要用户验证的页面启动 Session,判断是否登陆:

<?php 
//  防止全局变量造成安全隐患 
$admin = false; 
//  启动会话,这步必不可少 
session_start(); 
//  判断是否登陆 
if (isset($_SESSION["admin"]) && $_SESSION["admin"] === true) { 
    echo "您已经成功登陆"; 
} else { 
    //  验证失败,将 $_SESSION["admin"] 置为 false
    $_SESSION["admin"] = false; 
    die("您无权访问"); 
} 
?>
  是不是很简单呢?将 $_SESSION 看成是存储在服务器端的数组即可,我们注册的每一个变量都是数组的键,跟使用数组没有什么分别。

  如果要登出系统怎么办?销毁 Session 即可。

<?php 
session_start(); 
//  这种方法是将原来注册的某个变量销毁
unset($_SESSION['admin']); 
//  这种方法是销毁整个 Session 文件
session_destroy(); 
?>
  Session 能否像 Cookie 那样设置生存周期呢?有了 Session 是否就完全抛弃 Cookie 呢?我想说,结合 Cookie 来使用 Session 才是最方便的。

  Session 是如何来判断客户端用户的呢?它是通过 Session ID 来判断的,什么是 Session ID,就是那个 Session 文件的文件名,Session ID 是随机生成的,因此能保证唯一性和随机性,确保 Session 的安全。一般如果没有设置 Session 的生存周期,则 Session ID 存储在内存中,关闭浏览器后该 ID 自动注销,重新请求该页面后,重新注册一个 Session ID。

  如果客户端没有禁用 Cookie,则 Cookie 在启动 Session 会话的时候扮演的是存储 Session ID 和 Session 生存期的角色。

  我们来手动设置 Session 的生存期:

<?php 
session_start(); 
//  保存一天 
$lifeTime = 24 * 3600; 
setcookie(session_name(), session_id(), time() + $lifeTime, "/"); 
?>
  其实 Session 还提供了一个函数 session_set_cookie_params(); 来设置 Session 的生存期的,该函数必须在 session_start() 函数调用之前调用:

<?php 
//  保存一天 
$lifeTime = 24 * 3600; 
session_set_cookie_params($lifeTime); 
session_start(); 
$_SESSION["admin"] = true; 
?>
  如果客户端使用 IE 6.0 , session_set_cookie_params(); 函数设置 Cookie 会有些问题,所以我们还是手动调用 setcookie 函数来创建 cookie。

  假设客户端禁用 Cookie 怎么办?没办法,所有生存周期都是浏览器进程了,只要关闭浏览器,再次请求页面又得重新注册 Session。那么怎么传递 Session ID 呢?通过 URL 或者通过隐藏表单来传递,PHP 会自动将 Session ID 发送到 URL 上,URL 形如:http://www.openphp.cn/index.php?PHPSESSID=bba5b2a240a77e5b44cfa01d49cf9669,其中 URL 中的参数 PHPSESSID 就是 Session ID了,我们可以使用 $_GET 来获取该值,从而实现 Session ID 页面间传递。

<?php 
//  保存一天 
$lifeTime = 24 * 3600; 
//  取得当前 Session 名,默认为 PHPSESSID 
$sessionName = session_name(); 
//  取得 Session ID 
$sessionID = $_GET[$sessionName]; 
//  使用 session_id() 设置获得的 Session ID 
session_id($sessionID); 

session_set_cookie_params($lifeTime); 
session_start(); 
$_SESSION['admin'] = true; 
?>
  对于虚拟主机来说,如果所有用户的 Session 都保存在系统临时文件夹里,将给维护造成困难,而且降低了安全性,我们可以手动设置 Session 文件的保存路径,session_save_path() 就提供了这样一个功能。我们可以将 Session 存放目录指向一个不能通过 Web 方式访问的文件夹,当然,该文件夹必须具备可读写属性。

<?php 
//  设置一个存放目录 
$savePath = './session_save_dir/'; 
//  保存一天 
$lifeTime = 24 * 3600; 
session_save_path($savePath); 
session_set_cookie_params($lifeTime); 
session_start(); 
$_SESSION['admin'] = true; 
?>
  同 session_set_cookie_params(); 函数一样,session_save_path() 函数也必须在 session_start() 函数调用之前调用。

  我们还可以将数组,对象存储在 Session 中。操作数组和操作一般变量没有什么区别,而保存对象的话,PHP 会自动对对象进行序列化(也叫串行化),然后保存于 Session 中。下面例子说明了这一点:

person.php
<?php 
class person { 
    var $age; 
    function output() { 
        echo $this->age; 
    } 
    function setAge($age) { 
        $this->age = $age; 
    } 
} 
?>
setage.php
<?php 
session_start(); 
require_once 'person.php'; 
$person = new person(); 
$person->setAge(21); 
$_SESSION['person'] = $person; 
echo '<a href='output.php'>check here to output age</a>'; 
?>
output.php
<?php
// 设置回调函数,确保重新构建对象。 
ini_set('unserialize_callback_func', 'mycallback'); 
function mycallback($classname) { 
    include_once $classname . '.php'; 
} 
session_start(); 
$person = $_SESSION['person']; 
//  输出 21 
$person->output(); 
?>
  当我们执行 setage.php 文件的时候,调用了 setage() 方法,设置了年龄为 21,并将该状态序列化后保存在 Session 中(PHP 将自动完成这一转换),当转到 output.php 后,要输出这个值,就必须反序列化刚才保存的对象,又因为在解序列化的时候需要实例化一个未定义类,所以我们定义了以后回调函数,自动包含 person.php 这个类文件,因此对象被重构,并取得当前 age 的值为 21,然后调用 output() 方法输出该值。

  另外,我们还可以使用 session_set_save_handler 函数来自定义 Session 的调用方式。

利用gettext来实现PHP的国际化编程

2007年10月05日 09时26分

本站文章如未特殊注明,均为原创,严禁转载。

  通常人们写程序时都是将文字写死在程序里的,比如:echo "Hello World!"; ,假如要改成它国语言,写国际化程序,就要逐个打开进行修改,程序较短时还行,若程序有上万甚至更多,改起来就不是那么容易了。近来随着i18n的逐渐标准化,我也来讲一讲在PHP中如何实现国际化支持。跟其他程序语言一样,在 PHP 也可以利用 gettext 套件写作 i18n 程序,实现 NLS(Native Language Support) 国际化支持,具体请参考官方文档( http://www.gnu.org/manual/gettext/index.html )。
  实现流程:程序设计者在程序码中写入所要显示的信息,在运行程序时并不会直接显示程序设计师所写的信息,而会先去找一个所设置语系的信息档。如果未找到,才会去显示程式码中的信息。

  一、安装设置gettext套件:
  1) *NIX系统:
  1、从 http://www.gnu.org/software/gettext/gettext.html 下载 gettext package,进行安装。
  2、编译PHP的时候加上“--with-gettext[=DIR]”,其中DIR为gettext安装的 目录,缺省为:/usr/local。
  3、保存,然后 restart server。

  2) WIN32系统:
  1、需要将gnu_gettext.dll档拷贝到系统目录下面 (Ex: C:\WINNT\SYSTEM32 or C:\WINDOWS\SYSTEM32),PHP 4.2.3 之后文件名为 libintl-1.dll,可在 php4\dlls 下获得。
  2、打开php.ini档,查找extension=php_gettext.dll,去掉前面的“;”。
  3、保存,然后restart server。
  若一切顺利,就可以在 phpinfo() 中看到 gettext 字样,至此已设置完毕。

  二、php_gettext.dll套件里有好几个函式,具体请看相关的manual。在这里我们只用记住3个函式就行了,如下:
string bindtextdomain ( string domain, string directory) string textdomain ( string text_domain) string gettext ( string message)   三、写作i18n程序:

<?php 
// 常规的程序 
echo "Hello World!"); 
?>
  下面是 i18n 程序:hello.php
<?php 
// I18N 程序范例开始 
define('PACKAGE', 'hello'); // 定义要用的mo文件名称,常规来说,我们都把PACKAGE的名称定义和程序名称相同。 

putenv('LANG=zh_TW'); 
setlocale(LC_ALL, 'zh_TW'); // 指定要用的语系,如:en_US、zh_CN、zh_TW 

bindtextdomain(PACKAGE, '/apache/htdocs/locale'); 
textdomain(PACKAGE); 

// The .mo file searched is: 
// /apache/htdocs/locale/en/LC_MESSAGES/hello.mo 

echo gettext("Hello World!"); 
?>
  在IE中输入:http://localhost/hello.php,输出结果为:“Hello World!”。
  note:按照 GNU package 里面的习惯,可以使用 _(...) 来代替 gettext(...) ,这样就可以少打很多 gettext 了。

  四、接下来设置gettext po档:
  1、创建目录结构,如下所示:
    bindtextdomain's dir
      /language
        /LC_MESSAGES
          domain.po
          domain.mo
  其中 bindtextdomain's dir 为 bindtextdomain() 所用的目录,language 为要用的语系,domain 为 PACKAGE 名称。
  以上面为例:
/locale
 /zh_TW
  /LC_MESSAGES
   hello.po
   hello.mo
  2、创建PO档
xgettext -d [您定义的PACKAGE名称] [程序文件名]   WIN32下面的xgettext、msgfmt程序档可以从 ( http://www.sourceforge.net ) 下载,需要 libiconv.dll,、libintl.dll 的支持。
  以上面hello.php档为例,
$ xgettext -d hello hello.php   运行后将产生一个hello.po档,内容如下:
# SOME DESCRIPTIVE TITLE.
# Copyright ? YEAR Free Software Foundation, Inc.
# FIRST AUTHOR , YEAR.
#
#, fuzzy
msgid ""
msgstr ""
"Project-Id-Version: PACKAGE VERSION\n"
"POT-Creation-Date: 2003-04-21 22:31+0800\n"
"PO-Revision-Date: YEAR-MO-DA HO:MI+ZONE\n"
"Last-Translator: FULL NAME \n"
"Language-Team: LANGUAGE \n"
"MIME-Version: 1.0\n"
"Content-Type: text/plain; charset=CHARSET\n"
"Content-Transfer-Encoding: 8bit\n"

#: hello.php:14
msgid "Hello World!"
msgstr ""
  里面列出 hello.php 档里所有调用 gettext 函式的字符串,翻译的时候只需将 msgid 值翻译填入 msgstr 即可,如翻译成中文。
# SOME DESCRIPTIVE TITLE.
# Copyright ? 2003 Ptker All Right Reserved.
# FIRST AUTHOR , 2003.
#
#, fuzzy
msgid ""
msgstr ""
"Project-Id-Version: 0.1\n"
"POT-Creation-Date: 2003-04-21 22:31+0800\n"
"PO-Revision-Date: YEAR-MO-DA HO:MI+ZONE\n"
"Last-Translator: Ptker \n"
"Language-Team: zh_TW \n"
"MIME-Version: 1.0\n"
"Content-Type: text/plain; charset=BIG5\n"
"Content-Transfer-Encoding: 8bit\n"

#: hello.php:14
msgid "Hello World!"
msgstr "世界,您好!"
  3、创建MO档
msgfmt -o hello.mo hello.po   运行后将产生一个hello.mo二进制档。
  4、最后将 hello.po、hello.mo 拷贝到相关语系的目录下即可。

  五、在IE中输入: http://localhost/hello.php ,现在的结果就是:“世界,您好!”

二分法在IP地址查询中的应用

2007年10月03日 13时55分

本站文章如未特殊注明,均为原创,严禁转载。

  前段时间做数据分析,需要大量的IP地址查询(每秒钟近万次检索),首先考虑到使用数据库。数据库大概存储几十万条IP记录,记录集如下:

+----------+----------+------------+---------+---------+--------+--------+ 
| ip_begin | ip_end   | country_id | prov_id | city_id | isp_id | netbar | 
+----------+----------+------------+---------+---------+--------+--------+ 
|        0 | 16777215 |          2 |       0 |       0 |      0 |      0 | 
| 16777216 | 33554431 |          2 |       0 |       0 |      0 |      0 | 
| 33554432 | 50331647 |          2 |       0 |       0 |      0 |      0 | 
| 50331648 | 67108863 |          3 |       0 |       0 |      0 |      0 | 
| 67108864 | 67829759 |          3 |       0 |       0 |      0 |      0 | 
+----------+----------+------------+---------+---------+--------+--------+ 
  这样做查询需要用到如下SQL:
<?php
$sql = 'SELECT * FROM i_m_ip WHERE ip_begin <= $client_ip AND ip_end >= $client_ip';
?>

  这样的检索显然用不到索引,即使用到,MySQL查询效率也不大可能达到每秒500次以上,我做了很多并发优化,最终平均查询效率也只有每秒200次左右,实在是头痛。一开始我也有想到借鉴纯真IP库的检索方法,但是我一直对算法有抵触,也以为二分法很难,所以就没有尝试使用,直到最后没有办法了,才最终实现了二分法的IP地址检索。
  从上表可以看到IP库是从0到4294967295的一个连续数值,这个数值要是拆开存储,会有几百G的数据,所以没办法使用索引也没办法哈希。最终我使用PHP将这些东东转为二进制存储,抛弃了数据库的检索。可以看到IP起止长度为一个4字节的长整型,后面的国家ID、省份ID等,可以使用2个字节的短整型来存储,总共一行数据就有18个字节,总共31万条数据,算起来也就5M的样子。具体IP库生成代码如下:
<?php
/*
IP文件格式:
3741319168	3758096383	182	0	0	0	0
3758096384	3774873599	3	0	0	0	0
3774873600	4026531839	182	0	0	0	0
4026531840	4278190079	182	0	0	0	0
4294967040	4294967295	312	0	0	0	0
*/
set_time_limit(0);
$handle = fopen('./ip.txt', 'rb');
$fp = fopen("./ip.dat", 'ab');
if ($handle) {
    while (!feof($handle)) {
        $buffer = fgets($handle);
        $buffer = trim($buffer);
        $buffer = explode("\t", $buffer);
        foreach ($buffer as $key => $value) {
            $buffer[$key] = (float) trim($value);
        }
        $str = pack('L', $buffer[0]);
        $str .= pack('L', $buffer[1]);
        $str .= pack('S', $buffer[2]);
        $str .= pack('S', $buffer[3]);
        $str .= pack('S', $buffer[4]);
        $str .= pack('S', $buffer[5]);
        $str .= pack('S', $buffer[6]);
        fwrite($fp, $str);
    }
}
?>

  这样IP就按照顺序每18字节一个单位排列了,所以很容易就使用二分法来检索出IP信息:
function getip($ip, $fp) {
    fseek($fp, 0);
    $begin = 0;
    $end   = filesize('./ip.dat');
    $begin_ip = implode('', unpack('L', fread($fp, 4)));
    fseek($fp, $end - 14);
    $end_ip   = implode('', unpack('L', fread($fp, 4)));
    $begin_ip = sprintf('%u', $begin_ip);
    $end_ip   = sprintf('%u', $end_ip);

    do {
        if ($end - $begin <= 18) {
            fseek($fp, $begin + 8);
            $info = array();
            $info[0] = implode('', unpack('S', fread($fp, 2)));
            $info[1] = implode('', unpack('S', fread($fp, 2)));
            $info[2] = implode('', unpack('S', fread($fp, 2)));
            $info[3] = implode('', unpack('S', fread($fp, 2)));
            $info[4] = implode('', unpack('S', fread($fp, 2)));
            return $info;
        }

        $middle_seek = ceil((($end - $begin) / 18) / 2) * 18 + $begin;

        fseek($fp, $middle_seek);
        $middle_ip = implode('', unpack('L', fread($fp, 4)));
        $middle_ip = sprintf('%u', $middle_ip);

        if ($ip >= $middle_ip) {
            $begin = $middle_seek;
        } else {
            $end = $middle_seek;
        }
    } while (true);
}

  以上$fp为打开ip.dat的文件句柄,由于是循环检索,所以写在函数外面,免得每次检索都要打开一次文件,30W行数据二分法最多也只需要循环7次(2^7)左右即可找到准确的IP信息。之后本来还想将ip.dat放在内存中加快检索速度,后来发现,字符串定位函数的效率,根本和文件指针的偏移定位不是在一个数量级的,所以还是放弃使用内存来存放IP库。
  这个实现,使IP检索效率提高了近百倍,只是一个简单的二分法的应用,从此算法在WEB应用中不重要的观念彻底打消了。其实要实现这个,我还请教了金狐,我一开始是请他帮我生成一个纯真格式的IP库,然后用Discuz的IP查询函数来检索,不过他不肯帮我,最后造就了我的这个实践和学习。有时候,求人不如求己。

使用PHP调用MySQL的存储过程

2007年10月03日 11时59分

本站文章如未特殊注明,均为原创,严禁转载。

  MySQL好像从5.0开始才引入存储过程,反正以前做应用的时候从没碰过,不过现在因为主要作内部系统,所以很多应用都用到了存储过程,当然前台有时候也需要调用MySQL存储过程,PHP的MySQL Lib好像支持的不是很好,不过我搜索了些资料,虽然不多,但是还是尝试的使用了,现在介绍一下方法,以便用到的朋友不用再头疼。
  lMySQL扩展也是支持存储过程的,不过只支持无返回结果的存储过程,如果该存储过程存在输出,这个调用就会抛出一个错误,具体错误忘记了。调用方式很简单:
$rs = mysql_query("call func('str')", $conn);
  这个如果有返回结果,比如返回字符串,就会报错,我现在找到的解决方法是使用MySQLi扩展:
$rs = mysqli_query("call func('str')", $conn);
  这样$rs就作为一个普通的MySQL Result来使用了,非常方便。
  在调用存储过程的时候,可能还会碰到一个问题,那就是可能会顺序调用多个存储过程,这样同样会报错,解决方法就是在调用一个存储过程并处理完成后,手动关闭MySQL链接,然后再次connect,再调用另一个存储过程再处理,需要调用多少个存储过程,就重新连接多少次。
  因为我不是很了解MySQL扩展,以上纯属经验总结,如果有哪位高手知道来龙去脉,欢迎指点。

今天对自动化监控展现的一点想法

2007年09月29日 13时05分

本站文章如未特殊注明,均为原创,严禁转载。

  自动化监控展示,从我到公司短短半年,已经经历了2个版本了,第一个版本是对报表和图形展现的首次尝试,很粗糙,不过已经基本上能看到一个自定义组合查询的雏形.
  第二个版本完全被我Ajax化,引入了很多Javascript操作实现了无刷新的图形加载、添加和删除,并因此后续图形展现工作快速顺利的进行,只需要生成参数即可获得组合图形。
  第三个版本,已经不是在展示效果上下功夫了,而是解决第二个版本很多特殊化展示所对应的他特殊化配置的处理。这次我决定将所有测试用例/CGI作为一个单元,通过配置来灵活分配到各个需要展现的集合中。我想这个版本最头大的就是配置部分了,内部系统的配置简直要人命。
  一个事物,总是有一个成长的过程,其实一开始很多条件都是具备的,只是你没有去发现,你没有找到很好的解决方案,因此现在的迭代开发,真的是周期越来越短了,很明显的这个版本刚发布,下一个版本计划已经丢上来了。
  运营支持系统,主要的不是分析用户行为,而是分析如何更好的作为一件辅助工具来运行。所有人都在用同一个东西,如何更直观,更简单的展示更有价值的信息,是这个系统所要做的。更重要的不是WEB2.0的交互,而是信息的提供。快速、准确、有价值的信息。
  来腾讯半年了,接触到很多以前不曾接触到的东西,从外部系统开发转到内部运营支持系统开发,或许应用人群更狭小了,但是需要思考的东西,是否因此变少了呢?我们一直在摸索。

关于MySQL编码问题,经验总结

2007年09月28日 15时41分

本站文章如未特殊注明,均为原创,严禁转载。

  以下所描述无理论依据,纯属经验谈。
  MySQL使用4.1以上版本,管他是什么字符集,一律使用默认。不用去设置MySQL。
  然后举个使用GB2312和UTF-8的例子。
  好,你只要保证你的写着INSERT SQL语句的PHP文件编码为GB2312,那么恭喜你,你使用写着SELECT SQL语句的GB2312编码的PHP文件读取出来的数据也是GB2312的。
  同理,只要你插入数据库的PHP文件是UTF-8编码,那么你录入的就是UTF-8的,读取出来同样使用编码为UTF-8的读取。
  如果我录入为GB2312,显示要使用UTF-8怎么办,如果你的所有PHP文件为UTF-8编码,那么你在INSERT的时候,就必须使用iconv进行编码转换,将str转为GB2312入库,读取也一样,使用iconv转为UTF-8显示。
  你的前端页面使用什么编码,那么你那些字符串已经被该种编码 编过了,所以,尽管入库,他的机器码肯定就是那样的,不管存放在哪里,不管MYSQL指定为何种编码,他在录入数据的时候,并不会对你的数据进行转换。只要保证你的前端录入使用UTF-8,那么你读取的也是UTF-8。
  为什么使用PHPMYADMIN导入总是有问题呢?
  我没有研究过PHPMYADMIN的工作原理,但是他的PHP文件都是UTF-8编码的,也就是这样导入数据都是UTF-8的,你采用GB2312的PHP文件来读取,当然一堆乱。解决办法我猜有三种,一种在读取的时候,使用SET NAME将其编码转换,不知道可行不,另外一种是读取后使用iconv将其转为GB2312,第三种,就是不用PHPMYADMIN导入,自己写个GB2312的PHP脚本导入即可。
  总之一句话,你录入的时候采用什么编码,那么你读取的时候他就是什么编码。你想把这种编码显示成另外一种编码,那么你需要使用iconv或者mbstring将其进行编码转换。
  以上仅为个人实际经验,没时间研究理论。欢迎大家探讨或者有错误请指正。