PHP内核探索:数组源码分析
PHP内核    2019-04-25 16:07:15    13    0    0
admin   PHP内核

PHP中经常使用数组,使用数组最大的好处便是速度!读写都可以在O(1)内完成,因为它每个元素的大小都是一致的,只要知道下标,便可以瞬间计算出其对应的元素在内存中的位置,从而直接取出或者写入。那么内核中是如何实现的呢?

PHP大部分功能,都是通过HashTable来实现,其中就包括数组。HashTable即具有双向链表的优点,同时具有能与数据匹敌的操作性能。PHP中的定义的变量保存在一个符号表里,而这个符号表其实就是一个HashTable,它的每一个元素都是一个zval*类型的变量。不仅如此,保存用户定义的函数、类、资源等的容器都是以HashTable的形式在内核中实现的。

下面分别来看在PHP、内核中如何定义数组。

PHP中定义数组:

1<?php 
2    $array array(); 
3    $array["key"] = "values"
4?> 

在内核中使用宏来实现:

1zval* array; 
2array_init(array); 
3add_assoc_string(array, "key""value", 1); 

将上述代码中的宏展开:

01zval* array; 
02      ALLOC_INIT_ZVAL(array); 
03      Z_TYPE_P(array) = IS_ARRAY; 
04   
05      HashTable *h; 
06      ALLOC_HASHTABLE(h); 
07      Z_ARRVAL_P(array)=h; 
08      zend_hash_init(h, 50, NULL,ZVAL_PTR_DTOR, 0); 
09   
10      zval* barZval; 
11      MAKE_STD_ZVAL(barZval); 
12      ZVAL_STRING(barZval, "value", 0); 
13      zend_hash_add(h, "key", 4, &barZval, sizeof(zval*), NULL); 

内核为我们提供了方便的宏来管理数组。

01//add_assoc_*系列函数: 
02add_assoc_null(zval *aval, char *key); 
03add_assoc_bool(zval *aval, char *key, zend_bool bval); 
04add_assoc_long(zval *aval, char *key, long lval); 
05add_assoc_double(zval *aval, char *key, double dval); 
06add_assoc_string(zval *aval, char *key, char *strval, int dup); 
07add_assoc_stringl(zval *aval, char *key,char *strval, uint strlenintdup); 
08add_assoc_zval(zval *aval, char *key, zval *value); 
09   
10//备注:其实这些函数都是宏,都是对add_assoc_*_ex函数的封装。 
11   
12//add_index_*系列函数: 
13ZEND_API int add_index_long     (zval *arg, ulong idx, long n); 
14ZEND_API int add_index_null     (zval *arg, ulong idx           ); 
15ZEND_API int add_index_bool     (zval *arg, ulong idx, int b    ); 
16ZEND_API int add_index_resource (zval *arg, ulong idx, int r    ); 
17ZEND_API int add_index_double   (zval *arg, ulong idx, double d); 
18ZEND_API int add_index_string   (zval *arg, ulong idx, const char *str, int duplicate); 
19ZEND_API int add_index_stringl  (zval *arg, ulong idx, const char *str, uint length, int duplicate); 
20ZEND_API int add_index_zval     (zval *arg, ulong index, zval *value); 
21   
22//add_next_index_*函数: 
23ZEND_API int add_next_index_long        (zval *arg, long n  ); 
24ZEND_API int add_next_index_null        (zval *arg          ); 
25ZEND_API int add_next_index_bool        (zval *arg, int b   ); 
26ZEND_API int add_next_index_resource    (zval *arg, int r   ); 
27ZEND_API int add_next_index_double      (zval *arg, double d); 
28ZEND_API int add_next_index_string      (zval *arg, const char *str, intduplicate); 
29ZEND_API int add_next_index_stringl     (zval *arg, const char *str, uint length, int duplicate); 
30ZEND_API int add_next_index_zval        (zval *arg, zval *value); 

add_next_index_*()

1PHP中        内核中 
2$arr[] = NULL;  add_next_index_null(arr); 
3$arr[] = 42;    add_next_index_long(arr, 42); 
4$arr[] = true;  add_next_index_bool(arr, 1); 
5$arr[] = 3.14;  add_next_index_double(arr, 3.14); 
6$arr[] = 'foo'; add_next_index_string(arr, "foo"); 
7$arr[] = $var;  add_next_index_zval(arr, zval); 

add_index_*()

1PHP中            内核中 
2$arr[0] = NULL; add_index_null(arr, 0); 
3$arr[1] = 42;       add_index_long(arr, 1, 42); 
4$arr[2] = true;     add_index_bool(arr, 2, 1); 
5$arr[3] = 3.14;     add_index_double(arr, 3, 3.14); 
6$arr[4] = 'foo';        add_index_string(arr, 4, "foo", 1); 
7$arr[5] = $var;     add_index_zval(arr, 5, zval); 

add_assoc_*()

1$arr["abc"] = NULL; add_assoc_null(arr, "abc"); 
2$arr["def"] = 42;   add_assoc_long(arr, "def", 42); 
3$arr["ghi"] = true; add_assoc_bool(arr, "ghi", 1); 
4$arr["jkl"]  = 3.14 add_assoc_double(arr, "jkl", 3.14); 
5$arr["mno"]="foo"   add_assoc_string(arr, "mno""foo", 1"); 
6$arr["pqr"] = $var; add_assoc_zval(arr, "pqr", zval); 

下面在PHP中定义一个函数,并在其中使用数组。然后来看在内核中如何实现。

01<?php 
02function array_test(){ 
03    $mystr "Forty Five"
04    $return_value array(); 
05    $return_value[42] = 123; 
06    $return_value[] = "test"
07       
08    $return_value[] = $mystr
09    $return_value["double"] = 3.14; 
10       
11    $mysubarray
12    $mysubarray array(); 
13    $mysubarray[] = "hello"
14       
15    $return_value["subarray"] = $mysubarray
16   
17    return $return_value
18
19?> 

内核中实现:

01PHP_FUNCTION(array_test){ 
02    char* mystr; 
03    zval* mysubarray; 
04   
05    array_init(return_value); 
06   
07    add_index_long(return_value, 42, 123); 
08   
09    add_next_index_string(return_value, "test", 1); 
10   
11    add_next_index_stringl(return_value, "test_stringl", 10, 1); 
12   
13    mystr = estrdup("Forty Five"); 
14   
15    add_next_index_string(return_value, mystr, 0); 
16   
17    add_assoc_double(return_value, "double", 3.14); 
18   
19    ALLOC_INIT_ZVAL(mysubarray); 
20    array_init(mysubarray); 
21    add_next_index_string(mysubarray, "hello", 1); 
22    add_assoc_zval(return_value, "subarray", mysubarray); 
23

你可能会疑问上面代码中的变量return_value在哪里定义的。下面将PHP_FUNCTION展开,你就明白了。

1zif_array_test(int ht, zval *return_value, zval **return_value_ptr, zval *this_ptr, int return_value_used TSRMLS_DC);

没错,实际上每个函数都有一个默认的返回值return_value。在使用RETVAL_*()、RETURN_*()作为函数返回值时,仅仅是修改return_value。

上一篇: PHP内核探索:数组源码分析

下一篇: PHP内核探索:数组操作

13
登录 后评论.
没有帐号? 现在注册.
0 评论
Table of content