每天一个PHP语法六数组使用及内部结构
qiyuwang 2024-11-06 20:15 15 浏览 0 评论
说明
这里基于php7.2.5进行测试,php7之后内部结构变化应该不是太大,但与php5.X有差别。
我们今天学习PHP中的数组语法,数组在PHP中堪称万能结构,什么都能存什么都能放,非常灵活,因为PHP没有其他语言的如map、list等结构,PHParray就够了。
我们前面说变量的存储结构为zval, 值呢放在zend_value中,忘了的看这里
如何声明
$arr = [];
$arr[1] = "hello";
$arr1 = ['name' => '愤怒的鸟'];
如何实现
数组的底层结构为zend_array 也叫HashTable,也就是通过对数组的key进行hash计算之后能直接获取value的地址,时间复杂度为O(1)那是很快的。
typedef struct _zend_array HashTable;
struct _zend_array {
zend_refcounted_h gc;// 引用计数
union {
struct {
ZEND_ENDIAN_LOHI_4(
zend_uchar flags,
zend_uchar nApplyCount,
zend_uchar nIteratorsCount,
zend_uchar consistency)
} v;
uint32_t flags;
} u;
uint32_t nTableMask; // 中间映射计算
Bucket *arData; // 这里是真正存放数组元素的地方
uint32_t nNumUsed; // 已使用的bucket数量,可能包含已删除的元素
uint32_t nNumOfElements; // 数组中有效元素的数量
uint32_t nTableSize; // 数组的总容量
uint32_t nInternalPointer;
zend_long nNextFreeElement;// 数值索引的值
dtor_func_t pDestructor;
};
typedef struct _Bucket {
zval val; // 元素的值 实际是一个zval
zend_ulong h; /* 数组key 经过hash计算得出的值 */ /* hash value (or numeric index) */
zend_string *key; /*元素的key*/ /* string key or NULL for numerics */
} Bucket;
我们知道数组的key可以是数字或者字符串,但是PHP中的数组是有序的,也就是跟插入顺序是保持一致的,那么是如何做到的。
结论:key在存入bucket之前先通过一个中间映射表保存key的位置,先对key进行hash计算然后与数组大小值进行取模运算得出这个key在中间表的位置,然后在中间表的位置存储这个key在bucket中的位置。如图
这里在key是字符串的时候需要进行hash计算,如果是数值就直接拿来用就行了。
插入元素
这个操作比较明晰了,先计算中间表的位置,再存储到bucket
add_to_hash:
// nMumUsed Bucket的数量 ++
idx = ht->nNumUsed++;
// 有效元素的数量 ++
ht->nNumOfElements++;
if (ht->nInternalPointer == HT_INVALID_IDX) {
ht->nInternalPointer = idx;
}
zend_hash_iterators_update(ht, HT_INVALID_IDX, idx);
// arData的内存位置 给当前元素用
p = ht->arData + idx;
// 设置bucket的key
p->key = key;
if (!ZSTR_IS_INTERNED(key)) {
zend_string_addref(key);
ht->u.flags &= ~HASH_FLAG_STATIC_KEYS;
zend_string_hash_val(key);
}
// 设置bucket的h值 ,这里其实是zend_string中的h
p->h = h = ZSTR_H(key);
// 设置bucket的val,
ZVAL_COPY_VALUE(&p->val, pData);
// 在bucket中的位置
nIndex = h | ht->nTableMask;
Z_NEXT(p->val) = HT_HASH(ht, nIndex);
HT_HASH(ht, nIndex) = HT_IDX_TO_HASH(idx);
return &p->val;
查找元素
先自己思考一下我们在获取数组的值$a['name'],是如何获取的,先用key计算hash值,拿到中间表的位置,再拿到bucket的位置,就能取到值了
// 拿到key的hash值
h = zend_string_hash_val(key);
arData = ht->arData;
// 拿到中间表的位置
nIndex = h | ht->nTableMask;
// 拿到bucket的位置
idx = HT_HASH_EX(arData, nIndex);
// 这里先不看
while (EXPECTED(idx != HT_INVALID_IDX)) {
p = HT_HASH_TO_BUCKET_EX(arData, idx);
//
if (EXPECTED(p->key == key)) { /* check for the same interned string */
return p;
} else if (EXPECTED(p->h == h) &&
EXPECTED(p->key) &&
EXPECTED(ZSTR_LEN(p->key) == ZSTR_LEN(key)) &&
EXPECTED(memcmp(ZSTR_VAL(p->key), ZSTR_VAL(key), ZSTR_LEN(key)) == 0)) {
return p;
}
idx = Z_NEXT(p->val);
}
hash冲突
hash计算不可避免的在数据量大的时候有冲突的几率,一般一个常用方法是拉链法,也就是冲突元素串成链表,当keyhash冲突后遍历这个位置的链表,最终拿到匹配的key, 也就是上面的查找元素中while那一段,来看下PHP hashTable是如何处理的,我们还是分析上面那一段代码
add_to_hash:
// nMumUsed Bucket的数量 ++
idx = ht->nNumUsed++;
// 有效元素的数量 ++
ht->nNumOfElements++;
if (ht->nInternalPointer == HT_INVALID_IDX) {
ht->nInternalPointer = idx;
}
zend_hash_iterators_update(ht, HT_INVALID_IDX, idx);
// arData的内存位置 给当前元素用
p = ht->arData + idx;
// 设置bucket的key
p->key = key;
if (!ZSTR_IS_INTERNED(key)) {
zend_string_addref(key);
ht->u.flags &= ~HASH_FLAG_STATIC_KEYS;
zend_string_hash_val(key);
}
// 设置bucket的h值 ,这里其实是zend_string中的h
p->h = h = ZSTR_H(key);
// 设置bucket的val,
ZVAL_COPY_VALUE(&p->val, pData);
// 在bucket中的位置
nIndex = h | ht->nTableMask;
// 这一步,把 bucket当前位置nIndex的元素,设置为新值的next
// 也就是 ht[idx] = p->newval , p->nexal -> next -> p->oldval
Z_NEXT(p->val) = HT_HASH(ht, nIndex);
HT_HASH(ht, nIndex) = HT_IDX_TO_HASH(idx);
return &p->val;
// 这里是 zval.u2.next 下一个元素,忘了的看zval结构
#define Z_NEXT(zval) (zval).u2.next
// 这里就是取到 data[idx]的元素
#define HT_HASH_EX(data, idx) \
((uint32_t*)(data))[(int32_t)(idx)]
#define HT_HASH(ht, idx) \
HT_HASH_EX((ht)->arData, idx)
上图
扩容
PHP数组在初始化时不需要指定容量大小,也就是它是自动扩容的,如何实现呢。
结论:如果插入元素时发现容量不够了,如果已删除的元素达到一定比例就重建索引,如果没有达到就会进行原大小2倍的扩容,然后复制元素到新数组。
IS_CONSISTENT(ht);
HT_ASSERT_RC1(ht);
// 是否达到了这个值
if (ht->nNumUsed > ht->nNumOfElements + (ht->nNumOfElements >> 5)) { /* additional term is there to amortize the cost of compaction */
zend_hash_rehash(ht);
} else if (ht->nTableSize < HT_MAX_SIZE) { /* Let's double the table size */
// 这里会扩容2倍
void *new_data, *old_data = HT_GET_DATA_ADDR(ht);
// 2倍
uint32_t nSize = ht->nTableSize + ht->nTableSize;
Bucket *old_buckets = ht->arData;
// 申请内存
new_data = pemalloc(HT_SIZE_EX(nSize, -nSize), ht->u.flags & HASH_FLAG_PERSISTENT);
// 设置一些属性
ht->nTableSize = nSize;
ht->nTableMask = -ht->nTableSize;
HT_SET_DATA_ADDR(ht, new_data);
// 复制buckets
memcpy(ht->arData, old_buckets, sizeof(Bucket) * ht->nNumUsed);
// 删除老bucket
pefree(old_data, ht->u.flags & HASH_FLAG_PERSISTENT);
zend_hash_rehash(ht);
} else {
zend_error_noreturn(E_ERROR, "Possible integer overflow in memory allocation (%u * %zu + %zu)", ht->nTableSize * 2, sizeof(Bucket) + sizeof(uint32_t), sizeof(Bucket));
}
总结
PHP数组底层是hashTable, 通过一个中间映射表实现顺序性,自动扩容,value可以任何类型,key可以是int也可以是string
参考资料:
《PHP内核剖析》
相关推荐
- 基于Docker方式安装与部署Camunda流程引擎
-
1Camunda简介官网:https://docs.camunda.org/manual/7.19/installation/docker/Camunda是一个轻量级、开源且高度灵活的工作流和决策自...
- 宝塔Linux面板如何部署Java项目?(宝塔面板 linux)
-
通过宝塔面板部署Java还是很方便的,至少不需要自己输入tomcat之类的安装命令了。在部署java项目前,我还是先说下目前的系统环境,如果和我的系统环境不一样,导致部署不成功,那你可能需要去找其他资...
- 浪潮服务器如何用IPMI安装Linux系统
-
【注意事项】此处以浪潮服务器为例进行演示所需使用的软件:Chrome浏览器个人PC中需要预先安装java,推荐使用jdk-8u181-windows-x64.exe【操作步骤】1、在服务器的BIOS中...
- Centos7环境Hadoop3集群搭建(hadoop集群环境搭建实验报告)
-
由于项目需要存储历史业务数据,经过评估数据量会达到100亿以上,在原有mongodb集群和ES集群基础上,需要搭建Hbase集群进行调研,所以首先总结一下Hadoop集群的搭建过程。一、三个节点的集群...
- Hadoop高可用集群搭建及API调用(hadoop高可用原理)
-
NameNodeHA背景在Hadoop1中NameNode存在一个单点故障问题,如果NameNode所在的机器发生故障,整个集群就将不可用(Hadoop1中虽然有个SecorndaryNameNo...
- 使用Wordpress搭建一个属于自己的网站
-
现在开源的博客很多,但是考虑到wordpress对网站的seo做的很好,插件也多。并且全世界流量排名前1000万的网站有33.4%是用Wordpress搭建的!所以尝试用Wordpress搭建一个网站...
- Centos 安装 Jenkins(centos 安装ssh)
-
1、Java安装查看系统是否已安装Javayumlistinstalled|grepjava...
- Java教程:gitlab-使用入门(java中的git)
-
1导读本教程主要讲解了GitLab在项目的环境搭建和基本的使用,可以帮助大家在企业中能够自主搭建GitLab服务,并且可以GitLab中的组、权限、项目自主操作...
- Dockerfile部署Java项目(docker部署java应用)
-
1、概述本文主要会简单介绍什么是Docker,什么是Dockerfile,如何安装Docker,Dockerfile如何编写,如何通过Dockerfile安装jar包并外置yaml文件以及如何通过do...
- 如何在Eclipse中搭建Zabbix源码的调试和开发环境
-
Zabbix是一款非常优秀的企业级软件,被设计用于对数万台服务器、虚拟机和网络设备的数百万个监控项进行实时监控。Zabbix是开放源码和免费的,这就意味着当出现bug时,我们可以很方便地通过调试源码来...
- Java路径-02-Java环境配置(java环境搭建及配置教程)
-
1Window环境配置1.1下载...
- 35.Centos中安装python和web.py框架
-
文章目录前言1.Centos7python:2.Centos8python:3.进行下载web.py框架然后应用:4.安装好之后进行验证:5.总结:前言...
- 《我的世界》服务器搭建(我的世界服务器如何搭建)
-
1.CentOS7环境1.1更改YUM源#下载YUM源文件curl-o/etc/yum.repos.d/CentOS-Base.repohttps://mirrors.aliyun.com...
- CentOS 7 升级 GCC 版本(centos7.4升级7.5)
-
1.GCC工具介绍GCC编译器:...
- Linux安装Nginx详细教程(linux安装配置nginx)
-
环境准备1.因为Nginx依赖于gcc的编译环境,所以,需要安装编译环境来使Nginx能够编译起来。命令:yuminstallgcc-c++显示完毕,表示安装完成:2.Nginx的http模块需要...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- 基于Docker方式安装与部署Camunda流程引擎
- 宝塔Linux面板如何部署Java项目?(宝塔面板 linux)
- 浪潮服务器如何用IPMI安装Linux系统
- Centos7环境Hadoop3集群搭建(hadoop集群环境搭建实验报告)
- Hadoop高可用集群搭建及API调用(hadoop高可用原理)
- 使用Wordpress搭建一个属于自己的网站
- Centos 安装 Jenkins(centos 安装ssh)
- Java教程:gitlab-使用入门(java中的git)
- Dockerfile部署Java项目(docker部署java应用)
- 如何在Eclipse中搭建Zabbix源码的调试和开发环境
- 标签列表
-
- navicat无法连接mysql服务器 (65)
- 下横线怎么打 (71)
- flash插件怎么安装 (60)
- lol体验服怎么进 (66)
- ae插件怎么安装 (62)
- yum卸载 (75)
- .key文件 (63)
- cad一打开就致命错误是怎么回事 (61)
- rpm文件怎么安装 (66)
- linux取消挂载 (81)
- ie代理配置错误 (61)
- ajax error (67)
- centos7 重启网络 (67)
- centos6下载 (58)
- mysql 外网访问权限 (69)
- centos查看内核版本 (61)
- ps错误16 (66)
- nodejs读取json文件 (64)
- centos7 1810 (59)
- 加载com加载项时运行错误 (67)
- php打乱数组顺序 (68)
- cad安装失败怎么解决 (58)
- 因文件头错误而不能打开怎么解决 (68)
- js判断字符串为空 (62)
- centos查看端口 (64)