PHP 没有真正的数组! php 数组的底层实现
qiyuwang 2024-11-06 20:16 19 浏览 0 评论
PHP的数组非常多变。你可以把它当作映射使用,也可以当作集合使用,甚至可以当作数据对象使用……如果你很勇敢,甚至可以把它当作数组使用!
似乎将PHP数组当作传统的数组(即一个拥有从0开始的整数索引列表)是一件很危险的事情,其中到处都是陷阱,还很容易制造出bug。这一切的原因都是因为PHP的数组并不是真正的数组。
我们来看看这究竟是怎么回事。下面是一个PHP的小问题:下列程序的输出是什么?
<?php
$letters = ['d', 'c', 'a', 'b', 'e'];
$sorted = $letters;
natsort($sorted);
print $sorted[0];
答案是:它会输出d!
这段代码的本意是输出按字母排序后的第一个字符串,应该是a。但$sorted[0]的意思并不是“数组中的第一个元素”。它的意思是“查找键0然后返回该键的元素”。
在PHP中,数组实际上是映射(即关联数组),它有键和值。当你使用下面的代码创建数组时,
$ary = ['a', 'b', 'c'];
实际的操作其实是:
$ary = [0 => 'a', 1 => 'b', 2 => 'c'];
PHP会给每个元素指定一个整数键,从0开始依次排列,因此在许多方面这个数组的行为跟传统的数组很相似。
下面,我们尝试一下键的顺序:
<?php
$ary = [1 => 'b', 2 => 'c', 0 => 'a'];
print $ary[0]; // 'a'
print $ary[1]; // 'b'
print $ary[2]; // 'c'
// Prints: b c a
foreach ($ary as $letter) {
print $letter;
}
// Prints: 1:b 2:c 0:a
foreach ($ary as $key => $letter) {
print "$key:$letter";
}
如果通过键来访问数组,那么其行为跟传统数组很相似。但在迭代数组时,它就不会关心键的顺序,而是按照数组元素定义的顺序:b,c,a。
所以,所有PHP数组都有键和值,但这些键值对还有特定的顺序。换句话说:“PHP数组实际上是有序的映射。”
回到第一个示例:natsort()改变了键值对的顺序,但没有改变实际的键:
<?php
$letters = ['d', 'c', 'a', 'b', 'e'];
$sorted = $letters;
natsort($sorted);
print_r($letters); // [0 => 'd', 1 => 'c', 2 => 'a', 3 => 'b', 4 => 'e']
print_r($sorted); // [2 => 'a', 3 => 'b', 1 => 'c', 0 => 'd', 4 => 'e']
print $sorted[0]; // 'd'
如果$sorted[0]不会访问数组中的第一个元素,那么怎样才能访问第一个元素呢?或者说,怎样才能访问前三个元素呢?方法有以下几种。
array_values()
你可以通过array_values()给数组“重新编号”。它会返回一个数组,其值与传入的数组相同,但键从零开始重新排列:
<?php
$sorted = [2 => 'a', 3 => 'b', 1 => 'c', 0 => 'd', 4 => 'e'];
$sorted = array_values($sorted);
print $sorted[0]; // 'a'
print $sorted[1]; // 'b'
print $sorted[2]; // 'c'
array_slice()
通常,利用索引访问PHP数组时,我们实际上查找的是一个键。但array_slice()是一个例外——传入的索引实际上是数组内部的位置,而不是键。
<?php
$sorted = [2 => 'a', 3 => 'b', 1 => 'c', 0 => 'd', 4 => 'e'];
$first_three = array_slice($sorted, 0, 3);
print $first_three[0]; // 'a'
print $first_three[1]; // 'b'
print $first_three[2]; // 'c'
这种做法的一个陷阱就是它依然会保留字符串键,这一点与array_values()不同。
reset()、next()及其他
PHP中的每个数组都有一个内部指针,可以用来迭代数组。reset()将内部指针重置到数组的开头。next()将指针前进到下一个键值对。还有prev()、key()、current()和end()。这些低阶API很难看,但能让你理解PHP数组真正的工作原理:
<?php
$sorted = [2 => 'a', 3 => 'b', 1 => 'c', 0 => 'd', 4 => 'e'];
// start at the beginning
print reset($sorted); // 'a'
print key($sorted); // 2
print current($sorted); // 'a'
// advance forward
print next($sorted); // 'b'
print key($sorted); // 3
print current($sorted); // 'b'
// advance forward
print next($sorted); // 'c'
print key($sorted); // 1
print current($sorted); // 'c'
// jump to the end
print end($sorted); // 'e'
print key($sorted); // 4
print current($sorted); // 'e'
// there is no next element, so this returns null
print next($sorted);
你几乎永远不需要使用这些函数,但有时候可以使用reset()来方便地获取数组的第一个值,或者用end()获取最后一个值。
Laravel的collect()
Laravel有一个非常好用的collections类,该类已被提取到一个独立的函数库中。我们的工作中就在使用这个函数库。
它提供了first()和last()方法来获取数组的第一个和最后一个元素,以及take()方法获取前N个元素。
<?php
$sorted = [2 => 'a', 3 => 'b', 1 => 'c', 0 => 'd', 4 => 'e'];
print collect($sorted)->first(); // 'a'
print collect($sorted)->last(); // 'e'
print_r(collect($sorted)->take(3)->all()); // [2 => 'a', 3 => 'b', 1 => 'c']
注意take()会保留数组中的键。许多PHP数组函数都接受一个可选的参数$preserve_keys。而这个collections函数库在封装PHP数组函数时,几乎永远都会给这个参数传递true,所以可以认为使用该函数库时,键一直都被保留。
使用PHP数组的几个建议
下面是我在使用PHP数组时总结的一些心得:
时刻小心$ary[0]
每当你看到数组索引为0时,就应该知道这段代码很可能在将PHP数组当作传统数组处理。通常这种假设是不安全的,特别是当数组是从其他地方传递过来的情况下。0也许并不是数组中的第一个键,甚至可能根本不存在(例如在执行了array_filter()之后)。
除非是你自己创建的数组,否则应该使用reset($ary)或者库函数,比如collect($ary)->first()方法。
考虑对数组重新编号
$ary[0]问题也可以通过另一种方式解决:每当给其他函数传递数组时,确保它的键像传统数组一样。通常这意味着在执行array_filter()或者任何可能删除键或改变键的顺序的函数之后需要调用array_values()。
你可以说,利用array_values()反复“修正”数组违反了数组本身的性质。或许,我们不应该让PHP数组表现得像传统数组,而是应该接受PHP数组的性质,写代码时不要对数组的键做出假设。然而新手很可能会认为PHP数组像传统数组一样。
上面两点遵循了健壮性原则:“发送时要保守,接收时要自由。”
比较数组时,键很重要,但顺序不重要
像assertEquals(['a', 'b'], array_filter(['a', null, 'b']))之类的比较会失败,因为[0 => 'a', 1 => 'b']并不等于[0 => 'a', 2=> 'b']!它们的键必须一样才行。
相反,assertEquals($ary, collect($ary)->sort()->all())永远为真,因为对于==来说,键值对的顺序并不重要。例如,[0 => 'a', 1 => 'b'] == [1 => 'b', 0 => 'a']为真。
将数组当作映射使用
假设你有一个$users_by_id数组,其中$users_by_id[32]会查找id为32的User。那么,如果使用array_map(function ($user) { return $user->getName(); })来映射该数组,则会得到一个name的数组,其键为user id,因为array_map()并不会改变数组的键。在这种情况下保留键非常有用,所以当需要映射时,你应该避免使用可能导致数组重新编号的函数。
将数组当作有序映射使用
可以对$users_by_id数组进行排序,然后利用它:(1)根据id查找用户;(2)按照特定顺序遍历所有用户。利用这个技巧,就不需要像某些其他语言那样,仅仅为了跟踪顺序而维护一个单独的id数组。
指示数组的类型
PHP数组造成的许多混乱都是因为它试图将一种数据结构用于两种目的。尽管PHP的类型系统不会区别传统数组和映射,但我们应该区分。由于缺少合适的类型系统,我们应当使用变量命名规则来指示类型。例如,传统数组通常用复数形式,如$users,而映射通常以“by x”结尾,如$users_by_id。
总结
思维模型非常重要。我曾经把PHP数组只当作键值对的集合,但后来我意识到,数组实际上是键值对的有序列表,这时我才真正理解了PHP数组。
关于PHP文档中的数组和数组函数的怪异行为还有许多需要学习的地方,我发现有了正确的思维模型才能理解这些怪异的行为!
原文:https://medium.com/7shifts-engineering-blog/php-arrays-arent-really-arrays-57b627a1e46a
相关推荐
- 基于Docker方式安装与部署Camunda流程引擎
-
1Camunda简介官网:https://docs.camunda.org/manual/7.19/installation/docker/Camunda是一个轻量级、开源且高度灵活的工作流和决策自...
- 宝塔Linux面板如何部署Java项目?(宝塔面板 linux)
-
通过宝塔面板部署Java还是很方便的,至少不需要自己输入tomcat之类的安装命令了。在部署java项目前,我还是先说下目前的系统环境,如果和我的系统环境不一样,导致部署不成功,那你可能需要去找其他资...
- 浪潮服务器如何用IPMI安装Linux系统
-
【注意事项】此处以浪潮服务器为例进行演示所需使用的软件:Chrome浏览器个人PC中需要预先安装java,推荐使用jdk-8u181-windows-x64.exe【操作步骤】1、在服务器的BIOS中...
- Centos7环境Hadoop3集群搭建(hadoop集群环境搭建实验报告)
-
由于项目需要存储历史业务数据,经过评估数据量会达到100亿以上,在原有mongodb集群和ES集群基础上,需要搭建Hbase集群进行调研,所以首先总结一下Hadoop集群的搭建过程。一、三个节点的集群...
- Hadoop高可用集群搭建及API调用(hadoop高可用原理)
-
NameNodeHA背景在Hadoop1中NameNode存在一个单点故障问题,如果NameNode所在的机器发生故障,整个集群就将不可用(Hadoop1中虽然有个SecorndaryNameNo...
- 使用Wordpress搭建一个属于自己的网站
-
现在开源的博客很多,但是考虑到wordpress对网站的seo做的很好,插件也多。并且全世界流量排名前1000万的网站有33.4%是用Wordpress搭建的!所以尝试用Wordpress搭建一个网站...
- Centos 安装 Jenkins(centos 安装ssh)
-
1、Java安装查看系统是否已安装Javayumlistinstalled|grepjava...
- Java教程:gitlab-使用入门(java中的git)
-
1导读本教程主要讲解了GitLab在项目的环境搭建和基本的使用,可以帮助大家在企业中能够自主搭建GitLab服务,并且可以GitLab中的组、权限、项目自主操作...
- Dockerfile部署Java项目(docker部署java应用)
-
1、概述本文主要会简单介绍什么是Docker,什么是Dockerfile,如何安装Docker,Dockerfile如何编写,如何通过Dockerfile安装jar包并外置yaml文件以及如何通过do...
- 如何在Eclipse中搭建Zabbix源码的调试和开发环境
-
Zabbix是一款非常优秀的企业级软件,被设计用于对数万台服务器、虚拟机和网络设备的数百万个监控项进行实时监控。Zabbix是开放源码和免费的,这就意味着当出现bug时,我们可以很方便地通过调试源码来...
- Java路径-02-Java环境配置(java环境搭建及配置教程)
-
1Window环境配置1.1下载...
- 35.Centos中安装python和web.py框架
-
文章目录前言1.Centos7python:2.Centos8python:3.进行下载web.py框架然后应用:4.安装好之后进行验证:5.总结:前言...
- 《我的世界》服务器搭建(我的世界服务器如何搭建)
-
1.CentOS7环境1.1更改YUM源#下载YUM源文件curl-o/etc/yum.repos.d/CentOS-Base.repohttps://mirrors.aliyun.com...
- CentOS 7 升级 GCC 版本(centos7.4升级7.5)
-
1.GCC工具介绍GCC编译器:...
- Linux安装Nginx详细教程(linux安装配置nginx)
-
环境准备1.因为Nginx依赖于gcc的编译环境,所以,需要安装编译环境来使Nginx能够编译起来。命令:yuminstallgcc-c++显示完毕,表示安装完成:2.Nginx的http模块需要...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- 基于Docker方式安装与部署Camunda流程引擎
- 宝塔Linux面板如何部署Java项目?(宝塔面板 linux)
- 浪潮服务器如何用IPMI安装Linux系统
- Centos7环境Hadoop3集群搭建(hadoop集群环境搭建实验报告)
- Hadoop高可用集群搭建及API调用(hadoop高可用原理)
- 使用Wordpress搭建一个属于自己的网站
- Centos 安装 Jenkins(centos 安装ssh)
- Java教程:gitlab-使用入门(java中的git)
- Dockerfile部署Java项目(docker部署java应用)
- 如何在Eclipse中搭建Zabbix源码的调试和开发环境
- 标签列表
-
- navicat无法连接mysql服务器 (65)
- 下横线怎么打 (71)
- flash插件怎么安装 (60)
- lol体验服怎么进 (66)
- ae插件怎么安装 (62)
- yum卸载 (75)
- .key文件 (63)
- cad一打开就致命错误是怎么回事 (61)
- rpm文件怎么安装 (66)
- linux取消挂载 (81)
- ie代理配置错误 (61)
- ajax error (67)
- centos7 重启网络 (67)
- centos6下载 (58)
- mysql 外网访问权限 (69)
- centos查看内核版本 (61)
- ps错误16 (66)
- nodejs读取json文件 (64)
- centos7 1810 (59)
- 加载com加载项时运行错误 (67)
- php打乱数组顺序 (68)
- cad安装失败怎么解决 (58)
- 因文件头错误而不能打开怎么解决 (68)
- js判断字符串为空 (62)
- centos查看端口 (64)