04. 数组
学习目标
- 掌握数组的定义与使用
- 掌握数组的常见操作
- 掌握JVM运行时数据区的栈和堆
- 知道引用数据类型与基本数据类型的区别
数组概述
引入
引例:
假设一个班上有80个人,现在需要统计,某一门课程的平均成绩,是否需要定义80个变量?
很明显:
- 如果程序需要多少数据,就定义多少个变量,过于麻烦了,这种代码写出来也不美观。
- 当然,更重要的是多个变量单独定义且单独存在,之间没有任何关联,很不方便管理和维护。
这样的做法,就好比,去超市购物,把东西一个一个单独带回家。
很显然,购物需要**"袋子"**装东西,Java变量也需要一个容器来存放数据。
Java中用于存放数据的容器有很多,但最基本的容器是数组(Array)。定义一个数组,就可以存储很多数据。
思考:
数组中的数据是胡乱的摆放在一起吗?数组对装在里面的数据有什么要求吗?
定义
数组是存储多个,具有相同数据类型的数据元素的有序容器(集合)。
定义中的重点是:
- 数组能够存储多个元素,多个数据。
- 这些数据元素的数据类型,必须一致。
- 这些数据是有序的:
- 数组中的每个存储单元,都有唯一编号(下标),该编号,从左向右,从0开始编号,最大值是数组长度-1
- 这种编号,专业的术语称之为下标或者索引(index)
除此以外:
- 定义一个数组,也是定义一个变量。而且是一种引用数据类型变量,数组是典型的引用数据类型!
- 数组里面,可以存储基本数据类型元素,也可以存储引用数据类型元素,但是一个数组里面只能存储同一种数据类型元素。
数组的随机访问与数组的优缺点
思考:数组里的数据,为什么非要有序且数据类型一样?
这实际上和数组的数据结构结构有关系,数组是线性表的典型物理实现。
线性表(list):排列成一条线一样,具有"一对一"逻辑关系的数据,最佳的存储方式是使用线性表。
数组最显著的特征是支持随机访问
随机访问:指的是在访问某个元素时,无需经过其它元素,直接定位访问它
非随机访问:指的是访向某个元素时,需要先访问其它元素。
显然随机访问的效率很高,时间复杂度是常数级别的O(1)。
而数组的随机访问实现方式是:根据数组的首地址和下标,通过寻址公式直接计算出对应的内存地址,最终找出数据。要想使用这种方式实现随机访问,显然数组对数据结构和数组中的元素都是有要求的:
- 存储结构必须是连续的(有序),这样才能连续计算。
- 存储的元素必须数据类型相同,这样每个存储单元的地址偏移量都是相同的。
综上,数组是用一段连续的内存空间,来存储一组具有相同类型的数据的结构。
数组的缺点
1.作为一个容器,它只能存储相同数据类型的元素。
2.数组必须占用一片连续的内存空间,这说明数组对内存空间使用的要求很高, JVM在创建数组时,必须事先为数组规划好合理的空间, 一个数组只要在内存中被创建出来,那么它的存储空间就是固定的,
3.数组的长度一旦创建固定,是不可能再改变了!!数组的使用是很不方便的,实际开发中很少直接使用数组。 如果预先规划的数组长度过长,会导致内存空间的浪费, 如果过短,那就更不行了。
数组的优点
数组的优点是非常鲜明的,数组支持随机访问。数组中元素的存储和访问,效率都很高
扩展
数组的优缺点很鲜明,而且由于数组的长度不可变,所以数组在实际开发中很少直接被使用。
而是采取一种更加灵活的方式去间接使用数组。
比如Java中的集合(高级容器,是日常开发中最常用的容器)中ArrayList
ArrayList的底层实现仍然是一个数组,但是这个数组可以自动扩容
而且也有下标,也有随机访问.
数组的基本使用
数组的声明
要想使用数组,首先要声明(declaration)数组,类似于变量的声明。
声明数组的两种语法格式:
格式一
数据类型[] 数组名;
格式二
数据类型 数组名[];
第一种格式具有更好的可读性,可以直观的看到这个数组是一个什么数据类型的数组。
第二种格式,是Java沿袭自C语言的一种声明方式。(C语言语法当中只有格式二声明数组)
这是因为早期很多Java开发者都是C/C++开发转过来的,而且Java开发之初就是为了简化C++的。
所以很多开发者在开发Java时,一时改不了使用习惯。
我们在Java早期的源代码中,可以发现很多格式二的使用案例。
Java为了代码的兼容性考虑,不太可能会取消这一声明格式。
(但是像C#这种和Java同源的设计语言,已经取消了数组的声明格式二)
但是,我们毕竟不是Java开发者,而几乎所以Java规范中都禁止使用格式二定义数组。
数组的初始化
声明完成一个数组后,该数组仍然不能使用,还缺少一个初始化(initialization)的过程,类似变量初始化(赋值)
对于变量而言,初始化是在内存中开辟空间并赋值的过程,对于数组而言,也是类似的过程。
数组要开辟一片连续的空间用来存放数据,然后进行元素赋值,即:
- 我们要告诉需要开辟多少内存空间
- 数组中的元素要明确它的值
为了完成上述两个要求,数组的初始化就有了以下两种方式。
- 静态初始化
- 动态初始化
静态初始化
静态初始化指的是:
由程序员显式的,指定数组中每个元素的初始值,数组的长度由系统决定(实际上也是由程序员给出的)
和数组的声明写在一起,语法格式就是:
数据类型[] 数组名 = new 数据类型[]{元素1,元素2,元素3...};
注:new是一个关键字,它的含义是创建对象。(这里是数组对象!)
静态初始化有简写的形式,可以省略new关键字,如下:
数据类型[] 数组名 = {元素1,元素2,元素3...};
数组名 = {元素1,元素2,元素3...};
当然完整格式可以不和声明写在一起,可以单独使用
动态初始化
动态初始化指的是:
程序员只是指定数组的长度,数组中每个元素的初始值由系统(实际上是JVM)决定。
和数组的声明写在一起,语法格式就是:
数据类型[] 数组名 = new 数据类型[数组长度];
注意事项:
- 动态初始化没有给出具体元素的赋值,但仍然能够初始化完成,这是因为数组中的元素具有默认值。
- 数组的长度必须是一个int范围内的非负数。
- 动态初始化数组相对更灵活,是更常用的方式。
静态初始化和动态初始化叠加使用,是经典的错误错误:
数组名 = new 数据类型[数组长度]{元素1,元素2,元素3...};
数组的基本操作
数组的最基本操作,包括访问元素,存取元素,获取长度等等。
数组的访问
数组的访问有两种形式:
直接输出语句打印数组名,可以得到类似于:
[I@1540e19d
这样的一个字符串,解释一下这个字符串的由来:
- [左中括号表示该数据类型是一个(一维)数组
- I大写的字母i表示数组的类型是int类型
- @后面跟的是一个16进制的数,可以认为是该数组对象的内存地址空间。
若想要获取数组中元素的取值,其访问语法是:
数据类型 变量名 = 数组名[下标]
注:不能填入一个不合法的索引下标,否则会报错!
元素的赋值
数组元素的获取和赋值都依赖于下标访问,本质上是一个语法:
数组名[下标] = 值;
获取数组长度
数组的长度可以直接用引用(数组名)获取,语法是:
int len = 数组名.length;
注:数组的长度是一个int类型整数,Java不支持long类型作为数组长度
JVM运行时数据区
程序在运行期间,需要处理很多数据,JVM中有专门的区域来存放这些数据,这片区域称之为JVM的运行时数据区域。
在这片区域中,变量显然不可能是杂乱无章的随意存放的, 这些区域各有各的用途,创建时间,销毁时间等特点皆有不同,与之相对应的,不同区域中存放的变量的生命周期、特点和使用方式也会随之产生差异。
理解JVM运行时内存是学习Java的基本,这个东西并不底层,需要每位同学都掌握。
理解JVM运行时内存,能够加深我们对Java中的很多现象的理解。
划分
为了描述JVM运行时内存空间,Java的开发者在《Java虚拟机规范》中指出:JVM (运行时数据区)内存共分为:
- JVM栈
- 堆
- 方法区
- 程序计数器
- 本地方法栈
这五大区域,示意图如下:
JVM栈(以后简称栈,stack):描述的是Java的(普通)方法执行时的所占内存的内存模型。程序运行时调用方法的代价是:方法中有局部变量需要开辟空间存储,方法的执行过程会产生中间变量,方法执行完毕还需要存储返回地址等等。JVM栈正是Java的(普通)方法执行时所占用的内存空间, 局部变量会直接存储在栈帧中。
于是,方法的执行流程,在JVM内存中,就变成下面这样:
- 每当Java程序执行一个方法,都会在栈上分配一块只属于该方法的内存区域,称之为栈帧
- 每当Java程序执行一个方法,都会将一个存储该方法信息的栈帧压入栈中,称之为方法进栈
- 方法进栈的同时局部变量开辟内存空间存储值,局部变量生效。
- 当方法执行完毕后,该方法的栈帧随之销毁,称之为方法的出栈
- 方法栈帧被销毁的同时,局部变量也被销毁,局部变量失效。
注:栈中只有处于栈顶的栈帧才会生效,表示正在执行的方法。称之为当前栈帧,当前方法。
堆(heap):堆是JVM内存中最大的一块,new出来的东西(称之为对象或者实例)都在堆上。 所以new关键字的语义就是:在堆上开辟一片空间给相应的对象。而这片空间(对象)是有内存地址的,这个内存地址是留给外界访问用的。
注:引用数据用比较运算符比较的地址就是这个地址,即比较对象的内存地址。
方法区(method area):面向对象详细讲。
本地方法栈:和JVM栈类似,区别是本地方法栈是给本地(native)方法使用的,而不是普通方法。
程序计数器:JVM执行代码解释执行的,即是一行一行执行字节码的,程序计数器用来记录当前执行的行数。
很明显,在JVM内存模型中,相对比较重要的,和程序的执行联系更紧密的是:堆和JVM栈。堆内存用来存储对象,由于Java是面向对象语言,Java面向对象程序中将会有非常多的对象,所以 而JVM栈用来表示方法的执行流程,
方法调用
引申
什么是引用数据类型
引用数据类型是Java的两大数据类型之一,通过数组初始化的内存分配过程来一窥引用数据类型的特点。
引用数据类型的创建分为两部分:
- 首先是在栈上分配一片空间给引用数据类型的引用,简称
引用
,它是一个局部变量,直接存储在栈帧中。 - 在堆上开辟一片空间,用于存放引用数据类型的实际信息,称之为
对象
或者实例
虽然有两个部分,但对象才是引用数据类型的实质,栈上的引用通过存储对象的地址,指向了堆上对象,这样就可以通过引用间接访问堆上的对象。
总结来说就是:对象是实质,但我们不能直接访问堆上的对象,而是通过栈上的引用间接访问。
基本数据类型与引用数据类型有什么区别
基本数据类型的变量必然都是局部变量,你可能会疑惑,数组的元素也可以是基本数据类型,那它们不是局部变量啊。实际上我们不应该这么去思考,数组中的元素其实已经是(数组)对象的一部分了,它不应该单独拎出来看。所以它们的区别在于:
存储位置(本质区别)
基本数据类型不存在
引用
的概念,数据都是直接存储在栈上的栈帧里;引用数据类型在栈帧中存储引用,引用作为一个局部变量,存储的只是该引用类型在堆上对象的内存地址。
存储在堆上的对象存储具体信息,才是引用数据类型的实质
引申出,打印变量名区别:
- 基本数据类型,打印变量名就是该变量具体的数值
- 引用数据类型,没有办法直接访问对象,打印变量名(引用)会显示该引用存储的堆上的对象的内存地址。
堆和栈中内容的区别
从三个角度来分析这个问题
- 存储的类型
- 默认值
- 生命周期
存储类型
- 堆上存储的是new出来的东西,是引用数据类型的实质——对象。
- 栈上存储的是局部变量(基本数据类型和引用类型的引用)
默认值
- 堆上对象中的变量具有默认值:
- 整形(byte、short、int、long)默认值为0
- 浮点类型(float、double)默认值为0.0
- 字符类型(char)默认值是'\u0000' 表示编码值为0的字符,一个绝对空字符。''
- 布尔类型(boolean)默认值是false
- 引用数据类型默认值是null
- null既不是对象也不是任何一种数据类型,它仅是一个特殊的值
- 任何引用数据类型的引用都可以指向null,指向null并不意味着没有初始化,可以认为引用指向了虚无,反正没有指向任何一个对象。
- 对象才是引用数据类型的实质,没有指向对象的引用实际上没有任何意义,指向null的引用是无法正常使用的!
- 基本数据类型不能等于null
- 栈上的局部变量没有默认值,声明局部变量后必须显式的初始化,否则无法使用。
生命周期
堆上的对象使用完毕后,随着方法的出栈,对象的引用就会被销毁。这个时候对象就没有引用指向它,而是"孤零零"的单独存在于堆上,这种对象意味着我们就无法再次使用它了,这种对象没有意义了。在Java中,我们把这种对象称之为
垃圾
或者垃圾对象
,它们会等待垃圾回收器进行内存回收。关于Java的垃圾回收机制(Garbage Collection简称GC):
- 堆上的对象变成
垃圾
后,并不是立刻就会被回收,而是需要GC通过一系列的算法来决定它是否被回收。 - Java的GC机制是全自动的,程序员几乎无法干涉和主动回收
垃圾
。这一方面为Java程序员的开发节省了大量的精力(无需花费大量精力来管理堆内存),相比于C++的全手动回收垃圾对象
,Java在GC机制上的创新是Java能够如此流行的重要原因之一。但另一方面,一旦GC这种机制出现问题,对Java而言将会是非常难以解决的问题。malloc() free() - 垃圾回收是Java和C++之间的一道围墙,墙外的人想进来,墙内的人却想出去。
- 堆上的对象变成
栈上的局部变量的生命周期和栈帧保持一致。方法栈帧进栈后,局部变量开辟空间生效了,方法出栈后,局部变量就被销毁了。
对象中元素的默认初始化
在Java的面向对象设计中,一个非常重要的原则就是——通过new
关键字在堆上开辟空间,创建对象时,对象中的元素需要进行赋值。在现在的数组和后面的面向对象知识中,我们会学习非常多给对象中元素赋值的方式,但是 不管赋值的方式有多少种,对象中元素赋值的第一步永远是——默认初始化,具有默认值。这是一个非常重要的知识点,希望大家牢记。
举个例子来说,我们都知道数组的静态初始化,是直接给出数组对象的元素值。那么元素的值就是直接赋我们给出的具体值吗?结合上面,显然不是,必须先默认初始化,具有默认值,然后才能赋其它具体值。
一个经典的初学者问题
既然引用数据类型具有默认初始化,对象中的元素具有默认值,那为什么声明一个数组后为什么不能立刻使用呢?
不是引用数据类型有初始化,是创建的对象当中的元素具有初始化,对于声明的数组,它的引用在栈上,没有默认的初始化。只声明了的数组不存在引用,引用不是null。
数组长度为0,引用值不是null,可以打印出具体值
数组的引用为null,可以打印数组引用,打印出来仍然是null
练习
练习1:
静态初始化一个数组,输出数组名及元素。然后给数组中的元素赋值,再次输出数组名及元素。
练习2:
分别静态、动态初始化两个数组,分别输出数组名及元素。然后分别给数组中的元素赋值,再次分别输出数组名及元素。
练习3:
定义两个数组:
- 静态初始化一个数组,输出数组名,元素取值,长度
- 然后声明第二个数组,把第一个数组的地址赋值给第二个数组。
- 输出第二个数组的数组名,元素取值,长度
- 然后给第二个数组赋值,再次输出两个数组的名及元素
数组操作中的异常
异常的简单介绍
异常我们会在后续的课程中,会有专门的章节去讲,这里简单了解一下。
什么是异常?
异常指的是:程序在运行期间出现了不正常情况,这种不正常情况的信息就会封装成一个异常对象。一旦程序出现异常,JVM就会终止程序执行,并在控制台打印异常信息。
异常对象的主要作用是描述程序运行出现不正常情况时各种信息,主要包括:
- 异常的名称,问题的描述
- 产生问题的代码行数(位置)
注:由于Java代码最终需要解释执行,所以产生异常之前的代码是可以正常执行的。
数组下标越界异常
数组下标越界异常(ArrayIndexOutOfBoundsException),用来描述访问了某个数组的一个不存在(不合法)的下标时的问题。
注意事项:
- 这是一个单独针对数组操作的异常,从名字就能看出来。
- 这个异常在数组操作中很常见,尤其是在循环当中,当你误判了循环的变量是非常容易下标越界的。
空指针异常
空指针异常(NullPointerException),用来描述通过一个指向null的引用访问对象时的问题。当引用数据类型的引用指向了null(空常量)时,表示引用是没有指向任何对象,这时如果还想通过引用操作堆上对象,就会空指针异常(因为没有任何对象可供操作)
注意事项:
- 空指针异常(NullPointerExceptionE),是Java之中最负盛名的异常,没有之一。**以后大家会天天和引用数据类型打交道,也会每天和空指针异常打交道。**空指针异常在多数情况下是有害的,会导致程序意外终止,避免空指针异常是Java程序员的必修课之一。常见的、最简单朴实的规避手段就是通过if进行判断,判断出引用不会指向null后再使用引用操作对象。
最后再提一点:
我们在开发时,要明确知道程序中的引用哪里会指向null,哪里完全不会指向null,对于:
- 那些逻辑上,可能会指向null的引用,要在使用前慎重判断。如果等于null,需要做出相应处理(反正不能访问对象),判断不为null之后才能使用该引用访问对象。
- 那些逻辑上,完全不可能等于null的引用,就不应该做判断了。一旦程序抛出空指针异常,要去排查为什么引用会等于null,然后修正程序。
长度为0的数组
思考:
数组长度为0和数组是null以及数组未初始化,有啥区别?
- 数组未初始化: 这个数组完全是不可用的,没有初始化的数组毫无意义,一旦使用会编译报错。
- 数组长度为0和数组为null都是可以使用的,可以认为是经过初始化的,但它们都不是正常数组:
- 长度为0的数组,只在内存中存在结构但没有存储单元,不能存储任何数据。它的操作中:
- 直接打印数组名可以获取数组对象的地址。
- 不能访问任何数组下标,否则都会抛出数组下标越界异常。
- 输出数组的长度为0
- 数组为null,表示数组的引用指向了null,数组(对象)无法进行任何操作。
- 直接打印数组名得到一个null字符串。"null"
- 不能访问任何数组下标,也不能打印数组长度,都会报空指针异常。
- 长度为0的数组,只在内存中存在结构但没有存储单元,不能存储任何数据。它的操作中:
附一个长度为0的数组的经典用途:
假如方法的返回值是一个数组(或者其它容器),而又有无返回数据的需求,这个时候普遍有两种做法
返回一个长度为0的数组(或者其它容器)
返回null
需求:
根据不同的情况,方法可能有两个结果,可能有一个结果,也可能没有结果 这时要返回容器,比如数组/集合
数组的常见操作
数组的遍历
手写实现
在很多时候,我们需要数组遍历完成各种独特的功能,这时往往不好找到一个已存在的实现去使用,那么可以考虑自己去实现。接下来我们以遍历并输出数组的元素为例(arr变量表示一个一维数组):
最简单的情况下,直接使用for循环,打印数组元素即可。代码如下:
for (int i = 0; i < arr.length; i++) { System.out.println(arr[i]); }
在此基础上,可以考虑一些独特的需求,比如:
- 排版,更优美。
- 抽取出方法,复用遍历代码。
- 方法能够接收特殊数组(null数组/长度为0的数组)的输入而能够正常输出。
// 方式1:
public static void printArray(int[] arr) {
for(int x=0; x<arr.length; x++) {
System.out.println(arr[x]);
}
}
// 方式2:
public static void printArray(int[] arr) {
System.out.print("[");
for(int x=0; x<arr.length; x++) {
if(x == arr.length-1) {
System.out.println(arr[x]+"]");
}else {
System.out.println(arr[x]+", ");
}
}
}
JDK自带数组遍历实现
数组遍历并输出值,是非常常见的操作。所以如果你仅仅是想看一下数组里的元素长啥样,完全不需要自己手写实现。而是直接使用下面的方式:
Arrays.toString(数组)
注:该方法需要传入一个一维数组,返回值是一个遍历结果的字符串。
增强for循环遍历数组
数组的遍历除了可以使用for循环外,还可以使用增强for循环。(关于增强for会在学习集合时,详细去讲,现在先了解一下基本使用。)
增强for循环(也叫foreach),以遍历并打印数组元素为例,它的语法是:
for(数据类型 变量名 : 要遍历的数组或者集合){
System.out.println(变量名);
}
语法中的各个部分:
- 数据类型是要遍历数组或集合中元素的数据类型。比如遍历
int
数组,就应该填入int
。 - 从整个遍历的过程中看来,变量名就表示数组/集合中的某一个元素。整体就代表所有元素。
增强for和普通for遍历数组时的区别:
- 增强for的语法更简洁。
- 增强for循环中没有使用数组下标,而是直接遍历元素。当你想要在循环中使用数组下标时,就无法使用增强for了。
- 增强for也叫迭代器(iterator),它仅仅作为一个遍历数组/集合的工具而存在, 在增强for当中是不能修改任何元素的取值的。
获取数组中的最值
获取数组中的最值,包括获取最大值和最小值,也是常见操作。
具体思路:
- 任取一个元素**(一般选择第一个元素)**作为参照物。
- 遍历其他元素,依次比较,选择出更大/小的值,类似于打擂台。
- 最终获取最值。
// 最大值:
public static int getMax(int[] arr) {
int max = arr[0];
for(int x=1; x<arr.length; x++) {
if(arr[x] > max) {
max = arr[x];
}
}
return max;
}
// 最小值:
public static int getMin(int[] arr) {
int min = arr[0];
for(int x=1; x<arr.length; x++) {
if(arr[x] < min) {
min = arr[x];
}
}
return min;
}
数组的逆序
数组的逆序(reverse),即颠倒数组中元素的顺序,在原数组的数组上改变元素顺序:
- 即下标为和位置的元素互换,下标为和位置的元素互换....
- 即,把下标为和元素互换即可!
但是注意:只需要交换一半数组的元素即可,不要遍历整个数组,会再交换回去!
// 方式1:二分法
public static void reverse(int[] arr) {
for(int x=0; x<arr.length/2; x++) {
int temp = arr[x];
arr[x] = arr[arr.length-1-x];
arr[arr.length-1-x] = temp;
}
}
// 方式2:定义2个标记
public static void reverse(int[] arr) {
for(int start=0,end=arr.length-1; start<=end; start++,end--) {
int temp = arr[start];
arr[start] = arr[end];
arr[end] = temp;
}
}
数组元素的增删改查
数组是一个容器,可以用存放元素,存放数据。
在实际开发中,工程中也会需要存放大量数据,这一般是通过数据库来实现的。实际开发的基本需求就是基于数据库的,对数据进行增删改查,即,也有很多中低级Java程序员自嘲自己为"crud工程师"。
当然指的是:
- c,create:新增数据/增加。
- r,retrieve/read:检索数据/查询。
- u,update:更新数据/修改。
- d,**delete **:删除数据/删除。
我们现在还没有学习过数据库,但是不重要。现在我们使用数组这个容器,来模拟数据库,实现日常开发中最常见的"crud"操作。
需求: 创建容量为10的String数组, 使用String数组保存人名,要求名字不能重复 模拟对人名的相关操作
数组的拷贝
数组的长度是不可以改变的,所以如果想要实现数组元素删除和新增,一般需要使用数组的拷贝。
大致思路是,创建一个新数组,然后拷贝赋值:
- 首先需要明确新数组的长度,初始化这个新数组。
- 然后遍历原先的数组,过滤掉(或者新增)一些元素,给新数组赋值。
可变长参数
可变参数适用于:参数个数不确定,类型确定的情况,Java会自动把可变参数当作数组处理。
基本使用
怎么使用可变参数?
可变参数用于形参列表中,并且
- 语法:
[修饰符列表] 返回值类型 方法名 (形式参数列表,数据类型... 变量名){ //方法体 }
可变参数的三个点位于数据类型和变量名之间,前后有无空格都可以。最好是前无空格,后有空格。
调用可变参数的方法时,编译器为该可变参数隐含创建一个数组,在方法体中以数组的形式访问可变参数。
需求: 求不确定个数的int数值之和
注意事项
注意事项:
调用方法时,如果有一个固定参数的方法匹配的同时,也可以与可变参数的方法匹配,则选择固定参数的方法。
调用方法时,如果出现两个可变参数的方法都能匹配,则报错,这两个方法都无法调用了。
注:一般来说要避免可变参数方法,发生方法重载,避免导致方法调用失效情况出现。
参见如下代码:
public class Demo2 { public static void main(String[] args) { // 以下方法调用,编译报错 // test(1, 2); } public static void test(int... var) { } public static void test(int a, int... var) { } }
一个方法只能有一个可变长参数,并且这个可变长参数必须是该方法的最后一个参数。
方法的传参问题
基本概念
什么是方法的传值问题?
调用方法时,我们需要传递实参给方法,在方法内部有可能会改变这些实参的值。
那么方法执行完毕后,这些实参的值在原先的方法中会怎么变呢?这就是方法的传值问题。
比如下列代码:
// 需求: 将一个int实参变量取值变成原先的2倍
public static void doubleIntValue(int a) {
a *= 2;
}
两种传值方式
值传递(call by value),指的是调用方法时,传入的是实参的拷贝而不是实参本身。
如果Java是值传递的,那么方法改变的是实参拷贝的值,原本实参的值是不会被改变的。
引用传递(call by reference),指的是调用方法时,传入的是实参变量的地址,也就是实参本身。
如果Java是引用传递的,方法改变的是实参本身的值,方法结束后,原本实参变量的值会随之改变。
Java值传递
实际上来说,Java只存在值传递,方法得到的是变量的拷贝,而不是变量的地址。
对于基本数据类型形参和实参而言,方法调用过程如下:
- 在调用方法的方法栈帧中创建一个实参的副本。
- 对这个副本进行操作,原先方法栈帧的局部变量的值不会发生任何变化。
- 并且这个方法执行完毕后,随着方法出栈,这个实参的副本也被销毁了。
比如,以下方法代码:
public static void doubleIntValue(int num) { num *= 2; }
对于引用数据类型形参和实参而言,方法调用过程如下:
在调用方法的方法栈帧中创建一个引用的拷贝,因为是拷贝。
所以这个引用中存的对象地址和原先的引用一样。
结果就是,这个副本仍然指向了原先引用所指向的对象。
对这个引用的副本进行操作,原先方法栈帧的引用不会发生变化,但由于指向的是同一对象
结果就是,引用和引用拷贝指向的对象本身被改变了。
方法结束后,这个引用拷贝也被销毁了。
证明Java值传递
很多程序语言(尤其是C/C++)提供了两种传值方式,导致很多人也认为Java也是两种传参方式。这里举一个反例:
声明初始化两个数组
提供一个交换数组的方法swap:
public static void swapArray(int[] arr1,int[] arr2){ int[] temp; temp = arr1; arr1 = arr2; arr2 = temp; }
方法的调用过程如下:
首先在调用方法的栈帧中声明两个数组的引用拷贝,仍指向原先的数组
交换这两个拷贝的值,实际上就是交换它们指向的数组,这里两个拷贝完成了数组交换
原先的数组引用不受影响
方法结束后,这两个引用拷贝被销毁。
实测下来,运行结果和我们上述一样,证明Java只有值传递。
Java方法对方法参数能做什么
- 不能修改基本数据类型的实参的值,也不能修改引用数据类型实参引用的取值。
- 一旦违反上述原则,那么局部变量就不"局部"了。
- 可以改变引用数据类型中对象里的数据(称之为改变对象的状态,改变对象的属性值)
二维数组(了解)
二维数组的基本概念
二维数组的引入
引例,思考以下问题:
一个Java班上有80个人,可以创建一个数组装他们的成绩。如果有80个这样的班,怎么办?创建80个数组?
如果一个Java班级用一个一维数组来存放,那么把80个班级的一维数组全部放进一个一维数组,会这么样呢?
数组既可以存基本数据类型,也可以存引用数据类型,数组当然也是引用数据类型。
如果用一维数组再存储一维数组,就得到了
二维数组的本质
思考一下:JVM内存中,堆中,有没有二维数组这种特殊的内存结构呢?或者换句话说,二维数组和一维数组有本质区别吗?
需要注意的是引用数据类型数组里的元素,存储的是其它引用数据类型的引用。
一个长度为2的int类型二维数组内存图,可能是如下:
所以,二维数组的实质,仍然是一维数组。
二维数组的数据类型由其中一维数组的类型决定,只能存储相同类型的一维数组。比如上图就是一个int类型的二维数组。
二维数组的理解
其实,如果你比较机智,可能已经发现了,二维数组很像线性代数中的矩阵。
而实际上,二维数组在计算机领域的应用也大多和矩阵相关。比如图像处理,3D图形渲染等等。
在Java SE阶段,和二维数组比较相关的,用途比较多的可能就是——用二维数组来存储表格数据。
例如对于下列建立一张用来,表示多个班级的学生的成绩的表格:
一班学生成绩 | 二班学生成绩 | 三班学生成绩 | 四班同学成绩 | ... |
---|---|---|---|---|
90 | 86 | 78 | 90 | |
77 | 86 | 76 | 54 | |
86 | 67 | 87 | 60 | |
... | ... |
你知道二维数组怎么对应表格数据吗?
实际上,把表格中的一列数据看成是一个一维数组,那么二维数组就是整个表格数据。
了解这些后,接下来就学习一下二维数组的定义和使用,和一维数组没有本质区别。
二维数组的声明和初始化
和一维数组一样,要想使用二维数组,首先要进行声明和初始化。
声明
二维数组的声明(declaration)有三种格式:
格式一
数据类型[][] 二维数组名;
格式二
数据类型 二维数组名[][];
格式三**(奇怪的方式)**
数据类型[] 二维数组名[];
注意:
一些奇怪的面试题目:
int[] m,n[];
这里犯了两个错误:
- 这里不应该一行定义多个变量。
- 二维数组的声明应该用上述格式一!
初始化
二维数组的初始化(initialization)也有三种格式:
静态初始化
二维数组的静态初始化语法
二维数组名 = new 数据类型[][]{{元素1,元素2,元素..},{元素1..}...}; //可以简写为下面格式 数据类型[][] 二维数组名 = {{元素1,元素2,元素..},{元素1..}...};
注:简写同样需要和声明写在一起
动态初始化格式一
二维数组名 = new 数据类型[m][n];
其中:
- m表示二维数组的长度,代表二维数组当中,一维数组的个数。
- n代表二维数组当中,每个一维数组的长度,即一维数组能存储元素的个数。
注:
- 动态初始化格式一创建的二维数组,里面的每个一维数组的长度都相同。
- 其中的每一个一维数组相当于动态初始化,里面的元素都具有默认值, 。内存图如下:
动态初始化格式二
二维数组名 = new 数据类型[m][];
其中:
- m表示二维数组的长度,代表二维数组当中,一维数组的个数。
注:
- 这种方式创建的二维数组,实际上只有默认值null, 。内存图如下:
除了上述三种三种初始化方式,其它任何方式都是错误的,比如下面:
// 二维数组名 = new 数据类型\[][n]; 错误X
// 二维数组名 = new 数据类型\[m][n]{{元素1,元素2,元素..},{元素1..}...}; 错误X
三种初始化方式中,静态初始化很固定地为元素赋值。动态初始化格式一创建完毕后,一维数组的长度都是一样的,但可以直接使用。而格式二直接使用会空指针异常,还需要手动初始化二维数组中的每一个一维数组,每个一维数组的长度可以自己给出,相对灵活。
二维数组的基本操作
数组长度
二维数组中有关长度的,主要有以下:
获取二维数组的长度,即一维数组的个数。语法如下:
二维数组名.length;
获取二维数组中一维数组的长度,语法如下:
二维数组名[m].length;
注:
- 其中二维数组名[m]表示二维数组中的某一个一维数组。
- 只有二维数组中的一维数组完成初始化,才能够使用这种形式,不然会空指针异常。
- m必须是一个合法的下标,不然会数组越界。
访问一维数组
语法:
二维数组名[m];
注:
只有二维数组中的一维数组完成初始化,才能够使用这种形式。
m必须是一个存在的下标,不然会数组下标越界。
获取一维数组后,就可以把它整体作为一个一维数组,进行各种一维数组的操作。
元素的访问
语法:
二维数组名[m][n]
注:
- 对于静态初始化二维数组:
- m表示二维数组中一维数组的位置,最小是0,最大是m-1(即二维数组长度-1)
- n表示在指定一维数组中元素的位置,最小是0,最大是n-1(即某个一维数组长度-1)
- 对于动态初始化格式一的二维数组(明确指出m,n的取值):
- m表示二维数组中一维数组的位置,最小是0,最大是m-1(或者二维数组长度-1)
- n表示在指定一维数组中元素的位置,最小是0,最大是n-1(即某个一维数组长度-1)
- 动态初始化格式一后如果没有再赋值,得到的是默认初始值。
- 对于动态初始化格式二的二维数组(明确指出m,n未知)
- 这种格式初始化的二维数组,不能直接使用,必须先初始化其中的一维数组。
- 初始化一维数组后,再根据m,n的取值获取相应位置的元素。但也要警惕数组越界或空指针异常。
进阶操作
数组遍历
二维数组的遍历(traverse)同样是最基本操作,这里给出一个手写的参考代码。
二维数组的遍历
public static void traverseTwoDArray2(int[][] arr) {
System.out.print("[");
//一维数组使用for循环,二维数组使用双层for循环去遍历
//外层for应该遍历二维数组中的一维数组
for (int i = 0; i < arr.length; i++) {
//内层for应该遍历每一个一维数组
for (int j = 0; j < arr[i].length; j++) {
//这里就是具体元素的值
if (j == 0 && j != arr[i].length - 1) {
//如果是每个数组中的开头元素且不是最后一个元素
System.out.print("[" + arr[i][j] + ", ");
} else if (j == 0) {
//是开头也是最后的元素
System.out.print("[" + arr[i][j] + "], ");
} else if ((j == arr[i].length - 1 && i != arr.length - 1)) {
//如果是每个一维数组的末尾元素,除最后一个
System.out.print(arr[i][j] + "], ");
} else if ((i == arr.length - 1) && (j == arr[arr.length - 1].length - 1)) {
//如果是整个二维数组的最后一个元素
System.out.print(arr[i][j] + "]");
} else {
//普通的在中间的元素
System.out.print(arr[i][j] + " ,");
}
}
}
System.out.println("]");
}
可以看出,二维数组因为本身比一维数组复杂,遍历的过程也会更复杂,需要考虑的因素更多了。
当然多维数组的遍历,JDK也已经有实现了,同样使用类Arrays,语法如下:
Arrays.deepToString(某个二维数组)
杨辉三角
杨辉三角(YangHui Triangle)指的是南宋时期数学家杨辉,根据北宋时期的数学家贾宪的作品(现已遗失),发现的一种几何排列规律,在数学中,它是二项式系数在三角形中的一种几何排列。大致图案如下:
1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 1 5 10 10 5 1 ........
在欧洲,这个表叫做帕斯卡三角形(Pascal's Triangle),法国数学家布莱士·帕斯卡(Blaise Pascal )在1654年发现这一规律,相比于中国,比杨辉要迟393年,比贾宪迟600年。
杨辉三角从纯粹数字规律上来说,就是:
- 每一行的元素和行数一样,即行数等于列数。第一行有一列,第二行有两列....
- 第一行的元素从1开始,且之后每个元素的值,都是上一行同列元素和上一行左边列的元素之和。
- 前两行的元素和每一行的首尾元素由于没有上一行同列元素或上一行左列元素,默认都是1。
我们把杨辉三角的每一行的数据看成是一个一维数组,那么所有行组合起来,就是一个二维数组。
知道杨辉三角是一个二维数组后,那么怎么用一个二维数组存储它呢?
首先,肯定需要声明初始化一个二维数组,由于每个一维数组的长度不同,更好的选择是使用动态初始化格式二。
接下来使用for循环完成每一个一维数组的动态初始化,分配它们的长度。
开始赋值:
- 首先为每一个一维数组的首尾元素赋值1
- 为第三列之后的元素赋值:元素值 = 上一行同列的元素值 + 上一行上一列的元素值
注:不要忘记了首尾元素已经赋值过了,不要再重复赋值,导致数组越界。
赋值完毕后,开始按照杨辉三角的格式打印二维数组(实际上就是遍历二维数组),注意格式就行了。
整体参考代码如下:
public static void yangHuiTriangle() {
// 动态初始方式二创建二维数组
int[][] arr = new int[10][];
// 给每一个一维数组,完成动态初始化
for (int i = 0; i < arr.length; i++) {
arr[i] = new int[i + 1];
}
// 给一维数组的首尾赋值为1
for (int i = 0; i < arr.length; i++) {
// 给第一个元素赋值
arr[i][0] = 1;
// 行列相同就是最后一个元素
arr[i][i] = 1
}
// 其他元素赋值。i表示行,从第三行开始赋值,j表示列,从第二列开始,但要去掉最后一列
for (int i = 2; i < arr.length; i++) {
for (int j = 1; j < arr[i].length - 1; j++) {
arr[i][j] = arr[i - 1][j] + arr[i - 1][j - 1];
}
}
//遍历数组
// 外层是遍历二维数组
for (int i = 0; i < arr.length; i++) {
// 遍历装了具体元素的一维数组
for (int j = 0; j < arr[i].length; j++) {
System.out.print(arr[i][j]+"\t");
}
System.out.println();
}
}