好运1分快3官网_为什么要重写hashcode和equals方法?初级程序员在面试中很少能说清楚。

  • 时间:
  • 浏览:3

     我在面试 Java初级开发的前一天,一直会问:你有没有 重写过hashcode土土措施?不少候选人直接说没写过。我就想,或许真的没写过,于是就再通过四个问题报告 确认:你在用HashMap的前一天,键(Key)偏离 ,有没有 放过自定义对象?而这个 前一天,候选人说放过,于是四个问题报告 的回答就自相矛盾了。

    最近问下来,这个 问题报告 普遍回答不大好,于是在本文里,就干脆从hash表讲起,讲述HashMap的存数据规则,由此一群人就自然清楚上述问题报告 的答案了。

1 通过Hash算法来了解HashMap对象的高效性

    一群人先复习数据型态里的四个知识点:在四个长度为n(假设是300000)的线性表(假设是ArrayList)里,存放着无序的数字;日后一群人要找四个指定的数字,就不得不通过从头到尾依次遍历来查找,原本的平均查找次数是n除以2(这里是300000)。

一群人再来观察Hash表(这里的Hash表纯粹是数据型态上的概念,和Java无关)。它的平均查找次数接近于1,代价相当小,关键是在Hash表里,存装进 其中的数据和它的存储位置是用Hash函数关联的。

    一群人假设四个Hash函数是x*x%5。当然实际情况里不日后用没有 简单的Hash函数,一群人这里纯粹为了说明方便,而Hash表是四个长度是11的线性表。日后一群人要把6装进 其中,没有 一群人首先会对6用Hash函数计算一下,结果是1,统统统统一群人就把6装进 到索引号是1这个 位置。同样日后一群人要放数字7,经过Hash函数计算,7的结果是4,没有 它将被装进 索引是4的这个 位置。这个 效果如下图所示。

    原本做的好处非常明显。比如一群人要从中找6这个 元素,一群人后能 先通过Hash函数计算6的索引位置,日后直接从1号索引里找到它了。

不过一群人会遇到“Hash值冲突”这个 问题报告 。比如经过Hash函数计算后,7和8会有相同的Hash值,对此Java的HashMap对象采用的是”链地址法“的处置方案。效果如下图所示。

 

    具体的做法是,为所有Hash值是i的对象建立四个同义词链表。假设一群人在装进 8的前一天,发现4号位置日后被占,没有 就会新建四个链表结点装进 8。同样,日后一群人要找8,没有 发现4号索引里全是8,那会沿着链表依次查找。

    确实一群人还是无法彻底处置Hash值冲突的问题报告 ,日后Hash函数设计合理,仍能保证同义词链表的长度被控制在四个合理的范围里。这里讲的理论知识不必无的放矢,一群人能在后文里清晰地了解到重写hashCode土土措施的重要性。

2 为哪几个要重写equals和hashCode土土措施

    当一群人用HashMap存入自定义的类时,日后不重写这个 自定义类的equals和hashCode土土措施,得到的结果会和一群人预期的不一样。一群人来看WithoutHashCode.java这个 例子。

在其中的第2到第18行,一群人定义了四个Key类;在其中的第3行定义了唯一的四个属性id。当前一群人先注释掉第9行的equals土土措施和第16行的hashCode土土措施。    

1	import java.util.HashMap;
2	class Key {
3		private Integer id;
4		public Integer getId() 
5	{return id; }
6		public Key(Integer id) 
7	{this.id = id;	}
8	//故意先注释掉equals和hashCode土土措施
9	//	public boolean equals(Object o) {
10	//		if (o == null || !(o instanceof Key)) 
11	//		{ return false;	} 
12	//		else 
13	//		{ return this.getId().equals(((Key) o).getId());}
14	//	}
15		
16	//	public int hashCode() 
17	//	{ return id.hashCode();	}
18	}
19	
20	public class WithoutHashCode {
21		public static void main(String[] args) {
22			Key k1 = new Key(1);
23			Key k2 = new Key(1);
24			HashMap<Key,String> hm = new HashMap<Key,String>(); 
25			hm.put(k1, "Key with id is 1");		
26			System.out.println(hm.get(k2));		
27		}
28	}

    在main函数里的第22和23行,一群人定义了四个Key对象,它们的id全是1,就好比它们是两把相同的都能打开同一扇门的钥匙。

    在第24行里,一群人通过泛型创建了四个HashMap对象。它的键偏离 后能 存放Key类型的对象,值偏离 后能 存储String类型的对象。

    在第25行里,一群人通过put土土措施把k1和一串字符装进 到hm里; 而在第26行,一群人想用k2去从HashMap里得到值;这就好比一群人想用k1这把钥匙来锁门,用k2来开门。这是符合逻辑的,但从当前结果看,26行的返回结果全是一群人想象中的那个字符串,也不null。

    原困四个—没有 重写。第一是没有 重写hashCode土土措施,第二是没有 重写equals土土措施。

   当一群人往HashMap里放k1时,首先会调用Key这个 类的hashCode土土措施计算它的hash值,日后把k1装进 hash值所指引的内存位置。

    关键是一群人没有 在Key里定义hashCode土土措施。这里调用的仍是Object类的hashCode土土措施(所有的类全是Object的子类),而Object类的hashCode土土措施返回的hash值确实是k1对象的内存地址(假设是30000)。

    

    日后一群人日后是调用hm.get(k1),没有 一群人会再次调用hashCode土土措施(还是返回k1的地址30000),日后根据得到的hash值,能放慢地找到k1。

    但一群人这里的代码是hm.get(k2),当一群人调用Object类的hashCode土土措施(日后Key里没定义)计算k2的hash值时,确实得到的是k2的内存地址(假设是30000)。日后k1和k2是四个不同的对象,统统统统它们的内存地址一定不必相同,也也不说它们的hash值一定不同,这也不一群人无法用k2的hash值去拿k1的原困。

    当一群人把第16和17行的hashCode土土措施的注释加上后,会发现它是返回id属性的hashCode值,这里k1和k2的id全是1,统统统统它们的hash值是相等的。

    一群人再来更正一下存k1和取k2的动作。存k1时,是根据它id的hash值,假设这里是3000,把k1对象装进 到对应的位置。而取k2时,是先计算它的hash值(日后k2的id也是1,这个 值也是3000),日后到这个 位置去找。

    但结果会出乎一群人意料:明明3000号位置日后有k1,但第26行的输出结果依然是null。其原困也不没有 重写Key对象的equals土土措施。

    HashMap是用链地址法来处置冲突,也也不说,在3000号位置上,有日后位于着多个用链表形式存储的对象。它们通过hashCode土土措施返回的hash值全是3000。

     当一群人通过k2的hashCode到3000号位置查找时,确实会得到k1。但k1有日后仅仅是和k2具有相同的hash值,但不必和k2相等(k1和k2两把钥匙不必必 开同一扇门),这个 前一天,就需要调用Key对象的equals土土措施来判断两者有无相等了。

    日后一群人在Key对象里没有 定义equals土土措施,系统就不得不调用Object类的equals土土措施。日后Object的固有土土措施是根据四个对象的内存地址来判断,统统统统k1和k2一定不必相等,这也不为哪几个依然在26行通过hm.get(k2)依然得到null的原困。

    为了处置这个 问题报告 ,一群人需要打开第9到14行equals土土措施的注释。在这个 土土措施里,日后我四个对象全是Key类型,日后它们的id相等,它们就相等。

3 对面试问题报告 的说明

    日后在项目里一直会用到HashMap,统统统统我在面试的前一天全是问这个 问题报告 ∶你有没有 重写过hashCode土土措施?你在使用HashMap时有没有 重写hashCode和equals土土措施?你是缘何写的?

    根据问下来的结果,我发现初级守护守护进程员对这个 知识点普遍没掌握好。重申一下,日后一群人要在HashMap的“键”偏离 存放自定义的对象,一定要在这个 对象里用个人的equals和hashCode土土措施来覆盖Object里的同名土土措施。 

     本文是从Java核心技术及面试指南这本书中相关内容改编而来。