Java:所有的equals方法实现都是错误的?

译文
开发 后端
Java中的equals(等值)方法是一个常用的技巧。Class java.lang.Object定义了一个equals方法,其中的子类可以进行override。然而事实上,在对Java代码的大量正文进行研究之后,几位作者在2007年的一份论文中作出如下结论:几乎所有equals方法的实现都是错误的。本文为你详细的揭示了Equals方法的实现都错在了哪里。

【51CTO快译】本文介绍了一种改写(override)equals 方法的技巧。使用该技巧,即使在实体类的子类添加了新的域(field)时,仍然能够满足 equals 方法的约定。

在《Effective Java》一书的第 8 条目中,Josh Bloch 将子类化时满足 equals 约定这一困难描述为:面向对象语言中等值关系的最根本问题。Bloch 这样写道:

不存在一种方式,能够在扩展非实例类并添加值组件的同时,仍然满足equals的约定。除非你愿意放弃面向对象的抽象性这一优点。

《Programming in Scala》一书中的第 28 章提供了一种方法,子类可以对非实例类进行扩展,添加值组件,而同时满足 equals 约定。虽然书中提供的那种技巧是用于定义 Scala 类,但一样适用于 Java 中的 类定义。在本文中,为了讲解这种方法,我将使用《Programming in Scala》中相关章节,改编相关的文本,并将原书中的 Scala 示例代码转换为了 Java 代码。

常见的等值陷阱

Class java.lang.Object 定义了一个 equals 方法,其中的子类可以进行改写(override)。不幸的是,最终的结果表明,在面向对象语言中,编写正确的等值方法相当困难。事实上,在对 Java 代码的大量正文进行研究之后,几位作者在 2007 年的一份论文中作出如下结论:几乎所有 equals 方法的实现都是错误的。

这是一个严重的问题,因为等值方法是很多代码的根本。其一,对于类型 C,一个错误的等值方法可能意味着,你不能可靠地将一个类型 C 的对象放入集合中。你可能有两个等值的类型 C 元素 elem1、elem2,即“em1.equals(elem2)”输出 true。然而,在下面的示例中,equals 方法的实现就是一种常见的错误:

  1. Set< C> hashSet = new java.util.HashSet< C>();  
  2. hashSet.add(elem1);  
  3. hashSet.contains(elem2); // 返回 false! 

存在四种常见的陷阱,它们都会在改写equals时导致非一致性的行为:

◆使用错误的原型对equals进行定义。

◆更改equals而未同时更改 hashCode。

◆对equals进行定义时涉及可变域(field)。

◆未能成功地将equals定义为等值关系。

这四种陷阱将在下文中具体讲述。

#p#

陷阱 1:使用错误的原型对equals进行定义

在下面的代码中,我们将为普通点的类添加一个等值方法:

  1. public class Point {  
  2.  
  3.  private final int x;  
  4.  private final int y;  
  5.  
  6.  public Point(int x, int y) {  
  7.  this.x = x;  
  8.  this.y = y;  
  9.  }  
  10.  
  11.  public int getX() {  
  12.  return x;  
  13.  }  
  14.  
  15.  public int getY() {  
  16.  return y;  
  17.  }  
  18.  
  19.  // ...  

一个显而易见的错误定义如下:

  1. // 一个完全错误的 equals 定义  
  2. public boolean equals(Point other) {  
  3.  return (this.getX() == other.getX() && this.getY() == other.getY());  

这种方法的错误之处是什么?初一看,它可以正常运行:

  1. Point p1 = new Point(12);  
  2. Point p2 = new Point(12);  
  3.  
  4. Point q = new Point(23);  
  5.  
  6. System.out.println(p1.equals(p2)); // prints true  
  7.  
  8. System.out.println(p1.equals(q)); // 输出 false 

然而,一旦你将point放入集合中,问题就出来了:

  1. import java.util.HashSet;  
  2.  
  3. HashSet< Point> coll = new HashSet< Point>();  
  4. coll.add(p1);  
  5.  
  6. System.out.println(coll.contains(p2)); // 输出 false 

coll 怎么可能不包含 p2 呢?你已经将 p1 添加到其中,而 p1 等于 p2。在下面的互操作中,进行比较的点的具体类型被隐藏,这时,导致问题的原因将清晰可见。将 p2a 定义为 p2 的别名,但使用的是 Object 类型而不是 Point:

  1. Object p2a = p2; 

现在,如果你重复第一个比较,使用别名 p2a 而不是 p2,结果是:

  1. System.out.println(p1.equals(p2a)); // 输出 false 

哪里出错了呢?事实上,由于类型不同,之前指定的 equals 版本并没有改写标准方法 equals。下面是在根类 Object 中定义的 equals 方法:

  1. public boolean equals(Object other) 

由于 Point 中的 equals 方法使用 Point 而不是 Object 作为参数,因此,它并未对 Object 中的 equals 进行改写。相反,它只是一种重载的替代方法。Java 中重载由参数的静态类型解析,而不是运行时(run-time)类型。因此,只要参数的静态类型是 Point,就调用 Point 中的 equals 方法。同样,如果静态参数是 Object 类型,就调用 Object 中的 equals 方法。该方法没有被改写,因此在对 object 参数进行比较时,仍使用该方法。这就是“p1.equals(p2a)”输出 false 的原因,即使点 p1 和 p2a 具有相同的 x 和 y 值。这也是为什么在 HashSet 中 contains 方法返回 false 的原因。该方法是针对对常规集合进行操作,因此它会调用 Object 中的常规 equals 方法,而不是 Point 中重载的方法变种。

下面的代码定义了一个更好的equals方法:

  1. // 一个更好的定义,但仍不是完美的  
  2. @Override public boolean equals(Object other) {  
  3.  boolean result = false;  
  4.  if (other instanceof Point) {  
  5.  Point that = (Point) other;  
  6.  result = (this.getX() == that.getX() && this.getY() == that.getY());  
  7.  }  
  8.  return result;  

现在,equals 具有了正确的类型。它将 Object 类型的值作为参数并输出一个 boolean 结果。该方法的实现使用了 instanceof 和 cast(类型转换)。它首先检测其他(other)对象是否为 Point 类型。如果是,它将对这 2 个点的坐标进行比较,然后返回结果。否则,输出为 false。

#p#

陷阱2 :更改equals而未同时更改hashCode

如果你使用 Point 的最新定义,再次对 p1和 p2a 进行比较,将会得到期望中的结果:true。但是,如果你重复 HashSet.contains 测试,结果仍可能是 false:

  1. Point p1 = new Point(12);  
  2. Point p2 = new Point(12);  
  3.  
  4. HashSet< Point> coll = new HashSet< Point>();  
  5. coll.add(p1);  
  6.  
  7. System.out.println(coll.contains(p2)); // (很可能)输出 false 

事实上,输出结果不是百分百确定。你也可能从测试中得到true值。如果得到的结果是true,你可以试试另外一些坐标为1和2的点。最终,你将会找到一个未包含在集合中的点。这里出现错误的原因是,Point重定义了equals而没有对hashCode进行重定义。

请注意,上述实例中的集合为HashSet。这表示,集合中元素被放在由相应的散列码决定的哈希桶(hash bucket)中。在contains测试中,它首先查找散列桶,然后对哈希桶中的所有元素和指定元素进行比较。现在,Point类的最新版本确实对equals进行了重定义,但它没有同时对hashCode进行重定义。所以 hashCode 仍然保持 Object 类中其版本的值:分配对象地址的某种变化格式。p1 和 p2 的散列码几乎肯定是不同,即使这两个点的域(field)是相同的。不同的散列码意味着集合中散列桶具有较高概率的非重复性。contains 测试将根据 p2 的散列码在相应的散列桶中查找匹配的元素。大多数情况下,点 p1 会位于另一个散列桶中,因此绝不会找到它。p1 和 p2 有可能很偶然地位于同一散列桶中。对于这种情况,测试将返回ture 值。

问题在于,Point 的上次实现违法了Object 类中定义的hashCode约定:

如果两个对象根据equals(Object) 方法是等值的,那么对两个对象中任何一个调用 hashCode 方法都必须得到相同的整型结果。

事实上,在Java中,通常应同时对 hashCode 和equals进行重定义,这一事实是广为人知的。此外,hashCode 可能仅依赖equals所依赖的域。对于 Point 类,以下将是一个合适的 hashCode 定义:

  1. public class Point {  
  2.  
  3.  private final int x;  
  4.  private final int y;  
  5.  
  6.  public Point(int x, int y) {  
  7.  this.x = x;  
  8.  this.y = y;  
  9.  }  
  10.  
  11.  public int getX() {  
  12.  return x;  
  13.  }  
  14.  
  15.  public int getY() {  
  16.  return y;  
  17.  }  
  18.  
  19.  @Override public boolean equals(Object other) {  
  20.  boolean result = false;  
  21.  if (other instanceof Point) {  
  22.  Point that = (Point) other;  
  23.  result = (this.getX() == that.getX() && this.getY() == that.getY());  
  24.  }  
  25.  return result;  
  26.  }  
  27.  
  28.  @Override public int hashCode() {  
  29.  return (41 * (41 + getX()) + getY());  
  30.  }  

这只是 hashCode 多种可能的实现中的一种。将常量 41 加到一个整型域 x 上,所得结果再乘以素数 41,然后在加上另一个整型域 y。这样就可以提供合理分布的散列码,而运行时间和代码大小也会降低。

在定义与 Point 相似的类时,添加 hashCode 解决了等值的问题。但是,还有其他的问题需要注意。

#p#

陷阱 3 :对equals进行定义时涉及可变域

以下对 Point 类进行一项细微的修改:

  1. public class Point {   
  2.  
  3.  private int x;  
  4.  private int y;  
  5.  
  6.  public Point(int x, int y) {  
  7.  this.x = x;  
  8.  this.y = y;  
  9.  }  
  10.  
  11.  public int getX() {  
  12.  return x;  
  13.  }  
  14.  
  15.  public int getY() {  
  16.  return y;  
  17.  }  
  18.  
  19.  public void setX(int x) {  
  20.  this.x = x;  
  21.  }  
  22.  
  23.  public void setY(int y) {  
  24.  this.y = y;  
  25.  }  
  26.  
  27.  @Override public boolean equals(Object other) {  
  28.  boolean result = false;  
  29.  if (other instanceof Point) {  
  30.  Point that = (Point) other;  
  31.  result = (this.getX() == that.getX() && this.getY() == that.getY());  
  32.  }  
  33.  return result;  
  34.  }  
  35.  
  36.  @Override public int hashCode() {  
  37.  return (41 * (41 + getX()) + getY());  
  38.  }  

唯一的不同之处是域 x 和 y 不再是 final 类型,同时添加了两个集合方法,允许用户更改 x 和 y 值。现在,equals和 hashCode 方法的定义涉及了这些可变域,因此域更改时它们的结果也将改变。一旦你将点放入集合中,这会带来很奇怪的效果:

  1. Point p = new Point(12);  
  2.  
  3. HashSet< Point> coll = new HashSet< Point>();  
  4. coll.add(p);  
  5.  
  6. System.out.println(coll.contains(p)); // 输出 true 

现在,如果更改点 p 中的域,集合还将包含该点吗? 我们来试试下面的代码:

  1. p.setX(p.getX() + 1);  
  2.  
  3. System.out.println(coll.contains(p)); // (很可能)输出 false  

这看起来很奇怪。p 到哪里去了?如果你对集合的 iterator 是否包含 p 进行测试,会得到各位奇怪的结果:

  1. Iterator< Point> it = coll.iterator();  
  2. boolean containedP = false;  
  3. while (it.hasNext()) {  
  4.  Point nextP = it.next();  
  5.  if (nextP.equals(p)) {  
  6.  containedP = true;  
  7.  break;  
  8.  }  
  9. }  
  10.  
  11. System.out.println(containedP); // 输出 true 

此处的集合不包含 p,但 p 却在该集合的元素之中!发生了什么事呢?在更改 x 域之后,点 p 最后被放在了该集合 coll 下错误的散列桶中。也就是,其初始散列桶与散列码的新值已不再对应。在某种意义上可以说,点 p 在集合 coll 中消失了,即使它仍然是集合中元素。

从这个示例得出的教训就是,当equals和 hashCode 取决于可变状态时,可能会为用户带来问题。如果他们将这种对象放入集合中,必须小心,不要修改决定性的状态。而这是很棘手的。如果你现在需要进行一个比较,要考虑到对象的当前状态,通常不应直接使用 equals,而是使用其他命名。 对于 Point 的上一个定义,更为可取的是省略 hashCode 的重定义,并且命名比较方法 equalContents,或者使用其他不同于equals的命名。 这样,Point 将能够继承equals和 hashCode 的缺省实现。

#p#

陷阱 4:未能成功地将equals定义为等值关系

Object 中equals的约定指出 equals 必须实现非空对象的等值关系:

◆自反性:对于如何非空值 x,表达式 x.equals(x) 应返回true。

◆对称性:对于任何非空值:x 和 y,x.equals(y) 应返回true,当且仅当 y.equals(x) 返回 true。

◆传递性:对于任何非空值 x、y、z,如果 x.equals(y)返回 true 并且 y.equals(z) 返回 true,那么x.equals(z) 应返回 true。

◆一致性:对于任何非空值:x 和 y,多次调用 x.equals(y)应始终返回 true 或始终返回 false,如果对象的equals比较中所用信息未被修改。

◆对于任何非空值 x,x.equals(null) 应返回 false。

目前,对于 Point 类所使用的equals定义满足了equals的约定。然而,一旦涉及子类,事情将变得更加复杂。比如说,Point 有一个子类 ColoredPoint,其中添加了一个 Color 类型的域 color。假定将 Color 定义为枚举类型:

  1. public enum Color {  
  2.  RED, ORANGE, YELLOW, GREEN, BLUE, INDIGO, VIOLET;  

ColoredPoint 改写 equals,并添加新的 color 域:

  1. public class ColoredPoint extends Point { // 问题:equals 不对称  
  2.  
  3.  private final Color color;  
  4.  
  5.  public ColoredPoint(int x, int y, Color color) {  
  6.  super(x, y);  
  7.  this.color = color;  
  8.  }  
  9.  
  10.  @Override public boolean equals(Object other) {  
  11.  boolean result = false;  
  12.  if (other instanceof ColoredPoint) {  
  13.  ColoredPoint that = (ColoredPoint) other;  
  14.  result = (this.color.equals(that.color) && super.equals(that));  
  15.  }  
  16.  return result;  
  17.  }  

很多程序员都可能这样编写代码。请注意,在这种情况下,类 ColoredPoint 不必改写 hashCode。因为 ColoredPoint 的equals的新定义比 Point 中被改写的定义更为严格(意味着等值的对象更少),hashCode 的约定仍然有效。 如果两个颜色点是相等的,它们必须具有相同的坐标,因此也已保证它们的散列码是相等的。

以类 ColoredPoint 本身为例,equals的定义看起来没问题。但,一旦普通点和颜色点混合着一起时,equals的约定就将被破坏。 例如:

  1. Point p = new Point(12);  
  2.  
  3. ColoredPoint cp = new ColoredPoint(12, Color.RED);  
  4.  
  5. System.out.println(p.equals(cp)); // 输出 true  
  6.  
  7. System.out.println(cp.equals(p)); // 输出 false 

相等比较“pequalscp”将调用 p 的equals方法,已在类 Point 中定义。该方法仅考虑两个点的坐标。因此,相等比较输出 true 值。而另一方面,相等比较“cp equals p”调用 cp 的 equals 方法,其中类 ColoredPoint 中已定义。该方法返回 false,因为 p 不是 ColoredPoint。该方法返回 false,因为 p 不是 ColoredPoint。 因此,equals定义的关系不是对称的。

对称的缺失将为集合造成意想不到的后果。下面为一个示例:

  1. Set< Point> hashSet1 = new java.util.HashSet< Point>();  
  2. hashSet1.add(p);  
  3. System.out.println(hashSet1.contains(cp)); // 输出 false  
  4.  
  5. Set< Point> hashSet2 = new java.util.HashSet< Point>();  
  6. hashSet2.add(cp);  
  7. System.out.println(hashSet2.contains(p)); // 输出 true 

因此,即使 p 和 cp 是相等的,一个 contains 测试成功,而另一个却失败。

如何更改equals的 定义可以让它变为对称?基本上有两种方式。您可以使关系更一般或更严格。使它更加一般意味着对两个对象,a 和 b 被认为是相等的,如果比较 a 和 b 或 b 和 a 输出 true。以下为完成该功能的代码:

  1. public class ColoredPoint extends Point { // 有问题:equals 不具有传递性  
  2.  
  3.  private final Color color;  
  4.  
  5.  public ColoredPoint(int x, int y, Color color) {  
  6.  super(x, y);  
  7.  this.color = color;  
  8.  }  
  9.  
  10.  @Override public boolean equals(Object other) {  
  11.  boolean result = false;  
  12.  if (other instanceof ColoredPoint) {  
  13.  ColoredPoint that = (ColoredPoint) other;  
  14.  result = (this.color.equals(that.color) && super.equals(that));  
  15.  }  
  16.  else if (other instanceof Point) {  
  17.  Point that = (Point) other;  
  18.  result = that.equals(this);  
  19.  }  
  20.  return result;  
  21.  }  

在 ColoredPoint 中,equals的新定义比旧版本多了一种情况的检查:如果其他对象是 Point 而不是 ColoredPoint,该方法将使用 Point 的equals方法。这样就可以取得预期的效果,使equals具有对称性。现在,“cp.equals(p)”和“p.equals(cp)”都返回 true。 然而,equals的约定还是被打破了。现在的问题是,新的关系不再具有传递性!为了演示这个问题,下面进行一系列的声明。定义一个点和两个不同色的颜色点,所有点在同一位置:

  1. ColoredPoint redP = new ColoredPoint(12, Color.RED);  
  2. ColoredPoint blueP = new ColoredPoint(12, Color.BLUE); 

单独来看,redp 等于 p 并且 p 等于 bluep:

  1. System.out.println(redP.equals(p)); // 输出 true  
  2.  
  3. System.out.println(p.equals(blueP)); // 输出 true 

然而,比较 redP 和 blueP,输出 false:

  1. System.out.println(redP.equals(blueP)); // 输出 false 

因此,这违反了equals约定中的传递性子条款。

让equals关系更一般看来是死路一条。下面我们试试让它更严格。使equals更严格的一个方法是:不同类的对象,不同地对待。通过修改类 Point 和 ColoredPoint 中的equals方法来实现。 在类 Point 中,可以添加一个额外的比较,用于检查其他点的运行时类是否与这个点的类相同,代码如下:

  1. // 技术上有效,但仍不能令人满意的 equals 方法  
  2. public class Point {  
  3.  
  4.  private final int x;  
  5.  private final int y;  
  6.  
  7.  public Point(int x, int y) {  
  8.  this.x = x;  
  9.  this.y = y;  
  10.  }  
  11.  
  12.  public int getX() {  
  13.  return x;  
  14.  }  
  15.  
  16.  public int getY() {  
  17.  return y;  
  18.  }  
  19.  
  20.  @Override public boolean equals(Object other) {  
  21.  boolean result = false;  
  22.  if (other instanceof Point) {  
  23.  Point that = (Point) other;  
  24.  result = (this.getX() == that.getX() && this.getY() == that.getY()  
  25.  && this.getClass().equals(that.getClass()));  
  26.  }  
  27.  return result;  
  28.  }  
  29.  
  30.  @Override public int hashCode() {  
  31.  return (41 * (41 + getX()) + getY());  
  32.  }  

然后,你就可以将类 ColoredPoint 的实现恢复为之前违反了对称性要求的版本:

  1. public class ColoredPoint extends Point { // 不再违反平衡性要求  
  2.  
  3.  private final Color color;  
  4.  
  5.  public ColoredPoint(int x, int y, Color color) {  
  6.  super(x, y);  
  7.  this.color = color;  
  8.  }  
  9.  
  10.  @Override public boolean equals(Object other) {  
  11.  boolean result = false;  
  12.  if (other instanceof ColoredPoint) {  
  13.  ColoredPoint that = (ColoredPoint) other;  
  14.  result = (this.color.equals(that.color) && super.equals(that));  
  15.  }  
  16.  return result;  
  17.  }  

在这里,类 Point 的实例被认为与系统类的其他实例是相等的,仅当对象具有相同的坐标,并且具有相同的运行时类,即每个对象 .getClass() 返回相同的值。 新的定义可以满足对象性和传递性的要求,因为现在对不同类之间的每次对比都将返回 false。因此,颜色点永远不会与普通点相等。这种约定看起来是合理的,当有人会指出新的定义太过严格了。

下面使用稍微有点绕的方式定义位于坐标(1, 2)上的点:

  1. Point pAnon = new Point(11) {  
  2.  @Override public int getY() {  
  3.  return 2;  
  4.  }  
  5. }; 

pAnon 等于 p 吗?答案是否定的,因为与 p 和 pAnon 关联的 java.lang.Class 对象是不同的。对于 p 是 Point 类,而对于 pAnon,它是 Point 的一个匿名子类。 但显然,pAnon 只是位于坐标(1, 2)上的另一个点。 认为它与 p 不同,看起来并不合理。

#p#

明智的方式:canEqual 方法

从以上各种情况,看起来我们进退两难。是否存在一种明智的方式,在类层次结构的多个分层中对等值比较进行重定义,而同时满足其约定?事实上,有这样一种方式,但它需要另一个方法来重定义equals和 hashCode。这个想法是,只要类重定义 equals(和 hashCode),它就应该同时显式地声明,该类的所有对象与使用不同等值方法的超类中的对象,绝对不会相等。通过对重定义equals的每个类添加方法 canEqual 就可以实现。以下为该方法的原型:

  1. public boolean canEqual(Object other) 

当其他(other)对象是(重)定义了 canEqual 的类的实例时,该方法应返回 true,或者返回 false。它从equals中调用,以确保这些对象使用2种方式都是可比较的。下面是类 Point 新的也是最后的一个实现:

  1. public class Point {  
  2.  
  3.  private final int x;  
  4.  private final int y;  
  5.  
  6.  public Point(int x, int y) {  
  7.  this.x = x;  
  8.  this.y = y;  
  9.  }  
  10.  
  11.  public int getX() {  
  12.  return x;  
  13.  }  
  14.  
  15.  public int getY() {  
  16.  return y;  
  17.  }  
  18.  
  19.  @Override public boolean equals(Object other) {  
  20.  boolean result = false;  
  21.  if (other instanceof Point) {  
  22.  Point that = (Point) other;  
  23.  result = (that.canEqual(this) && this.getX() == that.getX() && this.getY() == that.getY());  
  24.  }  
  25.  return result;  
  26.  }  
  27.  
  28.  @Override public int hashCode() {  
  29.  return (41 * (41 + getX()) + getY());  
  30.  }  
  31.  
  32.  public boolean canEqual(Object other) {  
  33.  return (other instanceof Point);  
  34.  }  

类 Point:该版本的equals方法包含了一个附加的要求,由 canEqual 方法决定,其他(other)对象可以等于这个(this)对象。Point 中的 canEqual 实现声明所有 Point 实例都可以是相等的。

下面是 ColoredPoint 相应的实现:

  1. public class ColoredPoint extends Point { // 不再违反对称性要求  
  2.  
  3.  private final Color color;  
  4.  
  5.  public ColoredPoint(int x, int y, Color color) {  
  6.  super(x, y);  
  7.  this.color = color;  
  8.  }  
  9.  
  10.  @Override public boolean equals(Object other) {  
  11.  boolean result = false;  
  12.  if (other instanceof ColoredPoint) {  
  13.  ColoredPoint that = (ColoredPoint) other;  
  14.  result = (that.canEqual(this) && this.color.equals(that.color) && super.equals(that));  
  15.  }  
  16.  return result;  
  17.  }  
  18.  
  19.  @Override public int hashCode() {  
  20.  return (41 * super.hashCode() + color.hashCode());  
  21.  }  
  22.  
  23.  @Override public boolean canEqual(Object other) {  
  24.  return (other instanceof ColoredPoint);  
  25.  }  

可以证明 Point 和 ColoredPoint 的新定义满足了equals的约定。 等值是对称和可传递的。将一个 Point 与 ColoredPoint 比较,总会输出 false。事实上,任何普通点 p 和颜色点 cp,“p.equals(cp)”将返回 false ,因为“cp.canEqual(p)”将返回 false。反向进行比较,“cp.equals(p)”也将返回 false ,因为 p 的确不是ColoredPoint,所以 ColoredPoint 中equals正文中第一个 instanceof 检查将失败。

另一方面, Point 的不同子类的实例可以是相等的,只要这些类没有重定义等值比较方法。例如,使用新的类定义,p 和 pAnon 的比较结果为 true。下面是一些例子:

  1. Point p = new Point(12);  
  2.  
  3. ColoredPoint cp = new ColoredPoint(12, Color.INDIGO);  
  4.  
  5. Point pAnon = new Point(11) {  
  6.  @Override public int getY() {  
  7.  return 2;  
  8.  }  
  9. };  
  10.  
  11. Set coll = new java.util.HashSet();  
  12. coll.add(p);  
  13.  
  14. System.out.println(coll.contains(p)); // 输出 true  
  15.  
  16. System.out.println(coll.contains(cp)); // 输出 false  
  17.  
  18. System.out.println(coll.contains(pAnon)); // 输出 true 

这些例子显示,如果超类equals实现定义并调用 canEqual,那么实现子类的程序员可以决定他们的子类是否与超类的实例相等。由于 ColoredPoint 改写了 canEqual,例如,颜色点可能远不会与普通点相等。但由于 pAnon 中引用的匿名子类并未改写 canEqual,其实例可以与 Point 实例相等。

对 canEqual 方式,一种可能的批评是,它违反了里氏替换原则(Liskov Substitution Principle:缩写 LSP)。例如,通过比较运行时类来实现 equals 的技巧,被认为违反了 LSP,因为该技巧导致无法定义这样一个子类:其实例可以等于超类的实例。其推理思路是,LSP 声明:在需要超类实例的地方,你应能够使用(调换)子类实例。但是,在之前的实例中,“coll.contains(cp)”返回 false,即使 cp 的 x 和 y 值与集合中点相匹配。因此,看起来它可能像是违反了 LSP,因为你不能中出现 Point 的地方使用 ColoredPoint。但是,我们认为这是一种错误的解释,因为 LSP 并不要求子类的行为与超类完全相同,而只是它的行为方式能够满足超类的约定。

编写equals方法对运行时类进行比较的问题不在于它违反了 LSP,而是它没有为你提供一种方式,用来创建其实例与超类实例相等的子类。例如,如果我们之前的实例中使用运行时类的技巧,“coll.contains(pAnon)”将返回 false,而这不是我们想要的。相反,我们真的想要“coll.contains(cp)”返回 false,因为通过改写 ColoredPoint 中的 equals,我们基本上是在表示,一个位于坐标(1, 2)上的深蓝色点与位于(1, 2)的非颜色点并不相同。因此,在前面的例子中,我们可以将两个不同 Point 子类实例传递到集合的 contains 方法中,并且得到两个不同的结果,两个都是正确的。

原文:How to Write an Equality Method in Java 

作者:Martin Odersky,Lex Spoon,以及Bill Venners

译者:司马牵牛

【编辑推荐】

  1. Java开源软件六大帮派
  2. Java正则表达式工具类实例
  3. Java是平台而非产品:可添加型概念需改变
  4. Java中的堆内存与栈内存分配浅析
  5. Scala编程语言
责任编辑:yangsai 来源: 51CTO.com
相关推荐

2019-01-16 10:49:47

云平台云计算解决方案

2020-10-14 07:20:53

高并发

2015-07-21 14:59:44

2011-09-09 09:47:31

云计算许可证云计算

2009-09-23 09:47:23

Hibernate e

2015-09-21 13:54:01

大数据赚钱

2011-02-25 13:52:18

Java路径问题Web路径问题

2015-07-29 10:54:58

Java 8包列表

2022-05-16 10:09:18

首席信息官CIO企业

2010-10-22 16:48:49

SQL删除所有表数据

2009-07-17 16:19:16

Swing核心组件

2015-07-10 09:15:47

LeakCanary内存泄漏

2021-07-13 06:42:58

JavaEquals方法

2018-06-08 14:31:11

固态硬盘SSD

2015-08-27 14:04:08

微信硬件社交

2017-09-04 13:01:00

2019-05-07 16:19:03

MySQL存储引擎

2023-10-12 08:25:18

Javaequals内存

2023-04-03 08:20:10

blendOSLinux发行版

2009-09-15 18:27:59

equals实现canEqualScala
点赞
收藏

51CTO技术栈公众号