问题

思路说明

二叉树查找是一个面对动态数据比较常用的查找算法。本文根据下面地址文章翻译,并根据本人的理解进行适当修改。

原文地址:http://www.laurentluce.com/posts/binary-search-tree-library-in-python/comment-page-1/

定义内容可以参阅Wikipedia:

这里是中文的:http://zh.wikipedia.org/wiki/%E4%BA%8C%E5%85%83%E6%90%9C%E5%B0%8B%E6%A8%B9

摘要其中对二叉树的描述:

用python实现二叉树查找

以下面图示的二叉树为例说明查找算法

Node 类

创建一个类,命名为Node,做为二叉树节点结构,其中包括:左枝、右枝、节点数据三个变量。

例如创建一个含整数8的节点。因为仅仅创建一个节点,所以左右枝都是None。

这样就得到如下图所示的只有一个节点的树。

二叉树查找之基本思想 - 图1

插入方法

现在已经有了一棵光秃秃的树,要有枝杈和叶子,就必须用插入数据方法,添加新的节点和数据。

  1. def insert(self, data):
  2. """
  3. 插入节点数据
  4. """
  5. if data < self.data:
  6. if self.left is None:
  7. self.left = Node(data)
  8. else:
  9. self.left.insert(data)
  10. elif data > self.data:
  11. if self.right is None:
  12. self.right = Node(data)
  13. else:
  14. self.right.insert(data)
  1. root.insert(3)
  2. root.insert(10)
  3. root.insert(1)

当增加了第二个节点数据3,程序会:

  • 第一步,root会调用insert(),其参数是data=3
  • 第二步,比较3和8(已有的根节点),3比8小。并且树的左枝还是None,于是就在左边建立一个新的节点。

增加第三个节点数据10,程序会:

  • 第一步,跟前面的第一步一样,只不过data=10
  • 第二步,发现10大于8,同时右边是None,于是就把它做为右边新建分支的节点数据。

增加第四个节点数据1,程序会:

  • 第一步,同前,data=1
  • 第二步,1小于8,所以要放在树的左枝;
  • 第三步,左枝已经有子节点3,该节点再次调用insert()方法,1小于3,所以1就做为3的子节点,且放在原本就是None的左侧。

如此,就形成了下图的树

继续增加节点数据

  1. root.insert(6)
  2. root.insert(4)
  3. root.insert(7)
  4. root.insert(14)
  5. root.insert(13)

最终形成下图的树

二叉树查找之基本思想 - 图2

遍历树

此方法用于查找树中的某个节点,如果找到了,就返回该节点,否则返回None。为了方便,也返回父节点。

  1. def lookup(self, data, parent=None):
  2. """
  3. 遍历二叉树
  4. """
  5. if data < self.data:
  6. if self.left is None:
  7. return None, None
  8. return self.left.lookup(data, self)
  9. elif data > self.data:
  10. if self.right is None:
  11. return self.right.lookup(data, self)
  12. else:
  13. return self, parent

测试一下,找一找数据为6的节点

调用lookup()后,程序会这么干:

  1. 调用lookup(),传递参数data=6,默认parent=None
  2. data=6,小于根节点的值8
  3. 指针转到根节点左侧,此时:data=6,parent=8,再次调用lookup()
  4. data=6大于左侧第一层节点数据3
  5. 指针转到3的右侧分支,data=6,parent=3,再次调用lookup()
  6. 节点数据等于6,于是返回这个节点和它的父节点3

删除方法

删除节点数据。代码如下:

  1. def delete(self, data):
  2. """
  3. """
  4. node, parent = self.lookup(data) #已有节点
  5. if node is not None:
  6. children_count = node.children_count() #判断子节点数
  7. if children_count == 0:
  8. # 如果该节点下没有子节点,即可删除
  9. if parent.left is node:
  10. parent.left = None
  11. else:
  12. parent.right = None
  13. del node
  14. elif children_count == 1:
  15. # 如果有一个子节点,则让子节点上移替换该节点(该节点消失)
  16. if node.left:
  17. n = node.left
  18. else:
  19. n = node.right
  20. if parent:
  21. if parent.left is node:
  22. parent.left = n
  23. else:
  24. parent.right = n
  25. del node
  26. else:
  27. # 如果有两个子节点,则要判断节点下所有叶子
  28. parent = node
  29. successor = node.right
  30. while successor.left:
  31. parent = successor
  32. successor = successor.left
  33. node.data = successor.data
  34. if parent.left == successor:
  35. parent.left = successor.right
  36. else:
  37. parent.right = successor.right

在上述方法中,得到当前节点下的子节点数目后,需要进行三种情况的判断

  • 如果有一个子节点,要将下一个子节点上移到当前节点,即替换之
  • 如果有两个子节点,要对自己点的数据进行判断,并从新安排节点排序

上述方法中用到了统计子节点数目的方法,代码如下:

  1. def children_count(self):
  2. """
  3. 子节点个数
  4. cnt = 0
  5. if self.left:
  6. cnt += 1
  7. if self.right:
  8. cnt += 1
  9. return cnt

例1:删除数据为1的节点,它是3的子节点,1后面没有子节点

  1. root.delete(1)

例2:删除数据为14的节点,它是10的子节点,它下面有唯一一个子节点13,13替换之。

  1. root.delete(14)

例3:来个复杂的,删除节点数据为3的节点,它下面有两个节点,而节点6下面又有两个4,7。需要一个临时变量successor,将节点3下面的子节点进行查询,并把小于3下面的第一级子节点6左测节点数据4(该数据一定小于其父节点6)替换当前节点3,维持二叉树结构。如下图:

  1. root.delete(3)

二叉树查找之基本思想 - 图3

比较两个二叉树

比较两个二叉树的方法中,只要有一个节点(叶子)与另外一个树的不同,就返回False,也包括缺少对应叶子的情况。

例如,比较tree(3,8,10)和tree(3,8,11)

  1. #root2 是tree(3,8,11)的根
  2. #root 是tree(3,8,10)的根
  3. root.compare_trees(root2)

执行上面的代码,程序会这么走:

  1. root调用compare_trees()方法
  2. root有左侧子节点,调用该节点的compare_trees()
  3. 两个左侧子节点比较,返回true
  4. 按照前面的过程,比较右侧节点,发现不同,则返回False

打印树

把二叉树按照一定的顺序打印出来。不需要参数了。做法就是先左后右(左小于右)。

  1. def print_tree(self):
  2. """
  3. 按顺序打印数的内容
  4. """
  5. if self.left:
  6. self.left.print_tree()
  7. print self.data,
  8. if self.right:
  9. self.right.print_tree()

操作一下:

  1. root.print_tree()

输出: 1, 3, 4, 6, 7, 8, 10, 13, 14

包含所有树元素的生成器

创建一个包含所有树元素的生成器,有时候是有必要的。考虑到内存问题,没有必要实时生成所有节点数据列表,而是要每次调用此方法时,它返回的下一个节点的值。为此,使用它返回一个对象,并停止在那里,那么该函数将在下一次调用方法时从那里继续通过yield关键字返回值。在这种情况下,要使用堆栈,不能使用递归。

  1. def tree_data(self):
  2. """
  3. 二叉树数据结构
  4. """
  5. stack = []
  6. node = self
  7. while stack or node:
  8. if node:
  9. stack.append(node)
  10. node = node.left
  11. else:
  12. node = stack.pop()
  13. yield node.data
  14. node = node.right

举例,通过循环得到树:

  1. for data in root.tree_data():

程序会按照先左后右边的原子将数据入栈、出栈,顺序取出值,并返回结果