树的递归定义:
- 根结点
- 除根结点外的其它结点被分成n个不相交的集合
T1,T2,...,Tn
,其中每个集合本身是一棵树,树T1,T2,...,Tn
,称为根的子树。
树的性质和基本概念:
- 树的结点数等于所有结点的度数加1;
- 度为m的树中第i层上至多有
m^(i-1)
个结点; - 高度为h的m叉树至多有
(m^h-1)/(m-1)
个结点;(等比数列1+m+m^2+……
) - 具有n个结点的m叉树的最小高度为
logmn(m-1)+1
。
二叉树的非递归遍历是难点:
非递归遍历二叉树的方法是线索二叉树(Threaded Binary Tree
)方法,线索二叉树利用二叉树空指针域存放指向前驱和后继的结点,线索二叉树根据线索性质不同可分为:前序线索二叉树、中序线索二叉树和后序线索二叉树。
注:线索链表解决了无法直接找到该结点在某种遍历序列中的前趋和后继结点的问题,出现了二叉链表找左、右孩子困难的问题。
森林转换成二叉树:
由于树或者森林可以通过孩子兄弟表示法转换为二叉树,这样只需要研究二叉树的性质就行了。
树转换为二叉树
加线。在所有兄弟结点之间加一条连线。
去线。树中的每个结点,只保留它与第一个孩子结点的连线,删除它与其它孩子结点之间的连线。
层次调整。以树的根节点为轴心,将整棵树顺时针旋转一定角度,使之结构层次分明。(注意第一个孩子是结点的左孩子,兄弟转换过来的孩子是结点的右孩子)
森林转换为二叉树
把每棵树转换为二叉树。
第一棵二叉树不动,从第二棵二叉树开始,依次把后一棵二叉树的根结点作为前一棵二叉树的根结点的右孩子,用线连接起来。
二叉树转换为树
是树转换为二叉树的逆过程。
加线。若某结点X的左孩子结点存在,则将这个左孩子的右孩子结点、右孩子的右孩子结点、右孩子的右孩子的右孩子结点…,都作为结点X的孩子。将结点X与这些右孩子结点用线连接起来。
去线。删除原二叉树中所有结点与其右孩子结点的连线。
层次调整。
二叉树转换为森林
假如一棵二叉树的根节点有右孩子,则这棵二叉树能够转换为森林,否则将转换为一棵树。
从根节点开始,若右孩子存在,则把与右孩子结点的连线删除。再查看分离后的二叉树,若其根节点的右孩子存在,则连线删除…。直到所有这些根节点与右孩子的连线都删除为止。
将每棵分离后的二叉树转换为树。
huffman树的构造和huffman编码:
从给定的序列中找出最小的两个,构成一棵树的两个叶结点,根结点为两个数字相加,将相加之后的结果,添加到序列中,重复上述步骤,最终形成的二叉树就是huffman树。
对给定的n个权值
{W1,W2,W3,...,Wi,...,Wn}
构成n棵二叉树的初始集合F={T1,T2,T3,...,Ti,...,Tn}
,其中每棵二叉树Ti中只有一个权值为Wi的根结点,它的左右子树均为空。(为方便在计算机上实现算 法,一般还要求以Ti的权值Wi的升序排列。)在F中选取两棵根结点权值最小的树作为新构造的二叉树的左右子树,新二叉树的根结点的权值为其左右子树的根结点的权值之和。
从F中删除这两棵树,并把这棵新的二叉树同样以升序排列加入到集合F中。
重复二和三两步,直到集合F中只有一棵二叉树为止。
简易的理解就是,假如我有A,B,C,D,E
五个字符,出现的频率(即权值)分别为5,4,3,2,1
,那么我们第一步先取两个最小权值作为左右子树构造一个新树,即取1,2构成新树,其结点为1+2=3
,如图:
虚线为新生成的结点,第二步再把新生成的权值为3的结点放到剩下的集合中,所以集合变成{5,4,3,3}
,再根据第二步,取最小的两个权值构成新树,如图:
再依次建立哈夫曼树,如下图:
其中各个权值替换对应的字符即为下图:
所以各字符对应的编码为:A->11,B->10,C->00,D->011,E->010
huffman树的特点就是树的带权路径长度最短。
满二叉树和完全二叉树:
满二叉树——除了叶结点外每一个结点都有左右子女且叶结点都处在最底层的二叉树,。(这个似乎很好想像出来)
完全二叉树——只有最下面的两层结点度小于2,并且最下面一层的结点都集中在该层最左边的若干位置的二叉树;(这个,就说从满二叉树里,最下一层的叶子,如果是从右往左拿掉叶子,不论多少,都是完全的,如果不是从右往左拿,而是在中间拿掉了一个,就是不完全的)
结点与度数:
度为0的结点个数n0与度为2的结点个数n2的关系:n0 = n2 + 1
。
树的度数值得是结点中度数的最大值。
平衡二叉树的最小结点树:
如果根结点层次为1,则高度为h的平衡二叉树最少有F(h + 2) -1
个结点,其中F 为Fibonacci序列1, 1, 2, 3, 5, 8, 13, 21,...
因此5层最少有F(7) -1 = 13-1 = 12
个结点。
tips:在树的运算中,尽量使用一些递归的方法。
1 | /* |