字典树,即Trie树,是一种哈希树的变种的树形结构。利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。
字典树本身具有如下的几点性质:
·根节点不包含字符,除根节点外的每一个子节点都包含一个字符
·从根节点到某一节点。路径上经过的字符连接起来,就是该节点对应的字符串
·每个节点的所有子节点包含的字符都不相同
一颗字典树的样子如下图所示:
通常字典树的查询时间复杂度是O(logL),其中L是字符串的长度。通常建立的字典树是一颗26叉树,其实也就是包含了所有小写字母在内,对于可能包含其他字符的情况,可以通过增加孩子节点数目来对字典树能够处理的范围进行扩容。虽然字典树是一颗多叉树,但这种数据结构所涉及的操作相对简单,因此构建一颗字典树所需要的代码难度相对较小。ps.trie是AC自动机
的一部分。虽然还不太了解什么是AC自动机雾
以下便是字典树的模板实例:
1 | truct node |
字典树就如同他的名字一样,如同字典般的结构,对于需要多次查询和包含前缀的问题的高效解决有着十足的优势。具体的使用示例便以LeetCode的1268题为例。[https://leetcode-cn.com/problems/search-suggestions-system/]
题目描述:
给你一个产品数组 products 和一个字符串 searchWord ,products 数组中每个产品都是一个字符串。
请你设计一个推荐系统,在依次输入单词 searchWord 的每一个字母后,推荐 products 数组中前缀与 searchWord 相同的最多三个产品。如果前缀相同的可推荐产品超过三个,请按字典序返回最小的三个。
请你以二维列表的形式,返回在输入 searchWord 每个字母后相应的推荐产品的列表。
示例 1:
输入:products = [“mobile”,”mouse”,”moneypot”,”monitor”,”mousepad”], searchWord = “mouse”
输出:[
[“mobile”,”moneypot”,”monitor”],
[“mobile”,”moneypot”,”monitor”],
[“mouse”,”mousepad”],
[“mouse”,”mousepad”],
[“mouse”,”mousepad”]
]
解释:按字典序排序后的产品列表是 [“mobile”,”moneypot”,”monitor”,”mouse”,”mousepad”]
输入 m 和 mo,由于所有产品的前缀都相同,所以系统返回字典序最小的三个产品 [“mobile”,”moneypot”,”monitor”]
输入 mou, mous 和 mouse 后系统都返回 [“mouse”,”mousepad”]
示例 2:
输入:products = [“havana”], searchWord = “havana”
输出:[[“havana”],[“havana”],[“havana”],[“havana”],[“havana”],[“havana”]]
示例 3:
输入:products = [“bags”,”baggage”,”banner”,”box”,”cloths”], searchWord = “bags”
输出:[[“baggage”,”bags”,”banner”],[“baggage”,”bags”,”banner”],[“baggage”,”bags”],[“bags”]]
示例 4:
输入:products = [“havana”], searchWord = “tatiana”
输出:[[],[],[],[],[],[],[]]
提示:
1 <= products.length <= 1000
1 <= Σ products[i].length <= 2 * 10^4
products[i] 中所有的字符都是小写英文字母。
1 <= searchWord.length <= 1000
searchWord 中所有字符都是小写英文字母。
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/search-suggestions-system
可以看到,题目要求中明确说明了products[i]
中所有的字符都是小写英文字母,因此一颗标准的26叉的字典树便能很好的解决这一问题。当然,除了26叉这种暴力的解决方式外,使用哈希表也是一种很好的思路,本题LeetCode官方题解中的字典树便是利用和哈希表。但接下来我们还是以26叉树的思路来解决问题。字典树的结构已经很好的解决了题目对于前缀查询的要求,剩下需要解决的便是products
数组中前缀与searchWord
相同的最多三个产品并且按字典序返回最小的三个这一要求。我们可以在字典树中增加一个大小最多为三的优先队列,来保存符合当前前缀的单词,这一思路的来源便是第k大这一经典的问题。通过上述的修改,题目所要求的问题都得到了解决。
AC代码如下:
1 | class Solution { |
end☆~