前缀树/字典树

oneNeko 于 2021-12-28 发布

Trie,又称前缀树或字典树,是一棵有根树,其每个节点包含以下字段:

指向子节点的指针数组children。对于本题而言,数组长度为26,即小写英文字母的数量。此时children[0]对应小写字母a,children[1] 对应小写字母b,…,children[25] 对应小写字母z。 布尔字段isEnd,表示该节点是否为字符串的结尾。

插入字符串

我们从字典树的根开始,插入字符串。对于当前字符对应的子节点,有两种情况:

重复以上步骤,直到处理字符串的最后一个字符,然后将当前节点标记为字符串的结尾。

查找前缀

我们从字典树的根开始,查找前缀。对于当前字符对应的子节点,有两种情况:

重复以上步骤,直到返回空指针或搜索完前缀的最后一个字符。 若搜索到了前缀的末尾,就说明字典树中存在该前缀。此外,若前缀末尾对应节点的 isEnd 为真,则说明字典树中存在该字符串。

实现

class Trie{
private:
    bool isEnd;
    vector<Trie*> children;
public:
    Trie():isEnd(false),children(26){}

    // 插入
    void insert(string word){
        Trie *node=this;
        for(char ch : word){
            ch-='a';
            if(node->children[ch]==nullptr){
                node->children[ch]=new Trie;
            }
            node=node->children[ch];
        }
        node->isEnd=true;
    }

    // 搜索前缀树,如果不存在则返回空
    // 如果存在此前缀,则返回末尾节点;若返回的节点isEnd==true,则存在此单词
    Trie* search(string word){
        Trie *node=this;
        for(auto ch : word){
            ch-='a';
            if(node->children[ch]==nullptr){
                return nullptr;
            }
            node=node->children[ch];
        }
        return node;
    }
};

参考

实现Trie(前缀树)