• Posts tagged "敏感词"

Blog Archives

敏感词检测&过滤

敏感词检测&过滤

概念

Trie,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。

我们先来看一个Trie结构的例子

字典树

在这个Trie结构中,保存了A、to、tea、ted、ten、i、in、inn这8个字符串

把由蛮力匹配转变成基于Trie的匹配方案会极大的节省执行时间,这个比较对较长字符串进行匹配时更加明显。 对于长度在20左右的字符串。Tire的匹配速度比Hash的方式快了近10倍

应用程序:

参考:https://github.com/huhongda/common_service