我想实现一个功能,判断两个文本的相似度,比如该文本是广告,需要提取文本的关键字。(判断该文本是否是广告?)
那么这里就有问题了,
第一:我该怎么设计这些关键字呢?
第二:当我接受到了一个文本后,我怎么查找,该文本中是不有该关键字呢
算法复杂度比较高...,除非有好的算法
其实我并不需要Adblock Plus这么强大功能。想问:怎么列举文本(比如广告)这些关键字,还有通过什么方法查找找文本中的关键字呢???
但是可以借鉴的。
http:-//www.cnblogs.-com/pwg17/archive/2011/02/27/1966318.html