我们知道,中文断词搜索中用到的一种重要结构是倒排索引,由索引key和包含这个key的所有文档的id排列成的倒排链组成。搜索的过程就是对倒排链做布尔运算的过程(一般是求交运算)。假如没有中文分词,则一般只能以单字作为索引key建立倒排。
创新互联从2013年创立,先为乐都等服务建站,乐都等地企业,进行企业商务咨询服务。为乐都企业网站制作PC+手机+微官网三网同步一站式服务解决您的所有建站问题。
wordpress主题搜索对用户不太友好:原因是搜索必须是标题不间断的词语才能搜索得到。
举例:
比如你素材(或文章)的标题是 C4D瓷砖地板花纹花岗岩材质通道模型贴图法线置换凹凸素材
搜索 C4D瓷砖地板 瓷砖地板花纹 花岗岩材质 这种标题里相邻的词语才能搜索到这篇素材(或文章)
然而搜索 C4D花纹 C4D花岗岩 花岗岩模型贴图 像这种 标题里没有连在一块的词语,就搜索不到刚才那篇素材(或文章)。
intsearch中文智能断词搜索神器,解决你的烦恼。以下是intsearch搜索的示例:
1.完整的素材(或文章)能搜索到这篇
2.间断的词语也能搜索到这篇素材,用户搜索不会按照你标题里设置的连词搜索,搜索关键词具有随意和针对性,比如客户想找C4D的花岗岩贴图,当他搜索C4D花岗岩或者花岗岩贴图就能准确找到这篇素材。
3.词语打乱顺序也能搜索到这篇素材
需要的朋友可以去看我们的演示,截图上面有相关信息
wordpress系统本身是对搜索引擎友好的,如果网站的内容比较私密不希望蜘蛛爬取,可以能过以下方法实现:
1、进入wordpress "设置" - "阅读" - 然后勾选“建议搜索引擎不索引本站点”,再点击 “保存更改”。这样搜索引擎就不会收录和索引网站了。
2、还可以通过配置“robots.txt”来告诉搜索引擎,不要收录/索引网站的内容;
步骤:
1),新建一个文本文档,重命名为“robots.txt”;
2),在文本文件贴入以下内容并保存:
User-agent: * Disallow: / 3),将设置好的“robots.txt”上传至网站的根目录。
内容编辑的时候,切换到HTML编辑器,然后在需要索引的标题用H3标注,具体的用H几要和上面的定义FUNCTION对应,默认的是H3。然后在显示的时候会自动抓取。
为了达到美化的效果,需要用到CSS,具体的还是要根据需求调整。代码如下:
#article-index {
-moz-border-radius: 6px 6px 6px 6px;
border: 1px solid #DEDFE1;
float: right;
margin: 0 0 15px 15px;
padding: 0 6px;
width: 200px;
line-height: 23px;
}
#article-index strong {
border-bottom: 1px dashed #DDDDDD;
display: block;
line-height: 30px;
padding: 0 4px;
}
#index-ul {
margin: 0;
padding-bottom: 10px;
}
#index-ul li {
background: none repeat scroll 0 0 transparent;
list-style-type: disc;
padding: 0;
margin-left: 20px;
}