深圳网站制作公司易捷网络欢迎您,我司主营业务:深圳企业网站制作,欢迎来电。
深圳企业网站制作
深圳网站制作业务咨询
0755-61603557
赵先生:13714247375
深圳网站制作技术支持
您现在的位置:网站首页 > 深圳网站制作教程

百度分词理论之标题的设计实例解析

文章作者:易捷网站制作公司编辑    文章来源:深圳网站制作公司-易捷网络
影响一个页面在搜索引擎排名最重要的因素之一是相关度,而最直接体现一个页面与用户搜索行为是否相关的就是标题,那么想写好一个标题你就不能不去深入的了解搜索引擎的分词原理!以百度为例,经过十年左右的完善,在中文搜索里百度已经是一个非常高效的搜索引擎,大家也和点水一样肯定都知道一个高效的搜索引擎工作肯定会涉及到很多不为人知的技术点,但我们如果把复杂的搜索引擎工作简化为三个步骤那么分别是:查询,分词,匹配。那我们通过实例来看看搜索引擎是如何处理的呢,为了能理解的更加直观,我们以水手(年轻时很喜欢这首歌)为主关健词在百度进行实验。

一 搜索引擎如何处理查询

1,搜索引擎的被动行为。

如果用户根据自已的意愿在搜索的关健词的时候有加上空格,标点,那么搜索引擎会优化按用户的行为进行查询,这个应该很好理解!例如:百度搜索 郑智化水手与搜索 郑智化 水手,所返回的结果会是不一样的!可能这个例子还并不直观,举一个更直观的例子,分别搜索:郑智化 学 和 郑智 化学。搜索结果分别如下图:

2,搜索引擎的主动行为

搜索引擎收到用户的搜索内容,会根据自已基础词典与特殊词库为用户的查询进行主动分词,如搜索:郑智化水手,百度会根据其搜索词库(猜测为:人名库+歌名库)智能将郑智化与水手这两个词分别进行查询,搜索结果如: 那么如果搜索内容中包含同时中文与英文百度是如何处理的呢?百度会将英文做为单独的一块来处理,然后英文前后的词也做为一个单独的块。试搜索:郑智化bt下载,结果如下:

二,搜索引擎如何进行分词与匹配

分词根据字符串进行匹配,最常见的有三种分词匹配法,分别为:正向最大匹配法,反向最大匹配法和最短路径分词法。

1,什么是正向最大匹配法呢?

简单点说就是从左到右进行分词,例如百度:武林外传说,武林外传与传说是两个不同的词,根据用户搜索习惯与词库分析百度会返回一个正向最大的匹配,也就是分词为:武林外传说。搜索结果如下图:

2,什么是反向最大匹配法

反向分词固名思义就是从右向左进行分词了。回到刚才的例子,百度:郑智化学,如果按照正向分词那么我们应该得到的分词结果是:郑智化学。那么百度搜索的结果为什么却不是这样呢?而是分成了郑智 化学。

3,正反向同时分词匹配

而有一种特殊的情况,就是关健词前后组合内容被认为粘性相差不大,而搜索结果辊也同时包含这两组词的话,百度会进行正反向同时进行分词匹配,如搜索关健词:北京华烟云,返回结果如下:

4,什么是分词最少化

指:分出来的词数应该是最求最少化,以搜索:武林外传说 为例,理论可以分成:武林 外 传说,可是百度只分成了 武林外传 说,即能尽量将分组数减少,能分成两组的尽量不分成三组!

深圳网站制作公司易捷网络科技主营业务:企业网站制作、网站推广优化、企业邮箱申请、域名空间购买、网站备案、论坛网站制作和企业网站维护。网站建设服务热线:13714247375
上一篇企业网站制作技术文章:    网站排名时好时坏是什么原因
下一篇企业网站制作技术文章:    网站制作如何让搜索引擎经常抓取网站内容
深圳网站制作最新案例欣赏:
深圳网站制作相关文章阅读
网站制作流程深圳网站制作网站制作公司易捷网络深圳网站制作教程联系我们
业务咨询热线:0755-61603557    7X24小时热线:13714247375赵先生
地址:广东省深圳市宝安区宝源路鸿源大厦715    ICP备案号:粤ICP备12084881号-1
版权所有:深圳网站建设公司易捷网络科技有限公司版权所有
本站关键词:深圳网站制作公司  企业网站制作  深圳网站制作  企业网站制作
网站制作商务合作:花呗自动回款 网站地图 XML
QQ在线咨询