首页>>学生风采>>南华工商学院曾夏冰>>观点>>百度分词技术的规律

百度分词技术的规律

作者:曾夏冰
日期:2014/4/15 23:21:58

今天上了电商老师的课了,其中,老师讲到了,百度的分词技术,这大大的引起了我的兴趣,课后还特地去网上查了相关的资料,下面就让我来给大家讲解一下吧!

分词技术是指搜索引擎对用户提交查询的关键词进行各种匹配的一种技术。一般4个以上的汉字,百度就会为其进行分词了,百度分词技术一般有4个分类原则。

1、 正向分词:所谓正向分词,即从左到右来进行划分,如工地方向导,就可以分为工地、方向、导,这是百度最长用的方法。

2、 反向分词:顾名思义,反向分词就是和正向相反,即从右到左来进行分词,又如工地方向导就可划分为向导、地方、工。

3、 双向匹配:如习近平易近人,就会划分为习近平平易近人,为什么呢,那是因为百度以为你漏写了字。

4、 人名优先匹配:汉字里有人名的,会优先分出

南华工商学院曾夏冰:http://abc.wm23.com/momo123

广东省清远市清城区:http://wutongzi.com/kan/guangdong/qingyuan_qingcheng.html

我的微博:http://weibo.com/u/1993782762

我的博客:http://blog.sina.com.cn/zengxiabing

我的网店:http://shop107000163.taobao.com

分享