百度分词技术的规律
今天上了电商老师的课了,其中,老师讲到了,百度的分词技术,这大大的引起了我的兴趣,课后还特地去网上查了相关的资料,下面就让我来给大家讲解一下吧!
分词技术是指搜索引擎对用户提交查询的关键词进行各种匹配的一种技术。一般4个以上的汉字,百度就会为其进行分词了,百度分词技术一般有4个分类原则。
1、 正向分词:所谓正向分词,即从左到右来进行划分,如工地方向导,就可以分为工地、方向、导,这是百度最长用的方法。
2、 反向分词:顾名思义,反向分词就是和正向相反,即从右到左来进行分词,又如工地方向导就可划分为向导、地方、工。
3、 双向匹配:如习近平易近人,就会划分为习近平平易近人,为什么呢,那是因为百度以为你漏写了字。
4、 人名优先匹配:汉字里有人名的,会优先分出
南华工商学院曾夏冰:http://abc.wm23.com/momo123
广东省清远市清城区:http://wutongzi.com/kan/guangdong/qingyuan_qingcheng.html
我的微博:http://weibo.com/u/1993782762
我的博客:http://blog.sina.com.cn/zengxiabing
我的网店:http://shop107000163.taobao.com
能力秀动态
■为期9年共举办18期的大学生网络营销能力秀活动已圆满结束(2009-2018)。能力秀——网络营销开始的地方!祝所有秀友前程似锦!向所有网络营销老师、所有支持能力秀活动的人员和机构、所有为能力秀活动付出辛勤努力的工作人员们表示衷心的感谢并致以崇高的敬意!