网络市场信息采集
作者:葛梦婷
日期:2012/4/5 19:04:40
(一)搜索引擎调查内容
搜索引擎是获取互联网海量信息的重要方式,其工作原理是通过其内部的搜索智能机器人(robot)对处理后的用户搜索请求按照其数据库收录的网页进行识别筛选,将符合用户需求的网页反馈给用户。
目前,搜索引擎主要的搜索方式包括两种,即目录式检索和关键词检索。目录式检索是通过各搜索引擎的建立的主题分类目录分类逐层搜集所需的信息资源,因此主题检索实事上仅仅是一种目录式服务,如Yahoo等。关键词检索是根据各搜索引擎工作原理以智能的方式对收录网页进行过滤筛选,如Google、Vista等。
(二)搜索引擎检索工作流程
主题式检索较为简单,用户可以根据需求在信息服务商的检索目录中逐
级查找所需资源即可,且其结果较为准确有效,但检索时间较长,需要
用户直接介入。
1、明确检索目标,分析检索课题,确定几个能反映课题主题的核心词作为关键词,包括它的同义词、近义词、缩写或全称等。
2、选择搜索引擎。在选择搜索工具中,应充分参考各搜索引擎的质量性能,具体包括搜索速度、网页收录数量、链接成功率、智能水平等。例如,Google搜索引擎的速度快,网页收录多,但对中文兼容不是特别好。
3、采用一定的逻辑关系组配关键词,在搜索引擎检索输入框中输入,单击检索按钮,即可获得想要的结果。如果检索效果不理想,可调整检索策略:结果大多的,可进行适当的限制;结果太少的,可扩大检索的范围,取消某些限制,直到获得满意的结果。
4、尽量使用高级检索技术,提高检索的成功率。
(1)“+检索词”或“-检索词”方式:“+检索词”表示检索词必须出现在搜索结果中。如查找有关网络营销与成功案例的网页,检索提问可以为“+网络营销+成功案例”,如图1.4,表示网络营销和成功案例这两个词必须出现在搜索结果网页中,结果如图1.5所示。“-检索词”表示检索词不能出现在搜索结果中,如查找关于Windows的资料,但用不能想看到关于Windows 98或Windows 3.1的网页,检索提问可以为“+Windows -Windows 98-Windows 3.1”,减号的作用在于可以使搜索结果集中反映你的需求,使你无需为的大量无关的搜索结果而头疼。
(2)“检索词一Ⅰ检索词二”: “检索词Ⅰ检索词”表示一组检索词在搜索结果中能要出现任一个即被命中。如查询有关网络营销与成功案例的资料,检索提问可以为“网络营销Ⅰ成功案例”,表示在搜索结果中网络营销与成功案例这两个词只要出现一个都被命中。
(3)引号:“”表示引号内内容为专有名词,如检索提问为“电脑商情报”,会找出包含电脑商情报的网站,不会查找有关电脑商情报的网站,不会查找有关电脑商情或其它商情报的内容。此外,一些标点符号如“-”(连字符)、“\”(斜杠)、“_”(下划线)、“,”(逗号)、“.”(点)等在不同的搜索引擎也可作为短语连接符。例如:mother-in-low尽管没有加引号,仍作为专用语处理。
(4)截词符:如“词干*”,表示自动查找具有相同词干的所有关键词,能提高检索的全面性,扩大命中结果的数量。
分享
能力秀动态
■为期9年共举办18期的大学生网络营销能力秀活动已圆满结束(2009-2018)。能力秀——网络营销开始的地方!祝所有秀友前程似锦!向所有网络营销老师、所有支持能力秀活动的人员和机构、所有为能力秀活动付出辛勤努力的工作人员们表示衷心的感谢并致以崇高的敬意!