新鲜 / 健康 / 便利 / 快速 / 放心
第 2 章 文献综述
2.1 搜索引擎优化概念的研究。
搜索引擎优化英文为 Search Engine Optimization,简称 SEO.目前对于搜索引擎优化的概念尚没有统一的说法,归纳来说,搜索引擎优化的概念主要是从优化的原则、优化的方法及优化的目的三部分来定义的。
(1)搜索引擎优化的原则,即优化的依据。潘颖(2004)认为企业网站开展搜索引擎优化,要在符合搜索引擎的搜索规则下进行[10].单仁(2008)提出要针对搜索引擎抓取互联网页面、编辑索引的特点来对企业网站进行搜索引擎优化[11].昝辉(2009)提出搜索引擎优化的着眼点不能仅仅是考虑搜索引擎的算法,更重要的是对用户友好[12].冯英健(2013)提到搜索引擎优化要遵循搜索引擎的排名规则,还要为用户获取信息和服务提供方便,要以用户为核心的网站优化指导思想来进行优化[13].
综上所述,在给搜索引擎优化下定义时,要综合考虑搜索引擎的工作原理和用户的搜索需求。企业进行搜索引擎优化不能只偏重搜索引擎的排名算法,如果仅仅在搜索引擎取得好排名,没有用户的访问量,那搜索引擎优化也是不成功的。
(2)搜索引擎优化的方法,即怎么样进行搜索引擎优化。马晓玲,吴永和(2005)认为搜索引擎优化是在符合搜索引擎的工作原理的基础上,来对网站页面进行优化[14].马萌,金鹏(2008)认为搜索引擎优化是通过优化网站结构、网页代码和内容,来提高网站在搜索结果中的自然排名[15].何艳东,付经华(2009)提出搜索引擎优化是从网站自身、空间、域名、外部链接四个方面来进行,以使网站快速被收录并提高网站在搜索结果中的排名[16].Weideman(2009)提出搜索引擎优化是对企业网站进行再设计或作出改变[17].Heiler ,Chris(2012)认为搜索引擎优化是通过站内优化(如内容等)和站外优化(如链接等)来进行的[18].
综述文献来看,学者们普遍认为搜索引擎优化是在符合搜索引擎的工作原理和用户友好的前提下,对网站的结构、网页页面、链接、空间、域名等相关元素来进行优化。
(3)搜索引擎优化的目的,即优化为了实现什么目标。Wenyu Dou,Kai H.Lim(2010)提出搜索引擎优化对于企业网络营销来说非常重要[19].它能吸引用户进入企业网站,从而增加网站各页面的浏览量。搜索引擎优化就是要遵循搜索引擎工作原理(焦丽,路波,2009)[20],让各大搜索引擎更容易找到并收录企业网站(Weideman,2009),提高网站在一个或者多个搜索引擎中的能见度(何艳东,付经华,2009),从而提高网站在搜索结果中的自然排名(马晓玲,吴永和,2005;马萌,金鹏,2008;何艳东,付经华,2009),提高网站访问量(焦丽,路波,2009)或获得搜索流量(昝辉,2009),最终提升网站的销售或宣传能力(单仁,2008)。
从上述国内外文献可以看出,搜索引擎优化概念就是从优化规则、优化方法及优化目的三部分来定义的。搜索引擎优化就是根据搜索引擎的检索规则对企业网站采取合理、有效的措施,以提高网站在搜索引擎搜索结果中的自然排名,或者通过提高用户体验来增加客户流量,加强粘性,最终实现在线销售或品牌宣传的目的。搜索引擎优化不单单要考虑搜索引擎的算法和排名规则,还要考虑用户的搜索偏好,选取用户常用的关键词、站在用户角度来体验网页浏览的舒适度都是很好的搜索引擎优化原则。邹海华(2010)构建了搜索引擎优化模型,将用户、搜索引擎、网站统一纳入到该模型中[21].企业网站优化要对搜索引擎友好,更要对用户友好[22](李忆等,2014)。当一个网站可以方便用户获取有价值的信息,该网站的优化效果自然就会变好。
总的来看,搜索引擎优化(Search Engine Optimization,简称 SEO)是企业根据搜索引擎的工作原理,在符合用户友好的基础上,对网站内外部进行相关优化,使搜索引擎收录更多的网页,提高网站在搜索引擎中的自然排名,从而增加网站访问量,最终实现网站的销售或提升网络品牌。
2.2 搜索引擎优化方法的研究。
搜索引擎很好的解决了人们在繁杂的网络环境中查找自己需要信息的难题,于是被用户所依赖,搜索引擎营销就被众多企业重视起来。搜索引擎营销简单来说就是企业利用搜索引擎开展的营销活动,在用户利用搜索引擎检索信息时候,尽可能多的将企业营销信息传递给用户。据美国 Georgia 理工学院的调查结果显示,用户在利用搜索引擎查找信息时,超过 70%的用户会选择自然排名的搜索页面,而不是付费推广的页面。又因为用户只关心搜索结果靠前位置的规律,利用搜索引擎优化来提高自然排名便成为搜索引擎营销的非常重要的一部分[23](Er.Tanveer Singh 等,2013)。
国内外研究者认为搜索引擎优化的方法主要分为黑帽方法、白帽方法和灰帽方法。Er.Tanveer Singh 等(2013)提出黑帽方法不遵循搜索引擎规则,短期内就能快速提高网站的排名。黑帽方法隐藏了用户看不到的数据,它只是面向搜索引擎,仅是为了迎合搜索引擎的喜好。黑帽方法主要有:隐藏文本、链接工厂、关键词堆砌、买卖链接、门页(吴泽欣,2014)等。黑帽方法是不被允许的,各大搜索引擎已经对使用黑帽方法来进行优化的网站进行不同程度的惩罚。白帽是被认可的搜索引擎优化方法[24](付真真,陆伟,2009),从长远角度着眼为用户创造内容,该优化方法可以达到对用户友好和对搜索引擎友好的双赢效果[25](王新昊,康振华,2012),但想获得排名需要较长一段时间(Er.Tanveer Singh 等,2013)。灰帽方法介于白帽和黑帽之间,与白帽方法相比,网站排名提升速度较快但排名稳定性较差,往往由于缺少创造性和自律性而被搜索引擎屏蔽(王新昊,康振华,2012)。因此,本文主要研究白帽方法。
以前的研究者提出了不同的白帽搜索引擎优化方法,但归纳起来主要包括站内优化和站外优化两种[26](Khalil ur Rehman 等,2013)。站内优化时要在域名、网页标题和描述标签里放上要优化的关键词,且锚标签(anchor tags)、图片的Alt 标签里也要嵌入关键词,站内链接也要有关键词。要经常性的用新鲜特别的内容来更新网站,网页里的关键词要新且与网站内容相关,图片、视频、音频也要更新。站外优化主要可以考虑从反向链接(Back Linking)、社交网络(SocialNetwork )和论坛(Groups)三方面来开展。反向链接优化指的是高权重、高质量的网站有导入自己网站的相关链接,方便搜索引擎蜘蛛前来抓取和索引。社交网络优化是在自己的网站放上社会化媒体分享、点赞的按钮,加强用户参与。论坛优化方法是指网站在 Yahoo, MSN, Google 等旗下的论坛、贴吧中评论,并在评论里添加网站相关链接或附上希望目标用户阅读的特殊网页。学者对搜索引擎优化白帽方法的研究非常多,主要从以下几个方面进行综述:
(1)关键词。关键词优化研究主要从关键词选择、关键词密度、关键词分布三方面来进行。关于关键词选择的研究,昝辉(2009)认为选择关键词不应太宽泛,要具体有针对性,要站在用户角度思考。焦丽,路波(2009)提出要关注搜索的热门词,借鉴竞争者的关键词,同时要控制关键词数量,一页最多不超过3 个,其余要优化的重点关键词可以分散写在其他页面。付真真,陆伟(2009)认为选择关键词时候主要参考两个方面:关键词流行度和关键词竞争力。使用某关键词进行搜索时用户越多,说明关键词流行度越高。网站排名越靠前,说明该关键词的竞争力越强。任勇旗,唐毅(2009)认为选择关键词要从用户角度出发,注意关键词的拆分和组合,可以在核心关键词上加上地理位置、公司和产品名称相关的词汇构成长尾关键词[27].学者 Bih-Yaw Shih 等(2013)通过研究发现刚成立的网站,首先要选择恰当的域名和关键词,当网站 PR 值提高后,再增加更多关键词,使企业更加容易地提高关键词排名[28].
关于关键词密度的研究,Ravi Sen(2005)认为关键词密度在 2%-8%是比较合适的[29].焦丽等(2009)、任勇旗等(2009)认为关键词密度一般在 1%-7%较为合适,高于或低于这一标准都不好,优化过程中不能堆砌关键词。付真真,陆伟(2009)提出将关键词密度控制在 2%-8%对网站的排名是有好处的,过度使用可能会受到搜索引擎的惩罚。一般来说,在大多数的搜索引擎中,关键词密度在 3%-8%是较为适当的,不仅有益于网站的排名,还不会造成优化过度(魏兆连,2010)。
关于关键词分布的研究,马晓玲等(2005)提出网站首页不可能包含所有要推广的关键词,要均匀地按照金字塔模式将优化主题关键词分布到网站中,主要分布部位包括 title 和 meta 标签、标题、超链接文本、URL 文本、页首、页尾和段首。马萌等(2008)提出不同位置的关键词,重要程度不一样。网页主体内容中的关键词权重次之网页标题中的关键词权重, Alt 属性、Meta 标签中关键词的重要程度要视具体搜索引擎而定。任勇旗,唐毅(2009)提出关键词可以用 b,strong 等标签加强体现,关键词分布要无所不在,但有所侧重。付真真等(2009)认为关键词可以放到网页代码 Title 、Meta 标签、超链接文本、图片 Alt 属性、网页正文最吸引注意力的地方,如页面靠顶部、正文前 200 字以内,以方便搜索引擎识别网站要重点突出的关键词和重要页面。
从关键词优化综述来看,选择关键词要站在用户角度,要考虑关键词的使用率和竞争性,可以考虑关键词的组合、拆分,与地区、品牌等进行组合,构建创造长尾关键词。要控制关键词的个数,选择 2-3 个核心关键词来优化主页,剩下的相关关键词来辅助优化栏目页和内容页面(昝辉,2009)。Er.Tanveer Singh等(2013)建议每个页面放 2-3 个关键词,控制关键词密度。关键词要填充于整个页面的恰当位置,如 Title,Meta 标签,域名,一级、二级标题,链接文本,图片 Alt 属性等。
(2)Title 标签及 Meta 标签。Meta 标签主要包括 Meta Keywords 和 MetaDescription 标签。马晓玲等(2005)提出 Title 标签中要放置关键字,不要超过20 个汉字,尽量在描述中加入主要的关键字,Keywords 中只关注 1-5 个关键词。
陈炎龙等(2006)提出 Title 标签是网页中最重要的标签,放在其他 Meta 标签之前。Description 标签的字数在 150 字左右,尽量加入主要的关键词且靠近 Meta标签。Keywords 标签是一个隐藏的标签,除了搜索引擎,一般情况用户看不见。
相比于 Title 与 Description 标签,Keywords 标签显得不那么重要,因此仅在Keywords 标签中放上与页面内容相联系的关键词[30].Ali H.Al-Badi 等(2011)提出 Title 标签呈现在搜索引擎结果的列表里,Description 紧跟着 Title 出现[31].
从相关文献可以看出,Title 标签中要加入关键词,Meta 标签中也要加入关键词,但是要限制关键词的数量。魏兆连(2010)认为标题中只放 1-2 个关键词,描述中的关键词放 4 个最佳,对于刚建成的网站和中小型网站,绝对不能堆积关键词。Keywords 只加入与网页内容相关的关键词,最多包含 3-5 个最重要的关键词,不要超过 5 个。
(3)链接策略。马晓玲等(2005)提出网站内部链接要采用星型和树型的结构组合方式,网页间要互相连通,但一个页面中的链接应少于 100 个。在外部链接上,不与低质量的网站交换链接,与相同网页级别的网站交换链接最好以自己要优化的关键词作为锚文字。谭思云等(2008)认为网站内链建设可控性强,要适当增加网页内链数目来提高排名优势。首先确定要增加内链数目的重要网页,然后在网站中多建立一些与该网页内容相关的页面,并将新建页面的关键词链接导入到要增加内链数目的网页中,以方便搜索引擎识别网站中这些重要的页面,从而提高搜索引擎蜘蛛的爬行索引效率[32].任勇旗(2009)提出网站链接优化不仅仅包括导入链接,导出链接和内部链接优化也会对排名产生一定影响。其中导入链接是决定排名的关键,高质量的导入链接有一定的标准,如提供导入链接的网站外链页面在主流搜索引擎里有快照且收录 45 天以上,外链页面内容与导入链接优化网站内容相关等,一个页面的导出链接一般不要超过 15 个。
Er.Tanveer Singh 等(2013)认为网站要运用社交网络(Social Networking)加强互动,导入高质量的链接。Rajesh Singh(2013)提出交换链接是重要的优化技巧,要与内链、外链运用较好的网站来交换链接[33].
焦丽(2009)提出对搜索引擎来说, 决定一个网站排名的关键是高质量导入链接的数量,可以通过向搜索引擎目录提交网站、寻找网站交换链接的方法来增加导入链接数。导出链接和内部链接对网站排名也会有影响,但要控制一个页面导出链接数量不超过 15 个,首页的尽量不多于 10 个,网站要有意识的突出重要页面的链接,方便搜索引擎区分重要页面,进而重点收录。内部链接和导出链接中要使用锚文字,使得搜索引擎能抓取相应的关键词,提高在搜索结果显示的机率[34](昝辉,2015)。
(4)404 错误页面。张良瑛,张宇红(2011)提出 404 错误页面在搜索引擎中有重要的地位,搜索引擎蜘蛛遇到 404 错误页面时,便不再索引并将该网页从索引数据库中删除[35].Fuxue Wang(2011)基于百度搜索引擎收集了 116 家网站的网址进行研究,研究发现网页大小、客制化的 404 页面和全站链接是搜索引擎优化最有效的方法[36].Enge,E 等(2013)提到没有重定向时,会返回 404 错误。
有了重定向,搜索引擎蜘蛛就会从新的 URL 读取网页内容[37].李忆等(2014)提出了特别设计的 404 错误页面能提供更多信息,不仅有益于用户的上网体验,还有利于搜索引擎蜘蛛爬行。通过实证研究,证明了 404 错误页面正向影响百度收录数、百度权重和日均页面访问量,负向影响世界排名。昝辉(2015)提出了默认 404 错误页面和客制化 404 页面,并提出了客制化 404 页面的标准,如 404页面要保持与网站统一的模板,在最醒目的位置显示错误信息等。Deepali M Pati等(2015)提出网站出现 404 错误时,要将错误地址转向到正确页面[38].
(5)页面打开速度。马晓玲等(2005)提到要提高服务器响应速度,减少用户因网页迟迟无法完整显示而关闭网页离开的概率。毛冠嫱等(2011)认为页面大小不超过 15K 是加快网页下载速度的有效措施之一,页面显示速度快,减少用户等待时间,在一定程度上会增加用户的浏览量,对搜索引擎更为友好[39].
昝辉(2015)提出页面打开速度是影响自然搜索排名的直接因素之一。
(6)其他方面。网站应避免纯图像及 FLASH 风格的网站设计,多使用一些普通文本(陈炎龙等,2006)。马萌等(2008)提出为了给搜索引擎访问网站提供方便,应该建立站点地图,便于搜索引擎蜘蛛发现网站上有价值的网页和检索每个网页有效的关键词。何艳东等(2009)认为域名存在的时间长短对搜索引擎优化有影响,搜索引擎给予。gov,.edu,.org,.com 域名的权重要比一般域名的高的多,而。cn 的域名的权重相对较低。莫云峰(2009)认为网站内容,主机策略,网站代码优化,关键词,链接等是影响搜索引擎优化的有效策略[40].企业开展搜索引擎优化不仅要提高用户的体验,也要便于搜索引擎顺利抓取网站的基本信息,还要服务于网站运营维护人员,提高他们搜索引擎优化的意识,由此提出网站优化包括用户体验优化、搜索引擎优化以及网站运营维护优化[41](姚灵,2011)。认为。页面经常性地更新能提高排名或至少帮助保持排名,页面更新频率是影响搜索引擎蜘蛛返回网站抓取网页的因素之一(昝辉,2015)。
综上所述,关键词选择、关键词密度、关键词分布位置、Title 长度、Title中关键词的个数、Meta 描述长度、Meta 描述中关键词的个数、内部链接、导入链接、导出链接、404 错误页面、页面打开速度、域名、网站地图、网站内容及更新频率等都是进行白帽搜索引擎优化可以考虑的优化方法,这些方法会在一定程度上影响搜索引擎优化效果。
2.3 搜索引擎优化效果的测量。
国内外研究搜索引擎优化方法的学者很多,对于搜索引擎优化效果的研究特别是通过实证分析优化方法与效果的相对少些,已有研究主要是从网站的流量和非流量数据来衡量优化效果。
付真真(2009)提出搜索引擎优化效果的四种评价指标,分别是网站在搜索引擎中的排名、网站流量、PR 排名、第三方权威网站排名。其中,网站流量指网站的访问量,用于网站流量统计的三个主要指标是页面浏览量、独立用户数和IP 地址访问量。PR 排名指的是网页级别排名,是 Google 搜索引擎的核心排名算法。网页级别取值从 1 到 10,范围较小。权威网站排名是指 Alexa 世界排名和适用于中文网站的 China Rank 中国网站排名。本文是基于百度搜索引擎优化来进行的,想要准确反映不同排名网站的搜索引擎优化方法的不同,所以我们不考虑 Google 的变动幅度有限的 PR 排名。
Fuxue Wang(2011)研究分析了搜索引擎优化方法所带来的影响,搜索引擎优化方法主要包括四个方面:结构优化(主要有 404 错误页面、网站目录层级、页面尺寸的优化)、关键词优化(主要是关键词密度优化)、内容优化(主要是页面标题长度优化)和链接优化(包括内部链接和外部链接的优化)。搜索引擎优化影响主要从搜索引擎收录数量、独立 IP 的数量、PV 浏览量等方面来进行研究的,这些影响指标可以考虑作为实证研究中的因变量。
Eric Enge(2013)站在搜索引擎优化从业人员的角度分析,提出在优化之前要先确定网站的基准数据点。主要数据点有:按照搜索引擎和关键词分类,量化自然搜索流量;按照搜索引擎分类,量化带来流量的主要关键词;识别表现不佳的页面;确实索引页面数量;如果出现 404 错误,识别相关页面和链接到这些页面的外部网站。在优化过程中捕捉优化数据,如排名、访问次数、反向链接数、关键词规则、网站总流量等。将基准数据和优化数据进行比较,可以很好的形成搜索引擎优化效果比对,从而合理的调整优化方法。搜索引擎优化不仅会影响中间变量如排名、索引数量等,还会影响业务目标销售额、成本和回报等。
昝辉(2015)提出 SEO 效果数据监测分为非流量和流量两部分。非流量数据主要有搜索引擎收录数(包括网站总收录页面数、特征或典型页面收录数、各分类下产品页面收录数、有效收录页面数)、排名(关键词排名,主要监测首页、分类页面、典型最终产品或文章页面的关键词排名)、外部链接数、转化和销售。
以谷歌流量分析软件为统计工具,提出了用户数(某段时间内访问网站的实际人数)、浏览量、跳出率(指的是只浏览一个页面就离开的访问数占总访问数的比率)、流量来源(分别记录流量是来自直接访问、点击流量还是搜索流量)等流量分析指标。研究记录搜索引擎优化数据,除了验证优化效果,为其他部门提供数据外,最重要的是能发现问题,改进搜索引擎优化方法。分别记录流量和非流量数据是对搜索引擎优化效果较为全面的检测,对接下来的实证研究有很强的指导意义。
冯英健(2013)提出搜索引擎营销的目标层次分别是存在层、表现层、关注层和转化层。存在层的基本目标是提高网站的相关网页在搜索引擎中的收录数量,因为只有被搜索引擎收录,才有排名的机会(昝辉,2015)。表现层的目标是争取在搜索引擎搜索结果中获得靠前的排名,以吸引用户眼球。关注层的目标是增加流量,只有用户进到自己网站浏览查看,才有销售和转化的可能性。第四个目标是实现转化,达成销售。转化层是是各种搜索引擎方法所实现效果的集中体现,是前面三个目标层次的进一步提升。但是转化层不好控制,容易受到多种因素的影响,因此,要将重点放在属于策略范畴的前三个层次上。
自然排名的搜索引擎优化属于搜索引擎营销,所以搜索引擎优化的效果层次与冯英健提出的搜索引擎营销目标层次基本一致。但是转化和销售并不受搜索引擎优化控制,更多的是受制于产品本身质量、价格、客服水平、运营能力、品牌知名度等因素(昝辉,2015),所以在衡量搜索引擎优化效果时候,不考虑转化环节,主要是三个方面:收录数、排名和访问量。王彦辉(2012)分析了内外部链接和搜索引擎收录的关系[42].蒋继娅等(2010)通过实证研究了搜索引擎优化技术对中国网站排名和 Alexa 网站排名的影响。他们提出评定网站优化情况好坏的最大衡量目标就是网站流量。借助第三方检测工具反映网站的访客情况,及时地了解访客的兴趣点,辅助管理员对网站内容进行调整和优化,符合用户的搜索需求,将网站访问者转化为真正的目标客户,进而成为网站的忠诚客户[43].
2.4 本章小结。
本章节主要是从四个部分进行文献综述的。第一部分是简单阐述了国内外搜索引擎优化的研究现状,搜索引擎优化在国外研究较早,发展较为成熟。国内发展晚,较之国外研究还不够成熟,不够专业,并且搜索引擎优化行业存在着一定的问题。第二部分综述了搜索引擎优化的概念,主要从优化的依据、优化方法和优化目的三方面来定义的。第三部分综述了搜索引擎优化的方法,主要包括黑帽、白帽和灰帽优化方法。白帽方法是被认可的,重点从关键词,Title 标签及 Meta标签,链接策略,404 错误页面,页面打开速度等方面来综述白帽方法。最后阐述了搜索引擎优化的效果测量指标,主要是从在搜索引擎中的收录量、网站自然排名、网站访问量等几方面来进行检测等。本章的文献综述为变量选取和模型构建提供了很好的理论支撑和借鉴意义。