今天,有一位博友问我:为什么在SEO工具里查自己网站关键词的排名都在100名以后,但是在百度搜关键词时有很多词却在首页?我经过对比才发现,原来百度快照收录的是他不带www的域名,而他在站长工具里查询的时候是输入带www的域名。
于是,很多做SEO的朋友会有个疑问,对于同一个网站来说,访问也都是相同的,跳转的都是一个网站,为什么域名带www和不带www的排名会有差距?收录相差也会很大,原因在哪里呢?
网址前面为什么要加WWW-马海祥博客
WWW(World Wide Web)简称3W,有时也叫Web,中文译名为万维网,环球信息网等,WWW由欧洲核物理研究中心(CERN)研制,其目的是为全球范围的科学家利用Internet进行方便地通信,信息交流和信息查询。
1、什么是WWW
首先我们要搞明白,什么是www?当大家习惯性地在访问一个网站的时候输入“www.”的时候,大家有没有想过到底什么是www呢?
凡是上网的人,谁不知道“WWW”的重要作用?要输入网址,首先得打出这三个字母来,这三个字母,就是英语的“World Wide Web”首字母的缩写形式,“WWW”在中国曾被译为“环球网”、“环球信息网”、“超媒体环球信息网”等,最后经全国科学技术名词审定委员会定译为“万维网”。
那都是很久以前的事情了,那个时候我们的互联网还很稚嫩,不同的服务需要不同的工具来完成,不像现在基本上所有服务都能够通过浏览器来搞定。
那个时候,Internet提供的主要服务有万维网(WWW)、文件传输(FTP)、电子邮件(E-mail)、远程登录(Telnet)等,说白了,那个时候的www(World Wide Web)是标识这是一个需要你用浏览器来访问的网页服务,而不是需要你用telnet访问的bbs,或者ftp工具访问的文件传输服务,所以那个时候,网站主页的域名前面要用www。
说到这里,想起来一件趣事,去年的时候,我给马海祥博客网站做改版的时候,我建了个测试网址用的是http://ww.mahaixiang.cn,把测试地址发过去让他们看看,居然有人问我:“你是不是打错了?哪儿有两个ww开头的网址?”我顿时大囧,问:“你不觉得http://ww.mahaixiang.cn、http://www.mahaixiang.cn和seo.mahaixiang.cn其实是一个道理吗?”对方回答:“seo.mahaixiang.cn是二级域名,而http://www.mahaixiang.cn是一级域名。”我听了以后无语了。
关于什么是一级域名域名什么是二级域名,Michael F Liu帮助我们解释的很清楚:
首先,你得明白域名的一些原理,域名是分层次(hierarchy)的,从右到左,域名从高层到低层,比如说我们国家的.cn域名就是最高一层的顶级域名,而 http://mahaixiang.cn这种域名就是一个二级域名,如果是www.mahaixiang.cn这种形式的域名,实际是已经是三级域名了。
那么,为什么现在互联网上多见的域名都是www.mahaixiang.cn这种形式的呢?
说起来,这其实是一个历史遗留的问题,互联网的初期,能上网的都是大公司,大公司的服务器当然是比较忙碌的,电子邮件、文件、 FTP ,当然还有HTTP,多种服务都得提供,一台服务器肯定是不行的,所以他们就把不同的任务交给不同的服务器去处理,为了区分,就用上了不同的子域名,也就是我们现在看到的www.mahaixiang.cn,ftp.mahaixiang.cn,mail.mahaixiang.cn等等的子域名形式。
时代在发展,科技在进步,原来需要多台服务器才能完成的任务,现在只需要把任务分布到多台服务器上就行了,不必非得用子域名来区分,比方说Google,在http://google.com这个域名背后有无数的服务器支持着运行,现在继续用子域名,纯粹是为了给用户方便了。
2、WWW万维网工作原理
当年人们对于www的定义是:WWW是建立在客户机/服务器模型之上的,WWW是以超文本标注语言(标准通用标记语言下的一个应用)与超文本传输协议为基础,能够提供面向Internet服务的、一致的用户界面的信息浏览系统,其中WWW服务器采用超文本链路来链接信息页,这些信息页既可放置在同一主机上,也可放置在不同地理位置的主机上;本链路由统一资源定位器(URL)维持,WWW客户端软件(即WWW浏览器)负责信息显示与向服务器发送请求。
world wide web是无数个网络站点和网页的集合,它们在一起构成了英特网最主要的部分(英特网也包括电子邮件、Usenet以及新闻组),它实际上是多媒体的集合,是由超级链接连接而成的,我们通常通过网络浏览器上网观看的,就是万维网的内容。
网址前面为什么要加WWW-马海祥博客
我们的互联网正是通过链接(http),创造了www(World Wide Web)这个新的世界,因为链接,一个网站哪怕再小,也不是一座孤岛;一个网站哪怕再大,也大不过互相链接的整个Web,两个Web页面跨网站的链接,让整个Web成为一个整体,并获得生命(具体可查看马海祥博客《HTTP服务的七层架构技术解析及运用》的相关介绍)。
链接成为Web上特有的一种礼仪,一段文字或一幅图片,它存在于哪里并不重要,重要的是,它存在,任何人都可以给它一个链接,也可以说,链接的出现,让Web成为一个公共领域。
然而在中国,我们的网络却充斥着slw(Self Limited Web)的气氛,新浪、搜狐、网易、百度的blog仍然无法通过Rss阅读器顺利订阅,网上无数需要被引用的图片被防盗链功能显示成一个大大的Logo,无数人每天不厌其烦的将同样的内容从一个网站复制到另一个网站,随意的关闭服务,更改内容链接地址,随意删除内容,让原有链接失效,还有那个根本不存在的伟大的墙……。
在这样的环境下,我们更需要时刻提醒大家,你们的“首页”域名之所以不用http://index.mahaixiang.cn,不用http://web.mahaixiang.cn,不用http://page.mahaixiang.cn而是用www.mahaixiang.cn这样的形式,那是因为你所创建的是一个World Wide Web。
3、WWW万维网的硬件组成
当你想进入万维网上一个网页,或者其他网络资源的时候,通常你要首先在你的浏览器上键入你想访问网页的统一资源定位符(Uniform Resource Locator),缩写URL,或者通过超链接方式链接到那个网页或网络资源,这之后的工作首先是URL的服务器名部分,被名为域名系统的分布于全球的因特网数据库解析,并根据解析结果决定进入哪一个IP地址(IPaddress)。
接下来的步骤是为所要访问的网页,向在那个IP地址工作的服务器发送一个HTTP请求,在通常情况下,HTML文本、图片和构成该网页的一切其他文件很快会被逐一请求并发送回用户。
网络浏览器接下来的工作是把HTML、CSS和其他接受到的文件所描述的内容,加上图像、链接和其他必须的资源,显示给用户,这些就构成了你所看到的“网页”。
(1)、客户机
客户机是一个需要某些东西的程序,而服务器则是提供某些东西的程序,一个客户机可以向许多不同的服务器请求,一个服务器也可以向多个不同的客户机提供服务,通常情况下,一个客户机启动与某个服务器的对话,服务器通常是等待客户机请求的一个自动程序,客户机通常是作为某个用户请求或类似于用户的每个程序提出的请求而运行的,协议是客户机请求服务器和服务器如何应答请求的各种方法的定义。
WWW客户机又可称为浏览器,通常的环球信息网上的客户机主要包括:IE,Firefox,Safari,Opera,Chrome等,在Web中,客户机的任务是:
①、帮助你制作一个请求(通常在单击某个链接点时启动)。
②、将你的请求发送给某个服务器。
③、通过对直接图象适当解码,呈交HTML文档和传递各种文件给相应的“观察器”(Viewer),把请求所得的结果报告给你。
一个观察器是一个可被WWW客户机调用而呈现特定类型文件的程序,当一个声音文件被你的WWW客户机查阅并下载时,它只能用某些程序(例如Windows下的“媒体播放器”)来“观察”。
通常WWW客户机不仅限于向Web服务器发出请求,还可以向其他服务器(例如Gopher、FTP、news、mail)发出请求。
(2)、服务器
WWW万维网的服务器具有以下功能:
①、请求的合法性检查,包括安全性屏蔽。
②、针对请求获取并制作数据,包括Java脚本和程序、CGI脚本和程序、为文件设置适当的MIME类型来对数据进行前期处理和后期处理。
③、审核信息的有效性。
④、把信息发送给提出请求的客户机。
⑤、如果服务器不在80号端口,而在其它端口(例如8080)等待用户连接,此时WWW将失败,客户端需要更改连接的端口。
另外,有些机构的网关具有网址过滤功能以禁止访问某些网站,会导致失败,此时可以试用代理服务器去访问被禁止的网站。
4、为什么非要加WWW?
不加www的裸域名好处主要是域名更加简短、容易记忆,坏处就多了,讲几个主要的技术原因:
(1)、裸域名只能绑定DNS的A记录,不能绑定CNAME记录
也就是说你不能把裸域设定为另外域名的别名,很多时候这对管理不是很方便,特别是使用第三方托管服务的时候,如果第三方迁移服务器导致IP地址变更,你必须自己去更改DNS的A记录。
比如你的个人博客采用Tumblr的服务,如果使用裸域,你需要手动将你域名的A地址指向Tumblr指定的IP地址,Tumblr如果迁移了机房,所有通过这种方式设定个人域名的用户都必须更改自己的DNS才能继续使用,否则服务就会中断,使用子域名的CNAME记录就相对简单很多,只需要将www子域名的CNAME字段指向这个域名,之后如果Tumblr更改IP地址,他们只需要重新设置这个域名的A记录,而无需要求每个用户去更改DNS记录。
这个技术上的限制导致许多大型的第三方服务商不支持使用裸域,典型的如Google的服务,现在都不能使用裸域,Google的服务用户基数大,不得不采用DNS级别的分布式,使用到的IP地址太多,而且变动大,让用户绑定A记录的话不利于负载均衡,维护起来也是几乎不可能完成的任务,同理,大部分CDN也不支持裸域。
(2)、裸域的cookie的作用范围太大
假如知乎也采用裸域,那么知乎所有cookie的作用范围就包括http://mahaixiang.cn下的所有子域名,也就是说访问http://seo.mahaixiang.cn和http://app.mahaixiang.cn的时候都会带上http://mahaixiang.cn裸域页面设置的cookie,从安全、隐私、可扩展性、以及管理的角度而言,这对很多大型网站来说是不可接受的(关于cookie的影响,我曾在马海祥博客《基于Cookie信息的互联网精准广告定向技术研究》的一文中也跟大家做过详细的介绍)。
(3)、URL的正则匹配
如果带www前缀的并且以.com/.net/.org结尾的,通常成功的机会要大很多,这个你会在许多文本编辑器里面遇到,如果URL不是www开头,并且也不是三大顶级域名结尾的,匹配成功的概率就要小很多,这是使用过程中有时候会让人很抓狂的点,重不重要全看你的用途和场合了。
5、从SEO的角度分析带www和不带www的域名
严格来说,带www的是属于二级域名,不带www的属于一级域名,搜索引擎默认,这两个域名是指向同一个网站的,在搜索引擎收录和展示稳定下来后,它会选择其中一个域名来展示给用户,那么这个域名就叫做首选域。
(1)、我们推广时网址中带www和不带www有什么区别?
我们一般建议你确定好首选域,如果我们确定带www的网址为首选域,那么我们就要注意了,我们所有的推广网址都要做带WWW的链接,同样我们确定不带WWW为首选域,我们就要选择不带WWW为推广链接,而不要2个链接都推广,这样会导致权重分散。
(2)、带www和不带www的收录问题
很多SEOer反映的一个问题就是带WWW和不带WWW收录不一样,一般情况下不带WWW收录要多于带WWW的,这到底是什么问题呢?
首先不带www的是一级域名,而带www的是二级域名,一级域名的权重肯定比二级域名高,所以有时候就会出现这种情况,不带www的收录远远高于带www的,而关键词排名,不带www的自然也高于带www的,当然,这个对站长们来说是没有太大影响的,因为这两个域名都是跳到你的网站。
所以,我不太建议大家总是纠结于不带WWW和带WWW的收录问题,因为你纠结根本就没有用,因为不带WWW的网址我们几乎不会去碰他(指优化),因为我们不去优化他,也不给他增加外部链接,甚至内容链接也不会去增加,那又谈什么影响呢?说实在的,不带WWW一般情况下是不会去参与关键词排名的,所以你不用去纠结他,我们的首选域优化一般是带WWW的网址。
那又为什么不带WWW一般收录都比较好呢?其实这个问题不是收录问题,而是权重的影响问题,因为不带WWW处于的是正常收录状态,因为他没有受到外部链接和内部链接的权重下降的困扰,我们都知道,带WWW经常要受到外部链接的困扰,因为我们要用带WWW的来做关键词排名,所以,我们要努力为其增加外部链接和增加内部链接,所以矛盾就来了。
增加外部链接是有风险的,就拿友情链接来说吧,友情链接就是一个典型的风险问题,你链接我,我也链接你,那么就属于双向投票,只要其中一个网站降权,势必就会影响到对方,那么单向链接就没有风险了吗?非也!单向链接也有风险,单向链接一旦丢失就会造成降权,只要丢失的在合理的比例内还好,要是没有就会导致快照倒退,网站不收录,关键词排名下降等等风险,所以购买链接为什么容易降权就是这个道理。
当我们碰上网站不收录,百度快照停滞不前,而不带WWW快照和收录都良好的情况下,我们就应该要分析的是为什么你带WWW不收录,是不是链接出问题了,如果是就逐一的分析你的网站链接而不是去纠结带WWW和不带WWW的问题。
(3)、带WWW和不带WWW要不要做301转向?
那有的人要说,我就是想要www的域名收录靠前不行吗?这该如何做呢?通常我们会用301重定向技术,把权重转向带www的域名,这就是我们在平时访问网站时,明明输入的是不带www的域名,但进入网站后会自动跳转为带www的域名显示,这样经过一段时间后,权重慢慢就会转向于带www的域名了。
我们讲过URL标准化的概念,在搜索引擎看来,带www和不带www的URL是不同的两个URL,当它们指向同一个网站时,会让搜索引擎不懂应该选择哪一个URL作为主要的,所以,马海祥建议部分符合条件的主机采用301重定向进行URL标准化设置(具体可查看马海祥博客《301永久重定向的设置方法大全》的相关介绍)。
如果你的主机不支持301重定向,把首页的所有链接采用绝对地址的链接形式也可以很好解决这个问题。
带www和不带www的域名对搜索引擎是同等的,任意选择其中一个作为主域名,在内部链接和友情链接时,都使用主域名,这样不会使PR值分散。
所以,马海祥建议是要做301转向,这样有利于域名的唯一性,让用户能够记住我们的首选域,把非首选域301定向到首选域上是非常有必要的做法。