指标和维度的定义


第18章

Analytics

数据分析报表由以下指标和维度组成。

数据分析中的指标

指标是用来衡量维度特质的。举个例子,来源/媒介维度可能包括以下指标:

  • 访问数(Sessions )
  • 新访问占比(% New Sessions)
  • 用户数(Users)
  • 新用户数(New Users)
  • 跳出率(Bounce Rate)
  • 平均浏览页面(Pages / Session)
  • 平均访问时长(Avg. Session Duration)
  • 目标转化率(Goal Conversion Rate)
  • 目标完成数(Goal Completions)
  • 转化价值(Goal Value)

通常情况下,指标会出现在相应报表的数列中。

基础数据分析指标的定义

我们对基础数据指标的定义包括:

  • 页面浏览量(Page Views)
  • 访问数(Sessions)
  • 独立访客数(Unique Users)
  • 新用户数(New Users)
  • 老用户数(Returning Users)
  • 平均浏览页面(Page Views / Sessions)
  • 网站停留时间(Time on Site)
  • 跳出和跳出率(Bounces & Bounce Rate)
  • 转化数(Conversions)

页面浏览量-PV

当用户在你的网站浏览了一个页面就产生了1个页面浏览量(PV)。当这个用户在你的网站继续访问你网站的第二个页面,这时页面浏览量(PV)就变成了2。你的网站整体的页面浏览量是每个用户浏览量的累计之和。

用户 页面流量量-PV
User A 5
User B 2
User C 1
All Users 8

页面浏览量和独立访客是两个不同的概念。举个例子,用户A访问你网站的其中一个页面,然后关掉浏览器离开了网站。然后这个用户在30分钟内重复了这个动作4次(注意,用户只访问相同的页面),这里一共产生了5个页面浏览量(PV),但独立访客只有一位。

用户 PV Page 1 PV Page 2 独立 PV
User A 5 0 1
User B 1 1 2
User C 1 0 1
All Users 7 1 4

访问数

用户访问你的网站,无论他浏览了多少个页面,访问数都是1。

我们通过一些实例来说明访问次数是如何计算的,我们来看第一个场景:

  • 用户浏览你网站的某个页面,除此以外,没有进行任何其他操作,这时候访问数为1。
  • 用户使用浏览器访问你的网站,并在30分钟内没进行任何操作,那么30分钟后这次视为访问结束。
  • 注意,默认情况下,大部分网站分析工具会认为如果一个用户在30min或者更长的时间内都不活跃,那么在30min之后这一次访问将结束。
  • 30分钟后,用户再次打开浏览器回到你的网站,并且点击内链进入下一个页面,这被计算为一个新的访问。这时候,这个用户产生了2个访问。

我们来看看第二个场景:

  • 用户访问你的网站,点击并浏览了多个页面,这时候访问次数是1。
  • 我们把你的网站分析工具的系统时间设置为00h00,也就是第二天,这时候,网站上所有的用户访问都会到期。
  • 用户继续在你的网站上点击浏览更多的页面,这时候新的访问产生,访问次数变为2。

注意,访问次数有时也被称为访客数。

独立访客数

当用户第一次访问你的网站浏览了一个页面,被安装在你网站上的分析工具会在用户的浏览器(比如Chrome)上标记一个新的cookie。这时,独立访客是1。

几个小时之后,用户再次使用一样的浏览器(比如Chrome)访问你的网站。网站分析工具识别出此时的cookie与之前访问时的相同,这时,独立访客仍然是1。

直到几天以后,用户通过不同的浏览器访问你的网站(比如用火狐),网站分析工具会在火狐浏览器上标识为不同的新cookie,这时,这个访客被重新标记为独立访客。

现在你的数据分析报表中的独立访客为2,虽然是同一个用户在一天内多次访问你的网站,但是使用的是不同的浏览器。

新用户数

当用户访问第一次访问你的网站并浏览器了多个页面,安装在你网站的分析工具会在用户浏览器(比如Chrome)上标识为一个新cookie。这时,独立访客是1,新用户也是1。

几个小时之后,这个用户再次使用同样的浏览器(比如Chrome),网站分析工具识别出此时的cookie与之前访问时的相同,这时,独立访客仍然是1,新用户也是1。

这时,第二个用户第一次访问你的网站,你的网站分析工具在用户浏览器(比如火狐)标识为一个新cookie。这第二个用户被计算为一个新用户。

现在,你网站的新用户一共是2个。

老用户数

当用户第一次访问你的网站并浏览了某个页面,安装在你网站的分析工具会在用户浏览器(比如Chrome)标识为一个新cookie。这时,独立访客是1,老用户是0。

几个小时后,这个用户再次通过同一个浏览器(比如chrome)访问你的网站,网站分析工具识别出此时的cookie与之前访问时的相同,这时,独立访客仍然是1,老访客变成1。

平均浏览页面(PV/访问数)

平均浏览页面是页面浏览量(PV)和访问数的百分比,是我们在数据分析中经常被使用的指标。

举个例子,一个电子商务网站的PV/访问次数在正常情况下在8至9之间(比如是8.2)。这个比例是我们衡量这个网站用户行为的基准指标。

我们通过对网站做出的一些调整,比如减少购买漏斗中的步骤,第二天平均浏览页面变为了6.7。如果这个指标的变动超过1.0则被视为非正常波动。当然,如果你能弄清楚指标波动背后的原因,这也是可以接受的。

另外一个例子是,如果你的网站没有做任何大的调整但昨天的平均浏览页面却下降剧烈(比如从6.7下降到5.0,波动已经超过了1.0),这时你可能需要分析每个主要流量来源下的平均浏览页面。你可能会发现某个可疑的流量来源(比如某个广告渠道)。前天的平均浏览页面是6.0,但是昨天却突然变成了1.5,你可以怀疑昨天来自某个广告渠道的流量存在作弊或者机器人流量。

网站停留时间

我们用一个例子解释网站停留时间。

用户在21:10:00访问页面A,在21:10:20访问页面B,然后在21:10:50访问了页面C,除此以外,这个用户在你的网站上没有任何其他动作。

这个用户在页面A的停留时间为21:10:20 – 21:10:00 = 20 秒

这个用户在页面B的停留时间为21:10:50 – 21:10:20 = 30秒

但是这个用户在页面C的停留时间是未知的。准确的时间是这用户关掉浏览器退出你网站的时间,但这个动作没有被你的网站分析工具记录下来。

所以,网站停留时间是用户访问页面A加上访问页面B的时间,一共是50秒。

跳出和跳出率

让我们用一个例子说明什么是跳出以及跳出率。

当用户登录你网站其中一个页面并没有做任何其他操作,然后通过关闭浏览器离开了你的网站,这就算一个跳出。此时,跳出次数为1,访问次数为1。

第二个用户登录你网站的其中一个页面,点击内链进入网站的下一个页面。然后他离开了你的网站。这个用户的跳出为0,访问次数为1。

现在你的网站跳出次数是1,访问次数是2,跳出率为跳出次数与访问次数的百分比。

跳出率 = (跳出次数 / 访问次数) x 100%

所以,跳出率为50%。

转化

转化是指用户在你的网站上发生的某个动作。

举个例子,网站上的注册可以被称之为转化。你的网站分析工具可以配置跟踪用户注册。你的网站提供一个表单给用户填写,字段包括用户姓名、地址等。用户完成填写并提交表格。用户提交完成后将会来到一个写着“填写完成”的注册成功页,这就完成了一次转化。

数据分析中的维度

维度告诉你网站的用户属性。举个例子:

  • URL:页面、着陆页、退出页、上一页、主机名等
  • 流量来源:来源、媒介、活动关键词、引荐路径等
  • 地理位置:国家、地区、城市等
  • 设备:移动、桌面、平板电脑等

当用户访问你的移动网站,他可能会存在以下属性或者值:

  • 性别:女
  • 年龄:35-44
  • 城市:纽约
  • 来源/媒介:谷歌/自然流量
  • 关键词:中文移动端SEO白皮书
  • 浏览器: Chrome
  • 设备类别:移动
  • 操作系统:Android

通常,维度在数据分析报表中用行来展示。

基础分析维度的定义

我们进行数据分析的基本维度包括:

  • 页面(Pages)
  • 着陆页(Landing Pages)
  • 退出页(Exit Pages)
  • 流量渠道(Traffic Channels)
  • 流量来源(Traffic Sources (or Referrers))
  • 计划(Campaigns)
  • 关键词(Keywords)

页面

页面(或者叫网站页面)通常是网站分析中最小的维度,页面用URL(网站地址)定义。

举个例子,一个网站的首页example.com通常是这样的:

www.example.com/ 或 www.example.com/index.php

例如,其他页面可以是这样:

www.example.com/fruits/ 或 www.example.com/fruits/index.php

页面浏览量的指标可以被关联为一个页面,比如页面A昨天有30个页面浏览量。

着陆页

着陆页是一个网站页面,对于一个用户在你网站上产生的访问数来说,着陆页就是用户进入你网站的入口,并可以识别是哪个流量来源(比如直接流量、谷歌自然流量或者其他来源)。

访问数的指标能被关联为一个着陆页,举个例子,在所有的流量来源中,着陆页A(m.example.com/fruits/)昨天的访问数是50。

访问数也能被关联成着陆页里的流量来源,举个例子,着陆页A(m.example.com/oranges/)在直接流量中的访问数是20。

退出页

退出页是用户离开你的网站前(通过关闭浏览器)访问的最后一个页面。

流量渠道

流量渠道是在某个细分类别下的多个流量来源的总和。最主要(也是最常用的)的流量渠道有:

  • 直接流量 – 无引荐来源。
  • 搜索引擎(自然流量和付费流量)- 由搜索引擎(比如谷歌)带来的流量。搜索引擎渠道进一步细分为自然流量(比如谷歌自然流量)和付费搜索流量(比如谷歌付费搜索)。
  • 引荐流量 – 引荐流量是指由搜索引擎以外的其他网站(比如新浪)带来的流量,这里不包括社交网站带来的流量。
  • 社交网站 – 由社交网站带来的流量(比如Facebook)。
  • 其他 – 当一个流量不能计入以上渠道时,就会被计入其他流量。

流量来源

流量来源是流量渠道的子类别,让我们用下面的例子说明:

  • 谷歌自然流量 – 谷歌自然排名带来的流量是自然搜索流量。谷歌自然流量是自然搜索流量渠道下的流量来源。
  • 谷歌付费流量 – 谷歌付费推广带来了付费搜索流量。谷歌付费流量是付费搜索流量渠道下的流量来源。
  • Chinamobileseo.com – 对于流量渠道而言,这个属于引荐流量渠道下的流量来源。Chinamobileseo.com是实际的流量来源。
  • Facebook – 对于流量渠道而言,这个属于社交网站流量渠道下的流量来源。Facebook.com是实际的流量来源。
  • 直接流量 – 你可以在数据分析工具后台的直接流量报表(或者是none的细分下)中看到这个流量来源。

计划

计划经常被用于广告的子维度。举个例子,在谷歌付费搜索账户里你可以命名“品牌关键词计划”、“通用词关键词计划”。另外一个例子,你可以在Facebook推广渠道中命名“大学生计划”。

关键词

如果用户是通过搜索引擎渠道来的,关键词数据将会记录在你的网站分析工具中。

用户可以通过自然搜索和付费搜索进入网站,当你在搜索引擎推广账户中给URL打完标签,这时通过付费搜索渠道来的用户的关键词数据将会记录在网站分析报表中。

如果用户是通过自然搜索来的(主要是谷歌或者Bing),你的网站分析工具将无法展现任何关键词数据。这并不意味着用户在谷歌或者bing没有进行关键词搜索。谷歌、bing等搜索引擎对搜索结果页面进行了https加密处理,这意味着关键词数据不会被传输给网站分析工具。

指标和维度构成数据报表的实例

你的报表如果要有意义,一个指标必须要分配给一个维度。举个例子,在指定日期下:

  • 移动设备[维度]获取了1000个访问[指标]
  • 直接流量[维度]创造了25个转化[指标]
  • 首页[维度]获取了5000个PV[指标]


数据分析技术白皮书在2016年11月正式出版。

英文版:Definitions of Metrics and Dimensions – 繁体中文版:指标和维度的定义







数据分析技术白皮书上的内容按下列许可协议发布: CC Attribution-Noncommercial 4.0 International

Gordon Choi's Analytics Book