网站是如何识别每一个用户的?

摘要:用户在访问网站的时候,如何通过技术手段识别每一个用户?

  用户在访问网站的时候,如何通过技术手段识别每一个用户?

  不知道大家在访问网站的时候,会不会疑惑为什么我的所有信息都会被网站“看到”呢?比如说我上网的地理位置、点击了哪个页面、在网站停留了多长时间、花了多少钱等等。

  其实我们的所有操作都会被网站“看到”,也就是被统计起来;网站统计之后的数据就是大家常常听到的 UV、PV、Session 等等之类的网络术语(之后我会展开阐述各个概念)。

  但是作为一名求知欲旺盛的少年,怎么能止步于 What 层面,我们还要知道 Why and How。

网站是如何识别每一个用户的?

  网站是如何看到用户的问题,其实专业来讲,是用户识别的问题。接下来,我们一一来展开分析:

  一般而言,我们会使用 MAC Address、IP、Cookie、User Agent、Mobile Number、User ID、SIM ID、Email 作为识别用户身份的手段。这些方法都有各自的优劣,比如,移动端常用 Mobile Number、SIM ID 等来识别用户,网站常用 Cookie 来识别用户。而在此,我们也关注 IP 和 Cookie,重点阐述下两者的概念和优劣。

  因此,特将常用网站数据分析方面的概念整理出来,分享给大家。

  IP,Internet Protocol,独立IP

  IP 为计算机网络相互连接进行通信而设计的协议,是连接到网上的所有计算机网络实现相互通信的一套规则,我们每台可以上网的电脑都有一个 IP,且在全世界范围内是唯一的。因此 IP 的唯一性被用来作为网站表现的一个指标。

  插播插播:在向具体说明IP和Cookie的使用之前,先向大家介绍一个实用的工具 GA,知道 GA 是什么的小伙伴儿可以直接略过这段了。

  GA,即 Google Analytics,是 Google 提供的一个统计网站、App 等互联网产品数据的数据分析工具,可以对用户的年龄、性别、地理位置,PV、UV、访问时长、访问页面、跳出率、等指标进行统计,对分析网站或是 App 有很好的帮助作用。

  如果还是比较抽象的话,可以理解成国外的百度统计——当然百度统计要比 GA 开发的晚得多了。

  之前做过网站站长或是App运营的人可能使用过这个工具,但由于 Google 如今退出中国,可能有很多小伙伴儿们不太清楚 GA 是什么,因此插播此段。

  GA 不使用 IP 地址来识别访问者的身份,但是会追踪每个访问者的 IP 地址信息,且整个追踪过程是在 Google 服务器端完成的,不会在 GA 的返回数据中看到。

  那么 GA 统计 IP 地址的意义仅是用来识别访问者的地理位置信息。这个地理位置信息会以地图的方式展现给我们,告诉我们用户活跃的大致位置。

  Cookie,浏览器缓存

  Cookie refers to an HTTP cookie, which is a small piece of data sent from a website and stored on the user’s computer by the user’s web browser

  while the user is browsing. At the same time, it also called a web cookie, Internet cookie, browser cookie, or simply cookie.

  网站为了辨别用户身份,追踪 session 等数据跟踪而预先储存在用户本地终端上的通常经过加密的数据。Cookie 是网站以一小段文本的形式存放在用户本地终端的信息,以便网站之后的读取,基本能够唯一对应到用户的访问终端,但要预先写入访问终端,同时还是在用户允许使用 Cookie 的前提下。

  听起来 Cookie 也有劣势,那为什么我们要放弃使用 IP 的统计而转向使用 cookie 的方式呢?

  

 

  当用户使用客户端第一次访问某个网站服务器时,比如 Baidu.com,那么 Baidu.con 的网站服务器就会预先写入一段 Cookie 到客户端上。GA 通过随机数和时间戳来生成字符串来唯一标识用户,且还会记录一些访问信息,比如访问的页面、访问的时间等,而当我们再次访问 Baidu.com 的时候,服务器会直接找到 Cookie 信息,更新一些访问信息,但是并不会更改唯一表示的用户信息。

  之后也会使用 Cookie 对用户的 session、UV、PV 等数均进行统计,也就是生成了大家平日里常见的数据指标了。显而易见,Cookie 比 IP 更准确,这也就是为什么网站现在都使用 Cookie 来识别用户了。

  那么问题来了,网站是如何通过 Cookie 来识别用户身份的呢?

  作者:产品美景,公众号:产品美景,带你领略产品的美~

  本文由 @产品美景 原创发布。未经许可,禁止转载

  题图来自 Unsplash ,基于 CC0 协议