TECHNICAL DOCUMENT
我们怎么看官网访问量
这一篇是给家长看的诚实说明。 我们承诺过 Tortoise App 里”数据都在你的手机里, 我们不上传云端”。 那这个官网呢? 我们要不要看访问量? 怎么看? 这一篇讲清楚。
简单答案: 看, 但是只看服务器自己的日志
我们用一种叫 GoAccess 的开源工具。 它的工作方式: 读我们自己服务器上 nginx 自动记录的访问日志 — 跟你浏览任何网站时, 服务器都会记的那种日志一样。我们不在网页里塞任何东西。
具体说:
- 我们不放 cookies — 不会有”Tortoise 网站”的 cookie 进到你的浏览器
- 我们不注入 JavaScript 跟踪 — 你打开开发者工具看 Network, 看不到任何上传统计数据的请求
- 我们不接 Google Analytics / 百度统计 / Cloudflare Analytics — 你的浏览信息不会离开我们的服务器, 更不会去到第三方
- 我们没有第三方 SDK — 整个网站只有静态 HTML/CSS/图片, 没有别的
我们能看到什么
我们的服务器只能看到这些 (因为这是网络协议的基本信息, 任何网站访问都不可避免):
- 今天有多少人访问 (按 IP 数算独立访客)
- 大家看了哪几页 (/ /story /docs/public/16 之类)
- 大致来源 (从哪个国家, 用什么浏览器)
- 页面是否打开成功 (200 OK 还是 404 NotFound)
- 谁分享过链接 (Referrer 字段, 你从微信发出来的话我们不知道是微信, 那不会传)
我们看不到的
- 你的姓名、邮箱、电话、设备号 — 这些网站访问根本不传, 想看也看不到
- 你在网页里的鼠标移动、停留时长、点击位置 — 这些需要塞跟踪 JS 才能看, 我们没塞
- 你的浏览历史 (在其他网站做了什么) — 这是 Google Analytics 那种第三方才能跨站跟踪, 我们没接
- 你两次访问之间是同一个人吗 — 因为没有 cookies, 我们看不出来。每次访问对我们就是一个独立的 IP, 同一个人换 wifi 就成两次
为什么我们这么做
因为我们 App 里跟家长说 “数据都在你的手机里”。 那如果我们官网装一堆 Google Analytics、百度统计、热力图、用户行为分析 — 你打开官网了解我们, 反而第一时间数据先被上传到 Google 和百度去 — 这是自己打自己脸。
我们不愿意这样。 GoAccess 是免费的、开源的、跑在我们自己服务器上的, 它就只是把 nginx 本来就在记的日志整理成图表给我们看。它不会主动联系你的浏览器, 也不会把数据发到任何第三方。
你能验证吗
能。
- 在浏览器打开开发者工具 → Network 标签 → 刷新 https://serpilo.com — 看所有网络请求, 你只会看到我们自己域名的请求 (HTML/CSS/图片), 不会看到任何 google-analytics.com / hm.baidu.com / static.cloudflareinsights.com 之类的请求
- 在浏览器打开开发者工具 → Application → Cookies → https://serpilo.com — 应该是空的
如果将来某天我们改主意要装第三方统计, 我们会在 footer 或这篇文档里说清楚, 不会偷偷上。
我们用这些数据做什么
主要是看:
- 哪几篇文档孩子和家长真的在看 — 帮我们决定写哪些
- 哪几页 404 了 — 帮我们修死链
- 哪个国家来的家长多 — 帮我们决定先翻译哪些篇
- 今天到底有几个人来 — 简单看看产品有没有人关心
我们不用这些数据:
- 不卖给任何人
- 不用来”个性化” 网页 (网页对所有人显示一样)
- 不跟广告系统对接 (官网没广告)
- 不跟用户行为画像系统对接
给家长一句话
如果你看了这篇仍然不放心, 可以用一种最简单的方式访问我们: 在浏览器无痕模式里打开 https://serpilo.com 。这跟普通访问的区别也就是: 你关掉浏览器后, 浏览器自己会清空, 我们这边看到的还是一个独立的 IP, 一样的信息量。
想了解我们对你 (家长) 隐私的整体承诺 → App 权限申请详解 想看孩子的屏幕时间数据是怎么处理的 → 温柔引导