Job Database

Posted: **Tue May 20, 2025 11:22 am**

对于 WhatsApp 这种全球性的、高并发的即时通讯应用，时间戳字段的数据类型选择和时区处理是至关重要的设计考量。最推荐且最可能被 WhatsApp 采用的方案是使用 Unix 时间戳（毫秒级精度），并且在数据存储层面完全避免时区问题。

1. 时间戳字段的数据类型：BIGINT
数据类型： BIGINT (64位整数)
存储内容：存储Unix 毫秒时间戳 (Unix Millisecond Timestamp)。
Unix 时间戳定义为自协调世界时（UTC）1970 年 1 月 1 日 00:00:00 以来经过的秒数。毫秒时间戳则是精确到毫秒。
为什么选择 BIGINT 和毫秒级 Unix 时间戳？
与时区无关 (Time Zone Agnostic)： Unix 时间戳是一个绝对时间点，不包含任何时区信息。无论服务器部署在哪里，无论用户身处哪个时区，它都表示同一个全球统一的瞬间。这对于分布式系统和全球用户群至关重要，避免了因时区转换带来的复杂性和错误。
精确度：毫秒级精度足以满足即时通讯场景的需求。在并发量极高的情况下，秒级时间戳可能导致同一秒内有多条消息，使得排序和唯一性判断变得困难。毫秒级精度提供了更精细的事件排序能力。
计算简便：整数类型的 Unix 时间戳非常适合进行时间间隔计算、比较和排序。数据库对整数的索引和操作效率也极高。
存储空间小：相对于复杂的日期时间字符串或数据库原生的日期时间对象（它们可能占用更多字节或需要额外的解析），BIGINT 占用固定的 8 字节空间，效率高。
跨平台兼容性：几乎所有编程语言和数据库系统都 塞浦路斯 whatsapp 数据库 原生支持 Unix 时间戳的生成、解析和转换，互操作性好。
避免 Y2K38 问题： INT (32位) 类型的 Unix 时间戳在 2038 年会发生溢出，而 BIGINT (64位) 可以支持到数千亿年，完全消除了这个顾虑。
2. 时区问题的处理策略：集中在客户端和服务端转换
在存储层面，WhatsApp 几乎肯定会避免直接处理时区。时区转换和本地化显示的工作会推迟到应用程序层面（客户端或服务层）。

数据库存储：所有时间戳在数据库中都统一存储为UTC 时间的 Unix 毫秒时间戳。数据库不执行任何时区转换。

发送方客户端：

客户端获取设备的本地时间。
客户端将其转换为 UTC 时间的 Unix 毫秒时间戳。
将此 UTC 时间戳随消息一起发送到服务器。
服务器端：

服务器接收到客户端发送的 UTC 时间戳，并直接将其存储到数据库中。
服务器自身也应始终使用 UTC 时间来处理所有时间相关逻辑（如消息排序、状态更新），避免服务器自身的时区设置造成混淆。
接收方客户端：

客户端从服务器（或本地数据库）获取 UTC 时间的 Unix 毫秒时间戳。
客户端获取用户的本地时区设置。
客户端将 UTC 时间戳转换为用户本地时区对应的日期和时间，然后显示给用户。例如，如果用户在东京（UTC+9），时间戳 1716183600000（表示 UTC 时间 2024-05-20 12:00:00）会被显示为 2024-05-20 21:00:00。
“最后上线时间” (Last Seen) 的隐私和显示：

last_seen_timestamp 同样以 UTC Unix 毫秒时间戳存储。
当显示给用户时，会根据查看用户的本地时区进行转换。
隐私设置（例如，“不显示最后上线时间”）在数据检索和发送给客户端之前进行过滤，而不是在存储层面进行时区处理。
3. 多个时间戳字段
一条消息通常会包含多个时间戳，每个都有其特定的含义：

timestamp (或 sent_timestamp)：消息在发送方设备上创建/发送的时间。
server_received_timestamp：消息被服务器接收的时间。这个时间戳对于服务器内部的排序、日志记录和事件处理非常重要，因为它代表了服务器的“权威”接收时间。
delivered_timestamp：消息成功送达接收方设备的时间。
read_timestamp：消息被接收方阅读的时间。
所有这些时间戳都会以 BIGINT 类型存储为 UTC Unix 毫秒时间戳。

总结
WhatsApp 会选择 BIGINT 类型来存储毫秒级的 Unix 时间戳，这是处理全球范围内实时消息传递的最佳实践。这种方法从根本上消除了数据库层面的时区复杂性，将所有时区相关的转换逻辑推迟到应用程序的客户端侧，从而确保了数据的一致性、可扩展性和准确性。

Job Database

时间戳字段使用什么数据类型？考虑时区问题吗？

时间戳字段使用什么数据类型？考虑时区问题吗？