即时消息系统设计
stateDiagram-v2
客户端 --> 接入服务
接入服务 --> 客户端
接入服务 --> 业务处理服务
业务处理服务 --> 接入服务
业务处理服务 --> 存储服务
业务处理服务 --> 外部接口服务
外部接口服务 --> 业务处理服务
存储服务 --> 业务处理服务
- 接入服务:连接保持、协议解析、消息推送
- 业务处理服务:消息的存储、未读数变更、更新最近联系人等,这些内容都是业务处理的范畴
- 存储服务:账号信息、关系链,以及消息本身,都需要进行持久化存储
- 外部接口:消息推送接口 像苹果的APNs
收发架构
表结构
消息表:
- 消息id
- 消息内容
- 消息类型
- 消息时间
索引表:一般用于查询收发双方的历史聊天记录
- 索引用户id
- 索引另一方用户id
- 发信还是收信
- 消息id
联系人表:用于查询某一个人最近的所有联系人
- 索引用户id
- 索引另一方用户id
- 最新的一条消息id
通道
- 发:可以使用HTTP或者长连接发
- 收:自带的长连接推送或者手机厂商提供的推送服务
可用性
- 端口连通性:业界确认比较安全的端口基本上只有 80、8080、443、14000,其他端口都有被限制的风险
- HTTP隧道:一些组织的网络代理只允许通过 HTTP 协议访问外网
- 在代码写死兜底的一些连接IP点来兜底前面的所有端点发现失效的情况
接入速度
- IDC机房多线运营商接入
- 使用HTTPDNS来加快解析速度
- 动态测试可用节点,选出速度最快并配合后端选择负载最小的接入点
稳定性
跟业务强相关的逻辑应该下沉到更后端,接入点的功能应该更为技术纯粹,用户和连接的映射维护、通信协议的编解码、建连和断连逻辑处理、ACK 包和心跳包处理等
上行使用短连接,使上下行隔离能避免在下行压力大的时候消息发不出去,同时像图片、音频这种二进制流数据,也需要开辟新的连接来下载,避免阻塞核心通道
多媒体数据
出于性能与隔离考虑,先通过独立通道上传文件流,上传完成后会返回文件的唯一标识 ID,然后再把这个唯一标识 ID 作为消息的引用,通过普通消息收发通道进行发送
借助长连接通道,对体积较小的音频和缩略图进行实时推送,提升用户浏览和播放体验
对于一些私密性的视频,可以利用HLS自带的加解密功能,对于视频片段进行对称加密,再通过鉴权来获取密钥,对于其他音频、视频则就需要定制化开发播放器了
使用HTTP支持的Range头实现下边播和拖动快进
对于在消息会话里的图片,我们可以使用低分辨率的缩略图来显示,等用户点击缩略图后再去加载大图,并使用一些高压缩率的格式比如WebP来节省带宽
方式
- 短轮询:多用在用户规模比较小,且不愿花费太多服务改造成本的小型应用上
- 长轮询:适合对实时性要求比较高,但是整体用户量不大的场景
- 长连接:WebSocket、XMPP、MQTT,每种协议都有自己的局限性,所以IM一般都使用TCP构建自己的私有协议来满足自己的业务需求
可靠投递
重传不可达问题前,这个可靠投递可以参考消息队列的可靠投递方案
考虑重传不可达问题之后,就需要引入消息完整性校验,可以通过类似数据库事务并发控制的版本号来实现,本地维护一个最新版本号,每次拉取数据可以通过这个版本号来确定消息的完整性
时序性
为了保证相关消息之间的有序性,每条消息需要一个可以排序的id,这个id可以通过单点如redis自增生成,也可以使用一些分布式id生成算法如雪花算法来生成,值得注意的是,一般只需要保证消息在会话级别有序即可
为了避免乱序带来的影响,在本地可以直接根据这个id进行排序插入即可,但在服务端,为了避免一连串相关消息乱序带来的业务逻辑错误,可以将这一连串消息打包至同一个消息包,然后再进行排序处理
未读数
在消息未读数的实现上,一般需要针对用户维度有一个总未读数的计数,针对某一个具体用户需要有一个会话维度的会话未读的计数
消息安全
- 传输安全:域名解析安全(HTTPDNS)、链路安全(TLS)
- 存储安全:账户密码安全(单向散列)、内容存储安全(端到端加密)
- 内容安全:指针对消息内容的识别和传播的控制(敏感词汇、图片识别、外链识别、OCR)
心跳机制
- 使服务端能清除知道哪些连接失效,及时清理掉
- 使客户端发现掉线,及时重连
- 使TCP连接保活
方式:
- TCP Keepalive
- 应用层心跳:可更灵活调控心跳间隔,在节省网络流量和保活层面优势更明显
多终端漫游
- 多端在线时,IM 服务端在收到消息后推给接收方的多台设备
- 离线消息主动拉取
- 通过版本号来进行增量离线消息拉取
- 一般针对离线消息的下推会采用整体打包的方式来把多条消息合并成一个大包推下去,同时针对合并的大包还可以进一步进行压缩
负载均衡与扩缩容
大部分情况下,发送都不容易是瓶颈,所以发送可以使用短连接,在进行消息投递时,有两种选择:
- 将消息精确投递到某个节点,这需要使用一个中央点来存储哪个客户在哪个节点
- 将消息投递到所有节点,节点内部维护状态决定是否要发送
客户端先通过一个入口调度服务来查询本次连接应该连接的入口 IP,在进行缩容时,可以通知LB不再接受新请求,等到差不多了,可以强制断开所有连接,让这些连接重新均衡到其他连接点
群聊系统
- 写扩散难度太大,业界针对群聊消息的存储,一般采取“读扩散”的方式
- 为实现只能看到加群后的消息,可以使用用户的加群时间过滤来实现
- 批量优化,由于大群一对多的特性,像消息发送、ACK回送等都可以积攒一定量或者时间来批量合并操作,减少性能消耗
- 同时由于大群的特性,最好也是使用节点内部维护状态维护状态的方式来进行消息投递,避免中央存储称为瓶颈