原始内容只有 4 条排查动作,这里把它整理成一条更容易回看的最小链路。
1. 先做一次受控重启
第一步先重启相关服务,主要不是为了“碰运气恢复”,而是为了减少历史长连接干扰判断。
这一步想解决的问题是:
- 是否有旧连接长期不释放
- 当前现象是不是被历史状态放大了
2. 先从日志确认请求有没有进来
原始记录里写的是“排查 log 调用接口”,回看时可以理解成:
- 先确认流量是否真的到达入口
- 先找到对应接口、模块或网关层的调用日志
如果这一步就没有日志,后面的排查重点就更偏网络入口、路由或上游调用侧。
3. 用 netstat 看连接来源
netstat -antp
原始笔记里强调的是“查看 src ip”。
所以这一步的核心是确认:
- 连接是否真的建立
- 来源 IP 是否符合预期
- 是否存在异常来源或连接模式
4. 用唯一标识串起全链路
原始记录里保留了两个关键字段:
logidtimestamp
真正有价值的是这个排查思路:
- 先拿到一次确定有问题的请求标识
- 再按
logid、时间戳去查相关模块 - 对比链路在哪一段中断、超时或被丢弃
5. 最小回看版步骤
以后再遇到“流量像是下线了”的问题,可以先按下面顺序做:
- 重启服务,去掉历史长连接干扰
- 查入口日志,确认请求是否到达
- 用
netstat -antp看连接与来源 IP - 用
logid和时间戳串联各模块日志
FEATURED TAGS
Git
Cheat Sheet
Markdown
Tools
C++
Linker
Thread
Linux
TCP
Network
GDB
Debug
leetcode
链表
WSL
Ubuntu
Windows
Linux Kernel
GCC
Android
adb
Troubleshooting
Profiling
Sanitizer
glibc
MySQL
Database
Python
curl
Build
ELF
clang-format
CMake
Graphviz
Performance
vcpkg
Protobuf
排查
速查
内存
STL
调试
性能分析
性能
读书笔记
方法论
架构
网络
Timer
mbedTLS
TLS
安全
负载均衡
脚本
工具
LRU
二叉树
BST
中序遍历
回溯
二分查找
优先队列
排序
旋转数组
jenkins
部署