core dump 调试技巧

开启 core dump 前先确认磁盘空间、权限和落盘目录。生产环境不要无脑全局开启 unlimited，否则连续崩溃时可能把磁盘写满。

先开启 core dump

当前 shell 临时开启：

ulimit -c unlimited

临时指定 core 文件命名规则：

sudo sysctl -w kernel.core_pattern=/tmp/core-%e-%p-%t

不要直接把 core_pattern 指向业务二进制目录或 root 私有目录，除非你已经确认对应服务账户有写权限、目录可清理，而且不会把敏感数据长期留在错误位置。需要持久化时，优先写入 /etc/sysctl.d/*.conf 后再 sysctl --system。

适合先快速确认大致崩溃位置。

如果系统开启了 dmesg_restrict，普通用户可能看不到完整日志，这时更适合直接拿 core 文件进 gdb。

当程序在崩溃前会进行复杂的文件、网络或进程调用时，strace 能帮助你看到最后几个系统调用，再配合 addr2line 缩小范围。

如果没有稳定复现的 core 文件，最实用的仍然是：

很多线上崩溃最终并不是靠“单步调试”解决，而是靠复现条件和日志上下文定位出来的。

gdb /path/to/program /path/to/core-file

进入 gdb 后常用命令：

bt
frame 0
info locals
info args
thread apply all bt

如果变量因为编译优化被折叠，可以结合这篇资料排查：

https://www.qdcto.com/archives/1002#_%E6%9F%A5%E7%9C%8B%E8%A2%AB%E4%BC%98%E5%8C%96%E5%90%8E%E7%9A%84%E5%8F%98%E9%87%8F%E5%80%BC

在 gdb 里查看当前函数的反汇编：

disassemble proc_conn_timeout_limited
disassemble /m proc_conn_timeout_limited

/m 会把源码和汇编混排显示，适合排查优化后的代码路径。

info registers

当崩溃点涉及空指针、非法地址访问或调用约定问题时，寄存器值往往能直接提示是哪一个参数出了问题。

Git Cheat Sheet Markdown Tools C++ Linker Thread Linux TCP Network GDB Debug leetcode 链表 WSL Ubuntu Windows Linux Kernel GCC Android adb Troubleshooting Profiling Sanitizer glibc MySQL Database Python curl Build ELF clang-format CMake Graphviz Performance vcpkg Protobuf 排查速查内存 STL 调试性能分析性能读书笔记方法论架构网络 Timer mbedTLS TLS 安全负载均衡脚本工具 LRU 二叉树 BST 中序遍历回溯二分查找优先队列排序旋转数组 jenkins 部署