[LWN 新闻] Linux 原子写入:向原子缓冲 I/O 迈进
许多应用程序需要能够将多块数据原子性地写入磁盘,确保操作要么完全成功要么完全失败。虽然某些文件系统已支持原子直接I/O,但原子缓冲I/O仍是一项挑战。Pankaj Raghav等内核开发者正在推进使用write-through语义实现原子缓冲写入,这将允许通过pwritev2()和RWF_ATOMI…
- 242
- 0
- 阅读全文
Jackie Liu
做正确的事,把事情做正确。
许多应用程序需要能够将多块数据原子性地写入磁盘,确保操作要么完全成功要么完全失败。虽然某些文件系统已支持原子直接I/O,但原子缓冲I/O仍是一项挑战。Pankaj Raghav等内核开发者正在推进使用write-through语义实现原子缓冲写入,这将允许通过pwritev2()和RWF_ATOMI…
Tejun Heo 发布的 sched_ext 子调度器补丁允许在单个系统上运行多个 CPU 调度器。该功能通过控制组(cgroup)机制实现,可以为不同的工作负载选择不同的调度算法。父调度器控制何时运行工作负载,子调度器控制进程如何访问 CPU,而 CPU 控制器负责分配时间片。这一改进使"一种调…
2025年2月,Yeoreum Yun 在内核邮件列表中发布了一项关于提升 BPF 安全性的建议:使用内存保护密钥(Memory Protection Keys)来防止 BPF 程序对内存的未授权访问。该提案建议在内核中添加 kmalloc_pkey() 和 vmalloc_pkey() 函数,让 …
双向链表在内核中是一个非常常见的存在,从数据的关联,队列的创建,每一个子系统中,都有他的影子存在,它属于内核最基本的一个部件。那么他虽然是非常的常见,但是要弄清楚他也不是那么容易,因为他与平常自己设计的双向链表还不太一样。 Contents1 一个普通的双向链表2 Linux 下双链表的基础2.1 …
SysRq 魔键是一组由 Linux 内核解析的组合键,他使得用户可以直接执行各种低级指令,这些操作与当时的系统状态无关。例如从冻结中恢复,或者在不破坏文件系统的情况下重启系统,他的效果类似与直接按住了计算机的硬件重置按钮(电源开关),但是它具有更多的选项和更多的控制权。 通过这个组合键,为用户提供…
最近在研究 NUMA Node 对于内存申请的影响,发现有一些网卡驱动会去主动探测其网卡设备所在的 PCIe 节点所在的 NUMA Node,然后通过 alloc_pages_node 去该节点附近进行内存申请。理论上来说,这种方式比较好,也是麒麟内核在做网络优化时常用的一种手段之一,但是这种手段难…
Contents1 说在前面的废话2 从系统调用 io_uring_setup 说起3 交互需要使用的缓存区3.1 到底需要映射几块内存区域3.2 为什么需要拆分 sq_ring4 关键数据结构4.1 sq_ring 数据结构4.2 cq_ring 数据结构4.3 sqes 的单元数据结构4.4 c…
Contents1 IO 到底怎么啦2 尴尬的 AIO3 那么应该是什么样子的呢?4 io_uring 实现了什么 IO 到底怎么啦 当前 Linux 对文件的操作有很多种方式,最古老的最基本就是 read 和 write 这样的原始接口,这样的接口简洁直观,但是真的是足够原始,效率什么自然不是第一…
很早以前就想写一下关于 initcall 的相关知识点,但是一直苦于没有特别强烈的需求以及自己的懒惰才拖到现在,其实一直在想要不要写一篇这样的文章,毕竟目前网上能够查阅到几乎所有的资料,不过也没有什么关系,就当是为了记忆把之前的一些理解写下来。 Contents1 module_init 与其他的 …
为什么想起写这篇文章呢?第一是最近在研究 kdump/kexec 等系列的内核崩溃现场保护能力,所以有相关的技术积累,但是这篇文章不打算什么分析,因为接下来的文章我会分析什么是 kdump 以及如何实现内核崩溃现场保护;第二是因为方便记忆,我自己平常不太喜欢写 Word 这种类型的工作总结,比较喜欢…