Caturra's Blog

https://www.bluepuni.com/ Caturra's Blog Caturra的个人博客 2025-06-02T00:00:00+08:00 Caturra https://www.bluepuni.com/ Jekyll © 2025 Caturra /favicon.ico /images/favicon.png x86 的内存类型 2025-06-02T00:00:00+08:00 2025-06-02T00:00:00+08:00 https://www.bluepuni.com/archives/x86-memory-type/ Caturra

动机 x86 允许系统任意内存区域被 L1/L2/L3 缓存接管，因此对于每一个页来说都有必要进行缓存方式的控制管理，而这就是内存类型（memory type）的动机。那么开发者需要了解内存类型的动机？正常来说我们不需要了解，但是要是碰到 MMIO 的话最好了解一下，因为通常涉及缓存就需要考虑内存模型，也就是访问乱序问题和数据不可见问题。 NOTE: 本文不会详细调研内存类型的概念，因为要解决上述 MMIO 问题的话，默认的 ioremap 已经处理好了（历史上出现过问题）。这些就当作是扩展阅读吧。名词对齐 memory type (Intel/AMD) = type of caching (Intel SDM) = page cache mode (Linux). 这三个名词都是同一概念，本文使用 memory type。有哪些内存类型 Intel 手册（卷三...

[快速笔记] C++20 协程的对称转移 2025-04-18T00:00:00+08:00 2025-04-18T00:00:00+08:00 https://www.bluepuni.com/archives/cpp20-coroutine-symmetric-transfer/ Caturra

背景翻过 cppcoro 的同学应该有留意到 CPPCORO_COMPILER_SUPPORTS_SYMMETRIC_TRANSFER 的宏定义，这是一个解决非对称转移asymmetric transfer问题的配置宏，新版 Clang 默认打开，GCC 默认关闭。这一块其实比较老黄历，不值得细究了，但是可以了解一下。问题 Task inner() { co_return; } Task outer() { // Use large number of iterations to trigger stack-overflow for (int i = 0; i != 50000000; ++i) { co_await inner(); } } C++20 协程的 resume 操作并不能完全保证是尾调用（tail call），也就是编译器可以将...

[快速笔记] C++20 协程的竞态条件 2025-04-16T00:00:00+08:00 2025-04-16T00:00:00+08:00 https://www.bluepuni.com/archives/cpp20-coroutine-race-condition/ Caturra

背景本文简单补充一下 C++20 协程介绍当中略过的细节。此前在 awaiter 章节提到等待器存在竞态条件，刚好看到 Raymond Chen 在 C++/WinRT 介绍中也提到这个问题，还给了几种方案来修复问题，顺过来当笔记了。 Raymond 为此水了四篇文章，我只水一篇不过分吧。问题 auto resume_foreground(DispatcherQueue const& dispatcher) { struct awaitable { DispatcherQueue m_dispatcher; bool m_queued = false; bool await_ready() { return false; } bool await_suspend(coroutine_han...

Asio 异步操作的取消支持 2025-04-07T00:00:00+08:00 2025-04-07T00:00:00+08:00 https://www.bluepuni.com/archives/cancellation-in-depth/ Caturra

本文是 Talking Async Ep2: Cancellation in depth 的个人观片笔记，演讲者为 Asio 作者 Christopher Kohlhoff，主要内容是介绍 Asio 对异步操作的取消设计。前提说明我真的很想结束这个话题，之前的笔记零零散散讨论过很多次取消点了，总是不满意，所以还是翻了点库存资料再调研一遍。但是这种抠细节的事情抠多了没意思，我暂时也没有改进 uring_exec 的计划，这回简单写点草稿算了。如有错误，还请指正。另外一提，EP1 讨论了 Asio 的异步接口演变历史，话题相对轻松很多。我也做了简单的文本转译。 Man-in-the-middle proxy awaitable<void> proxy(tcp::socket client, tcp::endpoint target) { tcp::sock...

dispatch、post 和 defer 2025-03-21T00:00:00+08:00 2025-03-21T00:00:00+08:00 https://www.bluepuni.com/archives/dispatch-post-and-defer/ Caturra

背景一 dispatch、post 和 defer 是 Asio 提供的任务提交接口。它们的注释都相同（Submits a completion token or function object for execution），但是意图是相当的不同。考虑到这可能是一个关于任务执行的通用问题，本文标题就不特别标明 Asio 了。 // 可以更换为 dispatch 或者 defer asio::post(executor, [] { /* do stuff. */ }); 对于没了解过 Asio 的读者，你可以简单理解任务提交为上述接口形式。executor 可能是某个指定线程、线程池或者其他类似的概念，任务（lambda）并不局限于 I/O 函数。至于任务参数类型、函数内是否保证线程安全、返回确定方式是 one way 还是 two way 等细节由 executor 决定，本...

[演讲笔记] 结构化并发与协程实践 2025-03-12T00:00:00+08:00 2025-03-12T00:00:00+08:00 https://www.bluepuni.com/archives/structured-concurrency-and-cpp-coroutine/ Caturra

本文是 C++ Coroutines and Structured Concurrency in Practice 的个人观片笔记。主要内容是作者（Dmitry Prokoptsev）分享他考虑结构化并发而实现的 C++20 协程网络库 Corral。如今协程库基本上是满街走了，但是这场演讲对于结构化并发的讨论是相当的不错。一点说明：和上一篇笔记类似，本文的内容会相对简略。推荐看原视频，感受下作者离谱的语速。本文假定读者已了解 C++20 协程。不了解也没关系，看个思路。实在的好处协程的好处其实没有必要强调，用过都说好。作者给了一个与传统回调对比的例子，可以看出协程更好写、更好读，也更易维护。协程对于生命周期、资源管理和错误传播三个方面都能得到收益：不再是跟语言对抗，而是享受语言带来的特性。潜在的问题市面上典型的异步框架一个典型的...

[演讲笔记] 飞快地解析 JSON 2025-03-06T00:00:00+08:00 2025-03-06T00:00:00+08:00 https://www.bluepuni.com/archives/parsing-json-really-quickly/ Caturra

本文是 Parsing JSON Really Quickly: Lessons Learned 的个人观片笔记，演讲者为 Daniel Lemire（simdjson 作者）。主要内容是分享基本的高性能解析思路，以及早期 simdjson 的具体实现。一点说明：个人笔记会相对简短，主要是补充作者略过太快的算法细节。 InfoQ 有演讲的全文记录（English），喜欢原味的同学不要错过！动机 What I hear a lot - not from everyone, but from enough people - is that they have all these cool AI stuff, but their servers are just spending all their time producing JSON and parsin...

ClickHouse 的 SIMD UTF-8 验证实现 2025-02-15T00:00:00+08:00 2025-02-15T00:00:00+08:00 https://www.bluepuni.com/archives/clickhouse-validate-utf8/ Caturra

背景字符串处理和无分支编程是相当矛盾的需求（总之我不会），ClickHouse 给了一个无分支向量处理 UTF-8 验证的算法，学学人家怎么做的。规范 Code Points First Byte Second Byte Third Byte Fourth Byte U+0000..U+007F 00..7F U+0080..U+07FF C2..DF 80..BF U+0800..U+0FFF E0 A0..BF 80..BF ...

ClickHouse 的 inline memcpy 实现 2025-02-14T00:00:00+08:00 2025-02-14T00:00:00+08:00 https://www.bluepuni.com/archives/clickhouse-memcpy/ Caturra

ClickHouse 的 inline memcpy 实现其实很简单的，但是毕竟名声大，还有注释写得特别好，忍不住摘下来……以后水群吹牛逼用！提前省流不考虑注释中提到的玄学，只看代码的话，至少需要关注以下几点： __restrict 非标准关键字安排上，避免阻挡别名优化。分支顺序很重要，小尺寸的执行流先安排（理由：抄的 glibc），其次才是中、大尺寸。 ClickHouse 认为的小尺寸是 16 字节以内，中尺寸是 128 字节以内。平凡操作（8 字节内）可以靠 __builtin_memcpy 操作。重叠 move 技巧：只需 __builtin_memcpy 两次。例子：to copy 5 bytes [0, 1, 2, 3, 4] we will copy tail [1, 2, 3, 4] first and then head [0, ...

一种没用的跳转判断优化算法 2025-02-10T00:00:00+08:00 2025-02-10T00:00:00+08:00 https://www.bluepuni.com/archives/naive-skip-optimization/ Caturra

本文算法只是翻阅 bytedance.sonic-cpp 过程中的简单折腾，暂时没有实际意义。基本的跳转判断 #include <cstring> #include <cstdint> // ~std::bit_cast bool EqBytes4(const char *src, uint32_t target) { uint32_t val; std::memcpy(&val, src, sizeof(uint32_t)); return val == target; } bool skip_literal_v1(const char *data, size_t &pos, size_t len, uint8_t token) { static constexpr...