Don't ERROR on PreallocXlogFiles() race condition.
authorNoah Misch <noah@leadboat.com>
Tue, 29 Jun 2021 01:34:56 +0000 (18:34 -0700)
committerMichael Paquier <michael@paquier.xyz>
Sun, 6 Apr 2025 06:26:23 +0000 (15:26 +0900)
commit675b771ca5f28bb38cf14151fb30ac28f2e1ca4b
tree789a995f38d77513687ff2bd555db4f2b2590b19
parent47d2d29827293ed46f3641d8843ce5b5823d26e4
Don't ERROR on PreallocXlogFiles() race condition.

Before a restartpoint finishes PreallocXlogFiles(), a startup process
KeepFileRestoredFromArchive() call can unlink the preallocated segment.
If a CHECKPOINT sql command had elicited the restartpoint experiencing
the race condition, that sql command failed.  Moreover, the restartpoint
omitted its log_checkpoints message and some inessential resource
reclamation.  Prevent the ERROR by skipping open() of the segment.
Since these consequences are so minor, no back-patch.

This commit has been applied as of 2b3e4672f760 in v15 and newer
versions.  This is required on stable branches of v13 and v14 to fix a
regression reported by Noah Misch, introduced by 1f95181b44c8, causing
spurious failures in archive recovery (neither streaming nor archive
recovery) with concurrent restartpoints.  The backpatched versions of
the patches have been aligned on these branches by me, Noah Misch is the
author.  Tests have been conducted by the both of us.

Reported-by: Arun Thirupathi
Author: Noah Misch <noah@leadboat.com>
Discussion: http://postgr.es/m/20210202151416.GB3304930@rfd.leadboat.com
Discussion: http://postgr.es/m/20250306193013.36.nmisch@google.com
Backpatch-through: 13
src/backend/access/transam/xlog.c
src/backend/replication/walreceiver.c
src/include/access/xlog.h