fix(insta-render): 큐 연결 socket_timeout=30 (None→30 교정)

근본원인 실험 확정: redis-py 블로킹 read에서 socket_timeout이 BLMOVE 블록(5s)
이하/None이면 read_timeout 경계 경합으로 간헐 "Timeout reading" → dequeue 실패
→ 슬레이트 draft 정지. socket_timeout 10/30은 모든 실험에서 안정. 블록보다 큰
30으로 명시(직전 None 커밋은 단독 테스트만 통과시켜 오도 — 재사용 패턴서 깨짐).

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
2026-06-08 03:17:34 +09:00
parent c451f5313b
commit 6774067505
2 changed files with 14 additions and 16 deletions

View File

@@ -224,12 +224,9 @@ async def test_poll_once_returns_false_on_timeout(monkeypatch):
fake_queue.fail.assert_not_awaited() fake_queue.fail.assert_not_awaited()
def test_make_queue_redis_no_read_timeout(): def test_make_queue_redis_socket_timeout_exceeds_block():
"""BLMOVE(블록 5s) dequeue가 read-timeout으로 깨지지 않도록 socket_timeout=None 보장 (회귀 가드).""" """BLMOVE(블록 5s) dequeue가 read-timeout 경계 경합으로 깨지지 않도록
import os, sys socket_timeout이 블록보다 충분히 커야 한다 (회귀 가드)."""
_here = os.path.dirname(os.path.abspath(__file__))
sys.path.insert(0, os.path.dirname(_here)) # services/insta-render
sys.path.insert(0, os.path.dirname(os.path.dirname(_here))) # services (_shared)
import worker
c = worker.make_queue_redis() c = worker.make_queue_redis()
assert c.connection_pool.connection_kwargs.get("socket_timeout") is None st = c.connection_pool.connection_kwargs.get("socket_timeout")
assert st is not None and st > 5 # blmove 블록(5s)보다 커야 안정

View File

@@ -98,17 +98,18 @@ async def poll_once(queue: ReliableQueue, client: httpx.AsyncClient) -> bool:
return True return True
def make_queue_redis(): # 블로킹 dequeue는 BLMOVE(블록 5s)를 쓴다. redis-py 블로킹 read에서 socket_timeout이
"""블로킹 dequeue(BLMOVE 5s)용 redis 클라이언트. # 블록(5s) 이하이거나 None이면 read-timeout이 블록 경계와 경합해 간헐적으로
# "Timeout reading"이 터져 잡을 못 꺼낸다(슬레이트 draft 정지). 실험상 socket_timeout이
# 블록보다 충분히 크면(10/30) 항상 안정. → 블록보다 넉넉히 큰 값을 명시한다.
QUEUE_SOCKET_TIMEOUT = 30 # > dequeue blmove 블록(5s)
BLMOVE 블록보다 짧은 socket_timeout(예: REDIS_URL ?socket_timeout=)이 걸려 있으면
idle 폴링마다 "Timeout reading"으로 dequeue가 실패해 잡을 영영 못 꺼낸다(슬레이트 draft 정지). def make_queue_redis():
→ read-timeout을 두지 않는다(socket_timeout=None). 죽은 연결은 socket_keepalive + """블로킹 dequeue(BLMOVE)용 redis 클라이언트. socket_timeout > 블록(5s) 보장."""
worker_loop 재시도로 감지/복구. (explicit kwarg가 URL의 socket_timeout을 override)
"""
return aioredis.from_url( return aioredis.from_url(
REDIS_URL, decode_responses=False, REDIS_URL, decode_responses=False,
socket_timeout=None, socket_keepalive=True, socket_timeout=QUEUE_SOCKET_TIMEOUT, socket_keepalive=True,
) )