Phase 0 spec §6.1 originally specified relative spread (q90-q10)/median < 0.6. Phase 3b smoke (005930: median=-0.59%, q90-q10=15.3%) revealed Chronos-bolt zero-shot median frequently sits near zero, causing relative spread to explode (15.3/0.0059 ≈ 25) and reject every signal. Absolute spread (0.153 < 0.6) preserves the threshold semantic and keeps Phase 7 IC validation tractable. Phase 4 spec §4.2 + Phase 0 §6.1 both amended with cross-reference. chronos_predictor.py conf calculation unchanged — monotonic mapping there is independent of hard-gate semantics.
16 KiB
Confidence Signal Pipeline V2 — Phase 4: Signal Generator Design
작성일: 2026-05-17 작성자: gahusb 상태: Approved for implementation 선행 spec:
- Phase 0 architecture (
2026-05-15-confidence-signal-pipeline-v2-architecture.md) - Phase 1 stock WebAI API (
2026-05-15-signal-v2-phase1-webai-api.md) - Phase 2 web-ai pull worker (
2026-05-16-signal-v2-phase2-web-ai-pull-worker.md) - Phase 3a KIS data collection (
2026-05-16-signal-v2-phase3a-kis-data-collection.md) - Phase 3b Chronos-2 + momentum (
2026-05-16-signal-v2-phase3b-chronos-momentum.md)
브레인스토밍 결정 6개:
- scope = A (신호 생성만, Phase 5 가 발송)
- trigger = A (매 분봉 cycle 후 일괄 평가)
- minute_score = A (Linear 5-level 1.0/0.7/0.5/0.3/0.0)
- 임계값 = A+ (6 env 외부화)
- state.signals schema = A (Phase 0 spec §5.2 그대로)
- 테스트 = A (9 단위 + 1 integration = 10 신규)
1. 목표
Phase 2/3a/3b 의 모든 산출을 종합해 Phase 0 spec §6.1/§6.2/§6.3 의 매수/매도/dedup 룰 적용. 임계값 통과한 신호를 state.signals 에 저장 + SignalDedup 으로 24h 중복 차단.
Why: Phase 5 (agent-office) 의 입력 계약 완성. signal_v2 가 자체적으로 매수/매도 신호 생성 → Phase 5 가 발송.
2. 범위
포함 (6 항목)
- ①
signal_generator.py신규 —generate_signals(state, dedup, settings) -> None(state mutating) - ②
config.py확장 — 6 env (STOP_LOSS_PCT,TAKE_PROFIT_PCT,CHRONOS_SPREAD_THRESHOLD,ASKING_BID_RATIO_THRESHOLD,CONFIDENCE_THRESHOLD,MIN_MOMENTUM_FOR_BUY) - ③
state.py확장 —signals: dict[str, dict](Phase 5 input) - ④
pull_worker.py확장 — 매 cycle 후generate_signals호출 + signature 확장 (dedup + settings) - ⑤
main.py의 lifespan poll_task 호출 시 dedup/settings 전달 - ⑥ 테스트 9 단위 + 1 integration = 10 신규 (45 → 55)
Phase 4 산출 (Phase 5 input)
state.signals[ticker] — Phase 0 spec §5.2 schema:
{
"ticker": str, "name": str,
"action": "buy" | "sell",
"confidence_webai": float,
"current_price": int,
"avg_price": int | None, # sell 시만
"pnl_pct": float | None,
"context": {
"chronos_pred_1d": float (median),
"chronos_pred_conf": float,
"chronos_q10": float, "chronos_q90": float,
"screener_rank": int | None,
"screener_scores": dict | None,
"minute_momentum": str,
"asking_bid_ratio": float,
"news_sentiment": float | None,
"news_reason": str | None,
},
"as_of": str (ISO),
}
범위 외 (NOT)
- agent-office
/signalHTTP POST (Phase 5) - Qwen3 검증 + 이중 텔레그램 (Phase 5)
- 호가 변경 시 즉시 매도 trigger (Phase 7 backlog)
- 자동 매매 (Phase 8 backlog)
- ML 기반 룰 변종 (Phase 7 백테스트 후)
kospi_change,news_top컨텍스트 (Phase 7 backlog)- 외부 API 호출 — Phase 4 는 state 만 사용 (pure function)
3. 파일 구조 + 변경 매트릭스
| 파일 | 작업 | 라인 |
|---|---|---|
signal_v2/signal_generator.py |
신규 (generate_signals + 5 helpers) | ~250 |
signal_v2/config.py |
Settings 6 field 추가 | +15 |
signal_v2/state.py |
PollState signals 필드 |
+2 |
signal_v2/pull_worker.py |
poll_loop signature + 매 cycle 호출 | +10 |
signal_v2/main.py |
lifespan poll_task 인자 추가 | +3 |
signal_v2/tests/test_signal_generator.py |
9 단위 신규 | ~350 |
signal_v2/tests/test_pull_worker.py |
1 integration 추가 | +50 |
합계: 7 파일 변경, 10 신규 테스트.
외부 의존성 신규
없음. signal_generator 는 순수 함수, 외부 라이브러리 0.
6 신규 env
| env | 기본값 | 의미 |
|---|---|---|
STOP_LOSS_PCT |
-0.07 |
손절선 비율. pnl_pct < 이 값 → 즉시 매도 |
TAKE_PROFIT_PCT |
0.15 |
익절선 비율. pnl_pct > 이 값 → 검토 알림 |
CHRONOS_SPREAD_THRESHOLD |
0.6 |
`(q90-q10)/max( |
ASKING_BID_RATIO_THRESHOLD |
0.6 |
bid_ratio >= 이 값 → 매수 통과 |
CONFIDENCE_THRESHOLD |
0.7 |
confidence_webai > 이 값 → 신호 발생 |
MIN_MOMENTUM_FOR_BUY |
strong_up |
분봉 모멘텀 카테고리 |
4. 매수 룰 + Confidence
4.1 매수 룰 대상
- screener Top-N (
state.screener_preview.items) - portfolio 보유 종목 (추가 매수 검토, dedup 으로 중복 차단)
4.2 Hard gate (모든 조건 충족)
state.chronos_predictions[ticker].median > 0(다음날 상승)(q90 - q10) < settings.chronos_spread_threshold(absolute spread — Phase 3b 실 운영 데이터 기반 변경)state.minute_momentum[ticker] == settings.min_momentum_for_buy(기본 strong_up)state.asking_price[ticker].bid_ratio >= settings.asking_bid_ratio_threshold
Spread formula 결정 노트 (2026-05-17 implementer 변경 채택):
- Phase 0 spec §6.1 의 한국어 "(90-10 분위수) / 50 분위수 < 0.6" 은 relative spread 로 명시되었으나, Phase 3b 실 운영 결과 (Chronos zero-shot prediction 의 median 이 종종 0 가까이) 에서 relative formula 가 거의 모든 신호 거부 → useless.
- 변경: absolute spread
(q90 - q10) < 0.6사용. 0.6 = 60% 변동 예측 — 한국 주식 1-day 변동성 (1-2%) 대비 매우 넓음 (모델 자신 없음 신호). - 결과: Phase 3b smoke 005930 (median=-0.59%, q10=-8.9%, q90=6.4%, spread=15.3%) → spread 0.153 < 0.6 → hard gate 통과 가능 (다른 조건 충족 시).
- Phase 7 IC 검증 시 임계값 재조정 가능 (env
CHRONOS_SPREAD_THRESHOLD).
4.3 Soft confidence (Phase 0 spec §6.1)
chronos_conf = state.chronos_predictions[ticker]["conf"]
minute_score = MOMENTUM_SCORES[state.minute_momentum[ticker]]
# MOMENTUM_SCORES = {"strong_up": 1.0, "weak_up": 0.7, "neutral": 0.5,
# "weak_down": 0.3, "strong_down": 0.0}
screener_norm = 1 - (rank - 1) / 20 if rank is not None else 0.0
confidence_webai = chronos_conf * 0.5 + minute_score * 0.3 + screener_norm * 0.2
4.4 임계값
confidence_webai > settings.confidence_threshold (기본 0.7) → 신호 발생.
4.5 누락 처리
- portfolio (Top-N 외) 매수:
screener_rank = None→screener_norm = 0(보수적) chronos_predictions[ticker]누락 → silent (Hard gate 위반)asking_price[ticker]누락 → silent
5. 매도 룰 + Dedup
5.1 매도 대상
portfolio holdings 만 (state.portfolio.holdings).
5.2 매도 룰 (Phase 0 spec §6.2)
(a) 손절선 (즉시 trigger):
pnl_pct < settings.stop_loss_pct(기본 -0.07)- 다른 룰 무관 — 즉시 매도
confidence_webai = 1.0
(b) 익절선 (검토 알림):
pnl_pct > settings.take_profit_pct(기본 0.15)- "검토 권고" — 강제 매도 X
confidence_webai = 0.6
(c) 이상 신호:
chronos_predictions[ticker].median < -0.01minute_momentum[ticker] == "strong_down"asking_price[ticker].bid_ratio < (1 - settings.asking_bid_ratio_threshold)(매도세 ≥ 60%)- confidence_webai = chronos_conf × 0.5 + inverted_minute × 0.3 + 1.0 × 0.2
- 임계값 >
settings.confidence_threshold
5.3 우선순위 (같은 ticker 다중 trigger 시)
- 손절 (Phase 0 spec §6.2 "즉시") — 다른 룰 우회
- 이상 신호
- 익절선
상위 trigger 시 하위 skip (한 종목당 한 cycle 1 매도 신호).
5.4 Dedup (Phase 0 spec §6.3 + Phase 2 SignalDedup)
if dedup.is_recent(ticker, action, within_hours=24):
continue # silent
# 신호 dict 생성
state.signals[ticker] = {...}
dedup.record(ticker, action, confidence=confidence_webai)
Dedup 키 (ticker, action) — 같은 종목의 매수/매도 별도 추적, 충돌 없음.
손절선도 dedup 적용 (Phase 0 spec §6.3 "1일 1회 max").
6. State 통합 + pull_worker
6.1 PollState 확장
signals: dict[str, dict] = field(default_factory=dict)
매 cycle 마다 덮어쓰기 X — 같은 ticker key 재발생 시 갱신, 그 외 유지. dedup 으로 중복 차단되므로 누적 안전. Phase 5 consumer 가 처리 후 본인 측 dedup.
6.2 pull_worker 흐름
async def poll_loop(client, state, shutdown,
kis_client=None, chronos=None,
dedup=None, settings=None) -> None:
while not shutdown.is_set():
now = datetime.now(KST)
if _is_market_day(now) and _is_polling_window(now):
# 1. stock + KIS 분봉/호가 (Phase 2 + 3a)
await _run_polling_cycle(client, state, kis_client=kis_client)
# 2. 분봉 모멘텀 (Phase 3b)
update_minute_momentum_for_all(state)
# 3. 종가 트리거 시 Chronos (Phase 3b)
if _is_post_close_trigger(now) and chronos and kis_client:
await _run_post_close_cycle(kis_client, chronos, state)
# 4. (신규 Phase 4) 신호 생성
if dedup is not None and settings is not None:
try:
generate_signals(state, dedup, settings)
except Exception:
logger.exception("generate_signals failed")
...
6.3 main.py lifespan
_ctx.poll_task = asyncio.create_task(
poll_loop(
_ctx.client, state_mod.state, _ctx.shutdown,
kis_client=_ctx.kis_client,
chronos=_ctx.chronos,
dedup=_ctx.dedup,
settings=settings,
)
)
7. signal_generator.py 구조
def generate_signals(state: PollState, dedup: SignalDedup, settings: Settings) -> None:
"""Phase 4 entry point — state mutating."""
_evaluate_buy_signals(state, dedup, settings)
_evaluate_sell_signals(state, dedup, settings)
def _evaluate_buy_signals(state, dedup, settings) -> None:
"""screener Top-N + portfolio 매수 후보 평가."""
candidates = _buy_candidates(state) # screener Top-N + portfolio holdings
for ticker, rank in candidates:
if not _check_buy_hard_gate(state, ticker, settings):
continue
confidence = _compute_buy_confidence(state, ticker, rank)
if confidence <= settings.confidence_threshold:
continue
if dedup.is_recent(ticker, "buy", within_hours=24):
continue
state.signals[ticker] = _build_buy_signal(state, ticker, rank, confidence)
dedup.record(ticker, "buy", confidence=confidence)
def _evaluate_sell_signals(state, dedup, settings) -> None:
"""portfolio 보유 종목 매도 평가 — 손절 > 이상 > 익절 우선순위."""
if state.portfolio is None:
return
for holding in state.portfolio.get("holdings", []):
ticker = holding["ticker"]
# 우선순위 1: 손절선
sell = _try_stop_loss(state, holding, settings)
# 우선순위 2: 이상 신호
if sell is None:
sell = _try_anomaly(state, holding, settings)
# 우선순위 3: 익절선
if sell is None:
sell = _try_take_profit(state, holding, settings)
if sell is None:
continue
if dedup.is_recent(ticker, "sell", within_hours=24):
continue
state.signals[ticker] = sell
dedup.record(ticker, "sell", confidence=sell["confidence_webai"])
Helper 함수:
_buy_candidates(state) -> list[tuple[ticker, rank | None]]_check_buy_hard_gate(state, ticker, settings) -> bool_compute_buy_confidence(state, ticker, rank | None) -> float_build_buy_signal(state, ticker, rank, confidence) -> dict_try_stop_loss(state, holding, settings) -> dict | None_try_anomaly(state, holding, settings) -> dict | None_try_take_profit(state, holding, settings) -> dict | None_build_context(state, ticker, rank, ...) -> dict
8. 테스트 (10 신규)
8.1 test_signal_generator.py (9 단위)
| # | 이름 | Setup | 검증 |
|---|---|---|---|
| 1 | test_buy_signal_when_all_conditions_pass_and_confidence_high |
chronos +2%, narrow, strong_up, bid_ratio 0.7, rank 1 | state.signals[ticker]["action"]=="buy", confidence > 0.7, dedup.record 호출 |
| 2 | test_silent_when_chronos_median_negative |
median -1% | state.signals empty |
| 3 | test_silent_when_distribution_spread_too_wide |
spread 1.0 | empty |
| 4 | test_silent_when_momentum_not_strong_up |
weak_up | empty |
| 5 | test_silent_when_bid_ratio_below_threshold |
0.5 | empty |
| 6 | test_silent_when_confidence_below_threshold |
rank 20 + median +0.5% (chronos_conf 낮음) → confidence < 0.7 | empty |
| 7 | test_sell_signal_when_stop_loss_triggered |
pnl_pct -0.08 | "sell" + confidence 1.0 |
| 8 | test_sell_signal_when_take_profit_triggered |
pnl_pct 0.16 | "sell" + confidence 0.6 |
| 9 | test_silent_when_dedup_recently_sent |
dedup.is_recent True | empty |
8.2 test_pull_worker.py (1 integration)
| # | 이름 | 검증 |
|---|---|---|
| 10 | test_poll_loop_calls_generate_signals_after_cycle |
mock state setup + mock dedup → poll_loop 1 cycle → state.signals 갱신 |
합계: 9 + 1 = 10 신규. 45 → 55 total.
9. 위험 / 운영 / DoD
9.1 위험 매트릭스
| 위험 | 완화 |
|---|---|
| Phase 0 spec 의 confidence 공식이 실 운영과 안 맞음 | 6 env 외부화 → Phase 7 IC 검증 후 .env 조정 |
| Chronos 누락 (장 시작 첫 cycle) | Hard gate 위반 → silent. 종가 cron 후 매수 신호 가능 |
| Dedup DB 손상 | WAL + busy_timeout. 운영자 manual 복구 (signal_v2.db 삭제) |
| 동시 cycle 에서 같은 종목 buy + sell trigger | dedup PK (ticker, action) 별도 추적 — 충돌 없음 |
| portfolio 매수 → screener_norm=0 → 신호 발생 어려움 | 보수적. 다른 component 높아야 신호. 의도된 동작 |
| 손절선 trigger 후 24h 추가 손실 → 다음 알림 차단 | 운영적 허용 (Phase 0 spec §6.3 1일 1회 max) |
| 신호 빈도 너무 적음 | 4주 IC 검증 + 임계값 완화 |
| 신호 빈도 너무 많음 (false positive) | dedup + 임계값 강화. Phase 7 |
| 매도 우선순위 잘못 (손절 > 이상 > 익절) | 테스트 케이스로 검증 + 코드 명시 |
| signals dict 누적 (cycle 사이 stale entry) | dedup 으로 중복 차단되므로 안전. Phase 5 consumer 가 처리 후 본인 측 marker |
9.2 운영 영향
| 항목 | 영향 |
|---|---|
| 다운타임 | signal_v2 재기동 ~5초 |
| 사용자 영향 | 없음 (Phase 5 까지 발송 없음) |
.env 갱신 |
optional 0-6개 (기본값 충분) |
| V1 영향 | 0 |
| KIS API 부하 | 0 (Phase 4 는 외부 호출 없음) |
9.3 Phase 4 완료 조건 (DoD)
signal_v2/signal_generator.py신규 (generate_signals + 8 helpers)signal_v2/config.pySettings 에 6 field 추가 (default 있음)signal_v2/state.pyPollStatesignalsfieldsignal_v2/pull_worker.pypoll_loop signature + 매 cycle 호출signal_v2/main.pylifespan 의 poll_task 인자 (dedup, settings) 추가- 9 단위 + 1 integration 테스트 PASS (총 55)
- 운영 smoke: signal_v2 시작 → 1 cycle 후 state.signals 빈 dict (운영 시간대 신호 발생 가능 종목 없을 시 정상) 또는 ≥ 1 신호 생성
- V1 무영향
- git push
10. Phase 5 와의 관계
본 Phase 4 완료 후 즉시 Phase 5 (agent-office /signal + Qwen3 + 이중 텔레그램) brainstorming. 의존성:
[Phase 4 spec/plan/실행] → [Phase 5 spec/plan/실행]
3-5일 2주
Phase 5 의 입력 = 본 spec 의 state.signals[ticker] (state polling 또는 HTTP push). Phase 5 작업:
- agent-office
/signalendpoint 신설 (Phase 0 spec §5.2 schema 수신) - web-ai → agent-office HTTP client 추가 (signal_v2 측)
- web-ai 의 Ollama Qwen3 14B Q4 설치 + agent-office 의 LLM 검증 호출
- 이중 텔레그램 (본인 풀 / 아내 lite)
11. Backlog (본 spec NOT)
- 호가 변경 시 즉시 매도 trigger — Phase 7 운영 후 검토
kospi_change컨텍스트 (KIS 지수 fetch) — Phase 7news_top컨텍스트 (news_sentiment.reason 다중 추출) — Phase 7- 매수/매도 ML 룰 — Phase 7 백테스트 후
- portfolio 매수의 screener_norm fallback (다른 default 값) — IC 검증 후
- 신호 hit-rate 대시보드 — Phase 7
- 분할 매수/매도 전략 — Phase 7 이후
- 자동 매매 (실주문) — Phase 8
- 손절선 dedup 면제 (즉시성 위해) — Phase 7 운영 검증 후