Google이 비공식 trends endpoint 두 가지(/trends/.../rss + /trends/api/dailytrends) 모두 404로 폐기 (NAS에서 직접 호출 시 확정). 대안으로 YouTube Data API v3 mostPopular(regionCode=KR, 50개)로 source 교체: - source 이름: google_trends → youtube_trending - 키워드: 영상 제목 정제 (대괄호·이모지 제거, 60자 limit) - API 키: YOUTUBE_DATA_API_KEY (agent-office와 공유, .env 그대로 활용) - 키 미설정 시 graceful skip - docker-compose insta-lab에 환경변수 추가 - 테스트 9/9 pass (기존 6 + youtube 3 신규)
161 lines
5.9 KiB
Python
161 lines
5.9 KiB
Python
import os
|
|
import gc
|
|
import tempfile
|
|
from unittest.mock import patch, MagicMock
|
|
|
|
import pytest
|
|
|
|
from app import db as db_module
|
|
from app import trend_collector
|
|
|
|
|
|
@pytest.fixture
|
|
def tmp_db(monkeypatch):
|
|
fd, path = tempfile.mkstemp(suffix=".db")
|
|
os.close(fd)
|
|
monkeypatch.setattr(db_module, "DB_PATH", path)
|
|
db_module.init_db()
|
|
yield path
|
|
gc.collect()
|
|
for ext in ("", "-wal", "-shm"):
|
|
try:
|
|
os.remove(path + ext)
|
|
except OSError:
|
|
pass
|
|
|
|
|
|
NAVER_RESPONSE = {
|
|
"items": [
|
|
{"title": "<b>기준금리</b> 인상", "link": "https://n.news.naver.com/a/1", "description": "한국은행 발표"},
|
|
{"title": "환율 급등", "link": "https://n.news.naver.com/a/2", "description": "달러 강세"},
|
|
{"title": "기준금리 추가 인상", "link": "https://n.news.naver.com/a/3", "description": "추가 발표"},
|
|
],
|
|
}
|
|
|
|
|
|
def test_fetch_naver_popular_extracts_top_terms(tmp_db, monkeypatch):
|
|
fake_resp = MagicMock()
|
|
fake_resp.json.return_value = NAVER_RESPONSE
|
|
fake_resp.raise_for_status.return_value = None
|
|
|
|
with patch.object(trend_collector.requests, "get", return_value=fake_resp):
|
|
trends = trend_collector.fetch_naver_popular("economy", per_seed=10, top_n=5)
|
|
|
|
keywords = [t["keyword"] for t in trends]
|
|
assert "기준금리" in keywords
|
|
for t in trends:
|
|
assert t["category"] == "economy"
|
|
assert t["source"] == "naver_popular"
|
|
assert 0.0 <= t["score"] <= 1.0
|
|
|
|
|
|
def test_collect_naver_writes_to_db(tmp_db, monkeypatch):
|
|
fake_resp = MagicMock()
|
|
fake_resp.json.return_value = NAVER_RESPONSE
|
|
fake_resp.raise_for_status.return_value = None
|
|
with patch.object(trend_collector.requests, "get", return_value=fake_resp):
|
|
n = trend_collector.collect_naver_popular_for(["economy"])
|
|
assert n > 0
|
|
rows = db_module.list_trends(source="naver_popular")
|
|
assert len(rows) > 0
|
|
assert all(r["source"] == "naver_popular" for r in rows)
|
|
|
|
|
|
def test_classify_keyword_with_cache(monkeypatch):
|
|
calls = {"n": 0}
|
|
|
|
def fake_claude(keyword: str) -> str:
|
|
calls["n"] += 1
|
|
return "economy"
|
|
|
|
monkeypatch.setattr(trend_collector, "_llm_classify_one", fake_claude)
|
|
trend_collector._category_cache.clear()
|
|
|
|
c1 = trend_collector.classify_keyword("기준금리")
|
|
c2 = trend_collector.classify_keyword("기준금리")
|
|
assert c1 == c2 == "economy"
|
|
assert calls["n"] == 1
|
|
|
|
|
|
def test_fetch_youtube_trending_parses_and_cleans_titles(tmp_db, monkeypatch):
|
|
"""YouTube Data API mostPopular 응답 → 제목 정제 + 분류."""
|
|
monkeypatch.setattr(trend_collector, "YOUTUBE_DATA_API_KEY", "fake_key")
|
|
payload = {
|
|
"items": [
|
|
{"snippet": {"title": "[속보] 기준금리 인상 단행 🔥"}},
|
|
{"snippet": {"title": "(공식) BTS 컴백 무대 🎤"}},
|
|
{"snippet": {"title": "스트레스 관리 5가지 방법"}},
|
|
# 중복 제목 — 중복 제거 확인
|
|
{"snippet": {"title": "[속보] 기준금리 인상 단행 🔥"}},
|
|
]
|
|
}
|
|
fake_resp = MagicMock()
|
|
fake_resp.json.return_value = payload
|
|
fake_resp.raise_for_status.return_value = None
|
|
monkeypatch.setattr(trend_collector.requests, "get", lambda *a, **kw: fake_resp)
|
|
monkeypatch.setattr(
|
|
trend_collector, "classify_keyword",
|
|
lambda kw: ("economy" if "금리" in kw else
|
|
"celebrity" if "BTS" in kw else
|
|
"psychology" if "스트레스" in kw else "uncategorized"),
|
|
)
|
|
|
|
trends = trend_collector.fetch_youtube_trending()
|
|
keywords = [t["keyword"] for t in trends]
|
|
assert "기준금리 인상 단행" in keywords # 대괄호·이모지 제거
|
|
assert "BTS 컴백 무대" in keywords # 괄호 제거
|
|
assert "스트레스 관리 5가지 방법" in keywords # 그대로
|
|
assert len(trends) == 3 # 중복 제거됨
|
|
assert all(t["source"] == "youtube_trending" for t in trends)
|
|
|
|
|
|
def test_fetch_youtube_trending_no_api_key_returns_empty(monkeypatch):
|
|
monkeypatch.setattr(trend_collector, "YOUTUBE_DATA_API_KEY", "")
|
|
out = trend_collector.fetch_youtube_trending()
|
|
assert out == []
|
|
|
|
|
|
def test_fetch_youtube_trending_graceful_on_api_failure(monkeypatch):
|
|
monkeypatch.setattr(trend_collector, "YOUTUBE_DATA_API_KEY", "fake_key")
|
|
fake_resp = MagicMock()
|
|
fake_resp.raise_for_status.side_effect = RuntimeError("quota exceeded")
|
|
monkeypatch.setattr(trend_collector.requests, "get", lambda *a, **kw: fake_resp)
|
|
out = trend_collector.fetch_youtube_trending()
|
|
assert out == []
|
|
|
|
|
|
def test_collect_all_invokes_both_sources(tmp_db, monkeypatch):
|
|
monkeypatch.setattr(trend_collector, "collect_naver_popular_for",
|
|
lambda cats: 5)
|
|
monkeypatch.setattr(trend_collector, "collect_youtube_trending",
|
|
lambda: 3)
|
|
out = trend_collector.collect_all(["economy"])
|
|
assert out == {"naver_popular": 5, "youtube_trending": 3}
|
|
|
|
|
|
def test_seeds_for_filters_placeholder(tmp_db, monkeypatch):
|
|
"""category_seeds 템플릿에 placeholder '...'가 들어가도 DEFAULT 폴백."""
|
|
from app import db as db_module
|
|
db_module.upsert_prompt_template(
|
|
"category_seeds",
|
|
'{"economy": ["...", "…", "a", "real_keyword"]}',
|
|
"test",
|
|
)
|
|
out = trend_collector._seeds_for("economy")
|
|
# '...', '…', 'a'(2자 미만)는 필터링되고 'real_keyword'만 남음
|
|
assert out == ["real_keyword"]
|
|
|
|
|
|
def test_seeds_for_falls_back_when_all_invalid(tmp_db, monkeypatch):
|
|
"""모든 시드가 invalid면 DEFAULT_CATEGORY_SEEDS 폴백."""
|
|
from app import db as db_module
|
|
db_module.upsert_prompt_template(
|
|
"category_seeds",
|
|
'{"economy": ["...", "TBD", ""]}',
|
|
"test",
|
|
)
|
|
out = trend_collector._seeds_for("economy")
|
|
# DEFAULT_CATEGORY_SEEDS["economy"] 가 반환되어야 함
|
|
from app.config import DEFAULT_CATEGORY_SEEDS
|
|
assert out == list(DEFAULT_CATEGORY_SEEDS["economy"])
|