feat(phase3a): 스토리→가사(Gemini) + generate 인증·일일제한 + callback 정리

- lib/music/story-prompt.ts: MusicStory 스키마 + Gemini 응답 파싱/검증(타로 prompt.ts 방어 패턴 포팅)
- app/api/studio/story/route.ts: 로그인 인증 후 Gemini 모델 폴백(2.5-pro→2.5-flash→2.0-flash)으로 가사 JSON 생성. 일일 사용량은 미집계(생성 확정 전 초안 단계)
- app/api/studio/callback/route.ts: Suno webhook 수신용 최소 200 응답 엔드포인트
- app/api/studio/generate/route.ts: 인증(401) + 일일 제한(429, MUSIC_DAILY_LIMIT) 추가, Suno 생성 성공 시에만 recordUsage('music') 기록

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
2026-07-03 12:56:58 +09:00
parent 0742059db2
commit 2aa424f3ce
4 changed files with 190 additions and 0 deletions

View File

@@ -0,0 +1,115 @@
import { NextResponse } from 'next/server';
import { GoogleGenerativeAI } from '@google/generative-ai';
import { createClient } from '@/lib/supabase/server';
import {
STORY_SYSTEM_PROMPT,
buildStoryUserMessage,
parseStoryJson,
validateStory,
} from '@/lib/music/story-prompt';
import { config as loadDotenv } from 'dotenv';
import { resolve } from 'path';
export const runtime = 'nodejs';
// Vercel 최대 타임아웃 (Pro plan 300s, Hobby 60s)
export const maxDuration = 60;
// Next.js가 env 로드를 놓치는 경우 대비해 직접 로드 (Windows 환경 대응)
loadDotenv({ path: resolve(process.cwd(), '.env.local'), override: true });
// 모델 우선순위 — 사주 analyze·타로 interpret와 동일 폴백 목록(이 API 키로 접근 가능한 모델만)
const MODELS = [
{ id: 'gemini-2.5-pro', maxTokens: 8192 },
{ id: 'gemini-2.5-flash', maxTokens: 8192 },
{ id: 'gemini-2.0-flash', maxTokens: 8192 },
] as const;
// wall-clock 예산 — maxDuration(60s)보다 여유 있게 끊어 graceful 502를 반환
const TIME_BUDGET_MS = 45_000;
// 최악 호출 수 상한 — 모델 폴백 × 검증 실패 reroll을 합쳐도 이 값을 넘지 않음
const MAX_ATTEMPTS = 3;
export async function POST(request: Request) {
// 1) 인증 — 로그인 사용자만 (Gemini API 무단 호출 방지)
// 일일 사용량 집계·제한은 generate 단계에서만 수행 — story는 가사 초안 생성일 뿐이라 미집계.
const supabase = await createClient();
const { data: { user } } = await supabase.auth.getUser();
if (!user) {
return NextResponse.json({ error: '로그인이 필요합니다.' }, { status: 401 });
}
// 2) 입력 검증
let body: Record<string, unknown>;
try {
body = await request.json();
} catch {
return NextResponse.json({ error: '잘못된 요청 형식입니다.' }, { status: 400 });
}
const story = typeof body.story === 'string' ? body.story.trim() : '';
if (!story) {
return NextResponse.json({ error: '이야기를 입력해주세요.' }, { status: 400 });
}
// 3) API 키
const apiKey = process.env.GEMINI_API_KEY;
if (!apiKey) {
console.warn('[스튜디오] GEMINI_API_KEY 미설정 — 503 반환 (예시 가사 반환 금지, 데이터 오염 방지)');
return NextResponse.json({ error: 'AI 서비스가 준비 중입니다.' }, { status: 503 });
}
const genAI = new GoogleGenerativeAI(apiKey);
const userMessage = buildStoryUserMessage(story);
// 4) 호출 — 모델 폴백 + 검증 실패 시 같은 모델로 1회 reroll
// wall-clock 45s 예산과 총 호출 3회 상한으로 최악 케이스를 조기 종료(→ 502)
const startedAt = Date.now();
let feedback = '';
let attempts = 0;
modelLoop:
for (const { id: modelId, maxTokens } of MODELS) {
// retry 0: 최초 시도, retry 1: 검증 실패 시에만 같은 모델로 1회 reroll
for (let retry = 0; retry < 2; retry += 1) {
if (attempts >= MAX_ATTEMPTS || Date.now() - startedAt > TIME_BUDGET_MS) {
break modelLoop;
}
attempts += 1;
try {
const model = genAI.getGenerativeModel({
model: modelId,
systemInstruction: STORY_SYSTEM_PROMPT,
generationConfig: {
temperature: 0.9,
topP: 0.95,
maxOutputTokens: maxTokens,
},
});
const prompt = feedback
? `${userMessage}\n\n[이전 시도 오류: ${feedback}] 스키마를 정확히 지켜 다시 출력하세요.`
: userMessage;
const result = await model.generateContent(prompt);
const text = result.response.text();
const parsed = parseStoryJson(text);
const invalid = parsed ? validateStory(parsed) : 'JSON 파싱 실패';
if (parsed && !invalid) {
return NextResponse.json({ story: parsed });
}
// 검증 실패 — 사유를 피드백으로 주입해 같은 모델로 1회 reroll(retry 루프 계속)
feedback = invalid ?? 'JSON 파싱 실패';
} catch (modelError) {
// 호출 자체의 예외(레이트리밋 등)는 reroll하지 않고 바로 다음 모델로 폴백
feedback = modelError instanceof Error ? modelError.message : 'model error';
break;
}
}
}
return NextResponse.json(
{ error: '가사 생성에 실패했습니다. 잠시 후 다시 시도해주세요.' },
{ status: 502 }
);
}