import { NextResponse } from 'next/server'; import { GoogleGenerativeAI } from '@google/generative-ai'; import { createClient } from '@/lib/supabase/server'; import { STORY_SYSTEM_PROMPT, buildStoryUserMessage, parseStoryJson, validateStory, } from '@/lib/music/story-prompt'; import { config as loadDotenv } from 'dotenv'; import { resolve } from 'path'; export const runtime = 'nodejs'; // Vercel 최대 타임아웃 (Pro plan 300s, Hobby 60s) export const maxDuration = 60; // Next.js가 env 로드를 놓치는 경우 대비해 직접 로드 (Windows 환경 대응) loadDotenv({ path: resolve(process.cwd(), '.env.local'), override: true }); // 모델 우선순위 — 사주 analyze·타로 interpret와 동일 폴백 목록(이 API 키로 접근 가능한 모델만) const MODELS = [ { id: 'gemini-2.5-pro', maxTokens: 8192 }, { id: 'gemini-2.5-flash', maxTokens: 8192 }, { id: 'gemini-2.0-flash', maxTokens: 8192 }, ] as const; // wall-clock 예산 — maxDuration(60s)보다 여유 있게 끊어 graceful 502를 반환 const TIME_BUDGET_MS = 45_000; // 최악 호출 수 상한 — 모델 폴백 × 검증 실패 reroll을 합쳐도 이 값을 넘지 않음 const MAX_ATTEMPTS = 3; export async function POST(request: Request) { // 1) 인증 — 로그인 사용자만 (Gemini API 무단 호출 방지) // 일일 사용량 집계·제한은 generate 단계에서만 수행 — story는 가사 초안 생성일 뿐이라 미집계. const supabase = await createClient(); const { data: { user } } = await supabase.auth.getUser(); if (!user) { return NextResponse.json({ error: '로그인이 필요합니다.' }, { status: 401 }); } // 2) 입력 검증 let body: Record; try { body = await request.json(); } catch { return NextResponse.json({ error: '잘못된 요청 형식입니다.' }, { status: 400 }); } const story = typeof body.story === 'string' ? body.story.trim() : ''; if (!story) { return NextResponse.json({ error: '이야기를 입력해주세요.' }, { status: 400 }); } // 3) API 키 const apiKey = process.env.GEMINI_API_KEY; if (!apiKey) { console.warn('[스튜디오] GEMINI_API_KEY 미설정 — 503 반환 (예시 가사 반환 금지, 데이터 오염 방지)'); return NextResponse.json({ error: 'AI 서비스가 준비 중입니다.' }, { status: 503 }); } const genAI = new GoogleGenerativeAI(apiKey); const userMessage = buildStoryUserMessage(story); // 4) 호출 — 모델 폴백 + 검증 실패 시 같은 모델로 1회 reroll // wall-clock 45s 예산과 총 호출 3회 상한으로 최악 케이스를 조기 종료(→ 502) const startedAt = Date.now(); let feedback = ''; let attempts = 0; modelLoop: for (const { id: modelId, maxTokens } of MODELS) { // retry 0: 최초 시도, retry 1: 검증 실패 시에만 같은 모델로 1회 reroll for (let retry = 0; retry < 2; retry += 1) { if (attempts >= MAX_ATTEMPTS || Date.now() - startedAt > TIME_BUDGET_MS) { break modelLoop; } attempts += 1; try { const model = genAI.getGenerativeModel({ model: modelId, systemInstruction: STORY_SYSTEM_PROMPT, generationConfig: { temperature: 0.9, topP: 0.95, maxOutputTokens: maxTokens, }, }); const prompt = feedback ? `${userMessage}\n\n[이전 시도 오류: ${feedback}] 스키마를 정확히 지켜 다시 출력하세요.` : userMessage; const result = await model.generateContent(prompt); const text = result.response.text(); const parsed = parseStoryJson(text); const invalid = parsed ? validateStory(parsed) : 'JSON 파싱 실패'; if (parsed && !invalid) { return NextResponse.json({ story: parsed }); } // 검증 실패 — 사유를 피드백으로 주입해 같은 모델로 1회 reroll(retry 루프 계속) feedback = invalid ?? 'JSON 파싱 실패'; } catch (modelError) { // 호출 자체의 예외(레이트리밋 등)는 reroll하지 않고 바로 다음 모델로 폴백 feedback = modelError instanceof Error ? modelError.message : 'model error'; break; } } } return NextResponse.json( { error: '가사 생성에 실패했습니다. 잠시 후 다시 시도해주세요.' }, { status: 502 } ); }