본문으로 건너뛰기
economics

추론 비용 (Inference Cost)

정의

학습이 끝난 모델이 실제 요청을 처리할 때 발생하는 단위당 실행 비용

#추론 비용#Inference Cost#토큰 비용#LLM 가격

추론 비용이란?

추론 비용은 모델 학습 이후, 실제 서비스에서 프롬프트를 처리하고 응답을 생성할 때 드는 비용입니다.

보통 어떻게 측정하나요?

API 환경에서는 주로 입력·출력 토큰 단가로 측정하고, 로컬 환경에서는 GPU 감가상각, 전력비, 운영비를 합산해 계산합니다.

왜 중요한가요?

추론 비용은 제품 가격 정책, 기능 범위, 사용자당 수익성에 직접 영향을 주기 때문에 AI 서비스의 사업성 판단 핵심 지표로 쓰입니다.

AI 검색에 내 사이트는 노출되고 있을까?

ChatGPT·Perplexity·Gemini가 내 브랜드를 어떻게 답하는지 무료로 확인해 보세요.

지금 진단 시작 →

관련 용어