JSON-LD
Schema.org 어휘를 HTML body 와 분리된 <script type="application/ld+json"> 블록에 작성하는 W3C 표준 syntax. Google이 우선 권장하는 구조화 데이터 형식
JSON-LD란?
JSON-LD(JSON for Linked Data)는 schema.org 어휘를 HTML body 와 독립된 <script type="application/ld+json"> 블록 안에 JSON 형식으로 작성하는 W3C 공식 표준 syntax 입니다. Microdata · RDFa 와 함께 schema.org 가 명세하는 3가지 구조화 데이터 syntax 중 하나로, Google Search Central 가이드는 명확하게 JSON-LD 를 우선 권장합니다.
왜 JSON-LD가 우선 권장되나?
| Syntax | 위치 | 추출 robust 성 | Google 권장 |
|---|---|---|---|
| JSON-LD | <script> 블록 (HTML body 분리) |
✅ 본문 변경에 영향 받지 않음 | ✅ 우선 권장 |
| Microdata | HTML attribute (itemscope/itemtype) |
△ HTML 파싱 트리 의존 | 호환 |
| RDFa | HTML attribute (vocab/typeof) |
△ HTML 파싱 트리 의존 | 호환 |
이유는 두 가지입니다.
- HTML body 와 분리 —
<script>블록 안 독립 JSON 으로 작성되어 마크업 변경이 schema 데이터를 깨뜨리지 않습니다. - 추출 robust 성 — Microdata · RDFa 는 HTML 파싱 트리에 의존하므로 일부 봇이 정상 추출하지 못할 수 있지만 JSON-LD 는 별도 토큰화로 일관 추출됩니다.
JSON-LD 1.1 은 W3C Recommendation (2020-07) 으로 공식 표준 위상도 가장 높습니다.
GEO·AEO 관점에서의 JSON-LD
LLM (ChatGPT · Claude · Gemini · Perplexity) 답변 인용 실측에서 JSON-LD 우선 추출 패턴이 확인됩니다. AI 답변이 페이지를 entity 로 식별하고 인용 결정을 내릴 때 가장 안정적인 구조화 데이터 형식이라는 의미입니다.
특히 Aggarwal et al. KDD 2024 의 Cite-source 전략은 자연어 본문에 "출처: ..." 라고 쓰는 것보다 schema.org 의 Article.citation · Organization.url 같은 필드를 JSON-LD 로 명시하는 것이 LLM 추출 robust 성에서 우위라는 학술 근거를 제공합니다.
적용 예시
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "Article",
"headline": "RanketAI Guide #06: Schema.org 13타입 GEO 영향도",
"author": { "@type": "Organization", "name": "RanketAI Editorial" },
"datePublished": "2026-05-09",
"publisher": {
"@type": "Organization",
"name": "RanketAI"
}
}
</script>