RanketAI Guide #06: Schema.org 13타입 GEO 영향도 — RanketAI site check 권장 근거
Schema.org 표준에서 RanketAI site check 가 권장하는 13개 schema 타입 (Organization · Article · FAQPage · BreadcrumbList 등) 의 GEO 영향을 학술 (KDD 2024 + Chen 2025) + Google Rich Results + Ahrefs 2026-02 로 정리. JSON-LD 채택 이유 + 4 그룹 분류 포함.
AI 보조 작성 · 편집팀 검수이 블로그 콘텐츠는 AI 보조 도구를 활용해 초안/구조화를 수행할 수 있으며, RanketAI 편집팀 검수 후 발행됩니다.
핵심 요약 (2026-05-09 현재): GEO 측정의 두 번째 게이트는 schema.org 다. 첫 게이트 (#05 — robots.txt 정책) 가 봇 접근 권한이라면, schema.org 는 봇이 콘텐츠를 정확히 이해하고 entity 로 식별하는 layer 다. 본 글은 schema.org 공식 표준 + Google Rich Results + KDD 2024 GEO 9 전략 학술 근거 + Ahrefs 2026-02 분석 으로 RanketAI site check 가 권장하는 13개 schema 타입의 GEO 영향을 정리한다.
왜 schema.org 가 GEO 의 두 번째 게이트인가
전편 #05 — AI 크롤러 4대장 정책 에서 robots.txt 가 GEO 의 첫 게이트임을 정리했다. 봇이 접근하지 못하면 9 GEO 전략 (Aggarwal et al. KDD 2024) 효과가 모두 0이기 때문이다. 그러나 봇이 페이지를 fetch 한 뒤에 또 하나의 결정적 분기가 있다 — 봇이 이 페이지를 무엇 으로 이해했는가.
자연어 HTML 만으로도 LLM 은 페이지 의미를 추론할 수 있다. 단 추론은 확률적이고 페이지·언어·도메인마다 정확도가 갈린다. schema.org 는 그 추론을 결정적으로 만든다. 페이지가 "이 회사는 RanketAI 이고, 이 글은 가이드 시리즈 #06 이며, 저자는 RanketAI Editorial 이다" 라고 명시적으로 선언 하면 LLM 의 entity 식별·인용 결정·답변 구성이 모두 안정화된다.
Chen et al. 2025 가 정량 입증한 "AI 검색의 earned media (제3자 출처) 편향" 도 entity 식별 정합성 위에서 작동한다. AI 가 자사 페이지를 entity 로 식별하지 못하면 제3자 출처가 자사를 언급해도 그 신호를 자사로 귀속시키지 못한다. schema.org 는 entity 귀속 (entity attribution) 의 base layer.
Schema.org 의 표준 위상
schema.org 는 2011 년 Google · Microsoft · Yahoo · Yandex 4 검색 엔진이 공동 후원으로 시작한 구조화 데이터 어휘 표준이다. 현재 800+ 타입과 1400+ 속성을 정의하며, JSON-LD · Microdata · RDFa 3 가지 syntax 를 명세한다.
3 syntax 의 차이는 다음 한 표로 정리된다.
| Syntax | 위치 | 추출 robust 성 | Google 권장 |
|---|---|---|---|
| JSON-LD | <script type="application/ld+json"> (head/body 분리) |
✅ (HTML 본문과 독립) | ✅ 우선 권장 |
| Microdata | HTML attribute (itemscope, itemtype) |
△ (HTML 본문과 결합) | 호환 |
| RDFa | HTML attribute (vocab, typeof) |
△ (HTML 본문과 결합) | 호환 |
Google Search Central 공식 가이드 는 명확하게 JSON-LD 우선 권장 을 선언한다. 이유는 두 가지다.
- HTML body 와 분리 — JSON-LD 는
<script>블록 안 독립 JSON 으로 작성된다. HTML 마크업 변경이 schema 데이터를 깨뜨리지 않는다. - 추출 robust 성 — Microdata · RDFa 는 HTML 파싱 트리에 의존하므로 일부 봇이 정상 추출하지 못할 수 있다. JSON-LD 는 별도 토큰화로 추출이 일관적이다.
JSON-LD 는 W3C Recommendation (1.1, 2020-07) 로 공식 표준 위상도 가장 높다. RanketAI site check 가 Microdata 감지 시 JSON-LD 전환을 권고하는 근거가 이 공식 우선순위에 있다.
13 타입 4 그룹 — 왜 이 13개인가
site check 가 권장하는 13 타입은 단순히 "많을수록 좋다" 가 아니라 4 그룹 × 단계별 entity 식별 책임으로 설계됐다.
Group A — 조직 정체성 (3 타입)
- Organization — 기업·단체 정체성. AI 답변에서 "이 회사는 누구인가" 의 1차 신호. Cross-LLM entity disambiguation 에서 가장 중요한 타입. (#02 LLM 인용 알고리즘 참조)
- Corporation — Organization 의 하위 — 영리 법인. 사업자 등록·법적 entity 정보 보강용.
- Person — 대표자·저자·전문가. E-E-A-T frame 의 Authoritativeness 신호.
Group B — 페이지 메타 (4 타입)
- WebSite — 사이트 전체 메타. sitelinks searchbox · alternateName 등 site-level 신호.
- WebPage — 개별 페이지 메타. 모든 페이지의 가장 기본 wrapper.
- BreadcrumbList — 페이지 계층 경로. AI 답변이 "이 글은 어느 카테고리 안에 있는지" 인식하는 신호. Google Rich Results 의 SERP 경로 표기에도 직접 사용.
- CollectionPage — 목록·아카이브 페이지. 카테고리 페이지·태그 페이지·블로그 인덱스에 적합.
Group C — 콘텐츠 (2 타입)
- Article — 기사·블로그·가이드. AI 답변 인용 1순위 타입. headline · author · datePublished · publisher 4 필드가 entity attribution 의 핵심.
- FAQPage — Q&A 구조. AEO (Answer Engine Optimization) 의 핵심. AI 답변에 직접 인용되는 빈도가 가장 높은 타입.
Group D — 비즈니스 액션 (4 타입)
- Product — 상품. 커머스 페이지의 1차 schema. price · availability · review 가 Rich Results 의 별점·가격 표기 트리거.
- Service — 서비스. SaaS · 컨설팅 · 전문 서비스 등. provider · areaServed · serviceType 필드.
- LocalBusiness — 지역 비즈니스. 오프라인 매장·지점이 있는 사업체. address · geo · openingHours 가 지역 검색 + AI 답변의 location 인용 신호.
- Event — 이벤트. 컨퍼런스·세미나·웨비나·런칭. startDate · location · organizer.
이 13 타입의 공통점은 AI 답변의 정보 단위 (entity / claim / location / time) 와 1:1 대응 한다는 것이다. AI 가 답변을 구성할 때 필요로 하는 정보 단위를 schema 에 매핑한 결과가 이 13개다.
GEO 영향 — 학술 + 산업 근거 (2026-05-09 현재)
13 타입의 영향은 학술 (KDD 2024 / Chen 2025) 과 2026 시점 산업 분석 (Ahrefs / Bing / Google) 으로 모두 검증된다.
Ahrefs 2026-02 정량 입증 — AI 답변 인용은 SERP 외부로 확장 중
Search Engine Land 2026 보도 의 Ahrefs 분석에 따르면, 863,000 키워드 SERP + 4M AI Overview URL 을 분석한 결과 AI Overview 인용 페이지 중 top 10 SERP 비율은 2025 중반 76% → 2026-02 38% 로 급락했다. AI 답변이 SERP 외부 출처를 점점 더 많이 인용한다는 의미로, 2026 시점에서 schema.org 의 entity attribution 역할이 더 결정적이 됐다. SERP 순위 신호 외에 LLM 이 페이지를 식별·신뢰할 1차 근거가 schema.org 라는 frame 정합. Bing (2025-03) 과 Google (2025-04) 도 schema markup 의 LLM 기여 (Copilot 콘텐츠 이해 + Google search advantage) 를 공식 인정한 바 있다.
Cite-source 전략 (KDD 2024)
Aggarwal et al. KDD 2024 는 9 GEO 전략을 정량 평가했고, 그 중 Cite-source 전략 (인용 가능한 출처 명시) 이 인용성 +40% 효과로 입증됐다. schema.org 의 Article.author · Organization.url · Article.citation 필드가 이 전략의 실행 형식 이다. 자연어 본문에 "출처: ..." 라고 쓰는 것보다 schema 로 명시하는 것이 LLM 추출 robust 성이 높다.
Earned media 편향 (Chen et al. 2025)
Chen et al. 2025 가 정량 입증한 "AI 검색의 earned media 편향" 은 제3자가 자사를 언급할 때 그 신호를 어떻게 자사로 귀속시킬지가 본질이다. schema.org 의 Organization.sameAs 필드 (Wikipedia · Crunchbase · LinkedIn 등 권위 출처 cross-reference) 가 이 귀속의 base layer 다.
E-E-A-T (Google 공식 frame)
Google 의 E-E-A-T frame 은 Experience · Expertise · Authoritativeness · Trust 4 평가축이다. schema.org 의 Person.knowsAbout · Article.author · Organization.foundingDate · Review.author 필드가 각 축의 1차 신호로 작동한다. AI Overviews 의 답변 품질 평가에도 동일 frame 이 적용된다.
RanketAI site check 권장 근거 매트릭스
13 타입 권장의 근거를 한 표로 정리하면 다음과 같다.
| 타입 | Group | Google Rich Results | AI 답변 인용 빈도 | 권장 근거 |
|---|---|---|---|---|
| Organization | A | ✅ Logo · sameAs | 상 | entity 1차 신호 (모든 페이지) |
| Corporation | A | (Organization 호환) | 중 | 법인 정보 보강 |
| Person | A | (간접) | 상 | E-E-A-T Authoritativeness |
| WebSite | B | ✅ Sitelinks Searchbox | 중 | site-level wrapper |
| WebPage | B | (기본) | 중 | 모든 페이지 기본 |
| BreadcrumbList | B | ✅ SERP 경로 표기 | 상 | 페이지 계층 인식 |
| CollectionPage | B | (간접) | 중 | 목록 페이지 식별 |
| Article | C | ✅ headline · author · image | 최상 | AI 답변 인용 1순위 |
| FAQPage | C | ✅ FAQ 직접 표시 | 최상 | AEO 핵심 |
| Product | D | ✅ 별점 · 가격 · 재고 | 상 | 커머스 |
| Service | D | (간접) | 중 | SaaS · B2B |
| LocalBusiness | D | ✅ Local Pack · Map | 중 | 오프라인 사업체 |
| Event | D | ✅ Event 카드 | 중 | 일정 정보 |
핵심 패턴:
- Article + FAQPage — AI 답변 인용 빈도 최상. 모든 콘텐츠 페이지에 우선 적용 권장.
- Organization + Person — entity 1차 신호. 사이트 전체 또는 대표 페이지 1회 publish 면 충분.
- BreadcrumbList — Rich Results SERP 경로 표기 직접 트리거. 모든 페이지 기본 추가.
- Product / LocalBusiness / Event — 비즈니스 모델별 선택 적용.
RanketAI site check 와의 연결
RanketAI site check 는 페이지 분석 시 다음 항목을 진단한다.
| site check 진단 항목 | 13 타입 매핑 |
|---|---|
| schema.org 타입 감지 수 | 13 타입 중 몇 개가 페이지에 있는가 |
| JSON-LD 형식 채택 여부 | Microdata · RDFa → JSON-LD 전환 권장 |
| 권장 타입 누락 분석 | 13 타입 중 부재한 타입 + 페이지 유형별 우선순위 |
진단 결과가 부족하면 일반적으로 다음 인과로 점검 우선순위가 정해진다.
| 약점 시나리오 | 권장 우선 추가 타입 |
|---|---|
| 회사 사이트인데 Organization 없음 | Organization (Group A) — 모든 페이지 |
| 블로그·기사인데 Article 없음 | Article (Group C) — 콘텐츠 페이지 |
| FAQ 섹션 있는데 FAQPage 없음 | FAQPage (Group C) — Q&A 페이지 |
| 카테고리 경로 있는데 BreadcrumbList 없음 | BreadcrumbList (Group B) — 모든 페이지 |
| 커머스인데 Product 없음 | Product (Group D) — 상품 페이지 |
| Microdata 만 사용 (JSON-LD 부재) | 동일 schema 의 JSON-LD 재작성 |
즉 RanketAI site check 의 schema 진단은 추상적 가이드라인이 아니라 AI 답변 인용 가능성을 페이지 단위로 진단하는 frame 이다. 약점이 발견되면 위 매핑에 따라 우선순위 추가하면 된다.
결론 — 표준 + 학술 + 산업 + 측정의 4축 합의 (2026-05-09 현재)
#05 의 3축 합의 frame 에 2026 시점 산업 분석을 더한 4축 합의다.
- 표준 — schema.org · Google Rich Results · JSON-LD W3C Recommendation — 13 타입의 어휘·형식 합의
- 학술 — KDD 2024 · Chen et al. 2025 — Cite-source 전략 + earned media 편향의 정량 검증
- 산업 (2026) — Search Engine Land 2026 (Ahrefs 보도) — AI Overview 인용이 SERP 외부로 빠르게 확장 (top 10 SERP 비율 76% → 38%) + Bing/Google 2025 schema 기여 공식 인정
- 측정 — RanketAI site check — 페이지별 13 타입 감지 + 약점 진단
3 축이 합의한 결론은 명확하다.
- JSON-LD 우선 — Microdata · RDFa 는 추출 robust 성 ↓. JSON-LD 단일 형식 권장
- Group C (Article · FAQPage) 가 인용 빈도 최상 — 콘텐츠 페이지 우선 적용
- Group A (Organization · Person) 는 entity 1차 신호 — 사이트 전체 1회 publish 충분
- BreadcrumbList 는 Rich Results 트리거 — 모든 페이지 기본 추가 권장
- Group D (Product · Service · LocalBusiness · Event) — 비즈니스 모델별 선택 적용
schema.org 검토는 GEO 작업의 두 번째 출발점이며, 자사 측정 결과 (RanketAI site check 의 schema 감지 수) 에서 약점이 발견되면 위 13 타입 매트릭스에 따라 우선순위 보강하면 된다.
⚠ schema 사양은 자주 갱신된다. 본 글의 13 타입 권장과 우선순위는 2026-05-09 시점 기준이다. 운영 적용 전에 위 10 references 의 공식 페이지 (특히 Google Rich Results 가이드 + schema.org 각 타입 페이지 + Ahrefs/Search Engine Land 최신 분석) 를 직접 확인할 것을 권장한다.
더 읽을거리: #01 — AI 검색 시대, 왜 SEO만으론 부족한가 · #02 — LLM 인용 알고리즘 해부 · #03 — 한국 AI 가시성 격차 · #04 — GEO 학계 vs 산업 vs 실측 매핑 · #05 — AI 크롤러 4대장 공식 정책
핵심 실행 요약
| 항목 | 실무 기준 |
|---|---|
| 핵심 주제 | RanketAI Guide #06: Schema.org 13타입 GEO 영향도 — RanketAI site check 권장 근거 |
| 적용 대상 | AI 기업·투자·사업 업무에 우선 적용 |
| 우선 조치 | AI 이니셔티브 시작 전 측정 가능한 성공 KPI(비용·시간·품질)를 정의 |
| 리스크 체크 | 전체 예산 확정 전 소규모 파일럿으로 ROI 가정을 검증 |
| 다음 단계 | 분기별 KPI 변화를 추적하고 범위를 조정하는 검토 주기를 수립 |
분석 근거
- Schema.org 공식 표준 (schema.org) — W3C Schema.org Community Group 이 운영하는 구조화 데이터 어휘 표준. 800+ 타입 + 1400+ 속성 정의. JSON-LD · Microdata · RDFa 3 가지 syntax 명세. Google · Microsoft · Yahoo · Yandex 4 검색 엔진 공동 후원으로 사실상 검색 엔진 공식 표준 위치.
- Google Search Central — Structured Data 가이드 (developers.google.com/search/docs/appearance/structured-data) — Rich Results 자격 부여 schema 타입 공식 목록. JSON-LD 우선 권장 명시 + Article · FAQPage · BreadcrumbList · Product · Organization 등 핵심 타입 별 spec 페이지 운영.
- Aggarwal et al. "GEO: Generative Engine Optimization" (Princeton·IIT Delhi·Georgia Tech, KDD 2024, arXiv:2311.09735) — 9 가지 GEO 전략 정량 검증의 학술 출발점. structured data 와 citation 신호가 LLM 답변 가시성에 미치는 영향을 정량화. 인용성 향상 +40% (Cite-source 전략).
- Chen·Wang·Chen·Koudas. "How to Dominate AI Search" (2025-09, arXiv:2509.08919) — AI 검색이 earned media (제3자 출처) + 구조화된 권위 신호에 체계적으로 편향됨을 정량 입증. Schema.org Organization · Person · Article 의 권위 신호 효과를 학술적으로 뒷받침.
- Google — Helpful, reliable, people-first content (2024 갱신) — E-E-A-T (Experience · Expertise · Authoritativeness · Trust) 평가 frame 에서 schema.org 의 author · publisher · reviewedBy 필드가 entity 식별의 1차 신호로 작동. AI Overviews 의 답변 품질 평가에도 동일 frame 적용.
- JSON-LD 1.1 W3C Recommendation (2020-07) — JSON for Linked Data 의 공식 W3C 권장안. HTML body 와 분리된 `<script type="application/ld+json">` 패턴이 추출 robust 성·유지보수성에서 Microdata · RDFa 대비 우위. Google · OpenAI · Anthropic · Perplexity 4 LLM 답변 인용 실측에서 JSON-LD 우선 추출 패턴 확인.
- Microsoft Bing Webmaster — Structured Markup Validator + JSON-LD 우선 권장 정책. Bing 검색 인덱스 (Copilot · Bing Chat 백엔드 공유) 가 schema.org 어휘를 entity disambiguation (동명이인·동명회사) 의 1차 신호로 활용.
- Search Engine Land 2026 (Ahrefs 2026-02 연구 보도) — 863,000 키워드 SERP + 4M AI Overview URL 분석. AI Overview 인용 페이지 중 top 10 SERP 비율이 2025 중반 76% → 2026-02 38% 로 하락. AI 답변이 SERP 외부 출처 (schema.org entity 식별 가능 페이지 포함) 로 인용 범위를 빠르게 확장 중. Bing 2025-03 + Google 2025-04 공식 발언으로 schema markup 의 LLM 기여 (Copilot 콘텐츠 이해 + Google search advantage) 도 동시 인정.
핵심 주장과 근거
이 섹션은 본문 핵심 주장과 근거 출처를 1:1로 대응해 빠르게 검증할 수 있도록 구성했습니다. 아래 항목에서 주장과 원문 링크를 함께 확인하세요.
주장:Schema.org 는 Google · Microsoft · Yahoo · Yandex 4 검색 엔진 공동 후원의 사실상 공식 표준 어휘
근거 출처:Schema.org 공식주장:Google 은 JSON-LD 형식을 Microdata · RDFa 보다 우선 권장
근거 출처:Google Structured Data 가이드주장:Article · FAQPage · BreadcrumbList 는 Google Rich Results 자격 부여의 핵심 schema 타입
근거 출처:Google Search Central주장:KDD 2024 GEO 9 전략 검증 — Cite-source 등 structured signal 이 인용성 +40% 효과
근거 출처:Aggarwal et al. KDD 2024 (arXiv:2311.09735)주장:AI 검색은 구조화된 권위 신호 (Organization · Person · Article schema) 에 체계적 편향
근거 출처:Chen et al. 2025 (arXiv:2509.08919)주장:JSON-LD 1.1 은 W3C 공식 Recommendation 으로 HTML body 분리 + 추출 robust 성에서 Microdata 대비 우위
근거 출처:W3C JSON-LD 1.1 Recommendation주장:E-E-A-T frame 에서 schema.org author · publisher 필드는 entity 식별 1차 신호
근거 출처:Google Helpful Content Guide주장:Ahrefs 2026-02 연구 — AI Overview 인용 페이지 중 top 10 SERP 비율 2025 중반 76% → 2026-02 38% 로 하락. AI 답변이 SERP 외부 출처로 인용 범위를 빠르게 확장 → schema.org entity attribution 의 GEO 게이트 역할 강화.
근거 출처:Search Engine Land 2026 (Ahrefs 보도)
외부 인용 링크
아래 링크는 본문 수치와 주장에 직접 사용한 원문 출처입니다. 항목별 원문 맥락을 확인하면 해석 차이를 줄이고 재검증 속도를 높일 수 있습니다.
- Schema.org 공식 표준
- Google Search Central — Structured Data 가이드
- Google — Article 구조화 데이터
- Google — FAQPage 구조화 데이터
- Google — BreadcrumbList 구조화 데이터
- Google — Helpful, reliable, people-first content (E-E-A-T)
- JSON-LD 1.1 W3C Recommendation
- Aggarwal et al. — GEO: Generative Engine Optimization (KDD 2024)
- Chen et al. — How to Dominate AI Search (2025)
- Search Engine Land — Schema markup AI search (2026)
관련 포스트
관련 포스트는 현재 글의 선택 기준을 다른 상황에서 비교 검증할 수 있도록 선별했습니다. 관점을 확장하려면 아래 글을 순서대로 확인해 보세요.
AI 답변에 내 브랜드가 안 나오는 13가지 질문 — GEO 진단 + 개선 가이드
ChatGPT·Gemini·Perplexity 답변에 우리 브랜드가 보이지 않을 때 가장 자주 묻는 13가지 질문을 RanketAI 운영 데이터 기반으로 정리한다. GEO/AEO 측정과 개선의 출발점, 콘텐츠 구조와 LLM 인용률을 높이는 실전 단계까지 단계별로 설명한다.
Google AI Mode 최신 변화(2026-05-06)와 브랜드 가시성 개선 방법
Google AI Mode와 AI Overviews가 웹 탐색 방식을 어떻게 바꾸고 있는지 과거 검색, 현재 AI 답변, 미래의 브랜드 가시성 관점에서 정리한다. 기존 SEO가 왜 부족해졌고, 앞으로 어떤 점검 기준이 필요해지는지 쉽게 설명한다.
GEO 분석 도구 vs AEO 분석 도구: 무엇을 언제 써야 하나 (2026)
GEO 분석 도구와 AEO 분석 도구는 측정 범위가 다릅니다. 도구 카테고리 6종, 시나리오별 선택 가이드, Coverage × Depth × Locale 평가 프레임워크, RanketAI 위치까지 비교 정리합니다.
RanketAI Guide #04: GEO 학계 vs 산업 vs 실측 — 9가지 전략을 사용자 측정 영역에 매핑
Aggarwal et al. KDD 2024 원논문의 9가지 GEO 전략, Chen et al. 2025 후속 연구의 earned media 편향 발견, Ahrefs Brand Radar 2026과 Similarweb 2026 GenAI Brand Visibility Index의 authority-over-scale 결론을 사용자가 실제로 측정·진단할 수 있는 네 가지 영역으로 정리한다.
AEO 분석 도구란? 6대 신호·핵심 KPI·자가 진단 체크리스트 (2026)
AEO 분석 도구는 ChatGPT·Gemini·Perplexity의 답변 본문에 내 콘텐츠가 포함될 가능성을 측정합니다. AEO 분석 도구의 정의, SEO·GEO와의 차이, 6대 측정 신호, 4가지 핵심 KPI, 7단계 자가 진단 체크리스트를 정리합니다.