RanketAI Guide #06: Schema.org 13타입 GEO 영향도 — RanketAI site check 권장 근거
Schema.org 표준에서 RanketAI site check 가 권장하는 13개 schema 타입 (Organization · Article · FAQPage · BreadcrumbList 등) 의 GEO 영향을 학술 (KDD 2024 + Chen 2025) + Google Rich Results + Ahrefs 2026-02 로 정리. JSON-LD 채택 이유 + 4 그룹 분류 포함.
이 블로그 콘텐츠는 AI 보조 도구를 활용해 초안/구조화를 수행할 수 있으며, RanketAI 편집팀 검수 후 발행됩니다.
핵심 요약 (2026-05-09 현재): GEO 측정의 두 번째 게이트는 schema.org 다. 첫 게이트 (#05 — robots.txt 정책) 가 봇 접근 권한이라면, schema.org 는 봇이 콘텐츠를 정확히 이해하고 entity 로 식별하는 layer 다. 본 글은 schema.org 공식 표준 + Google Rich Results + KDD 2024 GEO 9 전략 학술 근거 + Ahrefs 2026-02 분석 으로 RanketAI site check 가 권장하는 13개 schema 타입의 GEO 영향을 정리한다.
왜 schema.org 가 GEO 의 두 번째 게이트인가
전편 #05 — AI 크롤러 4대장 정책 에서 robots.txt 가 GEO 의 첫 게이트임을 정리했다. 봇이 접근하지 못하면 9 GEO 전략 (Aggarwal et al. KDD 2024) 효과가 모두 0이기 때문이다. 그러나 봇이 페이지를 fetch 한 뒤에 또 하나의 결정적 분기가 있다 — 봇이 이 페이지를 무엇 으로 이해했는가.
자연어 HTML 만으로도 LLM 은 페이지 의미를 추론할 수 있다. 단 추론은 확률적이고 페이지·언어·도메인마다 정확도가 갈린다. schema.org 는 그 추론을 결정적으로 만든다. 페이지가 "이 회사는 RanketAI 이고, 이 글은 가이드 시리즈 #06 이며, 저자는 RanketAI Editorial 이다" 라고 명시적으로 선언 하면 LLM 의 entity 식별·인용 결정·답변 구성이 모두 안정화된다.
Chen et al. 2025 가 정량 입증한 "의 earned media (제3자 출처) 편향" 도 entity 식별 정합성 위에서 작동한다. AI 가 자사 페이지를 entity 로 식별하지 못하면 제3자 출처가 자사를 언급해도 그 신호를 자사로 귀속시키지 못한다. schema.org 는 entity 귀속 (entity attribution) 의 base layer.
Schema.org 의 표준 위상
schema.org 는 2011 년 Google · Microsoft · Yahoo · Yandex 4 검색 엔진이 공동 후원으로 시작한 구조화 데이터 어휘 표준이다. 현재 800+ 타입과 1400+ 속성을 정의하며, JSON-LD · Microdata · RDFa 3 가지 syntax 를 명세한다.
3 syntax 의 차이는 다음 한 표로 정리된다.
| Syntax | 위치 | 추출 robust 성 | Google 권장 |
|---|---|---|---|
| JSON-LD | <script type="application/ld+json"> (head/body 분리) |
✅ (HTML 본문과 독립) | ✅ 우선 권장 |
| Microdata | HTML attribute (itemscope, itemtype) |
△ (HTML 본문과 결합) | 호환 |
| RDFa | HTML attribute (vocab, typeof) |
△ (HTML 본문과 결합) | 호환 |
Google Search Central 공식 가이드 는 명확하게 JSON-LD 우선 권장 을 선언한다. 이유는 두 가지다.
- HTML body 와 분리 — JSON-LD 는
<script>블록 안 독립 JSON 으로 작성된다. HTML 마크업 변경이 schema 데이터를 깨뜨리지 않는다. - 추출 robust 성 — Microdata · RDFa 는 HTML 파싱 트리에 의존하므로 일부 봇이 정상 추출하지 못할 수 있다. JSON-LD 는 별도 토큰화로 추출이 일관적이다.
JSON-LD 는 W3C Recommendation (1.1, 2020-07) 로 공식 표준 위상도 가장 높다. RanketAI site check 가 Microdata 감지 시 JSON-LD 전환을 권고하는 근거가 이 공식 우선순위에 있다.
13 타입 4 그룹 — 왜 이 13개인가
site check 가 권장하는 13 타입은 단순히 "많을수록 좋다" 가 아니라 4 그룹 × 단계별 entity 식별 책임으로 설계됐다.
Group A — 조직 정체성 (3 타입)
- Organization — 기업·단체 정체성. AI 답변에서 "이 회사는 누구인가" 의 1차 신호. Cross-LLM entity disambiguation 에서 가장 중요한 타입. (#02 LLM 인용 알고리즘 참조)
- Corporation — Organization 의 하위 — 영리 법인. 사업자 등록·법적 entity 정보 보강용.
- Person — 대표자·저자·전문가. E-E-A-T frame 의 Authoritativeness 신호.
Group B — 페이지 메타 (4 타입)
- WebSite — 사이트 전체 메타. sitelinks searchbox · alternateName 등 site-level 신호.
- WebPage — 개별 페이지 메타. 모든 페이지의 가장 기본 wrapper.
- BreadcrumbList — 페이지 계층 경로. AI 답변이 "이 글은 어느 카테고리 안에 있는지" 인식하는 신호. Google Rich Results 의 SERP 경로 표기에도 직접 사용.
- CollectionPage — 목록·아카이브 페이지. 카테고리 페이지·태그 페이지·블로그 인덱스에 적합.
Group C — 콘텐츠 (2 타입)
- Article — 기사·블로그·가이드. AI 답변 인용 1순위 타입. headline · author · datePublished · publisher 4 필드가 entity attribution 의 핵심.
- FAQPage — Q&A 구조. AEO (Answer Engine Optimization) 의 핵심. AI 답변에 직접 인용되는 빈도가 가장 높은 타입.
Group D — 비즈니스 액션 (4 타입)
- Product — 상품. 커머스 페이지의 1차 schema. price · availability · review 가 Rich Results 의 별점·가격 표기 트리거.
- Service — 서비스. SaaS · 컨설팅 · 전문 서비스 등. provider · areaServed · serviceType 필드.
- LocalBusiness — 지역 비즈니스. 오프라인 매장·지점이 있는 사업체. address · geo · openingHours 가 지역 검색 + AI 답변의 location 인용 신호.
- Event — 이벤트. 컨퍼런스·세미나·웨비나·런칭. startDate · location · organizer.
이 13 타입의 공통점은 AI 답변의 정보 단위 (entity / claim / location / time) 와 1:1 대응 한다는 것이다. AI 가 답변을 구성할 때 필요로 하는 정보 단위를 schema 에 매핑한 결과가 이 13개다.
GEO 영향 — 학술 + 산업 근거 (2026-05-09 현재)
13 타입의 영향은 학술 (KDD 2024 / Chen 2025) 과 2026 시점 산업 분석 (Ahrefs / Bing / Google) 으로 모두 검증된다.
Ahrefs 2026-02 정량 입증 — AI 답변 인용은 SERP 외부로 확장 중
Search Engine Land 2026 보도 의 Ahrefs 분석에 따르면, 863,000 키워드 SERP + 4M AI Overview URL 을 분석한 결과 AI Overview 인용 페이지 중 top 10 SERP 비율은 2025 중반 76% → 2026-02 38% 로 급락했다. AI 답변이 SERP 외부 출처를 점점 더 많이 인용한다는 의미로, 2026 시점에서 schema.org 의 entity attribution 역할이 더 결정적이 됐다. SERP 순위 신호 외에 LLM 이 페이지를 식별·신뢰할 1차 근거가 schema.org 라는 frame 정합. Bing (2025-03) 과 Google (2025-04) 도 schema markup 의 LLM 기여 (Copilot 콘텐츠 이해 + Google search advantage) 를 공식 인정한 바 있다.
Cite-source 전략 (KDD 2024)
Aggarwal et al. KDD 2024 는 9 GEO 전략을 정량 평가했고, 그 중 Cite-source 전략 (인용 가능한 출처 명시) 이 인용성 +40% 효과로 입증됐다. schema.org 의 Article.author · Organization.url · Article.citation 필드가 이 전략의 실행 형식 이다. 자연어 본문에 "출처: ..." 라고 쓰는 것보다 schema 로 명시하는 것이 LLM 추출 robust 성이 높다.
Earned media 편향 (Chen et al. 2025)
Chen et al. 2025 가 정량 입증한 "AI 검색의 earned media 편향" 은 제3자가 자사를 언급할 때 그 신호를 어떻게 자사로 귀속시킬지가 본질이다. schema.org 의 Organization.sameAs 필드 (Wikipedia · Crunchbase · LinkedIn 등 권위 출처 cross-reference) 가 이 귀속의 base layer 다.
E-E-A-T (Google 공식 frame)
Google 의 E-E-A-T frame 은 Experience · Expertise · Authoritativeness · Trust 4 평가축이다. schema.org 의 Person.knowsAbout · Article.author · Organization.foundingDate · Review.author 필드가 각 축의 1차 신호로 작동한다. AI Overviews 의 답변 품질 평가에도 동일 frame 이 적용된다.
RanketAI site check 권장 근거 매트릭스
13 타입 권장의 근거를 한 표로 정리하면 다음과 같다.
| 타입 | Group | Google Rich Results | AI 답변 인용 빈도 | 권장 근거 |
|---|---|---|---|---|
| Organization | A | ✅ Logo · sameAs | 상 | entity 1차 신호 (모든 페이지) |
| Corporation | A | (Organization 호환) | 중 | 법인 정보 보강 |
| Person | A | (간접) | 상 | E-E-A-T Authoritativeness |
| WebSite | B | ✅ Sitelinks Searchbox | 중 | site-level wrapper |
| WebPage | B | (기본) | 중 | 모든 페이지 기본 |
| BreadcrumbList | B | ✅ SERP 경로 표기 | 상 | 페이지 계층 인식 |
| CollectionPage | B | (간접) | 중 | 목록 페이지 식별 |
| Article | C | ✅ headline · author · image | 최상 | AI 답변 인용 1순위 |
| FAQPage | C | ✅ FAQ 직접 표시 | 최상 | AEO 핵심 |
| Product | D | ✅ 별점 · 가격 · 재고 | 상 | 커머스 |
| Service | D | (간접) | 중 | SaaS · B2B |
| LocalBusiness | D | ✅ Local Pack · Map | 중 | 오프라인 사업체 |
| Event | D | ✅ Event 카드 | 중 | 일정 정보 |
핵심 패턴:
- Article + FAQPage — AI 답변 인용 빈도 최상. 모든 콘텐츠 페이지에 우선 적용 권장.
- Organization + Person — entity 1차 신호. 사이트 전체 또는 대표 페이지 1회 publish 면 충분.
- BreadcrumbList — Rich Results SERP 경로 표기 직접 트리거. 모든 페이지 기본 추가.
- Product / LocalBusiness / Event — 비즈니스 모델별 선택 적용.
RanketAI site check 와의 연결
RanketAI site check 는 페이지 분석 시 다음 항목을 진단한다.
| site check 진단 항목 | 13 타입 매핑 |
|---|---|
| schema.org 타입 감지 수 | 13 타입 중 몇 개가 페이지에 있는가 |
| JSON-LD 형식 채택 여부 | Microdata · RDFa → JSON-LD 전환 권장 |
| 권장 타입 누락 분석 | 13 타입 중 부재한 타입 + 페이지 유형별 우선순위 |
진단 결과가 부족하면 일반적으로 다음 인과로 점검 우선순위가 정해진다.
| 약점 시나리오 | 권장 우선 추가 타입 |
|---|---|
| 회사 사이트인데 Organization 없음 | Organization (Group A) — 모든 페이지 |
| 블로그·기사인데 Article 없음 | Article (Group C) — 콘텐츠 페이지 |
| FAQ 섹션 있는데 FAQPage 없음 | FAQPage (Group C) — Q&A 페이지 |
| 카테고리 경로 있는데 BreadcrumbList 없음 | BreadcrumbList (Group B) — 모든 페이지 |
| 커머스인데 Product 없음 | Product (Group D) — 상품 페이지 |
| Microdata 만 사용 (JSON-LD 부재) | 동일 schema 의 JSON-LD 재작성 |
즉 RanketAI site check 의 schema 진단은 추상적 가이드라인이 아니라 AI 답변 인용 가능성을 페이지 단위로 진단하는 frame 이다. 약점이 발견되면 위 매핑에 따라 우선순위 추가하면 된다.
결론 — 표준 + 학술 + 산업 + 측정의 4축 합의 (2026-05-09 현재)
#05 의 3축 합의 frame 에 2026 시점 산업 분석을 더한 4축 합의다.
- 표준 — schema.org · Google Rich Results · JSON-LD W3C Recommendation — 13 타입의 어휘·형식 합의
- 학술 — KDD 2024 · Chen et al. 2025 — Cite-source 전략 + earned media 편향의 정량 검증
- 산업 (2026) — Search Engine Land 2026 (Ahrefs 보도) — AI Overview 인용이 SERP 외부로 빠르게 확장 (top 10 SERP 비율 76% → 38%) + Bing/Google 2025 schema 기여 공식 인정
- 측정 — RanketAI site check — 페이지별 13 타입 감지 + 약점 진단
3 축이 합의한 결론은 명확하다.
- JSON-LD 우선 — Microdata · RDFa 는 추출 robust 성 ↓. JSON-LD 단일 형식 권장
- Group C (Article · FAQPage) 가 인용 빈도 최상 — 콘텐츠 페이지 우선 적용
- Group A (Organization · Person) 는 entity 1차 신호 — 사이트 전체 1회 publish 충분
- BreadcrumbList 는 Rich Results 트리거 — 모든 페이지 기본 추가 권장
- Group D (Product · Service · LocalBusiness · Event) — 비즈니스 모델별 선택 적용
schema.org 검토는 GEO 작업의 두 번째 출발점이며, 자사 측정 결과 (RanketAI site check 의 schema 감지 수) 에서 약점이 발견되면 위 13 타입 매트릭스에 따라 우선순위 보강하면 된다.
⚠ schema 사양은 자주 갱신된다. 본 글의 13 타입 권장과 우선순위는 2026-05-09 시점 기준이다. 운영 적용 전에 위 10 references 의 공식 페이지 (특히 Google Rich Results 가이드 + schema.org 각 타입 페이지 + Ahrefs/Search Engine Land 최신 분석) 를 직접 확인할 것을 권장한다.
더 읽을거리: #01 — AI 검색 시대, 왜 SEO만으론 부족한가 · #02 — LLM 인용 알고리즘 해부 · #03 — 한국 AI 가시성 격차 · #04 — GEO 학계 vs 산업 vs 실측 매핑 · #05 — AI 크롤러 4대장 공식 정책
관련 가이드
핵심 실행 요약
| 항목 | 실무 기준 |
|---|---|
| 핵심 주제 | RanketAI Guide #06: Schema.org 13타입 GEO 영향도 — RanketAI site check 권장 근거 |
| 적용 대상 | AI 기업·투자·사업 업무에 우선 적용 |
| 우선 조치 | AI 이니셔티브 시작 전 측정 가능한 성공 KPI(비용·시간·품질)를 정의 |
| 리스크 체크 | 전체 예산 확정 전 소규모 파일럿으로 ROI 가정을 검증 |
| 다음 단계 | 분기별 KPI 변화를 추적하고 범위를 조정하는 검토 주기를 수립 |
분석 근거
- Schema.org 공식 표준 (schema.org) — W3C Schema.org Community Group 이 운영하는 구조화 데이터 어휘 표준. 800+ 타입 + 1400+ 속성 정의. JSON-LD · Microdata · RDFa 3 가지 syntax 명세. Google · Microsoft · Yahoo · Yandex 4 검색 엔진 공동 후원으로 사실상 검색 엔진 공식 표준 위치.
- Google Search Central — Structured Data 가이드 (developers.google.com/search/docs/appearance/structured-data) — Rich Results 자격 부여 schema 타입 공식 목록. JSON-LD 우선 권장 명시 + Article · FAQPage · BreadcrumbList · Product · Organization 등 핵심 타입 별 spec 페이지 운영.
- Aggarwal et al. "GEO: Generative Engine Optimization" (Princeton·IIT Delhi·Georgia Tech, KDD 2024, arXiv:2311.09735) — 9 가지 GEO 전략 정량 검증의 학술 출발점. structured data 와 citation 신호가 LLM 답변 가시성에 미치는 영향을 정량화. 인용성 향상 +40% (Cite-source 전략).
- Chen·Wang·Chen·Koudas. "How to Dominate AI Search" (2025-09, arXiv:2509.08919) — AI 검색이 earned media (제3자 출처) + 구조화된 권위 신호에 체계적으로 편향됨을 정량 입증. Schema.org Organization · Person · Article 의 권위 신호 효과를 학술적으로 뒷받침.
- Google — Helpful, reliable, people-first content (2024 갱신) — E-E-A-T (Experience · Expertise · Authoritativeness · Trust) 평가 frame 에서 schema.org 의 author · publisher · reviewedBy 필드가 entity 식별의 1차 신호로 작동. AI Overviews 의 답변 품질 평가에도 동일 frame 적용.
- JSON-LD 1.1 W3C Recommendation (2020-07) — JSON for Linked Data 의 공식 W3C 권장안. HTML body 와 분리된 `<script type="application/ld+json">` 패턴이 추출 robust 성·유지보수성에서 Microdata · RDFa 대비 우위. Google · OpenAI · Anthropic · Perplexity 4 LLM 답변 인용 실측에서 JSON-LD 우선 추출 패턴 확인.
- Microsoft Bing Webmaster — Structured Markup Validator + JSON-LD 우선 권장 정책. Bing 검색 인덱스 (Copilot · Bing Chat 백엔드 공유) 가 schema.org 어휘를 entity disambiguation (동명이인·동명회사) 의 1차 신호로 활용.
- Search Engine Land 2026 (Ahrefs 2026-02 연구 보도) — 863,000 키워드 SERP + 4M AI Overview URL 분석. AI Overview 인용 페이지 중 top 10 SERP 비율이 2025 중반 76% → 2026-02 38% 로 하락. AI 답변이 SERP 외부 출처 (schema.org entity 식별 가능 페이지 포함) 로 인용 범위를 빠르게 확장 중. Bing 2025-03 + Google 2025-04 공식 발언으로 schema markup 의 LLM 기여 (Copilot 콘텐츠 이해 + Google search advantage) 도 동시 인정.
핵심 주장과 근거
이 섹션은 본문 핵심 주장과 근거 출처를 1:1로 대응해 빠르게 검증할 수 있도록 구성했습니다. 아래 항목에서 주장과 원문 링크를 함께 확인하세요.
주장:Schema.org 는 Google · Microsoft · Yahoo · Yandex 4 검색 엔진 공동 후원의 사실상 공식 표준 어휘
근거 출처:Schema.org 공식주장:Google 은 JSON-LD 형식을 Microdata · RDFa 보다 우선 권장
근거 출처:Google Structured Data 가이드주장:Article · FAQPage · BreadcrumbList 는 Google Rich Results 자격 부여의 핵심 schema 타입
근거 출처:Google Search Central주장:KDD 2024 GEO 9 전략 검증 — Cite-source 등 structured signal 이 인용성 +40% 효과
근거 출처:Aggarwal et al. KDD 2024 (arXiv:2311.09735)주장:AI 검색은 구조화된 권위 신호 (Organization · Person · Article schema) 에 체계적 편향
근거 출처:Chen et al. 2025 (arXiv:2509.08919)주장:JSON-LD 1.1 은 W3C 공식 Recommendation 으로 HTML body 분리 + 추출 robust 성에서 Microdata 대비 우위
근거 출처:W3C JSON-LD 1.1 Recommendation주장:E-E-A-T frame 에서 schema.org author · publisher 필드는 entity 식별 1차 신호
근거 출처:Google Helpful Content Guide주장:Ahrefs 2026-02 연구 — AI Overview 인용 페이지 중 top 10 SERP 비율 2025 중반 76% → 2026-02 38% 로 하락. AI 답변이 SERP 외부 출처로 인용 범위를 빠르게 확장 → schema.org entity attribution 의 GEO 게이트 역할 강화.
근거 출처:Search Engine Land 2026 (Ahrefs 보도)
외부 인용 링크
아래 링크는 본문 수치와 주장에 직접 사용한 원문 출처입니다. 항목별 원문 맥락을 확인하면 해석 차이를 줄이고 재검증 속도를 높일 수 있습니다.
- Schema.org 공식 표준
- Google Search Central — Structured Data 가이드
- Google — Article 구조화 데이터
- Google — FAQPage 구조화 데이터
- Google — BreadcrumbList 구조화 데이터
- Google — Helpful, reliable, people-first content (E-E-A-T)
- JSON-LD 1.1 W3C Recommendation
- Aggarwal et al. — GEO: Generative Engine Optimization (KDD 2024)
- Chen et al. — How to Dominate AI Search (2025)
- Search Engine Land — Schema markup AI search (2026)
AI 검색에 내 사이트는 노출되고 있을까?
ChatGPT·Perplexity·Gemini가 내 브랜드를 어떻게 답하는지 무료로 확인해 보세요.
지금 진단 시작 →관련 포스트
관련 포스트는 현재 글의 선택 기준을 다른 상황에서 비교 검증할 수 있도록 선별했습니다. 관점을 확장하려면 아래 글을 순서대로 확인해 보세요.
AI 답변에 내 브랜드가 안 나오는 24가지 질문 — LLM 별·상황별 진단 가이드 2026
ChatGPT·Gemini·Perplexity 답변에 우리 브랜드가 보이지 않을 때 가장 자주 묻는 13가지 질문을 RanketAI 운영 데이터 기반으로 정리한다. GEO/AEO 측정과 개선의 출발점, 콘텐츠 구조와 LLM 인용률을 높이는 실전 단계까지 단계별로 설명한다.
2026 네이버 AI 검색 완전 정리 — AI 브리핑은 Google AI Overview, AI 탭은 AI Mode에 가까운가
네이버 AI 브리핑은 검색 결과 상단 요약 카드로 Google AI Overview에 가깝고, 2026-04-28 베타 공개된 AI 탭은 쇼핑·예약까지 잇는 Google AI Mode형 대화 탐색에 더 가깝다. 두 서비스의 작동 방식·C-rank·AEO·AI 크롤러 인용 신호와 한국 시장 GEO·SEO 영향을 정리하고 RanketAI 활용법을 안내한다.
AI에게 'GEO 도구'를 물으면 지도 앱을 답한다 — 카테고리 명명이 AI 노출을 좌우한다
같은 분야를 'GEO·AEO 가시성 도구'와 'AI 검색 가시성 측정 도구' 두 이름으로 AI에 물었더니 답이 완전히 달라졌다. AI가 약어와 카테고리명을 문맥으로 해석하는 방식, 그리고 브랜드가 자기 분야를 명명할 때 엔티티 모호성을 피하는 3가지 원칙을 실측 데이터로 정리한다.
AI 가시성 측정 도구 비교 2026 — GEO·AEO 진단 SaaS 총정리
ChatGPT·Gemini·Perplexity 답변에서 브랜드 노출을 측정하는 AI 가시성 도구 10종을 전용 GEO SaaS·기존 SEO 확장형·국내 특화로 분류해 비교한다. Profound·Otterly·Peec AI·KIME 등 해외 도구와 RanketAI·블루닷·ChainShift·NNT Insights 등 국내 도구의 가격·지원 엔진·추천 대상을 정리한다.
RanketAI Guide #08: ChatGPT·Perplexity·Gemini 답변 4단계 — 브랜드 노출 지점 해부
ChatGPT·Perplexity·Gemini는 같은 프롬프트도 4단계 내부 파이프라인 — 해석·검색·조립·생성 — 으로 답을 만든다. 각 단계에서 우리 브랜드가 어디에 노출되는지, 측정으로 어떻게 정확하게 진단하는지 RanketAI 기준으로 정리한다.