AI 기업·투자·사업2026-05-09·작성: RanketAI Editorial Team·업데이트: 2026-05-09

RanketAI Guide #06: Schema.org 13타입 GEO 영향도 — RanketAI site check 권장 근거

Schema.org 표준에서 RanketAI site check 가 권장하는 13개 schema 타입 (Organization · Article · FAQPage · BreadcrumbList 등) 의 GEO 영향을 학술 (KDD 2024 + Chen 2025) + Google Rich Results + Ahrefs 2026-02 로 정리. JSON-LD 채택 이유 + 4 그룹 분류 포함.

AI 보조 작성 · 편집팀 검수

이 블로그 콘텐츠는 AI 보조 도구를 활용해 초안/구조화를 수행할 수 있으며, RanketAI 편집팀 검수 후 발행됩니다.

핵심 요약 (2026-05-09 현재): GEO 측정의 두 번째 게이트는 schema.org 다. 첫 게이트 (#05 — robots.txt 정책) 가 봇 접근 권한이라면, schema.org 는 봇이 콘텐츠를 정확히 이해하고 entity 로 식별하는 layer 다. 본 글은 schema.org 공식 표준 + Google Rich Results + KDD 2024 GEO 9 전략 학술 근거 + Ahrefs 2026-02 분석 으로 RanketAI site check 가 권장하는 13개 schema 타입의 GEO 영향을 정리한다.

왜 schema.org 가 GEO 의 두 번째 게이트인가

전편 #05 — AI 크롤러 4대장 정책 에서 robots.txt 가 GEO 의 첫 게이트임을 정리했다. 봇이 접근하지 못하면 9 GEO 전략 (Aggarwal et al. KDD 2024) 효과가 모두 0이기 때문이다. 그러나 봇이 페이지를 fetch 한 뒤에 또 하나의 결정적 분기가 있다 — 봇이 이 페이지를 무엇 으로 이해했는가.

자연어 HTML 만으로도 LLM 은 페이지 의미를 추론할 수 있다. 단 추론은 확률적이고 페이지·언어·도메인마다 정확도가 갈린다. schema.org 는 그 추론을 결정적으로 만든다. 페이지가 "이 회사는 RanketAI 이고, 이 글은 가이드 시리즈 #06 이며, 저자는 RanketAI Editorial 이다" 라고 명시적으로 선언 하면 LLM 의 entity 식별·인용 결정·답변 구성이 모두 안정화된다.

Chen et al. 2025 가 정량 입증한 "AI 검색의 earned media (제3자 출처) 편향" 도 entity 식별 정합성 위에서 작동한다. AI 가 자사 페이지를 entity 로 식별하지 못하면 제3자 출처가 자사를 언급해도 그 신호를 자사로 귀속시키지 못한다. schema.org 는 entity 귀속 (entity attribution) 의 base layer.

Schema.org 의 표준 위상

schema.org 는 2011 년 Google · Microsoft · Yahoo · Yandex 4 검색 엔진이 공동 후원으로 시작한 구조화 데이터 어휘 표준이다. 현재 800+ 타입과 1400+ 속성을 정의하며, JSON-LD · Microdata · RDFa 3 가지 syntax 를 명세한다.

3 syntax 의 차이는 다음 한 표로 정리된다.

Syntax	위치	추출 robust 성	Google 권장
JSON-LD	`<script type="application/ld+json">` (head/body 분리)	✅ (HTML 본문과 독립)	✅ 우선 권장
Microdata	HTML attribute (`itemscope`, `itemtype`)	△ (HTML 본문과 결합)	호환
RDFa	HTML attribute (`vocab`, `typeof`)	△ (HTML 본문과 결합)	호환

Google Search Central 공식 가이드 는 명확하게 JSON-LD 우선 권장 을 선언한다. 이유는 두 가지다.

HTML body 와 분리 — JSON-LD 는 <script> 블록 안 독립 JSON 으로 작성된다. HTML 마크업 변경이 schema 데이터를 깨뜨리지 않는다.
추출 robust 성 — Microdata · RDFa 는 HTML 파싱 트리에 의존하므로 일부 봇이 정상 추출하지 못할 수 있다. JSON-LD 는 별도 토큰화로 추출이 일관적이다.

JSON-LD 는 W3C Recommendation (1.1, 2020-07) 로 공식 표준 위상도 가장 높다. RanketAI site check 가 Microdata 감지 시 JSON-LD 전환을 권고하는 근거가 이 공식 우선순위에 있다.

13 타입 4 그룹 — 왜 이 13개인가

site check 가 권장하는 13 타입은 단순히 "많을수록 좋다" 가 아니라 4 그룹 × 단계별 entity 식별 책임으로 설계됐다.

Group A — 조직 정체성 (3 타입)

Organization — 기업·단체 정체성. AI 답변에서 "이 회사는 누구인가" 의 1차 신호. Cross-LLM entity disambiguation 에서 가장 중요한 타입. (#02 LLM 인용 알고리즘 참조)
Corporation — Organization 의 하위 — 영리 법인. 사업자 등록·법적 entity 정보 보강용.
Person — 대표자·저자·전문가. E-E-A-T frame 의 Authoritativeness 신호.

Group B — 페이지 메타 (4 타입)

WebSite — 사이트 전체 메타. sitelinks searchbox · alternateName 등 site-level 신호.
WebPage — 개별 페이지 메타. 모든 페이지의 가장 기본 wrapper.
BreadcrumbList — 페이지 계층 경로. AI 답변이 "이 글은 어느 카테고리 안에 있는지" 인식하는 신호. Google Rich Results 의 SERP 경로 표기에도 직접 사용.
CollectionPage — 목록·아카이브 페이지. 카테고리 페이지·태그 페이지·블로그 인덱스에 적합.

Group C — 콘텐츠 (2 타입)

Article — 기사·블로그·가이드. AI 답변 인용 1순위 타입. headline · author · datePublished · publisher 4 필드가 entity attribution 의 핵심.
FAQPage — Q&A 구조. AEO (Answer Engine Optimization) 의 핵심. AI 답변에 직접 인용되는 빈도가 가장 높은 타입.

Group D — 비즈니스 액션 (4 타입)

Product — 상품. 커머스 페이지의 1차 schema. price · availability · review 가 Rich Results 의 별점·가격 표기 트리거.
Service — 서비스. SaaS · 컨설팅 · 전문 서비스 등. provider · areaServed · serviceType 필드.
LocalBusiness — 지역 비즈니스. 오프라인 매장·지점이 있는 사업체. address · geo · openingHours 가 지역 검색 + AI 답변의 location 인용 신호.
Event — 이벤트. 컨퍼런스·세미나·웨비나·런칭. startDate · location · organizer.

이 13 타입의 공통점은 AI 답변의 정보 단위 (entity / claim / location / time) 와 1:1 대응 한다는 것이다. AI 가 답변을 구성할 때 필요로 하는 정보 단위를 schema 에 매핑한 결과가 이 13개다.

GEO 영향 — 학술 + 산업 근거 (2026-05-09 현재)

13 타입의 영향은 학술 (KDD 2024 / Chen 2025) 과 2026 시점 산업 분석 (Ahrefs / Bing / Google) 으로 모두 검증된다.

Ahrefs 2026-02 정량 입증 — AI 답변 인용은 SERP 외부로 확장 중

Search Engine Land 2026 보도 의 Ahrefs 분석에 따르면, 863,000 키워드 SERP + 4M AI Overview URL 을 분석한 결과 AI Overview 인용 페이지 중 top 10 SERP 비율은 2025 중반 76% → 2026-02 38% 로 급락했다. AI 답변이 SERP 외부 출처를 점점 더 많이 인용한다는 의미로, 2026 시점에서 schema.org 의 entity attribution 역할이 더 결정적이 됐다. SERP 순위 신호 외에 LLM 이 페이지를 식별·신뢰할 1차 근거가 schema.org 라는 frame 정합. Bing (2025-03) 과 Google (2025-04) 도 schema markup 의 LLM 기여 (Copilot 콘텐츠 이해 + Google search advantage) 를 공식 인정한 바 있다.

Cite-source 전략 (KDD 2024)

Aggarwal et al. KDD 2024 는 9 GEO 전략을 정량 평가했고, 그 중 Cite-source 전략 (인용 가능한 출처 명시) 이 인용성 +40% 효과로 입증됐다. schema.org 의 Article.author · Organization.url · Article.citation 필드가 이 전략의 실행 형식 이다. 자연어 본문에 "출처: ..." 라고 쓰는 것보다 schema 로 명시하는 것이 LLM 추출 robust 성이 높다.

Earned media 편향 (Chen et al. 2025)

Chen et al. 2025 가 정량 입증한 "AI 검색의 earned media 편향" 은 제3자가 자사를 언급할 때 그 신호를 어떻게 자사로 귀속시킬지가 본질이다. schema.org 의 Organization.sameAs 필드 (Wikipedia · Crunchbase · LinkedIn 등 권위 출처 cross-reference) 가 이 귀속의 base layer 다.

E-E-A-T (Google 공식 frame)

Google 의 E-E-A-T frame 은 Experience · Expertise · Authoritativeness · Trust 4 평가축이다. schema.org 의 Person.knowsAbout · Article.author · Organization.foundingDate · Review.author 필드가 각 축의 1차 신호로 작동한다. AI Overviews 의 답변 품질 평가에도 동일 frame 이 적용된다.

RanketAI site check 권장 근거 매트릭스

13 타입 권장의 근거를 한 표로 정리하면 다음과 같다.

타입	Group	Google Rich Results	AI 답변 인용 빈도	권장 근거
Organization	A	✅ Logo · sameAs	상	entity 1차 신호 (모든 페이지)
Corporation	A	(Organization 호환)	중	법인 정보 보강
Person	A	(간접)	상	E-E-A-T Authoritativeness
WebSite	B	✅ Sitelinks Searchbox	중	site-level wrapper
WebPage	B	(기본)	중	모든 페이지 기본
BreadcrumbList	B	✅ SERP 경로 표기	상	페이지 계층 인식
CollectionPage	B	(간접)	중	목록 페이지 식별
Article	C	✅ headline · author · image	최상	AI 답변 인용 1순위
FAQPage	C	✅ FAQ 직접 표시	최상	AEO 핵심
Product	D	✅ 별점 · 가격 · 재고	상	커머스
Service	D	(간접)	중	SaaS · B2B
LocalBusiness	D	✅ Local Pack · Map	중	오프라인 사업체
Event	D	✅ Event 카드	중	일정 정보

핵심 패턴:

Article + FAQPage — AI 답변 인용 빈도 최상. 모든 콘텐츠 페이지에 우선 적용 권장.
Organization + Person — entity 1차 신호. 사이트 전체 또는 대표 페이지 1회 publish 면 충분.
BreadcrumbList — Rich Results SERP 경로 표기 직접 트리거. 모든 페이지 기본 추가.
Product / LocalBusiness / Event — 비즈니스 모델별 선택 적용.

RanketAI site check 와의 연결

RanketAI site check 는 페이지 분석 시 다음 항목을 진단한다.

site check 진단 항목	13 타입 매핑
schema.org 타입 감지 수	13 타입 중 몇 개가 페이지에 있는가
JSON-LD 형식 채택 여부	Microdata · RDFa → JSON-LD 전환 권장
권장 타입 누락 분석	13 타입 중 부재한 타입 + 페이지 유형별 우선순위

진단 결과가 부족하면 일반적으로 다음 인과로 점검 우선순위가 정해진다.

약점 시나리오	권장 우선 추가 타입
회사 사이트인데 Organization 없음	Organization (Group A) — 모든 페이지
블로그·기사인데 Article 없음	Article (Group C) — 콘텐츠 페이지
FAQ 섹션 있는데 FAQPage 없음	FAQPage (Group C) — Q&A 페이지
카테고리 경로 있는데 BreadcrumbList 없음	BreadcrumbList (Group B) — 모든 페이지
커머스인데 Product 없음	Product (Group D) — 상품 페이지
Microdata 만 사용 (JSON-LD 부재)	동일 schema 의 JSON-LD 재작성

즉 RanketAI site check 의 schema 진단은 추상적 가이드라인이 아니라 AI 답변 인용 가능성을 페이지 단위로 진단하는 frame 이다. 약점이 발견되면 위 매핑에 따라 우선순위 추가하면 된다.

결론 — 표준 + 학술 + 산업 + 측정의 4축 합의 (2026-05-09 현재)

#05 의 3축 합의 frame 에 2026 시점 산업 분석을 더한 4축 합의다.

표준 — schema.org · Google Rich Results · JSON-LD W3C Recommendation — 13 타입의 어휘·형식 합의
학술 — KDD 2024 · Chen et al. 2025 — Cite-source 전략 + earned media 편향의 정량 검증
산업 (2026) — Search Engine Land 2026 (Ahrefs 보도) — AI Overview 인용이 SERP 외부로 빠르게 확장 (top 10 SERP 비율 76% → 38%) + Bing/Google 2025 schema 기여 공식 인정
측정 — RanketAI site check — 페이지별 13 타입 감지 + 약점 진단

3 축이 합의한 결론은 명확하다.

JSON-LD 우선 — Microdata · RDFa 는 추출 robust 성 ↓. JSON-LD 단일 형식 권장
Group C (Article · FAQPage) 가 인용 빈도 최상 — 콘텐츠 페이지 우선 적용
Group A (Organization · Person) 는 entity 1차 신호 — 사이트 전체 1회 publish 충분
BreadcrumbList 는 Rich Results 트리거 — 모든 페이지 기본 추가 권장
Group D (Product · Service · LocalBusiness · Event) — 비즈니스 모델별 선택 적용

schema.org 검토는 GEO 작업의 두 번째 출발점이며, 자사 측정 결과 (RanketAI site check 의 schema 감지 수) 에서 약점이 발견되면 위 13 타입 매트릭스에 따라 우선순위 보강하면 된다.

⚠ schema 사양은 자주 갱신된다. 본 글의 13 타입 권장과 우선순위는 2026-05-09 시점 기준이다. 운영 적용 전에 위 10 references 의 공식 페이지 (특히 Google Rich Results 가이드 + schema.org 각 타입 페이지 + Ahrefs/Search Engine Land 최신 분석) 를 직접 확인할 것을 권장한다.

더 읽을거리: #01 — AI 검색 시대, 왜 SEO만으론 부족한가 · #02 — LLM 인용 알고리즘 해부 · #03 — 한국 AI 가시성 격차 · #04 — GEO 학계 vs 산업 vs 실측 매핑 · #05 — AI 크롤러 4대장 공식 정책

핵심 실행 요약

항목	실무 기준
핵심 주제	RanketAI Guide #06: Schema.org 13타입 GEO 영향도 — RanketAI site check 권장 근거
적용 대상	AI 기업·투자·사업 업무에 우선 적용
우선 조치	AI 이니셔티브 시작 전 측정 가능한 성공 KPI(비용·시간·품질)를 정의
리스크 체크	전체 예산 확정 전 소규모 파일럿으로 ROI 가정을 검증
다음 단계	분기별 KPI 변화를 추적하고 범위를 조정하는 검토 주기를 수립

분석 근거

Schema.org 공식 표준 (schema.org) — W3C Schema.org Community Group 이 운영하는 구조화 데이터 어휘 표준. 800+ 타입 + 1400+ 속성 정의. JSON-LD · Microdata · RDFa 3 가지 syntax 명세. Google · Microsoft · Yahoo · Yandex 4 검색 엔진 공동 후원으로 사실상 검색 엔진 공식 표준 위치.
Google Search Central — Structured Data 가이드 (developers.google.com/search/docs/appearance/structured-data) — Rich Results 자격 부여 schema 타입 공식 목록. JSON-LD 우선 권장 명시 + Article · FAQPage · BreadcrumbList · Product · Organization 등 핵심 타입 별 spec 페이지 운영.
Aggarwal et al. "GEO: Generative Engine Optimization" (Princeton·IIT Delhi·Georgia Tech, KDD 2024, arXiv:2311.09735) — 9 가지 GEO 전략 정량 검증의 학술 출발점. structured data 와 citation 신호가 LLM 답변 가시성에 미치는 영향을 정량화. 인용성 향상 +40% (Cite-source 전략).
Chen·Wang·Chen·Koudas. "How to Dominate AI Search" (2025-09, arXiv:2509.08919) — AI 검색이 earned media (제3자 출처) + 구조화된 권위 신호에 체계적으로 편향됨을 정량 입증. Schema.org Organization · Person · Article 의 권위 신호 효과를 학술적으로 뒷받침.
Google — Helpful, reliable, people-first content (2024 갱신) — E-E-A-T (Experience · Expertise · Authoritativeness · Trust) 평가 frame 에서 schema.org 의 author · publisher · reviewedBy 필드가 entity 식별의 1차 신호로 작동. AI Overviews 의 답변 품질 평가에도 동일 frame 적용.
JSON-LD 1.1 W3C Recommendation (2020-07) — JSON for Linked Data 의 공식 W3C 권장안. HTML body 와 분리된 `<script type="application/ld+json">` 패턴이 추출 robust 성·유지보수성에서 Microdata · RDFa 대비 우위. Google · OpenAI · Anthropic · Perplexity 4 LLM 답변 인용 실측에서 JSON-LD 우선 추출 패턴 확인.
Microsoft Bing Webmaster — Structured Markup Validator + JSON-LD 우선 권장 정책. Bing 검색 인덱스 (Copilot · Bing Chat 백엔드 공유) 가 schema.org 어휘를 entity disambiguation (동명이인·동명회사) 의 1차 신호로 활용.
Search Engine Land 2026 (Ahrefs 2026-02 연구 보도) — 863,000 키워드 SERP + 4M AI Overview URL 분석. AI Overview 인용 페이지 중 top 10 SERP 비율이 2025 중반 76% → 2026-02 38% 로 하락. AI 답변이 SERP 외부 출처 (schema.org entity 식별 가능 페이지 포함) 로 인용 범위를 빠르게 확장 중. Bing 2025-03 + Google 2025-04 공식 발언으로 schema markup 의 LLM 기여 (Copilot 콘텐츠 이해 + Google search advantage) 도 동시 인정.

핵심 주장과 근거

이 섹션은 본문 핵심 주장과 근거 출처를 1:1로 대응해 빠르게 검증할 수 있도록 구성했습니다. 아래 항목에서 주장과 원문 링크를 함께 확인하세요.

주장:Schema.org 는 Google · Microsoft · Yahoo · Yandex 4 검색 엔진 공동 후원의 사실상 공식 표준 어휘
근거 출처:Schema.org 공식
주장:Google 은 JSON-LD 형식을 Microdata · RDFa 보다 우선 권장
근거 출처:Google Structured Data 가이드
주장:Article · FAQPage · BreadcrumbList 는 Google Rich Results 자격 부여의 핵심 schema 타입
근거 출처:Google Search Central
주장:KDD 2024 GEO 9 전략 검증 — Cite-source 등 structured signal 이 인용성 +40% 효과
근거 출처:Aggarwal et al. KDD 2024 (arXiv:2311.09735)
주장:AI 검색은 구조화된 권위 신호 (Organization · Person · Article schema) 에 체계적 편향
근거 출처:Chen et al. 2025 (arXiv:2509.08919)
주장:JSON-LD 1.1 은 W3C 공식 Recommendation 으로 HTML body 분리 + 추출 robust 성에서 Microdata 대비 우위
근거 출처:W3C JSON-LD 1.1 Recommendation
주장:E-E-A-T frame 에서 schema.org author · publisher 필드는 entity 식별 1차 신호
근거 출처:Google Helpful Content Guide
주장:Ahrefs 2026-02 연구 — AI Overview 인용 페이지 중 top 10 SERP 비율 2025 중반 76% → 2026-02 38% 로 하락. AI 답변이 SERP 외부 출처로 인용 범위를 빠르게 확장 → schema.org entity attribution 의 GEO 게이트 역할 강화.
근거 출처:Search Engine Land 2026 (Ahrefs 보도)

외부 인용 링크

아래 링크는 본문 수치와 주장에 직접 사용한 원문 출처입니다. 항목별 원문 맥락을 확인하면 해석 차이를 줄이고 재검증 속도를 높일 수 있습니다.

AI 검색에 내 사이트는 노출되고 있을까?

ChatGPT·Perplexity·Gemini가 내 브랜드를 어떻게 답하는지 무료로 확인해 보세요.

지금 진단 시작 →

X LinkedIn