SEO·검색엔진 핵심 개념 12 — sandbox·E-E-A-T·DA·CTR·AI Overview 한 페이지 정리
결론 먼저: 신규 도메인은 6-12주 Google sandbox 들어가서 노출 거의 0. 그동안 한국 사이트면 Naver 가 본채널이라 GSC 만 보면 사이트 죽은 줄 착각한다. AI Overview·zero-click 으로 클릭률은 더 떨어지는 추세. SEO 80% 는 시간, 20% 가 액션.
도메인 migration (taystudio.github.io → taystudios.com) 한 달 차. GSC 보니 클릭 2건·노출 777. "사이트 망함?" 하고 패닉. 근데 Cloudflare 보니 일 visit 55명 정상. Naver SearchAdvisor 까지 등록하니 한 달 노출 26,000 + 클릭 230.
= 데이터 한쪽만 보고 비명 지른 거.
이 글은 그동안 직접 부딪힌 SEO 핵심 개념 12개 정리. 신규 도메인 운영자가 가장 흔히 빠지는 함정 + 한국 시장 특수성까지.
검색엔진 기본 흐름
사이트 → [크롤링] → [색인] → [순위 결정] → 검색 결과 노출
이 5 단계 중 한 곳이라도 막히면 트래픽 0. 우리는 5/9 migration 후 5/22 까지 색인 거의 없다가 5/22~ 본격 색인 시작. 약 13일 걸림. 신규 도메인은 색인 자체가 시간 걸림.
| 용어 | 의미 |
|---|---|
| 크롤링 (Crawling) | 검색엔진 봇이 HTML 자동 방문해서 읽기. Googlebot·Naver Yeti·Bingbot |
| 색인 (Indexing) | 읽은 페이지를 검색엔진 DB 에 저장. 색인 없으면 검색 결과 안 나옴 |
| 순위 결정 (Ranking) | 검색어와 색인 페이지 매칭 + 알고리즘으로 1~10000위 결정 |
| 노출 (Impression) | 검색 결과 페이지에 우리 사이트가 표시된 횟수 |
| 클릭 (Click) | 검색 결과에서 사이트로 진입한 횟수 |
| CTR (Click-Through Rate) | 클릭 ÷ 노출 × 100. 정상 2-5%, 우리 GSC 0.3% / Naver 0.9% |
1. Google Sandbox — 신규 도메인 "견습 기간"
Google 이 신규 도메인을 일정 기간 "견습" 상태로 두는 비공식 알고리즘. 6-12주 색인은 되지만 검색 순위 상승 제한.
왜 존재?
스팸·MFA(Made For AdSense) 사이트가 신규 도메인 양산해서 노출 받는 거 막기 위함. "이 사이트가 6주 후에도 살아있나" 평가 시간.
신호
- 색인은 잘 됨 ✅
- 노출 spike → dip 패턴 (5/14 정점 → 5/24 거의 0)
- CTR 매우 낮음
- 같은 키워드에 다른 사이트 (오래된 도메인) 가 우선
대응
시간 + 콘텐츠 quality 유지 + 백링크 자연 발생. 외부 액션으로 단축 거의 불가능.
Google 은 공식 sandbox 존재 부정하지만 SEO 업계에서 widely observed. 우리 도메인 5/9 + 6-12주 = 6/20 ~ 7/30 자동 종료 expected. 그때까지 그냥 기다리는 게 정답.
2. E-E-A-T — Google 의 4 품질 기준
Experience · Expertise · Authoritativeness · Trustworthiness
| 기준 | 의미 |
|---|---|
| Experience (경험) | 실제 사용해본 사람이 쓴 글인가 |
| Expertise (전문성) | 작성자가 그 분야 전문가인가 |
| Authoritativeness (권위) | 이 사이트가 그 주제로 알려졌나 |
| Trustworthiness (신뢰) | 정확·투명·안전한가 |
특히 YMYL (Your Money, Your Life) — 세금·의료·법률·금융처럼 인생에 영향 큰 콘텐츠 — E-E-A-T 평가 매우 엄격. 잘못된 정보 1건만으로 사이트 전체 신뢰도 감점.
우리 사이트 38 계산기 중 절반 이상 YMYL (salary·property-tax·inheritance 등). 그래서 모든 수치는 정부 공식 사이트 (law.go.kr·국세청·기재부) 직접 인용으로 통일. 블로그·언론 인용 0건. E-E-A-T 위반 risk 차단.
3. Domain Authority (DA)
사이트가 검색엔진에서 얼마나 신뢰받는지 0~100 점수. Moz·Ahrefs 가 측정 (Google 공식 점수 X, 추정치).
핵심 결정 요인: 백링크 (다른 사이트가 우리 링크) 의 양·질.
- DA 70+ → Google 이 상위 노출
- DA 0~10 → 검색 결과 뒤
- DA 는 시간 + 백링크 자연 축적 만이 답
우리 신규 도메인 DA 거의 0. 이전 taystudio.github.io DA 일부 승계 추정. 3-6개월 축적 필요.
4. AI Overview — Google 검색의 새로운 적
2024년부터 Google 검색 결과 상단에 AI 가 직접 답 표시:
검색: "연봉 5000만 실수령액"
↓
AI Overview: "약 354만원 (4대보험·소득세 차감 후)..."
↓
사용자가 우리 사이트 클릭 안 함
우리 같은 계산기 사이트 직격타. Naver 는 아직 한국 정책 데이터의 AI 학습이 약해서 영향 미미.
5. Zero-Click Search
검색했지만 사이트 클릭 없이 검색 결과 페이지에서 답 보고 나가는 케이스:
- Featured Snippet (강조 박스)
- Knowledge Panel (지식 패널)
- AI Overview
- "현재 Google 검색의 60%+ 가 zero-click" (Similarweb 2024)
대응: 단순 fact 답 외의 차별화 콘텐츠 — 시뮬레이션·매트릭스·case study·시각화. AI 가 한 줄로 답할 수 없는 깊이.
우리 도구에 매트릭스 (1주택 공정시장가액 9×4 / DSR 역산 / 6+6 분배 시나리오) 박은 이유가 정확히 이것.
6. 한국 검색 시장 구조
| 엔진 | 점유율 (한국) | 특징 |
|---|---|---|
| Naver | 50~60% | 한국 NLP 강력, 자체 데이터 우선 |
| 30~35% | 글로벌, PageRank 유산, AI Overview | |
| Daum (Kakao) | 5~10% | Google 결과 부분 + 자체 카페 |
| Bing | 1~3% | Microsoft. GSC import 가능 |
한국어 키워드 (세금·계산기·정책) = Naver 우위. Google 만 보고 사이트 평가하면 안 됨.
7. Sitemap·robots.txt·llms.txt — 검색엔진과의 약속 문서
| 파일 | 역할 |
|---|---|
| sitemap.xml | "내 사이트의 모든 페이지 list 여기 있다" |
| robots.txt | "이 부분 크롤 OK / 이 부분 X" |
| llms.txt | "LLM 학습·검색용 사이트 메타" (신생 표준) |
| IndexNow | 페이지 변경 시 검색엔진 즉시 알림 (Bing·Yandex·Naver) |
robots.txt 에서 GPTBot·ClaudeBot·PerplexityBot·Google-Extended 명시적 Allow 가 표준. 우리도 그렇게 설정 완료.
8. Schema.org / JSON-LD — Rich Snippet 의 원리
검색엔진이 이해하는 구조화 데이터 표준. JSON-LD 형식이 가장 흔함.
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "FAQPage",
"mainEntity": [{
"@type": "Question",
"name": "연봉 5000만의 실수령액?",
"acceptedAnswer": { "@type": "Answer", "text": "월 약 354만원..." }
}]
}
</script>
이거 박으면 Google 검색 결과에 ⭐별점·FAQ 펼치기·빵부스러기 경로 등 표시 → CTR ↑.
9. CTR Optimization — 노출 → 클릭 비율
검색 결과 페이지에 우리 사이트가 떠도 클릭 안 되면 무의미. CTR 결정 요인:
<title>태그: 검색어 직접 매칭 + 매력적<meta name="description">: 150자 안에 핵심 가치- URL 가독성:
/tools/salary/>/p?id=12345 - rich snippet 표시: ⭐별점·FAQ 펼치기
- 사이트 신뢰도 (HTTPS, 도메인 age)
우리 신규 도메인 + AI Overview 영향으로 GSC CTR 0.3% (정상 2-5%). Naver 는 같은 사이트인데 0.9% — 3배 차이. 한국 검색엔진이 한국 콘텐츠 매칭 더 잘 함.
10. 키워드 — Short-tail vs Long-tail
| 유형 | 의미 | 예시 |
|---|---|---|
| Short-tail | 짧고 broad. 검색량 많지만 경쟁 치열 | "재산세" |
| Long-tail | 구체적·길고 검색량 작지만 의도 명확 | "지방세법 주택 재산세 세율 2026" |
신규 사이트는 short-tail 경쟁 못 이김. long-tail 누적이 정도. 우리 매트릭스·시뮬레이션 add 가 long-tail 키워드 흡수 전략.
11. 분석 도구 3종 — 한 쪽만 보면 큰 그림 못 봄
| 도구 | 보여주는 것 | 한계 |
|---|---|---|
| GSC | Google 검색 노출·클릭·색인 | Google 만 |
| Naver SearchAdvisor | Naver 검색 동일 | Naver 만 |
| Cloudflare Web Analytics | 모든 채널 실제 트래픽 | 검색어 정보 X |
우리 3종 결합 결과:
- GSC (3개월): 클릭 2 / 노출 777
- Naver (30일): 클릭 230 / 노출 26,000
- Cloudflare (24h): visits 57
→ Naver 가 GSC 의 33~115배. Google 만 봤으면 "사이트 망함" 오해할 뻔.
12. GEO (Generative Engine Optimization) — AI 검색 시대 SEO
ChatGPT·Claude·Perplexity·Gemini 가 답할 때 우리 사이트 인용하게 하는 최적화:
llms.txt— 사이트 root markdown 메타- 구조화 데이터 (Schema.org)
- 출처 명시 (author·date·source)
- fact-rich content (수치·출처·정확성)
우리 Cloudflare 에 chatgpt.com referrer 확인됨 = LLM 노출 이미 시작. llms.txt 갱신으로 가속 expected.
정리 — SEO 80% 는 시간, 20% 가 액션
할 수 있는 것: - sitemap·robots·llms.txt 설정 - 모든 검색엔진 등록 (GSC·Naver·Daum·Bing) - meta·title CTR 최적화 - 구조화 데이터 - 콘텐츠 차별화
할 수 없는 것: - Google sandbox 단축 - DA 즉시 상승 - AI Overview 완화 - Naver 알고리즘 변경
신규 도메인 운영 한 달 차 결론: 데이터 한 쪽만 보고 패닉하지 말 것. Google 약해도 Naver·Daum·AI 채널 합치면 충분한 트래픽이 들어옴. 우리 사이트는 일 visits 57, 한 달 230 Naver 클릭, AI 검색 노출 시작 — 절대 망한 상태 아님.
관련 글
- (예정) GSC vs Naver vs Cloudflare — 같은 사이트 3종 데이터의 차이
- (예정) llms.txt 도입기 — AI 검색 시대 사이트 메타데이터
댓글