Google Search Console의 범위 보고서 ‘제외 페이지’ 수정

Google Search Console의 범위 보고서 ‘제외 페이지’ 수정

콘텐츠가 눈에 띄지 않게 놔두지 마십시오. Google Search Console 색인 범위 보고서에서 제외된 부분에 대해 알아보고 상태를 수정하세요.

Google Search Console의 범위 보고서 '제외 페이지' 수정

Google Search Console을 사용하면 Google의 눈으로 웹사이트를 볼 수 있습니다.

웹 사이트 성능에 대한 정보와 페이지 경험, 보안 문제, 크롤링 또는 색인 생성에 대한 세부 정보를 얻습니다.

Google Search Console 색인 범위 보고서의 제외된 부분은 웹사이트 페이지의 색인 생성 상태에 대한 정보를 제공합니다.

웹사이트의 일부 페이지가 Google Search Console의 제외 보고서에 표시되는 이유와 해결 방법에 대해 알아보세요.

인덱스 커버리지 보고서란 무엇입니까?

Google Search Console 범위 보고서 는 웹사이트 웹페이지의 색인 상태에 대한 자세한 정보를 보여줍니다.

웹 페이지는 다음 네 가지 버킷 중 하나에 들어갈 수 있습니다.

  • 오류 : Google에서 색인을 생성할 수 없는 페이지입니다. Google에서 이 페이지의 색인을 생성하길 원할 수 있다고 생각하므로 이 보고서를 검토해야 합니다.
  • 경고와 함께 유효함 : Google에서 색인을 생성하는 페이지이지만 해결해야 할 몇 가지 문제가 있습니다.
  • 유효 : Google에서 색인을 생성하는 페이지입니다.
  • 제외됨 : 인덱스에서 제외된 페이지입니다.

Google 검색 콘솔 범위 보고서

제외된 페이지란 무엇입니까?

Google은 오류 및 제외된 버킷의 페이지를 색인화하지 않습니다.

둘의 주요 차이점은 다음과 같습니다.

  • Google은 오류가 있는 페이지를 색인화해야 한다고 생각하지만 검토해야 하는 오류 때문에 색인을 생성할 수 없습니다. 예를 들어, XML 사이트맵을 통해 제출된 색인 생성 불가능한 페이지는 오류에 해당합니다.
  • Google은 Excluded 버킷의 페이지가 실제로 제외되어야 한다고 생각하며 이것이 귀하의 의도입니다. 예를 들어 Google에 제출되지 않은 색인 생성이 불가능한 페이지는 제외 보고서에 표시됩니다.
    GSC에서 제외된 페이지

그러나 Google이 항상 올바른 것은 아니며 색인을 생성해야 하는 페이지는 때때로 제외됨으로 이동합니다.

다행히 Google Search Console 은 페이지를 특정 버킷에 배치하는 이유를 제공합니다.

그렇기 때문에 4개의 버킷 모두에 있는 페이지를 주의 깊게 검토하는 것이 좋습니다.

이제 제외된 버킷에 대해 알아보겠습니다.

제외된 페이지의 가능한 이유

귀하의 웹 페이지가 제외 그룹에 있는 15가지 이유가 있습니다. 하나하나 자세히 살펴보겠습니다.

“noindex” 태그에 의해 제외됨

“NOINDEX” 태그가 있는 URL입니다.

Google은 이러한 페이지를 XML 사이트맵 에 나열하지 않기 때문에 실제로 이러한 페이지를 색인 생성에서 제외하고 싶어한다고 생각합니다 .

예를 들어 로그인 페이지, 사용자 페이지 또는 검색 결과 페이지가 될 수 있습니다.

noindex 태그에 의해 제외된 Google Search Console

권장 조치:

  • 이 URL을 검토 하여 Google 색인에서 제외 할지 확인하세요 .
  • 해당 URL에 “noindex” 태그가 여전히/실제로 존재하는지 확인하십시오 .

크롤링 – 현재 색인 생성되지 않음 

Google은 이 페이지를 크롤링했지만 아직 색인을 생성하지 않았습니다.

Google이 문서 에서 말했듯 이 이 버킷의 URL은 “향후 인덱싱되거나 인덱싱되지 않을 수 있습니다. 크롤링을 위해 이 URL을 다시 제출할 필요가 없습니다.”

많은 SEO 전문가는 많은 일반 페이지와 색인 생성 가능한 페이지가 현재 색인이 생성되지 않은 크롤링 상태로 전환되는 경우 사이트에 심각한 품질 문제가 있을 수 있다는 점을 인지했습니다.

이는 Google이 이러한 페이지를 크롤링했으며 색인을 생성하기에 충분한 가치를 제공하지 않는다고 생각할 수 있습니다.

현재 크롤링된 Google Search Console은 IIndexed가 아닙니다.

권장 조치:

  • 품질 및 EAT 측면에서 웹사이트를 검토하십시오 .

발견됨 – 현재 인덱싱되지 않음 

Google 문서에 따르면 Discovered(현재 색인이 생성되지 않음) 아래에 있는 페이지는 “Google에서 찾았지만 아직 크롤링되지 않았습니다.”

Google은 서버에 과부하가 걸리지 않도록 페이지를 크롤링하지 않았습니다. 이 버킷 아래에 페이지 수가 많다는 것은 사이트에 크롤링 예산 문제가 있음을 의미할 수 있습니다.

현재 색인이 생성되지 않은 Google 검색 콘솔이 발견됨

권장 조치:

  • 서버의 상태를 확인하십시오 .

찾을 수 없음 (404)

Google에서 요청할 때 상태 코드 404(찾을 수 없음)를 반환한 페이지입니다.

이들은 Google에 제출된 URL(예: XML 사이트맵 )이 아니라 Google이 이러한 페이지를 발견했습니다(즉, 오래 전에 삭제된 이전 페이지에 링크된 다른 웹사이트를 통해).

GSC - 404에서 제외된 페이지

권장 조치:

  • 이 페이지를 검토 하고 작업 페이지에 대한 301 리디렉션을 구현할지 여부를 결정합니다 .

소프트 404

Soft 404 는 대부분의 경우 상태 코드 OK(200)를 반환하는 오류 페이지입니다.

또는 콘텐츠가 거의 또는 전혀 포함되지 않고 “죄송합니다”, “오류”, “찾을 수 없음” 등과 같은 단어를 사용하는 얇은 페이지일 수도 있습니다.

Google Search Console의 Soft 404

권장 조치:

  • 오류 페이지의 경우 상태 코드 404를 반환해야 합니다 .
  • 얇은 콘텐츠 페이지의 경우 Google에서 이 URL을 독립형 페이지로 인식할 수 있도록 고유한 콘텐츠를 추가 하세요.

리디렉션이 있는 페이지

웹사이트에서 리디렉션된 모든 페이지는 제외된 버킷으로 이동하여 Google이 웹사이트에서 감지한 리디렉션된 모든 페이지를 볼 수 있습니다.

Google Search Console의 리디렉션이 있는 페이지

권장 조치:

  • 리디렉션된 페이지 를 검토하여 리디렉션이 의도적으로 구현되었는지 확인합니다.
  • 일부 WordPress 플러그인 은 URL을 변경할 때 자동으로 리디렉션을 생성하므로 가끔 검토하는 것이 좋습니다.

사용자가 선택한 표준 없이 복제

Google은 이러한 URL이 귀하의 웹사이트에 있는 다른 URL과 중복된다고 생각하므로 색인을 생성해서는 안 됩니다.

이 URL에 대한 표준 태그를 설정하지 않았으며 Google은 다른 신호를 기반으로 표준 태그를 선택했습니다.

권장 조치:

  • 이 URL을 검사하여 Google이 이 페이지에 대해 선택한 표준 URL을 확인하십시오.

중복, Google은 사용자와 다른 표준을 선택했습니다.

GSC에서 제외된 페이지

이 경우 페이지에 대한 표준 URL 을 선언했지만 그럼에도 불구하고 Google은 다른 URL을 표준으로 선택했습니다. 결과적으로 Google에서 선택한 표준은 색인이 생성되고 사용자가 선택한 표준은 색인이 생성되지 않습니다.

가능한 조치:

  • URL을 검사하여 Google이 선택한 표준을 확인합니다.
  • Google 이 다른 표준(예: 외부 링크)을 선택하게 만든 가능한 신호를 분석합니다.

중복 제출된 URL이 표준으로 선택되지 않음

위 상태와 이 상태의 차이점은 후자의 경우 표준 주소를 선언하지 않고 색인 생성을 위해 Google에 URL을 제출했으며 Google은 다른 URL이 더 나은 표준이 될 것이라고 생각한다는 것입니다.

결과적으로 제출된 URL이 아니라 Google에서 선택한 표준이 색인이 생성됩니다.

권장 조치:

  • URL을 검사하여 Google이 선택한 표준을 확인합니다.

적절한 표준 태그가 있는 대체 페이지

이들은 단순히 Google이 표준 URL로 인식하는 페이지의 복제본입니다.

이러한 페이지에는 올바른 표준 URL을 가리키는 표준 주소가 있습니다.

권장 조치:

  • 대부분의 경우 조치가 필요하지 않습니다 .

Robots.txt에 의해 차단됨 

robots.txt 가 차단 한 페이지입니다 .

이 버킷을 분석할 때 Google이 예를 들어 다른 웹사이트에서 해당 페이지에 대한 참조를 찾은 경우 Google은 여전히 ​​이러한 페이지를 색인화하고 “손상된” 방식으로 표시할 수 있다는 점에 유의하십시오.

권장 조치:

  • robots.txt 테스터를 사용하여 이러한 페이지가 차단되었는지 확인하십시오 .
  • 색인에서 페이지를 제거하려면 “noindex” 태그를 추가하고 robots.txt에서 페이지를 제거하십시오.

페이지 제거 도구에 의해 차단됨 

이 보고서에는 제거 도구 에서 제거 를 요청한 페이지가 나열 됩니다.

이 도구는 일시적으로(90일) 검색결과에서 페이지를 제거하며 색인에서는 제거하지 않는다는 점에 유의하십시오.

권장 조치:

  • 제거 도구를 통해 제출된 페이지를 일시적으로 제거해야 하는지 또는 ‘noindex’ 태그가 있는지 확인하십시오.

승인되지 않은 요청으로 인해 차단됨(401)

이러한 URL의 경우 승인 요청(401 상태 코드)으로 인해 Googlebot이 페이지에 액세스할 수 없습니다.

이러한 페이지를 승인 없이 사용할 수 있어야 하는 경우가 아니면 아무 작업도 수행할 필요가 없습니다.

Google은 단순히 발생한 문제에 대해 알려줍니다.

구글 401페이지

권장 조치:

  • 이러한 페이지가 실제로 승인이 필요한지 확인하십시오 .

접근 금지로 인해 차단됨(403)

이 상태 코드 는 일반적으로 일부 서버 오류의 결과입니다.

제공된 자격 증명이 올바르지 않고 페이지에 대한 액세스 권한을 부여할 수 없는 경우 403이 반환됩니다.

Google 문서 에는 다음과 같이 명시되어 있습니다.

“Googlebot은 자격 증명을 제공하지 않으므로 서버가 이 오류를 잘못 반환하고 있습니다. 이 오류는 수정되거나 robots.txt 또는 noindex에 의해 페이지가 차단되어야 합니다.”

제외된 페이지에서 무엇을 배울 수 있습니까?

제외된 페이지의 특정 버킷에서 갑자기 급증하는 것은 심각한 사이트 문제를 나타낼 수 있습니다.

다음은 웹사이트의 심각한 문제를 나타낼 수 있는 급증의 세 가지 예입니다.

  • 찾을 수 없음(404) 페이지의 급증은 URL이 변경되었지만 새 주소로의 리디렉션이 구현되지 않은 성공적인 마이그레이션 을 나타낼 수 있습니다. 이는 예를 들어 경험이 없는 사람이 블로그 게시물의 슬러그를 변경하여 결과적으로 모든 블로그의 URL을 변경한 후에도 발생할 수 있습니다.
  • 현재 색인이 생성되지 않았 거나 크롤링 되지 않은 검색 항목 의 급증은 사이트가 해킹되었음을 나타낼 수 있습니다. 예제 페이지를 검토하여 이 페이지가 실제로 귀하의 페이지인지 아니면 해킹의 결과로 생성되었는지 확인하십시오(예: 한자가 포함된 페이지).
  • Excluded by ‘noindex’ 태그의 급증은 실패한 시작 및 마이그레이션을 나타낼 수도 있습니다 . 이는 스테이징 사이트의 “noindex” 태그와 함께 새 사이트가 프로덕션으로 이동할 때 자주 발생합니다.

요약

GSC 적용 범위 보고서의 제외 섹션 덕분에 웹사이트와 Googlebot이 웹사이트와 상호작용하는 방식에 대해 많은 것을 배울 수 있습니다.

당신이 새로운 SEO 이든 이미 몇 년의 경험이 있든 상관없이 Google Search Console을 확인하는 것을 일상적인 습관으로 만드십시오.

이것은 실제 재앙으로 바뀌기 전에 다양한 기술적 SEO 문제를 감지하는 데 도움이 될 수 있습니다.

댓글 달기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다