상세 컨텐츠

본문 제목

중복 콘텐츠 기준을 말하는 Google의 정의

본문

반응형

블로그 기사 콘텐츠의 스펙은 경합 사이트와 변하지 않는데 좀처럼 Google검색 순위가 오르지 않는다"그런 경험은 없나요? 물론 검색 순위가 오르지 않는 것은 여러 요소가 복합적으로 영향을 끼치고 있으며 중복 콘텐츠도 요인의 하나 일지도 모릅니다. 중복 콘텐츠의 종류를 비롯한 SEO에 미치는 영향이나 체크 방법, 각각의 상황에 적합한 대처 법 등을 자세히 해설합니다.

중복 콘텐츠 기준을 말하는 Google의 정의

중복 콘텐츠는 "제목""텍스트""사진"등의 요소가 다른 페이지의 내용과 중복된 상태를 가리키며, 취급은 "카피 콘텐츠"와 같습니다. Google의 공식 사이트에서는 중복 콘텐츠의 정의에 대해서 다음과 같이 해설되어 있습니다.
일반적으로 중복되는 콘텐츠는 도메인 내 또는 여러 도메인에 걸쳐서 존재하며, 다른 콘텐츠와 완전히 같은 것인지를 판단하는 매우 비슷한 콘텐츠의 블록을 말합니다.

※인용 전: Search Console도움말
사이트 내외를 불문하고 복수의 다른 URL에서 " 똑같다"또는"콘텐츠의 일부" 유사한 페이지에 액세스 할 수 있는 상태이면 제작자의 의도에 불구하고 중복 콘텐츠라고 간주되어 버립니다.
사이트 내의 페이지 수가 많을수록 발생할 확률이 높아 세상의 30%는 중복 콘텐츠라고 합니다.

중복 콘텐츠의 종류-중복 콘텐츠를 크게 분류하면 동일 도메인 "사이트 내"에서 발생하는 타입과 다른 도메인이다"외부 사이트 사이"에서 발생하는 타입의 2종류로 나누어집니다.
사이트 내부와 외부 각각에 대해서 중복 콘텐츠가 발생하기 쉬운 구체적 예를 봅시다.

사이트 내부의 중복 콘텐츠-사이트 내부의 중복 콘텐츠는 그 대부분이 "부득이 한 사양상의 문제"에서 발생합니다.
그래서 다음과 같은 중복 콘텐츠로 좋은 페이지가 존재하고 있어도 알아채지 못하는 사이트 운영자가 많습니다.

▼ 사이트 내부에서 발생하기 쉬운 중복 콘텐츠
-URL의 표기에 일관성이 유지되지 않는다
-www가 자동으로 생성되고 있다
-Web사용의 인쇄 페이지
-PC용과 스마트 폰용으로 별도의 URL로 되어있다.
-EC사이트 등 사진이 메인 페이지이다
-상품 설명이 업체 등으로부터 제공되고 있고 정형된 글을 인용하고 있다
-전국 대상 포털 사이트 등 비슷한 페이지를 지역별로 발신하고 있다
-관련성이 높은 KW마다 페이지를 작성한 결과 내용이 같다


외부 사이트 사이에서 발생하는 중복 콘텐츠
외부 사이트 사이에서 중복 콘텐츠가 발생하는 주요 원인으로서 아래와 같이 볼 수 있습니다.
-다른 사이트의 콘텐츠를 참고한 결과 내용이 닮겨있다.
다른 사이트의 콘텐츠를 복사하지 않더라도 다른 사이트의 컨텐츠를 참고로 사이트의 콘텐츠를 작성하면 내용이 유사한 경우가 있습니다. 의도하지 않아도 중복 콘텐츠(복제 콘텐츠)으로 판단되기 때문에 주의해야 합니다.

-다른 사이트에 같은 내용의 콘텐츠를 제공한다
다른 사이트에 콘텐츠를 제공하고 다른 사이트의 콘텐츠가 다른 사이트에서도 이용되고 있는 경우, 계약에 따라 콘텐츠를 제공해도 검색 엔진은 중복 콘텐츠라고 판단하게 됩니다.

-다른 사이트에 콘텐츠를 도용하고 있다
다른 사이트에 콘텐츠를 도용된 경우 통상 복제 사이트가 오리지널 컨텐츠라 판단되기 때문에 나쁜 영향은 없습니다. 그러나 타 사이트의 Web페이지보다 빨리 다른 사이트의 콘텐츠가 노출된 경우, 오리지날 사이트의 웹 페이지가 중복 콘텐츠라고 검색 엔진이 인식할 수 있습니다.

*중복 콘텐츠가 SEO에 미치는 영향
원래 중복 콘텐츠는 SEO에게 불리한 걸까요? 만약 중복 콘텐츠가 오리지널 컨텐츠와 동등한 평가를 얻어 버리면 검색 결과에 비슷한 페이지만 표시되어 버립니다.
이 상태에서 검색 사용자에게 가치 있는 정보를 제공할 수 없기 때문에 검색 엔진은 "중복 콘텐츠=가치 없는 물건"으로 보고, 오리지널 컨텐츠와 구별하는 것입니다.

이제 중복 콘텐츠가 SEO에 주는 대표적인 3가지 리스크에 대해서 봅시다.

- Google의 페널티 대상이 된다
과거 Google에 일하던 매트 카츠(Matt Cutts)는 중복 콘텐츠가 있을 뿐 즉시 페널티의 대상이 아니라고 말했습니다. 그러나 현재 Google에서 원칙적으로 2개 이상 중복 콘텐츠를 동시에 검색 결과에 내지 않도록 해야 한다고 발표했으며 특히"팬더 업데이트"가 실시된 2012년 7월 이후는 판단이 더욱 어려워지고 있는 것 같습니다.
중복 콘텐츠는 Google에서 정의하는 품질 콘텐츠에 해당하기 때문에 얼마나 유익한 정보가 담겼어도 높은 평가가 되지 않습니다.

이제 악의의 유무가 Google의 판정 기준에 영향을 미치는지 또 실제에 패널티를 받은 경우의 영향에 대해서 개별적으로 해설합니다.

-악의 있는 중복 콘텐츠
다음과 같은 무단으로 복제된 중복 콘텐츠는 분명히 Google의 품질 가이드 라인을 위반하고 있습니다. 그래서 악의적인 중복 콘텐츠로 간주되어 즉각 패널티를 받아도 반박의 여지가 없습니다.

무단 복제된 콘텐츠의 예로는 다음과 같은 것을 들 수 있습니다.
· 다른 사이트의 콘텐츠를 복사하여 독자의 콘텐츠나 부가가치를 더함 없이 노출하는 사이트
· 다른 사이트의 콘텐츠를 복사하고(어구를 유의어로 바꾸거나 자동화된 방법을 사용하고)약간의 수정을 가한 후에 노출하는 사이트
-뭔가의 독자적인 체계화와 사용자에 대한 편리성을 제공하지 않고 다른 사이트의 콘텐츠 피드를 그대로 게재하는 사이트
-유저에 실질적인 부가 가치를 제공하지 않고 다른 사이트의 동영상, 사진, 기타 매체 등의 컨텐츠를 내장하는 사이트

※인용 전: Search Console도움말
악의 없는 중복 콘텐츠
다음과 같은 중복 콘텐츠는 의도적이지 않다 우발적으로 발생하는 경우가 많아 뚜렷한 품질 기준 위반으로 할 수 없습니다.
대부분의 경우 위장을 의도한 것이 아닙니다. 악의 없는 중복 콘텐츠의 예에는 다음이 있습니다.
일반적 페이지와 모바일 장치용 간이 페이지 모두를 생성하는 토론 포럼
·복수의 다른 URL로 표시 또는 링크되는 상품
웹 페이지의 인쇄용 버전
인용 전: Search Console도움말
다만, Web제작자에게 악의가 있든 없든 사용자의 편리성이 훼손될 가능성이 있고 검색 엔진은 악의의 유무를 판별할 수 없습니다.
그래서, Google에서 사용성이 낮은 사이트라고 평가된 경우는 비록 악의 없는 이런 케이스에서도 페널티의 대상이 됩니다.

 

페널티의 영향

실제 패널티를 받은 콘텐츠가 어떤 불이익을 당하는지, Google공식 사이트의 설명을 살펴보면
극히 드문 사례로 Google에서 순위 조작이나 사용자에 대한 위장을 의도한 중복 콘텐츠가 표시될 가능성이 인식될 경우에도 Google에서는 관계하는 사이트의 인덱스 등록과 순위에 대해서 적절한 조정을 실시합니다. 그 경우 해당 사이트는 랭킹이 저하되며 Google인덱스에서 완전히 삭제되어 검색 결과에 표시되지 않게 될 가능성이 있습니다.

※인용 전: Search Console도움말
이처럼 중복 컨텐츠에 의해서 Google에서 패널티를 받자"검색 순위의 저하"이나 "인덱스 삭제에 의한 숨김"등 큰 SEO리스크가 발생됩니다.
검색 결과에 표시되지 않는 중복 콘텐츠는 통상, 동시에 검색 결과에 표시되지 않습니다. 검색 결과에 표시되는 것은 원작과 판단된 콘텐츠 1개입니다.
검색 결과에 중복 콘텐츠를 동시에 표시하면 유사한 내용의 Web페이지가 검색 결과에 표시됩니다. 그렇게 되면 첫번째 Web페이지에 접속하고 의문과 고민이 해결 안 된 사용자가 2번째 Web페이지에 접속해서도 내용이 유사하기 때문에 의문이나 고민을 해결할 수 없다는 사실이 될 수 있습니다.

사용자가 키워드 검색을 통해서 의문이나 고민을 해결할 수 있도록 검색 엔진은 다양성을 담보하려고 합니다. 같은 내용의 콘텐츠가 아니라 독자적인 부가 가치를 유저에게 주어지는 오리지날의 콘텐츠가 상위 표시되므로 중복 콘텐츠를 포함한 Web페이지는 상위 표시되지 않습니다.

링크 평가가 분산된다
사이트 내부에 중복 콘텐츠가 존재할 경우 링크 평가가 분산되는 것도 있습니다. 예를 들면 본래라면 링크 평가가 100을 주는데 중복 콘텐츠를 포함한 Web페이지를 사이트 내 2개 존재하므로 5:5에 평가가 분산될 가능성이 있습니다.
안에는 검색 엔진이 자동적으로 처리하고 평가를 하나 1개의 Web페이지에 내놓을 수도 있지만 반드시 열린다는 것은 아닙니다. 즉, 중복 콘텐츠에 의한 강제 링크 평가의 분산은 상위 표시를 놓치는 요인이 됩니다.

중복 콘텐츠의 점검 방법

"타 사이트 내에서 중복 콘텐츠가 발생 안 하는지"" 다른 사이트에 도용되지 않았는가?"걱정하고 있는 분에 대표적인 점검 방법을 3가지를 소개합니다.

Search Console의 "인덱스 커버리지"에서 체크!
중복 콘텐츠가 있는 경우, 텍스트 등의 중복 외에 HTML구조 문제나 사이트 구축 시 또는 이행시의 설정 실수 등이 요인으로 꼽힙니다.
이런 케이스로 활약하는 것이 바로 Search Console내에 있는 "인덱스 커버리지"라는 기능입니다.
옛 버전은 폐지되고 새 버전으로 통합된 2019년 9월 이후 기존의 인덱스 수와 중복 페이지도 조사할 수 있게 되었습니다.

Google검색 필터 기능을 해제하는 명령에서 체크!

이 방법은 공개된 Web페이지에 있으면 사이트 내외를 불문하고 중복 콘텐츠의 존재를 점검할 수 있는 것이 매력입니다. 원래 Google검색에 유사 페이지가 동시에 표시되지 않도록 필터 기능이 갖춰지고 있습니다.
달리 말하면, 이 필터 기능을 해제하면 중복 콘텐츠의 여부가 검색 결과에서 확인할 수 있게 됩니다.

▼ Google의 필터 기능을 해제하는 절차
-Google의 검색어 서치에서 알아보고 싶은 URL을 입력한다
-입력한 URL의 말미에 "&filter=0"을 추가하고 검색한다
-제외된 콘텐츠를 포함한 검색 결과가 표시된다

입력한 URL의 말미에 "&filter=0"을 추가하고 검색한다

 

반응형

관련글 더보기

댓글 영역