구글 SEO 2021 (검색엔진최적화 260 완벽 분석)

구글 검색 알고리즘 260항목 완전 분석! "SEO의 모든 것"

 

- 구글 SEO는, 현재 검색 상위 노출에 사용되고 있는 알고리즘에 [수백 가지 요소]가 좌우하고 있습니다.

이러한 요소에 대해 구글은 끊임없는 업데이트를 하고 있으며, 이 안에는 [판다 업데이트][펭귄 업데이트]와 같은 대규모부터, 이름도 없는 세세한 것까지 다양한 알고리즘이 존재합니다.

이번 포스팅은 독자적인 리서치와 구글 측의 발언으로부터, 알고리즘으로 검색엔진 최적화에 사용되고 있다고 여겨지는 항목을 검색 및 원문을 번역해 소개해드립니다.

구글 공식이 아닌 어디까지나 개인의 조사와 번역에 의한 것이지만, SEO를 실천하는데 있어 유용한 참고자료가 될 내용입니다.


*관련 내용매우 길기에, 목차 부분을 참고하셔서 읽으시면 좋습니다.

*원 내용Google Ranking Factors 260+ 를 번역 및 참고했습니다. 내용이 매우 어색해도 이해 부탁드립니다.

*빠르고 확실한 SEO 효과를 원하시다면, 전문업체를 통해 의뢰 받으시는게 가장 빠릅니다.


 

목차

 

1. 구글 순위 결정 요인

1-1. 플러스로 작용하는 내부 SEO 요인 (1~72번)


2. 마이너스로 작용하는 내부 SEO 요인

2-1. 사이트 전체에 대한 요인 (73~80번

2-2. 콘텐츠 관련 요인 (81~114번)

2-3. 코드에 관한 요인 (115~134번)

2-4. 서버 관련 요인 (135~149번)


3. 플러스로 작용하는 외부 SEO 요인

3-1. 권위성에 관한 요인 (150~172번)

3-2. 연관성에 관한 요인 (173~184번)

3-3. 품질에 관한 요인 (185~186번)

3-4. 기타 상황에 관한 요인 (187~203번)


4. 마이너스로 작용하는 외부 SEO 요인

4-1. 권위성에 관한 요인 (204, 205번)

4-2. 품질에 관한 요인 (206~210번)

4-3. 주변 상황에 관한 요인 (211~216번)

4-4. 링크 패턴에 관한 요인 (217~233번)

4-5. 스킴(Scheme) 관련 요인 (234~251번)

4-6. 기타 간섭 가능성 요인 (252~258번)

 

구글 순위 결정 요인

 

 

- 구글에는 SEO 관련 정보가 넘칩니다. 하지만, 그 정보 대부분부분적으로 또는 완벽하게 틀리는 둘 중 하나의 경우입니다.

이러한 정보를 그대로 받아들여 실천으로 적용하는 것은 좋지 않습니다. 실제로는 테크닉이나 간접적 상호 관계만 있는 것이 대부분입니다.

SEO에 대한 지식이라는 것은, 일반 블로그포럼 등에서 얻기 쉽지 않습니다. 실제로 믿을 수 있는 정보라고 하는 것은 아래의 3가지에서 얻는 경우가 가장 정확합니다.


1. 특허 정보
2. 구글 혹은 해당 직원의 발언
3. 과학적으로 올바르게 행해진 실험


이러한 정보가 있으면, 어떻게 검색 순위를 매기고 있는지 밝혀낼 수도 있습니다.

덧붙여서 논의의 여지가 있는 것이나, 완전히 미신에 지나지 않는 것도 이번 항목에 모두 포함했습니다. 또, 모든 요인은 구글의 일반 검색 순위 결정 요인에만 초점을 맞추고 있습니다.


*원문의 각각 항목에 대해 [concrete(확실함)], [probable(그럴듯함)], [likely(있을 수 있음)],  [maybe(있을지도 모른다)], [iffy(의심스럽다)], [myth(미신)] 으로 표기되어 있습니다.

*이것을 100%, 80%, 70%, 50%, 20%, 5%로 알기 쉽게 바꾸었습니다. 당연히 숫자가 높을수록 확실한 것입니다.


 

플러스로 작용하는 내부 SEO 요인

 

- 내부 SEO 요인이란 보유 사이트를 관리하여 직접 조작할 수 있는 SEO 요소입니다. 플러스로 작용하는 내부 SEO 요인에서는 순위에서 좋은 결과를 초래할 가능성이 있는 것에 대해 기술합니다.

 

이 중, 몇 가지 요소에서는 남용함으로써 반대로 마이너스 요인이 되는 것도 포함되어 있습니다(마이너스 요소는 후술).

플러스가 되는 내부 SEO 요인이란, 대략적인 표현을 하면 [콘텐츠의 내용], [모든 환경으로부터의 접근성], [사용자 체험에 대한 고안]과 관계합니다.

 

1. URL 내 키워드 (100%)

 

- 도메인 이름 외부에 있는 URL 부분에 포함되는 키워드 및 구문은, 특정 검색 질의에서 컨텐츠와의 관련성 설정에 도움이 됩니다. 다만, URL이 너무 길어지거나 키워드를 2번 이상 사용될 때, 수익률이 감소하는 것으로 보입니다.

 

2. URL 앞부분의 키워드 (80%)

 

- URL내의 키워드 순서를 요소화한다면, 이론적으로 앞부분에 적는 키워드에 비중이 높다고 말할 수 있습니다.

 

前구글 스팸 대책 팀의 리더였던 맷 커츠(Matt Cutts)의 말을 빌리자면 [5단어 정도, 그 이후의 키워드로 넘어갈수록 효과는 희미해져 간다]라고 확인되었습니다.

 

3. 타이틀 태그 내 키워드 (100%)

 

- 타이틀 태그(title tag)는 사이트의 문서 또는 페이지의 제목을 정의하며, 동시에 검색 결과나 SNS 공유시 스니펫(snippet)으로 자주 출현하는 태그입니다.

문자에 따라 다르지만, 30자를 넘지 않는 선에서 하는 것이 좋으며, URL과 마찬가지로 앞 부분 키워드에 비중이 높다는 설이 널리 이론화 되었습니다.

 

4. 페이지 키워드 밀도 (70%)

 

- 단어나 구문이 텍스트에 나타나는 시간의 백분율이며, 2000년대 초반에는 5.5%~6% 등장이 효과적이었다고 합니다.

그 이후, 구글에서는 컨텐츠 분석 방법을 개선해 왔고 현재 이러한 방법은 거의 효과가 없다고 보시면 됩니다. 오히려 키워드 출현율이 너무 높을 경우, 직접조치 대상이 될 수도 있습니다.

 

키워드 밀도는 구글 특허(Google Patents)에서 언급되기는 했지만, TF-IDF 뒤에 숨겨진, 단순한 개념에 불과합니다.


*키워드를 너무 반복하면 운 없는 경우, 해당 사이트의 일부 또는 전부가 구글검색결과에 제외됩니다.

*[구글서치콘솔] → 속성 검색 → 사이트 선택 → 직접 조치 → 감지된 문제가 있나 없나 확인 가능


 

5. 페이지 TF-IDF (80%)

 

- TF-IDF(Term Frequency - Inverse Document Frequency)혹은 [단어의 출현 빈도 + 역 문서 빈도]라 불리는 것에 대해 기술합니다.

TF-IDF는 통상 계측했을 때의 페이지 내 키워드 밀도 보다도, [일반적이지 않는] 키워드의 출현율에 대해 중점을 두도록 설계되어 있습니다.

이러한 계측 방법에서는 자주 등장하는 단어는 계측으로부터 제외되며, 예를 들면 [Google 순위 결정 요소] 같은 문구를 얼마나 많이 언급해야 하는지를 설정합니다.

 

6. H태그 내 키워드 (80%)

 

- H태그(제목 태그) 내 키워드는 페이지의 관련 주제를 정의할 때 높은 비중을 차지하는 포인트입니다. H1 태그에 가장 많은 비중이 있으며, H2·H3로 계속 될수록 낮아집니다.

H태그는 방문객의 접근성을 향상시키며, 명확하고 기술적인 H태그는 사이트 이탈률(Bounce rate)을 낮추는 것이 다양한 연구로 드러나고 있습니다.

 

7. 강조 표시된 단어 (100%)

- 굵은 글씨나 기울임·밑줄·큰 글꼴 등에 의해 강조 표시된 키워드는 페이지 관련 주제를 결정할 때 H태그만큼은 아니지만, 나름 큰 비중을 차지합니다. 이것은 맷 커츠나 SEO 연구가에 의해 입증되었습니다.

구글의 특허에는 [큰 폰트나 굵은 글씨, 또는 기울임 등으로 기재된 텍스트는 그렇지 않은 일반 텍스트 보다 가중치가 높을 수 있다]라고 기술되어 있습니다.

 

8. 서로 근접한 키워드 (80%)

 

- 단어 사이의 근린성은 단어들의 연관성을 암시합니다.

 

즉, 1개의 문장 안에서 [강남 고급 일식집]에 대해 다룬 문장이 있는 페이지가 [강남]과 [고급 일식집]에 대해 각기 다른 문장이나 단어로 말하고 있는 페이지보다, 상위에 표시될 가능성이 높습니다.

 

9. ALT 텍스트 키워드 (100%)

 

- 이미지 파일의 ALT 속성(ALT 태그)은 해당 이미지를 검색 엔진이나 이미지를 표시할 수 없는 환경에서 설명하는데 사용합니다. 특히, 이미지 검색에서 관련성 확립 동시에 접근성 향상으로 연결됩니다.

 

10. 정확한 검색 구문 일치 (80%)

 

- 구글은 검색 구문의 일부만 포함된 페이지를 반환할 수도 있고, 경우에 따라서 전혀 하지 않을 수도 있으나 특허에 따르면, 정보검색 점수(IR)는 정확한 구문 일치에 대해 더 높은 점수를 부여된다고 명시되어 있습니다.

구체적으로 든다면 [검색 질의의 모든 조건과 일치하는 문서는, 일부만 일치하는 문서보다 높은 점수를 받을 수 있다] 라고 명시합니다.

 

11. 부분 검색 구문 일치 (80%)

 

- 이 역시, 구글에 의해 입증된 것으로 페이지가 검색 문구와 정확히 일치하는 문구를 콘텐츠에 보유하고 있을 때, 그것은 쿼리와의 관련성을 강하게 인정받아 IR 점수를 높게 매길 수 있습니다.

이 과정에 있어서, 구글은 검색 질의와 부분적으로 일치하는 텍스트만 페이지에 포함되어도, 특정 검색에 대해 순위를 매길 수 있음을 간접적으로 확인합니다. 이것은 구글링을 할수록 더욱 검증됩니다.

 

12. 페이지 상단의 키워드 (70%)

 

- 이것은 영어에서 지극히 자연스러운 문법 경향이라고 할 수 있는데, 중요한 것은 먼저 말하려고 하며, 이것은 글이나 문장, 페이지로부터 HTML 태그에 이르기까지 모두에 해당되는 것입니다.

구글 역시, 이 사실을 모든 장소에서 적용하고 있는 것 같고, 페이지의 상단이나 보다 눈에 띄는 장소의 콘텐츠에 비중을 두고 있는 것 같습니다.

적어도 페이지 레이아웃 알고리즘에 비해 사이트 상단(above-the-fold)에 있는 콘텐츠가 우선되도록 설계되었습니다.

 

13. 키워드 기반 (100%)

 

- 키워드는 단어의 뿌리나 줄기를 따서 동일 기어(基語)를 가진, 그 줄기를 공유하는 다른 단어를 찾는 것입니다(stem-ming, stem-med 등).

키워드 밀도 점수와 같이, 이것에 소홀히 하면 가독성이 떨어지고 사이트에 부정적인 영향을 미치게 됩니다. 이것은 2003년 11월, 플로리다 업데이트(florida update)와 함께 도입되었습니다.

 

14. 내부 링크 앵커 텍스트 (100%)

 

- 링크의 앵커 텍스트(Anchor Text)는 사용자에게 해당 링크가 연결되는 위치를 알려줍니다.

 

이것은 사이트 내 탐색의 중요한 구성 요소이며, 악용되지 않을 경우 [여기를 클릭] 같은 애매한 링크보다, 특정 콘텐츠와 키워드의 관련성을 설정하는데 효과적입니다.

 

15. 도메인 이름이 키워드 (70%)

 

- 이것은 완전 일치 도메인(EMD)과도 관련된 것이지만, 도메인과 검색 쿼리가 정확히 일치하고 구글이 정의하는 [상업 쿼리(commercial query)]에 해당될 경우 순위에 강력한 순위 보너스가 주어집니다.

이것은 브랜드가 자신의 이름값에 걸맞게 순위를 매길 수 있도록 설계되었지만, 이후 빈번하게 이용되었기에 결과적으로 현재는 다양한 상황에서 효과가 덜 합니다.

 

16. 도메인 이름 내 키워드 (100%)

 

- 키워드가 도메인 이름 안에 포함될 경우, 순위에 보너스가 주어집니다. 그 비중은 특정 검색 쿼리와 도메인 이름이 완전 일치하는 경우보다는 낮지만, 도메인 이름 이후의 URL에 키워드가 포함되는 경우보다는 높아지고 있습니다.

 

17. 도메인 간 키워드 밀도 (70%)

 

- 구글의 연구원인 크리슈나 바라트(Krishna Bharat)는 힐탑(Hilltop) 알고리즘을 도입할 때, 페이지 랭크(PageRank)의 문제점을 다음과 같이 산출하였습니다.

[(페이지 등급에 따라) 권위가 매겨진 웹페이지가 가령, 검색 쿼리에 일치하는 콘텐츠를 가지고 있었다고 해서, 해당 쿼리의 토픽에 대한 권위라고는 할 수 없다]

 

이것은 TF-IDF가 페이지 수준에서의 관련성을 결정하는 것이기 때문에, 힐탑 알고리즘이 동일한 도구를 사용해 도메인의 [전문가(expert)]을 도메인을 정의한다고 작은 가정을 해봅니다.

 

18. 도메인 전체의 TF-IDF (70%)

 

- 만약, 2015년 이후로 텀 빈도(TF) 대신 키워드 밀도 같은 단어를 사용한다면 SEO 전문가들이 일제히 화를 낼 것입니다. 그 두 단어는 완벽한 동의어라고 해도 과언이 아닌데 말입니다.

키워드 밀도와 TF-IDF의 요소 비교를 할 때 중요한 것은 IDF의 부분, 즉 역문서 빈도(Inverse Document Frequency)입니다.

구글은 부사어와 같은 단어를 TF-IDF를 이용하여 제외하고, 토픽에 대한 자연스러운 키워드 밀도를 동적으로 평가하고 있습니다.

[어느 정도가 자연스러운가?] 라는 비교 지표는, 시간과 함께 수치는 줄어 들고 있는 것 같습니다.

 

19. 페이지 권한 배포 (100%)

 

- 일반적으로, 사이트 전체로부터 링크되어 있는 페이지는 권위(Page authority)가 높아지고, 그 페이지로부터의 링크, 그리고 그 아래가 될수록 권위는 낮아집니다.

같은 효과가 톱 페이지부터 링크되어 있는 페이지에서 볼 수 있는데, 이것은 대부분의 사이트에서 톱 페이지가 가장 링크되어 있는 페이지이기 때문입니다.

이 요인을 최대한 이용해 내부 링크 구조(사이트 아키텍처)를 만드는 것은, 페이지랭크 조각으로 알려져 있습니다.

 

20. 오래된 도메인 (70%)

 

- 이것은 새로운 도메인 이름이 일시적으로 상승할 수도 있기 때문에 다소 혼란스럽습니다. 오래된 도메인에는 조금 더 많은 신뢰가 주어지는데, 맷 커츠는 [이 신뢰는 아주 사소한 것] 이라고 강조합니다.

 

추측컨대, 이것은 단기 블랙햇(black hat) 프로젝트의 일부가 아니라는 것을 증명할 기회를 가졌던 사이트들에게 보상을 주는 것일 수도 있습니다.

 

21. 신규 도메인 (70%)

 

- 새로운 도메인은 일시적인 순위에서 부스트가 발동 될 수 있습니다.

구글에서는 새로운 컨텐츠의 결정 방법에 관한 협의가 이루어지고 있으며, 거기에는 [도메인 등록 일시의 문서 개시 일시의 지표로서 사용]에 관한 항목이 있습니다.

맷 커츠에 따르면 이 항목이 순위에 미치는 영향은 상대적으로 훨씬 적다는 것입니다. 말한다면, 이 항목은 새로운 사이트나, 시기적절한 틈새 사이트가 비약하는데 충분한 기회를 주기 위해 존재하고 있는 것에 지나지 않습니다.

 

22. 하이픈으로 구분된 URL 내의 키워드 (80%)

 

- URL에서 키워드를 구분하는 이상적인 방법은 하이픈(-)을 사용하는 것입니다. 밑줄(_)은 프로그래밍 변수와 혼동될 수 있으므로, 그다지 신뢰성이 높지 않습니다.

모든 키워드를 연결해 URL에 함께 매싱(Mashing)하면 하나의 키워드로 간주될 수 있기에 그 결과, URL 보너스에서 키워드를 활용할 수 없습니다.

덧붙여서, 이 이외의 이유로 하이픈을 사용한다고 사이트 순위가 대해 높아지지는 않습니다.

 

23. 태그 앞부분 키워드 (70%)

 

- 2000년대 초에 제창된 SEO 이론 중 [최초의 1/3룰] 이라는 것이 있었습니다.

 

이것은 [우리의 언어(영어)에 있어서, 글이든 타이틀·문장, 나아가서는 웹페이지 전체든, 일반적으로 나열 순서는 중요도 순인 것]에 기인하고 있습니다.

 

구글에서는 확인되지 않았지만, Northcutt의 단어 순서 실험 경험에서 이것이 요인임을 더 자주 시사했습니다.

 

24. 장기 도메인 등록 (70%)

 

- 구글은 특허 중에서 장기간에 걸친 도메인 등록이 도메인의 정당성을 예측하는데 믿을 만한 것이라고 직접적으로 밝히고 있습니다.

생각해 보면, 이것은 단기수익만 노리고, 도메인을 짧게 이용하는 웹 스팸에 대항하기 위한 수단일지도 모릅니다.

 

25. 후이즈 정보 공개 (50%)

 

- 구글은 도메인 등록 정보를 조사하는 능력을 낮게 잡고 있음에도 불구하고, 도메인 등록정보를 이용한 웹 스팸 선별을 위한 특허를 보유하고 있다는 것은 너무나 유명한 이야기.

또 맷 커츠가 비공개 후이즈(Whois)가 페널티 요인의 뇌관을 될 수 있다는 이야기 하는 것을 본 적이 있고, 그의 블로그 독자에게 가짜 후이즈 데이터를 보고하라고 격려하는 것을 본 적도 있습니다.

다만, 이것은 어디까지나 무의미하게 부정적인 요인이 되어 버리지 않게 [돌다리도 두들겨 보고 건넌다] 정도의 것에 지나지 않을 것입니다.

 

26. HTTPS(SSL) 이용 (100%)

 

- SSL은 사이트가 사용자 입력을 처리했는지 여부에 관계없이, 2014년에 정식으로 긍정적인 순위 요인으로서 발표되었습니다.

구글의 웹 마스터 트렌드 분석가인 게리 일리즈(Gary Illyes)는 2015년에 SSL의 중요성을 단지 [타이 브레이커(tiebreak)로서의 역할에 불과하다] 표현하고 있습니다.

하지만 수치 스코어를 기반으로 하는 알고리즘이 보고 있는 사이트는 수십억 개로, 경쟁률이 높은 쿼리에 있어서 타이 브레이커가 의미를 이루고 있는 것은 의외로 많습니다.

 

27. Schema.org (70%)

 

- 구글과 야후(Yahoo), 빙(bing), 얀덱스(Yandex)의 공동 프로젝트인 Schema(스키마)의 출현에 의해 키워드가 잠재적으로 가지는 이론 데이터를 이해할 수 있게 되었습니다.

그 결과, 검색 결과 페이지는 우리에게 익숙한 10개의 블루 링크 페이지에서 상당히 진보했다고 할 수 있으며, 현재 구조화 데이터의 이용은 모든 종류의 상황 하에서 순위를 늘릴 가능성을 가지고 있습니다.

또한, 전통적인 검색 순위에 있어서도 entity salience(어떤 키워드에 대해 Google이 일반적으로 알려진 정보를 자동으로 연결해 관련성을 판단하는 것)로 알려진 순위 요소를 충족시킴으로써 유리할 가능성은 있습니다.

 

28. 신선한 콘텐츠 (100%)

 

- 통상 QDF(Query Weight Freshance)로 불리는, 새로운 컨텐츠에 가치를 두며 의미 있는 쿼리에 관해서 말합니다. 이것은 모든 쿼리에 대해 적용되는 것은 아니지만, 특히 정보성이 풍부한 쿼리에 많이 적용됩니다.

 

이러한 SEO 혜택은 브랜드 퍼블리싱(Brand Publishing)이 매우 성공적인 경향을 보이고 있는, 또 다른 한 가지의 이유일 뿐 입니다.

 

29. 도메인 전체에서 신선한 콘텐츠 (50%)

 

- 이것은, 도메인 전체에서 컨텐츠의 신선함을 유지했을 경우에 SEO가 확증되어 있지 않은 고찰입니다. 참고로, 리소스를 전체적으로 보았을 때 구글은 가능하면 석화(石化)된 정보가 적을 것을 권장하고 있습니다.

나아가 정보의 정확성·관련성, 적어도 일부 중요한 정보에 대해서는 사이트 관리자에 의해 때때로 업데이트나 보충을 추가할 것을 Google은 요구하고 있습니다.

 

30. 오래된 콘텐츠 (100%)

 

- Google의 특허에는 [일부 질의의 경우, 오래된 문서가 새로운 문서보다 더 유리할 수 있다]라고 기술되어 있습니다.

 

거기에는 문서의 평균적인 기간을 고려, 검색 결과 집합이 표시되기 전, 검색된 결과에서 문서의 평균 연수에 따라서 다시 순위가 매겨질 수 있는 시나리오를 설명합니다.

 

31. 도메인 전체 오래된 콘텐츠 (50%)

 

- 이론적으로, QDF(Query Value Freshance)와 같은 뉴스 같은 컨텐츠가 우대 받는 알고리즘이 있는 이상, 그 반대의 오래된 것에 의존하는 쿼리(QDO) 같은 것이 존재할 가능성은 부정할 수 없을 것입니다.

Google의 입으로부터 Query Value Oldness에 대한 언급은 이루어졌던 적이 없던 것을 고려하면, QDF가 일하고 있지 않을 때는 오래된 컨텐츠가 우대되고 있을 가능성이 높다고 생각하면 앞뒤가 맞습니다.

다만, 도메인 전체에서의 컨텐츠 신선함 항목과 같이, 이 이론을 증명하기에 충분한 증거는 아직까지 아무것도 없습니다.

 

32. 질 높은 외부 링크 (100%)

 

- 외부로의 링크는 [페이지 랭크 유출(leak PageRank)]을 초래할 가능성이 있기는 하지만, 웹사이트는 막다른 골목으로 간주되지 않습니다.

구글은 [좋은 사이트]에 대한 외부 링크에 높은 평가를 부여합니다. 맷 커츠의 말을 빌리자면, [우리(Google)의 시스템은 좋은 사이트에 대해 링크 하는 것을 추천하고 있다]

 

33. 관련이 있는 외부 링크 (50%)

 

- Google이 인바운드 링크(Inbound Link)를 분석해 사이트의 권위 부여나 관련성, 문맥 판단을 하고 있는 것과 마찬가지로 외부 링크에서도 같은 것을 하고 있다고 생각하는 것은 지극히 자연스러운 일입니다.

힐탑 알고리즘과 연계할 수도 있겠지만, 단순한 링크 반환 관례로 이뤄지는 경우도 많습니다. 구글도 역방향 시나리오에 대한 수동 조치를 내놓고 있습니다.

 

34. 올바른 철자법과 문법 (70%)

 

- 이것은 Bing의 순위 요소로, Google 검색 수석 부회장이었던 아밋 싱할(Amit Singhal)도 다음과 같이 말하고 있습니다.

[우리도 이와 똑같은 것을 요구하고 있다] 즉, 철자와 문법의 정확성을 콘텐츠의 질로 고려한다는 것입니다.

맷 커츠는 2011년에 [오래 전에는 그랬지] 라는 말과 함께, 해당 요소를 사용하고 있는 것을 부정했지만, 어떠한 요소로서 검색 순위와의 상호 관계는 있을 것 입니다.

예를 들면, 최초의 팬더 업데이트에서는 오탈자와 문법 실수에 대한 영향이 있었다고 보여졌으며, 수십 가지 콘텐츠와 관련된 요소가 철자와 문법의 영향을 분명히 받습니다.

 

35. 독해 레벨 (20%)

 

- 검색 결과 페이지의 필터(현재는 존재하지 않는다)를 만든 것을 감안해도, Google은 콘텐츠의 독해 레벨을 분석하고 있을 것입니다.

또, 필터에서는 구글이 제일 싫어하는 콘텐츠나 저품질은 초급, 학술 문서는 상급으로 배분되고 있었습니다. 그러나 아직까지는 독해 레벨이 SEO와 연관돼 있음을 보여주는 증거도, 연구결과도 없습니다.

 

36. 리치 미디어 (70%)

 

- 이미지나 동영상 검색으로부터, 보다 큰 트래픽을 낳는 리치 미디어(rich media)는 [질 높은 오리지널 컨텐츠]로 간주되기에 충분한 것이라고 말할 수 있을 것입니다.

동영상은 판다 업데이트 2.5의 결정요인으로 이용된 것 같기도 하나, 아직까지 이 요소를 확정할 만한 확고한 증거는 발표되지 않고 있습니다.

 

37. 하위 디렉토리 (70%)

 

- 카테고리별 정보 설계에 관한 SEO 논의는 구글이 사이트 전체의 토픽 분포를 분석하고 있는 것 같다는 정보도 있어, 오랫동안 이루어져 왔습니다. 이것이 랭킹에 가져오는 영향이 어느 정도의 것인지는 확실히 모릅니다.

 

단지, Google은 이 정보를 구조화 데이터라고 부르는데, 적어도 검색 결과 페이지에 사이트 이동 경로(Breadcrumbtrail)를 표시하는데 사용할 것이기 때문에, 더 많은 페이지 순위를 매깁니다.

 

36. 메타 키워드 (50%)

 

- 모 SEO전문가에 의하면, 메타 키워드는 이제 SEO에 아무런 의미도 가지고 있는 않는 것 같습니다.

이것은 미신이며, 또 Google이 2015년 기준으로 메타 키워드를 랭킹 요인으로 이용하고 있다고 하는 소리를 들었다면 그 또한 미신에 지나지 않습니다.

이 두 가지 사실은 같은 방법으로 증명할 수 있습니다. 경합이 전혀 없는, 즉 마음대로 조작한 키워드를 메타 키워드에 넣은 페이지를 인덱스 시켜서 그 키워드로 검색해 보면 됩니다.

다만, 기억해 두었으면 하는 것은 구글 만이 이 세상의 검색 엔진 전부는 아니라는 사실입니다. 그리고 이 태그로 인해 혜택을 받고 있는 동적 사이트가 별의 수만큼 있다는 것을.

 

37. 모바일 친화적 (100%)

 

- 모바일 친화적(Mobile-friendly)인 사이트는 두드러진 순위 혜택을 받습니다. 현재, 이러한 요인으로 영향을 받는 순위는 이용자가 모바일 기기를 이용해 검색을 했을 경우에 해당하는 것으로 보입니다.

이는 모바일이 SEO 중에서도 주류가 됐음을 의미하며, 2015년 모바일 애드온 업데이트에서 결정적인 역할을 했습니다. 이러한 흐름이 될 것을 전문가들은 거의 10년 전부터 예견하고 있었습니다.

 

38. 메타 설명 (20%)

 

- 좋은 메타 설명(Meta Description)은 검색광고와 같은 작용을 합니다.

AdWords(애드워즈) 상에서 A/B 테스트를 하기 위해 수많은 AdWords 대행회사가 존재하는 것만 보아도, 이 분야가 얼마나 마케팅 가치가 있는가 하는 것은 명백합니다.

다만, 메타 설명에 사용된 키워드가 한때는 직접적인 순위 요인으로 여겨졌지만, 2009년 맷 커츠가 [지금은 아니다] 라고 밝혔습니다.

 

39. 구글 애널리틱스 (5%)

 

- 많은 사람들이 구글 애널리틱스(Google Analytics)가 순위 요인이 될 수 있다고 제안한 적이 있습니다.

그러나 지금까지 어떤 증거나, 맷 커츠가 명확하게 발언한 것도 포함해 Google 애널리틱스가 순위에 영향을 주고 있다, 혹은 주게 된다고 하는 생각은 완벽한 미신에 지나지 않습니다.

물론, 그 점을 빼놓더라도 여전히 마케터들의 강력한 도구이자 사이트 분석에서 매우 유용합니다.

 

40. 구글 서치 콘솔 (5%)

 

 

- 애널리틱스와 마찬가지로 Google 서치 콘솔(Google Search Console, 구 웹마스터 도구)을 이용하는 것에 의한 순위 혜택이 있다는 것은 전혀 확증되어 있지 않습니다. 

그런 것이 아닌, 서치 콘솔은 다른 순위 요인을 찾아내는 점에서 절대적인 효과를 발휘합니다. 특히 수동 대응 패널티와 크롤러 오류의 원인 규명 등입니다.

 

41. ccTLD와 국내 검색 (70%)

 

- 예를 들어 .kr이나 .uk 등의 국가 코드 최상위 도메인 TLD는 웹 국제화가 진전된 적도 있기에, 해당 도메인 대상 국가 내에서의 검색 순위에 좋은 영향을 미칠 것으로 생각됩니다.

특히 다른 나라의 ccTLD 사이트와 비교할 때 현저해진다고 여겨집니다.

 

42. XML 사이트 맵 (5%)

 

- 강제는 아니지만, Google에 사이트상 보다 많은 페이지를 인덱스화 한다는 목적이 있다면 사이트 맵은 도움이 됩니다.

기억해 두었으면 하는 것은, XML 사이트 맵이 랭킹에 좋은 영향을 주고 있다는 것은 또 하나의 미신에 지나지 않는다는 사실입니다. 이것은 구글이나, 그 외 많은 연구 결과로부터 명백합니다.

 

43. Salience of Entities (70%)

 

- 시간이 지날수록, 구글은 단어와 구절보다 아이디어와 논리적 실체를 더 많이 분석하는 것 같습니다. 이것은 페이지에 나타나는 정확한 검색 질의보다, 우리가 선호하는 것을 어떻게 말하는지 분석합니다.

 

간단히 말해서, [고기 요리법]을 검색 하면, [고기]라는 단어가 들어있지 않은 [스테이크 조리법]에 대한 결과를 보이게 하는 것입니다.

 

44. 문구와 문맥 (80%)

 

- 이젠 키워드 밀도가 실질상 의미를 가지지 않게 되었기 때문에, 단지 키워드를 전체에 쑤셔넣은 콘텐츠보다, 전체적으로 정교하게 쓴 콘텐츠 쪽이 훨씬 높은 순위를 차지할 가능성이 있다는 것을 알 수 있습니다.

Google의 특허 안에서 해당 요소는 [관련된 문구와 관련 문구의 클러스터 식별] 이라고 표현되어 있습니다.

 

45. 사용자와 가까운 웹 서버 (80%)

 

- 구글은 많은 로컬 쿼리에서 다르게 기능하고, 구글 맵 결과로 기존의 결과를 보완하며 잠재적으로 변경된 유기 목록도 제공합니다.

 

이는 국가 및 국제 검색에서도 마찬가지입니다. 동일한 국가 내에서와 같이, 최소한 사용자 가까이에서 사이트를 호스트하면 더 나은 순위를 누릴 수 있습니다.

 

46. 저자 평판 (5%)

 

- 구글에 의해서 2011~14년까지 실시한 실험인 저자 평판(Authority)은, 블로거가 특정 저자의 평판 확립을 위해서 기사에 [rel="author"]를 설치하게 된 것으로 특정 저자 평판 확립에 성공하였습니다.

해당 저자 평판 실험 종료는 Google에 의해서 직접 공표되었으며, Search Engine Land에서 저자 평판의 흥망성쇠에 대한 매우 좋은 추모 기사(?)를 보낸 바 있습니다.

 

47. rel="canonical" 태그 사용 (20%)

 

- rel="canonical" 태그는 동일 페이지의 URL를 시사하는데 이용됩니다. 이것에 의해 중복 컨텐츠에 의한 평가감소와 패널티를 막을 수 있는 것입니다.

 

이것은 어디까지나 제시이며, 때로는 Google에 의해서 무시되는 경우가 있습니다. 그들에 의하면, 태그 이용에 의한 직접적인 순위 공헌 따위는 일절 없습니다.

이러한 사정을 고려해도, 이 태그를 이용하는 것은 매우 좋은 일이라고 말할 수 있을 것입니다.

 

48. rel="author" 태그 사용 (5%)

 

- rel="author" 태그의 사용은 일찍이, SEO 어드바이스와 순위 요인 가설의 大스테디셀러였지만, 저자 평판의 소멸과 함께 아무런 의미도 가지지 않게 되어 버렸습니다.

rel="author"에 관련된 어떠한 얘기도 현재에 있어선 모두 미신입니다.

 

49. rel="publisher" 태그 사용 (5%)

 

- rel="author"와 같이, rel="publisher" 태그의 사용도 SEO의 스테디셀러 어드바이스였습니다. 그리고 역시 저자 평판과 함께 사라질 운명입니다.

 

50. "www" 서브도메인 사용 (5%)

 

- SEO 블로거가 흔히 말하는 착각에 빠진 소문 중 하나가 [www로 시작하는 URL이 더 순위가 높다]는 것입니다. 해당 소문의 근원이 되고 있는 것은, www로 부터 시작되는 URL로 통일되어 있는 사이트가 많기 때문일 것입니다.

 

51. 전용 IP 주소 (5%)

 

- 웹 서버의 IP 주소는, 지역 타겟의 마케팅을 하고 있는 몇 가지 케이스에서 도움이 됩니다.

만약, 스팸 사이트 투성이의 IP에 동거해 버리면 마이너스 요인이 될 수도 있을 것이고, 또 IP 주소에 의해서 힐탑 알고리즘은 2개의 다른 사이트가 과연, 동일 인물에 의해서 운영되고 있는지 아닌지를 특정하기도 합니다.

한 가지 말해둔다면, 전용 IP를 사용하는 것 자체가 플러스 랭킹 요인으로 작용하지는 않는다는 것입니다.

 

52. 서브 도메인 사용 (50%)

 

- 서브 도메인은 종종 Google에 의해서, 다른 사이트로서 간주되는 일이 있습니다. 서브 폴더와의 차이는 바로 이 점이라고 말할 수 있을 것입니다.

2012년에 맷 커츠 왈 [서브 폴더도 서브 도메인도 대체로 비슷하다]로, 차이가 현격하게 나는 것은 없지만, 가끔은 조금씩 나는 것 같습니다.

2012년 팬더 업데이트로부터의 Hub Pages의 회복 사례에서, 서브 폴더로 부터 서브 디렉토리로의 이관이라고 하는 방법이 있었지만, 그것을 감안하면 아직도 큰 요인이라고 생각됩니다.

 

53. 서브 도메인 갯수 (50%)

 

- 사이트상의 서브 도메인 갯수는 서브 도메인이 각각 전혀 다른 사이트로서 사용되고 있는지를 판단하기 위한 가장 현저한 요인이라 할 수 있습니다.

예를 들면, 수천개의 서브 도메인을 가지는 사이트라면 그것은 동일 테마에 따른 하나의 사이트로서 존재하고 있는 것이 아닌, 각각의 서브 도메인 마다 다른 운영자가 있다고 생각할 수 있습니다.

 

54. 애드센스 사용 (5%)

 

- SEO 편집자가 자주 제안해 오는 경우가 있는 것 같지만, Google에 의해서 완전히, 완벽하게 부정되고 있습니다.

애드센스(AdSense) 이용에 의한 영향의 증거도, 미디어 머니타이즈의 방법에 의한 순위 영향의 증거도 발견되지 않았습니다. 따라서 이것은 미신입니다.

 

55. HTML 주석 내 키워드 (5%)

 

- 이것은 10초간의 실험과 약간의 인내를 가지면 쉽게 밝혀지는 초기 SEO 이론입니다. 인용된 예에서, 우리는(원작자) 소스 코드에 전혀 경쟁적이지 않은 보충 단어를 배치한 다음 인덱싱되도록 눈에 띄게 링크합니다.

만약 그 단어가 검색에 나타난다면, 구글이 그 단어에 따라 순위를 매긴다는 증거가 되겠습니다. 하지만 이 경우에는 그렇지 않았습니다.

 

56. CSS/자바 스크립트 주석의 키워드 (5%)

 

- 55번 항목과 동일

 

57. CLASS, NAME 및 ID내 키워드 (5%)

 

- 다시 한 번, 우리는 전혀 경쟁적이지 않은 문구를 거기에 넣고 기다림으로써 이상한 곳에 있는 단어가 검색 엔진에 어떤 영향을 미치는지 여부에 대한 이론을 밝힐 수 있습니다.

구글이 우리에게 말하는 것이나 특허에 있는 것을 추측할 가치조차 없습니다. 여기서 다시 한번, 우리는 적어도 이 글을 쓸 때 해당 요소 역시 미신 이라는 것을 확인할 수 있습니다.

 

58. 개인 정보 보호 정책 사용 (50%)

 

- 2012년 Webmaster World에 개인 정보 보호 정책(Privacy Policy)의 혜택 순위가 매겨지는 것에 대한 큰 토론으로 확대된 적이 있습니다.

해당 토론에서 30%가 찬성표를 던졌고, 구글이 밝힌 철학에도 잘 부합은 합니다. 그럼에도 불구하고, 이것은 매우 이론적입니다.

 

59. 실제 확인 가능한 주소 (20%)

 

- 물리적인 주소는 표준 검색 순위에서 정당성의 표시로 이론화됩니다.

Google이 로컬 SEO(구글맵 SEO라고도 함)에 대한 인용구를 이름, 집주소, 휴대전화번호(때로는 NAP으로 단축됨)에 대한 언급으로 보는 개념에 의해 느슨하게 지지됩니다.

구글 품질관리 감사관들이 찾아보라고 지시하는 부분이기도 합니다.

 

60. 확인 가능한 전화번호 (50%)

 

- 59번 항목과 동일

 

61. 액세스 가능한 연락처 페이지 (50%)

 

- 정당성의 표시로 이론화되었습니다. 이것은 Google의 품질 평가자 지침(Quality Rater Guidelines)이라는 문서에서 비롯되었거나, 적어도 가장 잘 지원되는 것으로 보입니다.

해당 문서에서 구글은 품질관리 감사관에게 [확실한 연락처]를 검색할 것을 요청합니다.

 

62. 콘텐츠에 대한 코드 비율 (50%)

 

- Low Code-to-Content Ratio SEO 이론은 2011년에 널리 퍼졌고, 콘텐츠가 많으면 많을수록, 코드가 적으면 적을수록 좋다는 것을 시사했습니다.


1) 빠른 페이지 읽기 속도는 검증된 요인

2) Google의 구글 페이지스피드 인사이트(Page Speed Insights) 도구는 페이로드 크기가 5Kb만 줄어들어도 감지를 한다.

3) 특정한 미묘한 코드 실수가 평가 절하와 페널티를 야기할 수 있다.


해당 항목은 최소한 간접적인 상관관계가 있습니다.

 

63. 메타 소스 태그 (20%)

 

- 메타·소스 태그는 2010년에 Google 뉴스에서, 원본 소스를 보다 정확하게 나타내기 위해서 만들어졌습니다.

이것들은 [동시 전달 소스(제3자와 동시 전달하고 있는 경우)]와 [오리지널 소스(당신의 기사가 오리지날인 경우)]의 2개의 형태로 나눌 수 있습니다.

만약, 다수 사이트에서 동일 컨텐츠를 동시에 전달하고 있는 경우, 이론적으로 중복 컨텐츠 페널티를 막을 수 있습니다.

당신의 사이트의 기사가 오리지날인 경우는, 이 태그는 rel="canonical" 태그에 의해서 덧쓰기 됩니다.

 

64. 페이지당 추가 내용 (50%)

 

- SerpIQ는 컨텐츠의 길이가 순위에 미치는 영향을 조사하기 위한 재미있는 조사를 실시한 적이 있습니다. 그 결과, 2000~2500 단어 정도의 콘텐츠가 가장 좋은 것으로 나타났습니다.

다만. 다른 요인이 얼마나 영향을 미쳤는지에 대한 명백한 조사가 없습니다.

 

예를 들면, SNS에서 공유되기 쉬웠기 때문에 결과적으로 링크가 많이 달렸다든가, 순위가 좋으면 한층 더 노출이 증가해 계속 성장하고 있다든가, 쿼리에 의해서 변화하고 있다든가 합니다.

 

65. 메타 지오 태그 (20%)

- IP 주소 및 ccTLD와는 다르게, 맷 커츠는 [거의 볼거 없다]고 말하지만, 그는 이 태그를 gTLD 사이트(예: com)에서 사용할 경우, 지역 특정을 실시하기 위해 사용하는 것을 생각해 볼 것을 제안하고 있습니다.

 

즉, 거의 도움이 되지 않는 태그라고 인정은 받으나, 국제화 대응에 대해서는 극히 드문 케이스로 구글에 의해서 사용되는 경우가 있다는 것입니다.

 

66. 표시 제목 앞부분의 키워드 (70%)

 

- 10년 이상의 연구와 상관관계 연구는 키워드로 시작하는 제목이, 대개 키워드로 끝나는 제목보다 순위가 더 높다는 것을 시사하며, 이것은 테스트 하기도 쉽고 일반적으로 확인도 됩니다.

 

더 자세한 정보를 실은 소스도 있습니다. Thumback의 조사에서는, 타이틀의 키워드 순서 정렬로 20~30%정도의 트래픽 변화가 일어났습니다.

또, 그들의 조사 중에서 가장 트래픽이 좋았던 페이지의 타이틀은 키워드로부터 시작되는 것은 아니었지만, Google에 의해 검색 결과 페이지에서는 타이틀이 고쳐져 키워드로부터 시작되어 있던 것 같습니다.

 

67. H태그 앞부분 키워드 (50%)

 

- H태그는 키워드의 순서가 영향을 주기 쉬운 요소 중 하나입니다. 다시 한 번 말씀드리지만,  최초의 1/3규칙은 이런 종류의 설명을 하는데 사용되고 있으나, 역시 첫 부분의 키워드는 비중이 큽니다.

적어도, 시도해 볼 만한 가치는 있겠죠.

 

68. 다른 사이트보다 독창적 콘텐츠 (80%)

 

- Google의 특허와 해당 요소에 관한 SEO의 연구에 따르면, Google은 비슷한 콘텐츠에 낮은 평가를 부여하는 것 같습니다.

이 특허에서는, 한 번 관련성이 있는 콘텐츠의 그룹으로 결정되면, 도대체 어느 콘텐츠가 기술적이며 독특하고, 그리고 얼마나 기발한 것인가를 여러가지 방법으로 검증하도록 설계되어 있습니다.

 

69. 자신의 사이트 내 독창적 콘텐츠 (80%)

 

- Google의 특허에 의하면, 유니크함·기발함은 콘텐츠의 정교함과 같을 정도로 평가되어야 하며, 거기에 의해 [novelty score]라고 하는 것을 붙이고 있습니다. [유니크한 점수] 정도로 생각하시면 되겠습니다.

이것은 텍스트 정보 블록의 정량과 정성조사로 결정됩니다. 여기서 알려진 바로는 Google이 독특한 스코어를 매길 때 취하는 방법은 많은 문서를 비교한다는 것 뿐입니다.

중복 콘텐츠는 사이트 내·외 양쪽의 관점에서 결정되지만, 아마도 novelty score 에서도 같은 부분을 말할 수 있을 것입니다.

 

70. 사이트 전체 Novelty Score (70%)

 

- 구글 특허 [유니크한 콘텐츠의 판별] 에는, 어떻게 각각 문서의 [기발함]을 스코어링 하는지 써 있습니다.

사이트 전체의 평균적인 유니크한 스코어를 요소에 포함하는 점은, 사이트 전체의 콘텐츠의 빈약함을 보는 판다 업데이트나, 사이트 전체의 전문성을 보는 힐탑 알고리즘과 비슷하다고 할 수 있습니다.

 

71. 코멘트 수 (20%)

 

- 수많은 소스(그리고 심지어 특정 검색 콘솔 메시지)를 통해 구글이 사용자 생성 콘텐츠를 분리하여 다르게 분석할 수 있다는 것을 알고 있습니다.

어떤 이론은 구글이 콘텐츠 품질을 평가하는 데, 도움이 되는 콘텐츠에 대한 다양한 댓글이나 의견 등을 본다고 제안합니다. 그러나. 현재까지 이에 대해 구체적으로 문서화 된 증거는 없습니다.

 

72. 긍정적인 댓글 (5%)

- Google은 댓글이나 의견을 보고 콘텐츠의 질을 결정하고 있다는 가설이 있습니다. 그리고 Google은 제품 리뷰에 대한 평가를 분석할 수 있는 것을 인정하고 있으며, 관련 특허도 취득했습니다.

그러나, John Mueller는 [NO]라고 말합니다만, 간혹 간접적 요인으로 댓글 평가를 평가하기도 합니다. SEO에는 영향을 주지 않습니다.

 

마이너스로 작용하는 내부 SEO 요인

 

- 마이너스 내부 SEO 요인이란, 해당 요소가 오히려 현재의 순위를 낮춰버릴 가능성이 있는 것입니다. 이러한 요소는 접근성·평가감·패널티의 3가지로 분류할 수 있다.


1. 접근성(Accessibility) 문제: 이것은 당신의 사이트를 제대로 탐색하거나 분석하는 것을 방해할 수 있는, 구글봇에겐 걸림돌일 뿐 입니다.

2. 평가절하(Devaluation): 질 낮은 사이트의 지표가 되며, 당신의 홈페이지의 SEO에 방해가 될 수 있습니다.

3. 페널티(Penalty): 훨씬 심각한 문제로, 구글에서 당신이 오랫동안 쌓아온 실적과 노력이 하루아침에 물거품으로 돌아갈 가능성과 파괴적인 영향을 미칠 수 있습니다.


거듭 말하지만, 페이지 내 요인은 웹 사이트의 직접 관리의 일부로, 사용자가 직접 제어할 수 있는 부분입니다.

 

사이트 전체에 대한 요인

 

73. 도메인 전체에서 빈약한 콘텐츠 (100%)

 

- 아주 오래 전에 Google은 콘텐츠의 질이나 독창성을 이해하려고 기를 쓰고 있었던 적이 있습니다. 판다 알고리즘이 도입됨에 따라 이제 이것은 페이지 단위의 문제가 아닌, 도메인 전체의 문제가 됐다고 할 수 있습니다.

이러한 점에서, 해당 문제는 얼마나 검색 엔진상에서 컨텐츠의 평균적인 질을 향상시키는가 하는 것이며, 블로그의 [태그] 페이지로 대표되는, 어쩔 수 없이 반복되는 페이지에 noindex를 넣는 것이 효과적이기도 합니다.

 

74. 낮은 도메인 평가 (100%)

 

- 도메인은 시간을 뛰어넘어서 Google에게 평가받습니다. 그것은 설사, 도메인 소유자가 바뀌어서 완전히 다른 사이트로 운영되고 있다고 해도 말입니다. 前 소유주 때문에 페널티를 물려받을 수도 있습니다.

 

75. 과도한 내부 링크 (80%)

 

- 일찍이 맷 커츠는 [페이지당 링크 수를 명확하게 100개 이내로 제한하고 있다]고 했다가, 나중에 [타당한 수로 유지할 것]이라고 표현을 바꿨습니다.

이것은 일찍이 Google의 크롤러가 1페이지 당 100kb 이상 다운로드하지 않았던 것에 기인하고 있습니다.

해당 링크 갯수 관련은 이미 사실이 아니지만, 그럼에도 모든 링크는 페이지 랭크를 주고 받기 때문에, 구글의 구조를 생각한다면 있을 수 있는 이야기라고 예측 할 수 있습니다.

 

76. 과도한 외부 링크 (100%)

 

- 페이지 랭크 알고리즘의 단순한 구조를 생각하면, 과도한 외부 링크가 페이지 랭크를 도메인 밖으로 유출시켜 버린다는 것은 간단하게 이해할 수 있습니다.

물론, 마이너스 요인이 되는 것은 어디까지나 [과도한] 경우에 한정하며, 적당한 외부 링크는 오히려 플러스 요인이 된다는 것을 맷 커츠도 인정하고 있습니다.

 

77. 과도한 푸터 링크 (80%)

 

- 사이트 하단 부분에 채워지는 링크는 본문(콘텐츠) 부분에 기술된 링크보다 가치가 떨어집니다.

또, 유료 링크 스팸 대응에 대해 Google이 처음으로 설명하기 시작했을 때, 유료 링크 스팸의 수법으로서 사이트의 푸터(Footer) 부분에 수십 개 유료 링크를 채워 넣는 것이 주류였습니다.

따라서 푸터에 외부 링크를 너무 많이 걸면, 어떤 종류의 페널티를 초래할 수 있습니다.

 

78. 고립된 페이지 (100%)

 

- 내부 링크 도달이 거의 불가능한, 고립된 페이지는 도어웨이 페이지(Doorway Page)로 취급되어 웹 스팸 판정을 받을 가능성이 있습니다.

그렇게까지 되지 않더라도, 이런 페이지는 내부 페이지 랭크의 혜택도 받지 못하게 됩니다.

 

79. 링크 판매 (80%)

 

- 맷 커츠는 툴바 페이지 랭크가 링크 판매를 실시하면서 7 → 3으로 떨어져 버린 예를 거론한 바 있습니다.

페이지 랭크의 교환을 목적으로 한 링크 판매는, Google의 웹 마스터 가이드라인에서 페널티 항목으로 취급되고 있습니다.

 

80. 아웃바운드 링크 (5%)

 

- 어떤 의미에서는 페이지 랭크 유출로서 알려져 있는 것은 존재합니다. 즉, 배포할 수 있는 포인트는 미리 정해져 있고, 한번 빠져나간 포인트는 금방 회복되지 않는다는 생각입니다.

그러나, 맷 커츠는 [정말로 관련이 있고, 신뢰할 수 있는 아웃바운드 링크에는 다른 평가를 내릴 제어가 있다]고 인정하고 있습니다.

웹사이트라는 것은 집합체여야 하며, 막다른 골목이 되어서는 안되기 때문입니다.

 

콘텐츠 관련 요인

 

81. 본문(body)에서 과도한 키워드 남발 (80%)

- 키워드 스터핑(Keyword Stuffing)에 대한 페널티는, 과거 키워드만 많이 채워넣기만 하면 순위가 오르던 시대에 대응하기 위해 도입되었습니다.

어떤 실험에 따르면, 키워드 출현율이 6%를 넘은 단계에서 페널티가 발동하기도 했습니다. 이것은 TF-IDF가 작동 중일 가능성이 높으며, 주제나 키워드의 유형 및 맥락 등에 민감합니다.

 

82. 키워드 희석화 (80%)

 

- 높은 키워드 밀도 또는 TF-IDF가 긍정적으로 작용하고 있는 경우, 어떤 시점에서는 출현빈도나 출현율이 충분하지 않으면 관련성이 희박하다고 판단되어 버립니다.

구글이 자연어 이해를 깊게 한 덕분에, 이것은 [빈약한 콘텐츠]라고 고쳐 쓰는 편이 나을지도 모릅니다. 어쨌든, 명확한 테마 없이 모호하게 쓰여진 콘텐츠는 어떠한 키워드와 관련 지을 수 없는 것입니다.

 

83. 제목 태그 내 키워드 출현율 (80%)

 

- 제목 태그 내의 키워드 스터핑도 패널티가 가능한 것으로 보입니다. 이상적인 제목 태그의 길이는 30자 정도로, 검색 결과에 표시되었을 때 좋은 검색 광고로서의 기능도 합니다.

즉, 동일한 태그에서 동일한 키워드를 몇 번을 사용하든 간에 아무런 이점이 없다는 것입니다.

 

84. 너무 긴 제목 태그 (80%)

 

- 83번 항목과 동일.

 

85. H태그 내의 키워드 출현율 (80%)

 

- H1, H2, H3 등과 같은 제목 태그는 특정 단어에 가중치를 추가할 수 있습니다. 그러면, 가능한대로 키워드를 쑤셔넣으려고 하거나 H태그를 길게 하고 싶은 유혹에 빠지게 될 것입니다.

그리고 키워드 스터핑 페널티로 엔딩을 맞이할 것 입니다.

 

86. H태그 (h1,2 등) 남발 (80%)

 

- SEO 페널티라는 것이 정말로 존재하는지 확실한 대답을 원한다면, 플러스로 작용하는 내부 SEO 요인으로 거론된 항목을 상식적인 범위를 넘어서까지 시도해 보면 됩니다.

제일 간단한 방법은 전체 웹사이트를 H1 태그에 배치하는 것입니다.

 

87. URL 내 키워드 반복 (70%)

 

- URL에서 여러 차례 키워드를 반복했을 경우의 페널티는 아직까지 없는 것으로 보이지만, 그것을 한다고 SEO에 도움이 된다는 사실 역시 전혀 없습니다.

실제로 URL에 키워드를 5~6번 넣어보면, 매우 간단하게 확인할 수 있습니다.

 

88. 쓸데없이 긴 URL (80%)

 

- 맷 커츠는 URL에서 5단어 이후 키워드에 대해서는 SEO의 추가 가치가 감소한다고 지적합니다. 직접 확증된 건 아니지만, 구글에서 해당 과욕으로 피해를 보는 경우가 있다고 합니다.

그렇다고는 해도, 이 문제에 관해서는 다루어지는 방법도 다양하며 Bing은 URL 내 키워드 스터핑을 페널티로서 취급합니다.

 

89. ALT 태그 내의 키워드 출현율 (80%)

 

- 일반적으로, ALT 태그는 페이지에서 직접 보이지 않기에, ALT 태그 내에 키워드 스터핑이 널리 남용되었습니다. 정확한 표현의 몇 가지 단어라면 오히려 괜찮지만, 그 선을 넘어서면 페널티의 대상이 될 수 있습니다.

 

90. 쓸데없이 긴 ALT 태그 (80%)

 

- 89번 항목과 동일.

 

91. 긴 내부 링크 앵커 (70%)

 

- 적어도, 과도하게 긴 내부 앵커 텍스트는 추가적인 가치, 즉 평가 절하를 가져오지 않습니다. 그러나 운이 없으면, 지나치게 긴 앵커 텍스트 때문에 키워드 스터핑 웹 스팸 페널티를 받을 수 있습니다.

 

92. 높은 비율의 텍스트 링크 (50%)

 

- 링크 밖에 없고, 아무런 실체도 없는 사이트는 저품질로 간주된다는 이론이 있습니다. 하지만, 명확하게 증명된 소스는 아직까지 없습니다.

 

93. 너무나도 장황한 항목 (80%)

 

- 맷 커츠는 많은 키워드를 단지 나열만 하는 어떠한 형식의 콘텐츠는 키워드 스터핑에 걸릴 수 있다고 말했습니다.

사항, 단어, 개념, 키워드, 주요 문구 등을 나열만 하는 것은 결코 자연스러운 형태의 글이 아닙니다. 이런 종류의 콘텐츠가 너무 많이 쌓인다면, 평가절하와 페널티로 연결 됩니다.

 

94. 저작권 위반 (100%)

 

- Digital Millennium Copyright Act(DMCA)나 미국 밖에서 이와 유사한 저작권 규약을 위반한 콘텐츠를 싣고 있으면, 여러 가지 패널티에 걸릴 소지가 있습니다.

Google은 자동으로 출처 불명, 또는 무허가 컨텐츠를 발견할 수 있도록 노력하고 있는 것 같지만, 사용자가 직접 침해 신고를 통해 수작업도 가능합니다.

 

95. 이미지 내 텍스트 (100%)

 

- 구글은 이미지 분석에 많은 노력을 기울여 왔습니다. 하지만 전반적으로, 여러분이 리치 미디어에서 제시하는 텍스트가 구글에서 검색될 가능성은 매우 낮습니다.

이미지에 텍스트를 넣을 때 직접적인 평가 절하나 페널티는 없으며, 해당 단어에 대한 순위를 매길 수 있는 기회를 사이트가 갖지 못하도록 할 뿐입니다.

 

96. 동영상 내 텍스트 (100%)

 

- 이미지와 마찬가지로, 동영상에서 사용하는 단어들도 Google이 안정적으로 액세스할 수 없습니다.

동영상을 게시하는 경우, 비디오 내용을 완전히 구글이 검색할 수 있도록 텍스트 스크립트를 항상 게시하는 것이 도움이 됩니다. 이것은 HTML5, Flash를 포함한 리치 미디어 형식에 관계 없이 밝혀진 사실입니다.

 

97. 리치 미디어 내 텍스트 (100%)

 

- 96, 97번 항목과 동일.

 

98. 가치 없는 콘텐츠 (100%)

 

- 주제에 대해 포괄적이며, 정교하게 다룬 콘텐츠는 좋은 것으로 여겨져 왔습니다. 여기에 더해 판다 알고리즘의 도입에 의해, 독창성이 일절 없는 컨텐츠는 Google에 의해 엄벌 받는 상황이 정착되었습니다.

 

99. 타 도메인과 중복 콘텐츠 (100%)

 

- 다른 사이트와 본인의 콘텐츠가 중복인 경우, 그것이 본인의 저작권을 침해하고 있는지 아닌지, 혹은 출처 표시 등을 올바르게 행했는지 관계없이, 순위에 불이익을 발생시키곤 합니다.

해당 순위 로직은 콘텐츠가 웹 전체에 대해 독특하고 특별 할 수록 우대받는다는 이론과 그 궤를 같이합니다.

 

100. 본인 도메인 내 중복 콘텐츠 (100%)

 

- 타 도메인과의 콘텐츠 중복과 같이, 페이지 내 또는 사이트 내에서 중복이 발생했다면 평가에 좋지 않은 영향을 줄 가능성이 있습니다.

이것은 매우 일반적인 문제이며, 너무 많은 인덱스 태그 페이지 부터 www, non-www 버전의 사이트, URL에 추가된 변수에 이르기까지 다양한 문제에서도 발생할 수 있습니다.

 

101. 불이익을 받고 있는 사이트에 연결 (100%)

 

- Bad Neighbourhood 알고리즘으로서 도입되었습니다. 맷 커츠의 말을 빌리자면, [구글은 스팸 사이트나 그러한 류의 사이트로의 링크가 적을수록, 신뢰성은 향상된다] 

꼭 그러한 사이트에 링크를 붙여야 한다면, rel=nofollow를 사용해야 한다고 Google은 권장하고 있습니다.

 

102. 페이지 색인 없음 (noindex) (100%)

 

- 페이지에 값 "no index"를 전달하는 "robot"의 메타 태그가 포함되어 있다면, 구글은 결코 그것을 인덱스에 배치하지 않을 것입니다.

검색 순위를 매기고 싶은 페이지에 이것을 사용한다면, 그것은 좋지 않습니다. 해당값은 봇이 웹 페이지의 색인 처리를 못하도록 요청하기 때문입니다.

 

반대로, 검색 색인 생성 차단을 하고 싶다면 noindex가 유용하게 사용됩니다.

 

103. 내부 링크의 nofollow (80%)

 

- nofollow는 두 가지 방식으로 나타낼 수 있습니다.

페이지에 "no follow" 값이 있는 "follow" 메타 태그가 포함된 경우, rel="no follow" 특성이 페이지의 모든 링크에 추가되었음을 의미하며, 또는 개별 링크에 추가할 수 있습니다.

어느 쪽이든 [신용할 수 없는 링크], [더 이상 크롤링 하지 마라], [페이지 랭크를 건제주지 마라]는 의미로 받아들여집니다.

 

104. 아웃바운드 제휴 링크 (70%)

- 쉽게 말하면 어플리에이트 사이트 제휴 링크를 말합니다. 우리나라로 치면 텐핑이나 쿠팡 파트너스 등이 되겠습니다.

 

구글은 과거에 [추가 가치를 제공하지 않는 제휴 사이트]에 대해 적극적으로 대응에 나선 적이 있으며, 이는 가이드라인에도 기재되어 있습니다.

어필리에이트 링크는 robots.txt로 블록한 디렉토리로부터 301 리디렉션 경유로 실시한다는 SEO 패러니아가 만연하지만, Google은 탐색하지 않고도 http 헤더를 볼 수 있습니다.

실제로, 여러 명의 제휴 사이트 마케터가 해당 제휴 링크를 너무 많이 달았다가 페널티를 받았다는 신빙성 높은 사례를 발표했기 때문에 70%의 신빙도를 설정하였습니다.

 

105. 검색 결과 페이지 (100%)

 

- 일반적으로 구글은 사용자가 SERP(Search Engine Results Page)와 같이 잠재적인 콘텐츠 목록처럼 보이는 다른 페이지가 아닌, 콘텐츠에 제대로 접속하기를 원합니다.

페이지가 검색 결과 페이지와 너무 비슷할 경우, 단순하게 더 많은 링크의 집합으로 여겨지므로, 해당 페이지의 순위가 매겨지지 않을 수 있습니다.

이것은 태그/범주 페이지의 순위를 매기는 블로그 게시물에도 적용될 수 있습니다.

 

106. 자동 생성 콘텐츠 (100%)

 

- 사용자 검색 질의를 기반으로 하는 자동 생성 콘텐츠는 구글에 의해 [100% 불이익을 받을 것]이며, 구글 웹마스터 가이드라인 위반으로 간주 됩니다.

해당 규칙에 대한 예외도 있는데, 자동 생성 메타 태그 등의 경우에는 예외로서 인정되는 경우도 있습니다.

 

107. 피싱 활동 (100%)

 

- Google이 사용자의 정보를 훔치기 위해 다른 페이지 및 콘텐츠를 복제하는 피싱(Phishing)으로 당신의 사이트를 판단한다면, 엄청난 페널티를 각오하시길 바랍니다.

구글은 대부분 단순하게 [불법 행위]와 [사용자에게 피해를 줄 수 있는 행위]라는 포괄적 설명으로 사용하지만, 맷 커츠는 구체적으로 [안티피싱 필터(anti-phishing filter)]를 언급합니다.

 

108. 기한 만료 콘텐츠 (80%)

 

- 다양한 방법을 사용, 콘텐츠의 기한(정보로서의 기한)을 확인하는 특허를 Google은 소유하고 있습니다. 그 중 하나의 방법은 기본족으로 오래된 콘텐츠에 대한 것입니다.

이러한 요인에 관해서 불확실한 것이 있습니다. 과연, 이것이 적응되는 것이 모든 쿼리에서의 일인지, 혹은 QDF(Query Veets Refresh)라고 부르는 것과 관련이 있는지의 여부입니다.

 

109. 노골적인 성인 콘텐츠 (70%)

 

- 구글은 성인용 콘텐츠고 색인 및 검색 결과로 반환도 하지만, 해당 사이트에는 세이프서치(Safe Search) 기능이 [ON]으로 설정 되어 있기에, 따로 사용자가 설정하지 않으면 검색결과에 나오지 않습니다.

성인 콘텐츠가 페널티나 불이익을 주는 것은 아니지만, 일정 선을 넘는다면 세이프서치 필터에 의해 차단될 수 있습니다.

 

110. 메타 설명에서의 키워드 스터핑 (50%)

 

- 구글이 웹 랭킹에 메타 설명을 사용하지 않는다고 말하더라도, 광고에만 웹 스팸 신호를 보내는 것이 여전히 가능할지 모른다는 이론이 있습니다.

 

111. 메타 키워드의 키워드 스터핑 (50%)

 

- 2009년부터 구글은 메타 키워드를 전혀 보지 않는다고 말했습니다. 그럼에도 불구하고, 이 태그는 여전히 그 생각을 이해하지 못하거나 믿지 않는 사람들에 의해 널리 남용되고 있습니다.

후자의 사실 때문에 해당 태그가 아직도 Google에 웹 스팸 신호를 보낼 수 있다는 설이 있습니다.

 

112. 사용자 생성 스팸 콘텐츠 (80%)

 

- Google은 사용자 생성 스팸 콘텐츠 부분에만 초점을 맞춘 문제점을 찾아내고, 거기에 특화한 페널티를 만들어내고 있습니다.

이것은 서치 콘솔에 경고로서 나타나는 몇 안 되는 사례 중 하나로, 해당 페널티는 일반적으로 특정 페이지에만 적용되는 것으로 알려졌습니다.

 

113. 분리되어 있는 않은 외국어 콘텐츠 (70%)

- 당연한 얘기입니다만, 여러분이 노리는 타겟층이 사용하는 언어가 아닌 다른 언어로 콘텐츠를 작성하다 보면, 대부분 마이너스 내부 요인이 작용하게 됩니다.

그렇기에 따로 분리되지 않은 외국어 콘텐츠는 크롤러와 사용자 모두에게 마이너스가 된다는 것을 맷 커츠도 인정하고 있습니다. 따로, 해당 외국어에 대한 번역된 내용을 제공한다면 몰라도.

 

114. 자동번역된 콘텐츠 (80%)

 

- Google 번역이나 다른 번역프로그램을 이용해 손쉽게 [국제화]를 도모하려는 것은 맷 커츠 말하는 웹 마스터 가이드라인을 완전히 위반하는 행위입니다.

[그것도 꽤 무거운 페널티 벌칙을 받을 것]이라는 의미이므로 주의하세요. 맷 커츠는 자동 번역을, 자동 생성 콘텐츠로 분류한다고 밝혔습니다. 최소한 자동번역을 사용한다면, 직접 본인이나 전문가가 글을 다듬는게 좋습니다.

 

코드에 관한 요인

 

115. 자바 스크립트에 의해 숨겨진 콘텐츠 (50%)

 

- 구글은 검색 엔진에서 올바르게 크롤링 할 수 없기 때문에 자바스크립트에 콘텐츠를 넣는 것을 추천하지 않습니다만, 그렇다고 해서 구글이 자바스크립트를 크롤링하지 않는 것은 아닙니다.

다만, 자바스크립트가 페이지 상의 non-자바 스크립트를 은폐하기 위해 사용될 수 있는 극단적인 경우에는 여전히, 클로킹 페널티(cloaking penalty)를 받을 수 있습니다.

 

116. CSS에 의해 숨겨진 콘텐츠 (80%)

 

- 가장 많이 언급되는 내부 요소 페널티 중 하나가 사용자에게 보이지 않도록 고의로 감춘 텍스트나 링크입니다.

특히, Google에서 키워드 순위 향상을 노리고 했을 경우에는 상당히 무거운 페널티가 주어집니다만, 탭이라든가 툴팁이라든가 명확한 이유가 있는 경우에는 예외로 넘어갑니다.

 

117. 배경과 일치하는 콘텐츠 색상 (100%)

 

- 자주 거론되는 클로킹 패널티의 예로 들 수 있는 것이, 특정 콘텐츠를 배경과 같은 색으로 만들어서 사용자에게 잘 보이지 않게 한다는 것입니다.

Google은 페이지 레이아웃 알고리즘을 이용, 유저에게는 콘텐츠가 어떻게 보이고 있는지 분석하는 것으로 이 문제에 대처하고 있습니다. 실험 결과, 극소수의 사례에 불과하나 이 때문에 페널티가 초래될 수 있습니다.

 

118. 1픽셀 크기의 이미지 링크 (100%)

 

- 고전적인 숨겨진 링크의 수법이지만, 당연히 이 조그마한 이미지 링크는 Google에 의해서 숨겨진 링크로 취급 받습니다.

대체로 가로 x 세로 1px 이미지를 이용하거나, 터무니없이 작은 글꼴의 문자 링크를 사용합니다. 이러한 고전적인 수단은 확실히 쓸만하다고 생각하지만, 100% Google에게 들키므로 추천 하지 않습니다.

 

119. 빈 링크 앵커 (100%)

 

- 숨겨진 텍스트와는 좀 다를 수 있지만, 빈 앵커 텍스트를 이용한 숨겨진 링크도 클로킹 페널티의 대상이 됩니다.

이것도 역시나 위험하며, 한때 인터넷 세상을 풍미했던 전형적인 스팸 수법이기에 혹시나 잘못 작성한 링크가 없는지 다시 한 번 여러분의 사이트를 살펴봅시다.

 

120. 과도한 굵은 글씨 및 기울임 등 (70%)

 

- 굵은 글씨로 표시한 텍스트가 그렇지 않은 일반 텍스트보다 평가될 가능성이 높다고 다른 항목(7번 항목)에서 설명 드렸습니다.

그러나, [사이트 전체]의 글자를 굵은 글씨로 표기한다면 사이트 평가가 올라가는 일은 커녕, 이러한 행위는 Google이 정한 스팸 행위로 간주될 것입니다.

 

121. 내부 링크 오류 (100%)

 

- 깨진 내부 링크(Broken internal links)를 방치하면, 검색 엔진이 색인하기 더욱 어려워지며, 사용자의 탐색도 더욱 어려워집니다.

이것은 본인의 웹사이트 품질이 낮다고 대놓고 알려주는 표시나 다름없기에, 내부 링크의 오류가 없도록 관리와 수정을 권장합니다.

 

122. Frames/Iframes (100%)

 

- 과거에는 검색 엔진이 프레임에 위치한 콘텐츠를 완전히 탐색할 수 없었습니다. 비록, 그들이 이러한 약점을 어느 정도 극복했으나 프레임은 여전히 검색 엔진 크롤러에게 걸림돌이 되고 있습니다.

구글은 프레임 내의 콘텐츠도 페이지에 포함시키려 시도하지만, 이것이 올바르게 처리될 것이라고는 장담할 수 없습니다.

 

123. 동적 콘텐츠 (70%)

 

- 동적 콘텐츠(Dynamic Content)는 크롤러가 이해 및 랭크를 매기는데, 여러가지 어려움을 줄 수 있습니다.

특히 Google이 액세스할 수 있는 경우, 인덱스를 사용하지 않고 이러한 콘텐츠의 사용을 최소화하면 전체 사용자 경험이 더 긍정적이며, 순위에서 특혜를 받을 가능성이 높은 것으로 여겨집니다.

 

124. 너무 많은 광고 (100%)

 

- 페이지, 특히 퍼스트 뷰(first view) 부분에 과도하게 광고가 게재되었다면, 사용자 환경을 현저하게 해쳐 구글에 의한 페널티 대상이 될 가능성이 있습니다.

Google은 실제로 유저가 보는 페이지의 스크린샷을 기준으로 산출하고 있으며, 이것은 페이지 레이아웃 알고리즘의 일부나, 탑 헤비 알고리즘에 짜넣어져 있기도 합니다.

 

125. 팝업 사용 (70%)

 

- 2010년, 맷 커츠는 이에 대해 [NO]라고 대답했지만, 구글의 수석 웹 마스터 트랜드 분석가 존 뮬러(John Mueller)는 2014년에 [YES]라고 대답한 바 있습니다.

페이지 레이아웃·알고리즘의 구조와 효과를 생각했을 때, 팝업을 사용하면 검색 순위가 확실히 손상될 수 있습니다.

 

126. 로봇 허용 안 함 (100%) 

 

- 루트 디렉토리에 있는 robots.txt에 대상 크롤러를 '*' 또는 'google bot'으로 한 상태에서 disallow로 하면, 해당 사이트를 탐색하지 않게 됩니다.

해당 명령은 이미 Google이 가지고 있는 인덱스 자체를 삭제하는 명령은 아니지만, 콘텐츠 갱신 등의 업데이트가 이루어지지 않게 되어, 여러가지 플러스 요인이 반영되지 않게 되어 버립니다.

 

127. 메타 또는 JavaScript 리디렉션 (100%)

 

- 오래된 페널티의 일종으로 이제는 그다지 일반적이지 않지만, Google은 meta-refresh 나 JavaScript의 시간차 리다이렉트를 사용하지 않도록 권장하고 있습니다.

이것은 이용자를 혼란시키고 이탈률을 높이는 등, 문제의 원인이 될 수 있어 클로킹으로 간주될 수 있기 때문입니다. 대신에 서버 레벨에서의 301이나 302 리다이렉트를 사용하도록 합시다.

 

128. 자바 스크립트 내 텍스트 (100%)

 

- 구글이 자바 스크립트를 계속 발전시키고 있으나, 자바 스크립트를 사용하여 프린트 된 콘텐츠를 탐색하는 데 어려움을 겪을 가능성이 여전히 높습니다.

여기에 구글 봇이 언제, 누구에게 프린트 되는 맥락을 완전히 이해하지 못할 것이라는 우려도 큽니다.

JavaScript로 텍스트를 프린팅 한다고 딱히 페널티가 발생하지는 않지만, 이것은 분명한 리스크로 부정적인 요인이 됩니다.

 

129. 잘못된 HTML/CSS (70%)

 

- 맷 커츠는 이를 랭킹 요인으로 삼지 않는다고 밝혔습니다. 그러나 정기적으로 행하고 있는 SEO 연구가들의 실험 결과를 보는 한, 해당 요인으로 사용하고 있는 것 같습니다.

물론 코드가 완벽할 필요는 없으며, 간접적인 영향이 클 것입니다. 단지 코드가 관계하는 요인은 그 밖에도 있으므로, 잘못된 코드가 문제를 일으키는 것은 틀림없을 것이다.

예를 들어서, 태그 사용이나 페이지 레이아웃, 클로킹 등 잠재적으로 보이지 않는 수 많은 문제를 야기할 수 있습니다.

 

130. 감염된 사이트 (70%)

 

- 많은 웹사이트 소유자는 가장 부정접속이 많았던 웹서버가 따로 아무런 개서피해를 당하지 않는다는 사실에 놀라움을 느낄 것입니다.

그러나, 크래커들은 시큐리티 홀(security hole)의 수정이 행해질 때까지 들키지 않게 침입해 가능한 한 많은 정보를 훔쳐 보려고 하는 것입니다.

그리고, 최종적으로는 당신을 대신하여 악성 프로그램(멜웨어, malware) 배포 등을 하는 악의적인 모습을 나타냅니다. 이 점에 대해 구글은 매우 심각하게 받아들이고 있습니다.

 

131. 페이지 코드 오류 (50%)

 

- 아마도 페이지가 PHP, Java 또는 다른 서버 측 언어에 의해 생성된 오류들로 가득 차 있다면, 그것은 형편없는 사용자 경험과 낮은 품질의 사이트에 대한 구글의 정의를 충족시킵니다.

최소한 페이지 텍스트 내의 오류 메시지는 페이지의 텍스트에 대한 Google의 전체적인 분석을 방해할 수 있습니다.

 

132. 소프트 에러 페이지 (70%)

 

- Google은 소프트 404나 기타 소프트 에러 페이지를 사용하지 않도록 반복적으로 권장하고 있습니다. 이들은 기본적으로 문서 헤더에 HTTP 코드 200을 반환하는 오류 페이지 입니다.

논리적으로, 그러한 페이지를 Google이 올바르게 처리하는 것은 어렵고, 유저의 혼란도 부릅니다.

Google은 (적어도) 그러한 페이지를 낮은 품질로 간주하고, 그 수가 많으면 사이트 전체의 컨텐츠 품질에 영향을 끼쳐, 도메인 콘텐츠 전체 품질 점수를 크게 떨어트립니다.

 

133. 사이트맵 우선 순위 (50%)

 

- XML 사이트맵의 개별 페이지에 할당된 [우선 순위] 특성이 크롤링 및 랭킹에 영향을 미친다는 카더라가 많습니다.

그러나 검색 콘솔을 통해 Google에 전달할 수 있는 다른 신호와 마찬가지로, 요청했다는 이유만으로 일부 페이지가 실제로 더 높은 순위를 매길 가능성은 거의 없습니다.

이것은 중요도가 낮은 콘텐츠의 우선 순위를 낮추기 위한 신호로 주로 유용합니다.

 

134. robot.txt가 없다 (5%)

 

- 2015년 기준으로, 서치 콘솔은 robots.txt가 없을 경우 그것을 작성하도록 권장하고 있습니다. 이것 때문에 많은 사람들이 robots.txt가 없는 것이 마이너스 평가가 된다는 가설을 믿게 되었습니다.

Google의 존 뮬러 왈, [구글봇에 특별히 제한을 걸 필요가 없다면, robots.txt는 지워도 상관없다]고 어드바이스 했던 걸 생각 한다면 이상한 이야기입니다. 결국, 오해로 생긴 미신에 불과합니다.

 

서버 관련 요인

 

135. 원격 조종되고 있는 내부 링크 (100%)

 

- 페이지 랭크는 리다이렉트를 사이에 두면 약간 효력을 떨어뜨리도록 설계되어 있습니다.

 

그 때문에 www 유무나, URL 끝에 붙는 트레일링 슬래시 (/)의 유무로, 내부 링크를 리다이렉트 해 버리고 있다면.. 매우 아까운 일이 되어 버릴 수도 있습니다.

 

136. 사이트 읽는 속도가 느리다 (100%)

 

- 읽기 속도가 느린 사이트는 빠른 사이트보다 평가가 낮아집니다. 서버측, 단말측 양쪽 모두의 요인을 검사할 수 있는 툴은 세상에 많이 있으므로 반드시 이용해야 합니다.

또한, 읽기 속도의 문제는 사용자의 지역이나 단말기, 접속 속도 등의 환경에 의존하는 것이므로, 타겟 사용자의 사용환경을 염두에 두고 사이트를 구축해야 합니다.

 

137. 좋지 않은 환경의 IP 주소 (70%)

 

- 옛부터 지금까지, 웹호스팅에 의한 SEO 수법의 유언비어에 관해 맷 커츠는 진작에 [그런거 없다]고 부정 하고 있었지만, 아직도 IP 주소가 플러스 요인을 낳는다 믿고 열심히 몰두하는 패거리(?)가 있습니다.

그런 분들에게 말하고 싶은 것은, 좀처럼 없는 케이스이나 Google은 스팸이 만연하고 있다고 생각하는 프라이빗 네트워크든, 퍼블릭이든, 대상 범위의 IP주소 전체에 페널티를 부과하는 경우가 있습니다.

 

138. 너무 긴 응답 시간 (100%)

 

- Google은 접근할 수 없는 사이트는 색인 할 수 없습니다. 또, 이 논리는 사이트의 낮은 신뢰성과 낮은 사용자 경험이라는 불명예도 결정짓게 됩니다.

일시적인 사이트 다운은 순위에 영향을 주는 것은 아니지만, 적절한 응답 시간 안으로 사이트를 표시하는 것은 매우 중요합니다.

사이트 다운이 하루 이틀이면 문제없겠지만, 그 이상이 되면 분명히 여러가지 문제를 일으킬 것입니다.

 

139. 프라이빗 후이즈 (50%)

 

- 구글이 모든 등록자의 데이터에 항상 접근할 수는 없다는 지적이 종종 제기됩니다.

맷 커츠는 2006년 PubCon에서 [여전히 후이즈 데이터를 보고 있으며, 다른 부정적인 신호와 결합할 경우에 해당 사이트는 페널티를 받을 수 있다]고 분명히 밝혔습니다.

 

140. 거짓 후이즈 (20%)

 

- 프라이빗 후이즈와 동일하게, Google은 거짓 Whois를 사용한 트릭을 눈치채고 있고, 또, 그것이 문제라고도 인식하고 있습니다. 엄연한 ICANN 규약 위반이기에, 도메인 등록에 거짓 정보를 사용하지 마십시오.

 

141. 레지스터 단위로 페널티 (20%)

 

- 만약, 프라이빗 후이즈와 거짓 후이즈의 이야기에 귀 기울여 준다면, 맷 커츠가 그것들을 스팸 판정에 이용하려 한다는 점도 납득할 수 있을 것입니다.

그러한 일을 실시하고 있는 도메인 오너의 사이트가 일제 적발, 수동 대응될지도 모른다고 하는 것은 상상하기 어렵지 않습니다만, 어디까지나 이것은 카더라로 그러한 증거는 아무것도 없습니다.

 

142. 글로벌 순위에서 ccTLD (70%)

- kr이나, uk 등으로 대표되는 ccTLD는, 국가를 특정하기 위한 도메인 확장자 입니다. 글로벌 도메인 gTLD의 대척점이라고 보시면 되겠습니다.

 

ccTLD는 국제적 SEO에서는 편리하겠으나(어느 나라 사이트인지 한눈에 알 수 있으니까), 같은 이유로 해당 나라 외 Google에서의 순위를 노릴때는 아무래도 불리한 측면이 있습니다.

 

단, 몇 개의 ccTLD에서는 일반적으로 더 넓은 틀에서 사용되기 때문에, Google에 예외로서 인정받고 있는데, 예를 들어 [.co] 같은 도메인이 gccTLD로써 gTLD와 동등한 취급을 받습니다.

 

143. 도메인 파킹 (80%)

 

- 도메인 파킹(Domain Parking)이란, 아직 실제 웹사이트가 올라오지 않은 상태의 도메인으로, 대부분의 경우 도메인 레지스트리(domain name registry) 측에서 설정하고 있는 자동 생성 광고 페이지가 표시됩니다.

현재는 다른 많은 랭킹기준의 하나로 짜여져 있지만, 그다지 잘되지 않는 것 같으며 Google이 대량의 파킹된 도메인을 색인 하는 시절도 있었습니다.

현재, 구글은 파킹된 도메인에 대한 순위를 매기는 것을 원치 않는다는 점을 분명하게 밝혔습니다.

 

144. 하위 도메인 사용 (50%)

 

- 대부분의 경우, 하위 도메인은 Google에 완전히 다른 사이트로 판단됩니다. 여러 다른 요인과의 균형에서 하위 도메인 사용이 불이익을 낳는 경우 자체는 있을 수 있습니다.

예를 들어, 한 가지 주제에 대해 쓴 사이트를 많은 하위 도메인으로 분할해 버리면, 도메인 하나로 받을 수 있는 이익을 모두 낭비하는 것이 됩니다.

그 외 여러가지 말이 있습니다만, Google에서 하위 도메인 자체로 페널티를 받는 경우는 드물다고 보시면 되겠습니다.

 

145. 하위 도메인의 수 (50%)

 

- 사이트의 하위 도메인 수는, 해당 하위 도메인이 다른 오너에 의해서 운영되고 있는 각각의 사이트인지 어떤지를 판단하는 가장 중요한 요인이 될 수 있습니다.

 

146. 페이지의 HTTP 상태 코드 4XX/5XX (100%)

 

- 만약 Web 서버가 200(OK) 또는 301/302(리다이렉트) 이외의 스테이터스 코드를 빈번히 반환하고 있다면, 그것은 적절한 컨텐츠를 표시하고 있지 않다고 하는 것을 암암리에 광고하는 꼴 입니다.

브라우저로 볼 수 있어도(캐시 등이 남아 있어서), 실제로 콘텐츠는 없어져 버린 경우도 있을 수 있으므로 주의가 필요합니다.

 

147. 도메인 전체에서의 에러 페이지 비율 (50%)

 

- 스테이터스 코드 4XX나 5XX를 반환하는 페이지에 착지할 가능성이 높다는 것은 품질이 낮은 사이트라고 평가될 수 있습니다.

그러한 코드를 반환하고 있기 때문에 인덱스 되지 않을 가능성이 있으므로, 링크 끊김을 일으킨 링크가 없는가를 체크하는 것과 마찬가지로 주의하는 것이 좋습니다.

 

148. HTTP 기한 만료 헤더 (50%)

 

- 웹 서버를 사용하여 만료 헤더를 설정하면, 브라우저 캐시를 제어하고 성능을 향상시킬 수 있습니다.

그러나 이러한 기능은 사용 방법에 따라서 검색 엔진에 오랫동안 내용이 새로 고쳐지지 않을 수도 있다고 표시하여 검색 인덱싱에 문제를 일으킬 수도 있습니다.

 

149. 사이트맵 change freq (50%)

 

- XML 사이트 맵의 ChangeFreq 변수는 콘텐츠의 변경 빈도를 나타내기 위한 것입니다. 구글이 콘텐츠의 변화를 알려 주는 것보다 더 빨리 다시 크롤링하지 않을 수도 있다는 이론은 있습니다.

다만, 구글이 실제로 이 속성을 따르는지 안 따르는지 불분명 하긴 한데, 실제로 따르는지 여부는 구글 검색 콘솔에서 크롤 속도를 조정하는 것과 비슷한 결과를 낳을 것으로 보입니다.

 

플러스로 작용하는 외부 SEO 요인

 

- 외부 SEO 요인에서는, 직접 사이트를 제어하는 것 이외의 Google 랭크에 영향을 주는 요인에 대해 기술합니다. 대부분의 경우 이것은 외부 사이트로부터의 백링크 라는 것을 의미합니다.

플러스로 작용하는 긍정적인 페이지 외부 SEO 요인은 주로,


1. 이해도를 높일 것
2. 자연스러운 인기 획득과 관련, 신뢰성과 확산성이 높은 소스로부터 평판을 얻는데 주안점을 둡니다.


 

권위성에 관한 요인

 

150. 페이지에 대한 권위있는 사이트에서의 피링크 (100%)

 

- 인바운드 링크(백링크) 수가 많은 다른 사이트로부터 링크를 받는 것이 없는 사이트보다 훨씬 더 가치가 있습니다. 인바운드 링크의 경우에도 마찬가지이며, 사용자에 대한 링크의 값을 결정하는 등의 경우도 마찬가지입니다.

이러한 방식으로, 링크는 통화와 같은 가치라고 생각하시면 되며, 가상 가치는 0달러에서 100,000달러 사이입니다. 이것은 페이지 랭크 알고리즘의 기본이 되는 생각입니다.

 

151. 페이지에 추가 인바운드 링크 (100%)

 

- 피링크 하나 하나의 가치가 모두 같다고 가정할 때, 받을 수 있는 링크의 수가 많을수록 가치는 높아집니다.

물론, 해당 요인만 결정 요인이 되는 것은 아닙니다. 아무리 많은 양도 질적인 우위에는 못 미치며, 통상적으로 받는 피링크의 대부분은 문자 그대로 가치가 없습니다.

다만, 페이지 랭크 알고리즘이 계속 존재하는 한, 많은 피링크라는 총알이 없다면 격렬한 순위 경쟁의 전쟁에서 승리할 수 없습니다.

 

152. 도메인에 대한 권위있는 사이트의 피링크 (100%)

 

- 외부 사이트로부터의 피링크로 얻을 수 있는 페이지 랭크는, 도메인 중에 내부 링크를 통해서 분산됩니다.

대체로, 도메인 이름은 권위를 획득하는 데 도움이 됩니다. 즉, 권위 있는 사이트에 콘텐츠를 올리는 것이 그렇지 않은 도메인에 올리는 것보다 훨씬 순위가 높아집니다.

 

153. 도메인에 대한 추가 피링크 (100%)

 

- 동일한 값의 도메인에 대한 더 많은 링크는 해당 도메인 이름의 전체 권한을 증가시킵니다.

페이지 랭크 개념에 대한 래리 페이지의 연구 논문에서, 그는 [호스트 명 기반 클러스터링]을 페이지 랭크의 구성 요소라고 설명했습니다.

 

154. 소셜 시그널 (50%)

 

- Google이 말하는 소셜 시그널(Social Signal)이란, 현재 실험 중인 소셜 미디어에서 공유나 평판을 사이트의 권위 결정에 영향을 시켜야 할 것인가 아닌가 하는 것입니다.

Google+가 시작되어, 트위터와의 firehose 계약을 해제한 후, 맷 커츠는 [지금까지의 연구는 Google+의 데이터를 사용해 행한 실험보다 시원치 않은 것] 이라고 말했습니다.

최근 조사에서 말할 수 있는 것은, 직·간접적인지는 불분명하나 긍정적인 소셜 평판은 순위와 상관관계가 있다는 것입니다.

 

155. 브랜드 네임 인용 (5%)

 

- 로컬 SEO나 Google 맵 SEO의 큰 요인으로서, 기업명이나 주소, 전화번호 등이 있으면 링크를 붙이지 않아도 상위에 표시된다는 카더라가 있습니다.

Moz의 CEO 랜드는 이것이 통상의 SEO에도 고려되고 있는 것은 아닌가 하는 사례 연구법을 발표하기도 했습니다.

하지만 뭐.. 어디까지나 미신으로서 취급하는 편이 좋습니다.

 

156. C클래스 분산 IP (20%)

 

- 원칙으로서 Google은 링크 원주소 페이지나 도메인의 권위나, 질, 관련성을 기초로 링크를 스코어링 하고 있습니다. 이것은 IP주소와는 관계 없으나, 단 하나의 예외인 힐탑 알고리즘은 제외됩니다.

좀 더 구체적으로 말하면, 크리슈나의 연구서 섹션 2.1 [호스트 소속의 탐지] 라고 하는 부분입니다.

/24의 IP 범위, 혹은 IPv4 에 있어서 위로부터 3번째까지의 8비트 (A.B.C.D 중 C까지)가 동일한 사이트는, 동일 오너에 의해서 관리되고 있다고 간주, 힐탑에 의한 효력을 무효로 한다고 기재되어 있습니다.

 

157. DMOZ 목록 (80%)

 

- 인터넷의 모든 웹사이트가 링크를 받을 수 있는 그런 마법 같은 곳이 하나 있습니다. 그것이 Directory Mozilla, 통칭 DMOZ입니다.

이전에는 Google 디렉토리에 데이터 공급을 행한 적 있는 오픈 디렉토리 프로젝트입니다. 가장 오랫동안 부패로 무르익은 정치적 악몽이었던 이곳은, 현재 폐쇄되었습니다.

 

158. .EDU 도메인으로부터 링크 (5%)

 

- SEO 초보자를 호구 삼아서 저지르는 사기 중 하나로, [.EDU] 사이트로부터의 링크를 판매하는 것이 있습니다. 통상적인 링크보다 가치가 높다는 것이 그들의 주장인 듯 합니다.

맷 커츠는 [구글은 .edu도 .gov도 다른 도메인과 구별해 평가하지 않는다]며 일축하고 있습니다.

확실히, 도메인 사이트는 보통의 사이트 보다는 많은 링크를 모으고 있겠지만, [edu 링크 판매]와 같은 서비스에서 얻을 수 있는 링크는 그러한 것과 거리가 멉니다.

이런 경우는 스팸이 되기 쉬우며, 권위성이 없는 포럼이나 블로그로부터의 링크만 붙을 뿐입니다.

 

159. .GOV 도메인으로부터 링크 (5%)

 

- edu와 같은 경우입니다. gov가 통상적인 gTLD의 테두리를 넘어서 평가된다고 하는 것은 완벽하게 허구입니다.

수많은 사례 연구 혹은 권위 있는 브랜드 사이트가 그러한 링크를 따로 일절 포함하고 있지 않은 것을 고려하면, 완전히 신빙성이 떨어집니다.

 

160. 긍정적인 링크 획득 속도 (70%)

 

- 여러분의 사이트와 콘텐츠가 손실되는 것보다 더 빠르게 다시 링크를 얻고 있다면, 다소 불공정한 오프 페이지 SEO 이점을 가진 기존의 대형 브랜드보다 조금 더 많은 관심을 받고 있다고 추측됩니다.

구글의 한 특허는 [시간이 지남에 따라 문서(또는 페이지)에 대한 백링크의 수나 증가/감소율의 변화를 분석, 검색엔진은 문서가 얼마나 새로운지에 대한 귀중한 신호를 도출할 수 있을 것]

이라고 언급하면서, 적어도 이것을 주시하고 있음을 확인시키고 있습니다.

 

161. 자연스러운 비율의 딥 링크 (50%)

 

- 페이지 랭크 알고리즘의 단순한 구조로서, 홈페이지를 경유하지 않고 IP 주소로서 간접적으로 링크 되는 것보다, 페이지에 직접 링크 되는 것이 권위성은 올라갑니다.

극단적으로 부자연스러운 SEO 대책을 마련하지 않는 한, 홈페이지에 대한 조회수와 딥 링크수의 비율은 자연스러운 형태가 될 것입니다.

 

162. Google+ 프로필 (70%)

 

- 구글 플러스를 사용하는 것은 다소 예측 불가능한 요소이지만, 다양한 순위 이점을 가지고 갈 수 있습니다.

그러나 일부 사람들은 구글 플러스가 전통적인 순위 결정에 도움이 될 수 있다고 추측하지만, 우리는 이것을 쓸 때 유일한 실질적인 이점이 전통적인 방식이 아닌 방식으로 나타난다고 믿습니다. 

Google+로 달성할 수 있는 이러한 순위의 예는 Pete Meyers 2013 MozCon Presentation, Beyond 10 Blue Links를 참조하십시오.

 

*2019년 4월 2일, 종료된 서비스 입니다.

 

163. 트위터 팔로워 (20%)

 

 

- 브랜드의 twitter 팔로워 수가 직접적인 순위 요인이 되고 있는 것이 아니냐는 설이 강하게 제기되곤 합니다. 그러나, Google의 주장은 그것과는 완전히 다른 반대입니다.

확실히 Twitter 팔로워는 브랜드의 팬을 육성해 나가는데 있어서, 더없이 귀중한 자원이나 모두 Google의 현재 순위 결정 요인으로 요소나 증거와는 다릅니다.

 

164. 트위터 공유 (50%)

 

- Google에 의하면, 소셜 미디어에서의 공유는 기본적으로 백링크 밖에 취급되지 않고, 현재 트위터에서의 콘텐츠 공유에 그 이상의 부가가치는 없습니다.

 

165. 페이스북 좋아요 (20%)

 

- 163번, 트위터 팔로워 항목과 동일.

 

166. 페이스북 공유 (50%)

 

- 164번, 트위터 공유 항목과 동일.

 

167. Google+ 서클 (20%)

 

- 단지 잠깐, Google의 SPYW(Search Plus Your World) 기능에 의해서, 퍼스널라이즈 된 검색 결과가 통상의 검색 결과 위에 표시된 적이 있었습니다.

이것에 의해, Google+상에서 [+1] 한 써클에 관련하는 문서나 페이지가 우선되어 표시되었습니다.

지금 현재로서, 이 실험은 실패로 끝났다고 볼 수 있습니다. 장기적으로 만약 시그널화됐을 때를 위해 이에 주력해도 나쁠 것은 없겠으나, 적어도 지금 현재 서클이 검색 상위 요인이 되고 있다는 증거는 아무것도 없습니다.

 

168. Google+ +1 (10%)

 

- Google+가 런칭 된 후, Google는 도처에 Google+의 [+1] 버튼을 설치하는 실험을 진행시켜 왔습니다. Moz에선 [+1을 많이 모을 정도로 인기 사이트는 상위 표시되기 쉽다] 라고 하는 상관관계 조사를 발표했습니다.

그러자, 직후에 맷 커츠는 [어느 것도 사실이 아니며, +1은 직접 순위에 영향을 주는 것이 아니다] 라며 해당 조사를 부인했습니다.

 

169. 오래된 도메인으로부터 링크 (50%)

 

- Microsoft(bing)가 2008년에 제출한 특허정보에는 [오래된 문서로부터의 백링크에는 보다 더 높은 가치를 부여한다]고 기재되어 있습니다.

해당 내용에서는 100%가 최고 점수라고 치면, 10년 이상이 100%, 6~10년이 75%, 3~6년이 50%, 1~3년이 25%, 1년 미만이면 10% 라는 식입니다.

Google도 같은 요소를 가지고 있는 것은 아닐까 하는 카더라가 있지만, 확증은 없습니다.

 

170. 높은 MozRank/MozTrust 점수 (5%)

 

- 툴바 페이지 랭크 로 볼 수 있는 수치는, Google 검색이 실제로 이용하고 있는 페이지 랭크 와 일치하는 것은 아닙니다. 최근에는 이 수치의 정확성이 상당히 심각해졌기 때문에 많은 사람들이 MozRank 쪽을 보게 되었습니다.

그러한 배경은 있지만, Google은 언제라도 링크의 가치를 스스로 계산하고 있으며 아무리 MozRank와 실제의 순위에 상관관계가 있어도, 그 데이터를 Google 순위 결정에 이용하는 것은 있을 수 없습니다.

이것은 Maje나 Ahrefs 등, 다른 어떠한 제3자 기관의 데이터도 마찬가지 입니다.

 

171. 구글에서의 사이트 등록 (5%)

 

- 구글은 오랫동안, 크롤링을 재촉하기 위해 사이트를 등록하는 툴을 제공하고 있습니다. 오랫동안 믿어 온 미신 중의 하나가 이것이, 랭킹에 어떠한 이익을 가져다 주지 않을까 하는 것입니다.

그러나, 실제로는 또 하나의 미신일 뿐 입니다.

 

172. Google+ 로컬에서 승인된 주소 (20%)

 

- Google 맵의 로컬 리스팅에 사용되고 있는 Google+ 로컬 페이지가, 통상적인 순위 요인으로 사용되고 있는 것은 아닌가 하는 설이 자주 있었습니다.

그것들이 Google 맵상의 로컬 SEO나, 통상의 검색 결과 페이지에 나오는 6팩 부분의 순위에는 상당한 영향력을 발휘하지만, 통상의 랭킹에 이용되고 있다는 증거는 아무것도 없습니다.

 

연관성에 관한 요인

 

173. 키워드 앵커 텍스트 (100%)

 

- 외부 링크에 사용되는 앵커 텍스트는 검색어에 대한 페이지의 관련성을 설정하는 데 도움이 됩니다. 대상 페이지는 순위를 매기기 위해 해당 검색어가 반드시 포함되지 않아도 됩니다.

 

174. 관련 사이트의 링크 (100%)

 

- 당신과 유사한 자료를 다루는 사이트에서 링크는 필요합니다. 일반적인 오해와 위험한 링크 구축/해제 계획과는 다릅니다.

 

모든 링크가 그 주제와 특화된 사이트에 붙여져 있을 필요는 전혀 없습니다. 그건 너무 부자연스러우니까요.

 

175. 부분 관련 앵커 텍스트 (80%)

 

- 백링크가 자연스럽다는 것은 당연하지만, 모든 링크가 똑같이 붙어 있지 않다는 것입니다. 앵커 텍스트는 키워드 문구 중 일부만을 포함하고 있거나, 키워드와 다른 단어가 들어가 있어야 합니다.

Google의 특허에서는 [partially-related]라 제시되어 있으며, SEO 업계 용어로 말하면 [부분 일치 앵커] 라고 표현됩니다.

 

176. 부분적으로 관련 있는 ALT 텍스트 (80%)

 

- 부분일치 앵커 텍스트와 마찬가지로, 이미지 링크에 붙어 있는 ALT 텍스트도 다양한 종류가 있어야 합니다. 이것은 Google에 의해 직접 명기되어 있는 것은 아니지만, 간단한 실험에 의해서 증명은 되어 있습니다.

 

177. 타이틀 속성의 키워드 (5%)

 

- 링크에 붙어 있는 타이틀 속성은 앵커 텍스트와 마찬가지로 취급되는 것이 아닌가 하는 설이 있습니다.

그러나, 2005년 PubCon에서 Google은 [해당 속성을 이용하고 있는 사람은 이제 거의 없다] 라는 말과 함께 해당 설을 단호히 부정하고 있습니다. 또, 많은 연구에서도 이 속성이 전혀 요인으로서 이용되고 있지 않습니다.

 

178. ALT 텍스트 키워드 (100%)

- 이미지 링크의 ALT에 사용되는 텍스트는 앵커 텍스트와 같은 효과를 가집니다. 또한, 단적으로 신뢰할 수 있는 ALT 텍스트는 접근성을 향상시키고 Google 이미지 검색 상위 표시에도 도움이 됩니다.

 

179. 링크 주변의 문맥 (100%)

 

- 링크 주변의 텍스트가 문맥 이해에 이용된다는 설이, 꽤 예전부터 주창되고 있었습니다. Google의 특허와 심플한 실험이 이 설의 정당성을 나타내고 있습니다.

즉, 글에 기재되어 있는 링크가 단체로 문맥에서 분리된 링크보다 높은 가치를 제공하고 있는 것입니다.

 

180. 동일 검색 결과로부터 링크 (80%)

 

- Google의 특허에는 [순위 결과의 상호 관계를 고려한 후, 재순위 부여를 한 순위 결과]라는 것이 있습니다.

여기에는 어떤 쿼리에서 이미 상위에 표시되어 있는 페이지로부터의 링크는, 그렇지 않은 페이지로부터의 링크보다 해당 쿼리에 대한 상위 표시 효과가 높아진다는 것이 적혀있습니다.

 

181. 쿼리·페이지에서의 클릭률 (70%)

 

- 검색 결과 페이지로부터의 클릭율이 순위 결정 요인으로 사용되고 있는 것은, 꽤 유력한 설로서 존재합니다.

Bing은 그것을 순위 결정 요인으로서 이용하고 있으며, 맷은 2009년에 상당히 함축적인 표현으로 관련성에 대해 언급하고 있습니다.

또한, 클릭율이 순위에 영향을 준다고 생각할 수 있는 충분한 실험을 twitter를 이용해 실시한 케이스도 있습니다.

 

182. 도메인 클릭률 (50%)

 

- 특허에 [여러가지 검색 결과의 클릭률을 통한, 사이트의 품질 스코어링(corearing)을 실시하는 방법]이라는 기술이 있습니다.

이 특허의 이름은 글자 그대로 [사이트 품질 점수]입니다. 해당 특허는 클릭에 의해 도출되는 브랜드 쿼리에 대해서도 언급하고 있습니다.

하지만, 이들도 클릭률이 순위 결정 요인이 될 수 있다는 증거의 보탬일 뿐이며, 사이트 단위 클릭률도 그 안에 포함될 수 있다는 가능성에서 벗어나지 않습니다.

 

183. 타겟으로 삼고 있는 국가의 ccTLD로부터 링크 (70%)

 

- Google은 사이트와 특정 국가와의 관련성을 확립하기 위해, ccTLD(국가 코드 최상위 도메인)를 이용하고 있습니다.

특정 국가의 ccTLD 사이트로부터의 백링크는 그 나라에서의 순위에 영향을 준다고 하는 것이 일반적으로 생각되는 이론입니다.

 

184. 타겟 지역 IP 링크 (70%)

 

- 타겟 오디언스에 가까운 서버를 사용하는 것은 상당히 넓은 범위, 세계 수준에서 볼 때 해당 오디언스에 대한 랭킹에 긍정적인 영향을 준다고 Google은 말하고 있습니다.

그 밖에도 많은 요인들이 지역 관련성을 확립하고 있으며, 이는 Google.com과 Google.co.uk의 검색 결과를 비교해 봐도 알 수 있습니다.

이상과 같이, Google이 당신의 사이트로의 링크를 분석하는 툴과 사이트 자신을 분석하는 툴은 같은 것을 이용하고 있다고 가정할 수 있습니다.

 

품질에 관한 요인

 

185. 피링크의 안정성 (100%)

 

- 피링크는 시간이 지날수록 가치가 올라갑니다. 그 이유는 스팸링크나 유료링크는 수정되거나 최종적으로 삭제되는 정의구현(?)의 경우가 대부분이기 때문일 것입니다.

그 결과, 오래가는 백링크는 가치가 올라가며 이것은 특허로도 확정되었습니다.

 

186. 낮은 이탈률 (50%)

 

- Google은 검색 유저의 이탈율을 보고 있고, 그것을 순위 결정에 이용하고 있는 것이 아닌가 하는 설이 있습니다. Google 애널리틱스나 Chrome의 데이터 없이도, 해당 수치는 간단하게 이끌어 낼 수 있습니다.

맷 커츠는 이것을 부인하고 있으며, 사용자의 체류시간은 스팸이 쉽게 생기는 데다 노이즈  많다고 밝혔습니다.

그러나 SEO 블랙햇과 관련해 이를 증거하기 위한 연구를 하고 있으며, Bing은 [dwell time]이라는 명칭의 요인으로, 이탈률을 순위 결정에 이용하고 있음을 인정하고 있습니다.

 

기타 상황에 관한 요인

 

187. QDF (Query Deserves Freshness) (100%)

 

- Google는 모든 검색 쿼리를 똑같이 순위화하고 있는 것은 아닙니다. 뉴스 관련 같이, 특정 검색 쿼리에 관해서 말하면 컨텐츠가 공개되고 나서의 [신선함]이라고 하는 것이 크게 영향을 주고 있습니다.

Google에서는 이것을 QDF(Query Deserves Freshness)라고 부르고 있습니다.

 

188. Query Deserves Sources (QDS) (70%)

 

- Google의 Quality Rater Guidelines에 설명된 시나리오를 다루기 위해 만든 용어입니다. 사용자가 Google 검색 결과에 대한 품질 관리를 수행할 때 사용합니다.

이것은 전문 지식 및/또는 권위 있는 출처가 중요한 주제로, 이는 트랜잭션(Transaction) 및 탐색 쿼리와는 대조적으로, 모든 정보 검색 쿼리에 적용됩니다.

 

189. Query Deserves Oldness (QDO) (70%)

 

- Google 특허에 기재되어 있는 항목을 나타내기 위해 만들어진 용어입니다. [몇 개의 쿼리에 대해서는, 새로운 컨텐츠보다 낡은 것이 가치가 있는 것이 있다] 라고 기재되어 있습니다.

 

190. Query Deserves Diversity (QDD) (70%)

 

- Google는 모든 검색 쿼리를 똑같이 순위화하고 있는 것은 아닙니다. 일명, QDD라고 불리는 설이 있으나 이것은 같은 키워드에서도 다른 정의가 되는 것의 본질적인 의미를 찾아내는 [entity salience] 라는 개념에 의존합니다.

QDF의 컨셉과 겹치는 부분도 있지만, 어느 쪽인가 하면 Wikipedia의 애매함 회피를 위한 페이지와 같은 느낌입니다.

만약 검색 쿼리가 애매하다면, 검색 결과의 상위에는 여러가지 패턴의 결과가 표시되어야 합니다. 이것은 확증은 없지만, 재현성은 높습니다.

 

191. 세이프서치 (100%)

 

- 성인 콘텐츠와 관계된 경우, 세이프서치가 유효하게 되어 있는지 여부로 순위가 매겨지거나 하지 않거나 합니다. 초기설정에서는 세이프서치가 켜져있으며, 사용자가 끌 수 있습니다.

 

192. 구글 애즈 이용 (5%)

 

- SEO 편집증(병)은 해당 미신을 아직도 퍼트리게 합니다. 구글 애즈가 어떤 식으로든, 순위를 향상시킬 것이라고 시사하는 믿을 만한 연구는 아직까지 접한 것이 없습니다.

유기적 순위에 영향을 미치는 애드워즈는 구글의 핵심 철학에 반(反)하는 것이며, 구글만큼 이 미신에 대해 목소리를 내는 것을 경계하는 사람도 없을 것입니다.

 

193. 구글 애즈 미(未)이용 (5%)

 

- 192번, 구글 애즈 이용과 동일합니다.

 

194. 크롬 북마크 (50%)

 

- 맷 커츠에 의해서 직접 부정되고는 있지만, 2013년 Brighton SEO 컨퍼런스의 [전직 Google 사원의 이야기] 코너에서는 얘기가 조금 다릅니다.

또, Google의 특허에도 다음과 같이 기재되어 있습니다.

[서치 엔진은, 문서의 중요도를 결정하기 위해 어느 문서에 총 얼마 정도의 북마크나 마음에 드는 것이 있을지 해석할지도 모른다]

 

195. 크롬 사이트 트래픽 (50%)

 

- 이쪽도 Google에 부정되고 있지만, [트래픽을 베이스로 한 문서의 스코어링] 이라는 특허도 있습니다. 이것은 브라우저의 트래픽 데이터를 이용해 순위를 결정하는 것으로, 특허에는 아래와 같이 기재되어 있습니다.

[문서 누적의 트래픽 데이터는 문서의 스코어 작성(혹은 대체 스코어 작성) 으로서 이용될지도 모른다]

 

196. 사용자의 검색 이력 (70%)

 

- Google에서는 특별히 설정을 해제하지 않는 한, 검색 이력을 베이스로 퍼스널 라이즈 한다는 것은 잘 알려져 있습니다. 2009년 이후, Google 어카운트 로그인 상태에 관계없이 퍼스널 라이즈된 검색 결과가 표시되었습니다.

 

197. 구글 툴바 행동 (50%)

 

- 맷 커츠가 구글의 유기적 검색 결과 순위 결정에 구글 크롬 데이터가 사용되지 않는다고 밝힌 것처럼, 구글 툴바도 마찬가지였습니다.

그럼에도 불구하고, SEO에 의해 널리 보고되고 있는데 이는 브라우저 플러그인을 통해 정확히 이 작업을 수행하는 방법을 직접 논의하는 Google 특허와 관련이 있을 수는 있습니다.

 

198. 낮은 Alexa 점수 (5%)

 

- 구글이 이론적으로 사이트 트래픽을 순위 요소로 볼 수 있다는 특허와 추측은 있지만, 그들이 Alexa를 이용해 그렇게 하고 있다는 것을 뒷받침할 증거는 전혀 없습니다.

어떤 문서가 존재하는지 보면, Chrome 데이터를 사용하여 이 작업을 수행할 것을 제안합니다. 그런데, 그들은 스스로 이미 해당 작업을 완료했습니다.

 

199. 브랜드 단어 검색 합계 + 클릭 (70%)

 

- 구글 엔지니어 나브닛 판다(Navneet Panda)의 특허 [사이트 품질 점수]는 구글의 내비게이션 브랜드 검색(노스컷 연락처 페이지 등)이 도메인 전체의 품질 점수에 기여하는 시나리오를 기술하고 있습니다.

[점수는 특정 사이트를 찾고, 선호하는 사용자 조치와 특정 사이트에서 발견된 자원을 나타내는 수량으로부터 결정된다]

 

200. 높은 체류 시간 (70%)

 

- 사이트 품질 점수 특허에는 브랜드 검색의 합계와 클릭을 순위 요인으로 하기 위한 방법이 기재되어 있습니다. 그 방법의 하나로서 다음과 같습니다.

[시스템 구성에 의존하는데 예를 들면, 최소 체류 시간 혹은 컨텐츠의 길이 마다 최소 체류 시간 등을 설정하는 것으로, 시스템은 해당 유저들의 선택을 취급할 수 있을지도 모른다]

이것은 Bing이나 Yahoo!의 적응 예를 봐도, 있을 수 있는 이야기일지도 모릅니다.

 

201. 사이트맵 도구 제출 (20%)

 

- Google 검색 콘솔을 사용하여 XML 사이트맵을 Google에 제출할 수 있습니다.

이것은 경우에 따라 더 많은 페이지를 인덱스에 가져오는 것처럼 보이지만, 초기 [사이트 등록] 개념이 이상적이지 않았기 때문에 별 의미는 없습니다.

만약, 구글이 자력으로 찾아낼 수 없는 페이지는 어쨌든 제대로 된 순위가 매겨지는 것이 아닌 것입니다. 또, 이 툴을 이용하면 반대로 사이트 구조의 어디에 크롤링 문제가 발생하는지 이해하기 어려워집니다.

 

202. 국제 타겟팅 보고서 (70%)

 

- Search Console에는 국제 타겟팅 보고서(International Targeting Tool)가 잘 설정되어 있지 않을 때 알림 기능이 있습니다.

대개의 경우는 닷컴과 같은 gTLD나 .co와 같은 gcCTLD를 이용하고 있을 때 사용하는 것으로, 특정 조건하에서 특정 국가에서 상위에 표시되는데 도움은 됩니다.

 

203. 재심사 요청 (70%)

 

- Google의 재심사 요청은 원칙적으로 수동 대응(사람이 직접)되었을 경우의 해결책으로서 이용됩니다. 수동 페널티를 벗어나게 하기 위한 판단을 구하기 위해 Google에 의한 수동 사이트 심사를 탄원하기 위한 절차입니다.

수동 대응은 마이너스로 작용하는 순위 요인에서 극히 일부에 지나지 않는 것을 생각하면, 이 툴이 평소에 필요할 일은 거의 없습니다.

 

마이너스로 작용하는 외부 SEO 요인

 

- 마이너스로 작용하는 외부 SEO 요인은 일반적으로, 부자연스러운 링크 페널티의 원인이 되기도 하며 사이트에 대한 부자연스러운 패턴의 백링크와 관련된 것입니다.

2012년 펭귄 업데이트 도입 전까지 페널티까지는 아니었고, 평가 감소 정도에만 머물렀습니다. 이 경우, Google이 부자연스럽다고 느낀 링크로부터 거의 모든 효과가 무효화되지만, 그 이외의 데미지는 없었습니다.

한편, 외부 요인 페널티를 일으키는 펭귄 업데이트는 경쟁 사이트로부터의 악의적인 공격을 받아들이는 원인이 되기도 합니다. 이것은 네거티브 SEO와 구글 볼링(Google Bowling)으로 알려져 있습니다.

 

권위성에 관한 요인

 

204. 페이지 권위 분산 (100%)

 

- 페이지 랭크의 기능으로써 예를 들면, 1개의 링크를 실은 페이지가 1개 있을 때, 1.0의 페이지 랭크를 주고 받는다고 가정해봅시다.

 

같은 페이지에 1,000개의 링크를 싣고 있다면 주고받을 가치는 0.001이 됩니다(1000이 아님).

 

205. 도메인 권위의 분산 (100%)

 

- 페이지 권위의 분산이 일어나는 것과 같은 이유로, 외부 링크 페이지 랭크의 분산은 도메인 단위에서도 일어날 수 있습니다.

이것에 의해 누구에게 링크 하는가, 관계가 있는 곳으로부터 링크를 받는다든가 하는 것에 구애받고 있는 사이트는 가치가 있지만, 한편으로 무료 링크집 사이트 같은 것의 가치는 거의 없습니다.

 

품질에 관한 요인

 

206. 링크 주위의 문맥 (70%)

 

- 만약, 링크 주위의 문맥에 가치를 부여한다면 문맥이 없는 것은 좋지 않은 일이라고 생각할 수 없을까요? 그러나, 이것은 단순히 효과가 줄어들 뿐으로, 콘텐츠 부분의 링크와 비교하면 가치가 낮습니다.

 

207. 저품질 링크 주변 콘텐츠 (80%)

 

- Google은 링크 품질을 결정하기 위해 특히, 판다 업데이트와 펭귄 업데이트 도입 후에는 주변 콘텐츠의 질을 살펴봅니다.

직접적인 관련성은 모르나, 내부 요인의 품질을 결정하는 것과 같은 방법으로 외부 요인의 질을 결정하는 방법을 구글이 가지고 있다고 생각해도 이상할게 없습니다.

 

208. 관련 없는 링크 주변 콘텐츠 (70%)

 

- [참조 문맥 기준의 순위 결정] 이라고 하는 Google의 특허에는, Google이 링크와 해당 링크처의 관련성을 확립하기 위해서, 어떻게 해서 링크 주위의 콘텐츠를 보고 있는지 기재되어 있습니다.

만약, 콘텐츠가 주제를 정해서 쓰여진 것이 아니라면 이 강점은 살릴 수 없습니다. 주변 콘텐츠가 너무 무관한 것이라면, 부자연스럽고 페널티를 불러일으킬 가능성도 있습니다.

 

209. 사이트 와이드 링크 (80%)

 

- 사이트 와이드 링크(WideLink)는 그 자체에 해가 있는 것은 아니지만, 마이너스 평가를 받는 경향이 있습니다. 왜냐하면, 원칙적으로 그것들은 하나의 링크로서 취급되기 때문입니다.

맷 커츠도 사이트 와이드 링크는 자연적으로 발생하는 것이라고 인정하지만, 종종 웹 스팸 사이트와도 관련됩니다. 이 때문에, Google의 웹 스팸 팀은 사이트 와이드 링크를 수동으로 직접 조사하고 있는 것 같습니다.

 

210. 부정적인 감정 (70%)

 

- 2010년에 Google은 브랜드를 향한 감정(예를 들어 리뷰나 링크 주변의 콘텐츠 등)을 랭킹 요인으로 사용하고 있다고 하였습니다.

리뷰는 그보다 전부터 로컬 SEO 또는 Google 맵 SEO에서 중요한 랭킹 요인으로서 사용되고 있습니다.

 

주변 상황에 관한 요인

 

211. 부정적인 SEO (구글 볼링) (100%)

 

- 부정적인 SEO(Google Bowling)는 역사적으로 [구글 볼링]으로 불리며, 제3자가 사용자의 사이트를 대신하여 수행하는 악성 링크 스팸의 행위입니다.

예전에는 외부 SEO 요인의 대부분은 평가가 깎이는 정도로 그쳤으나, 지금은 페널티가 주류인 세상입니다. 페널티가 있는 현재로서는, 이러한 네거티브한 SEO의 존재는 이론적으로 증명할 수 있습니다.

 

212. 리디렉션에 의한 페널티 (70%)

 

- 존 뮬러는 구글 행아웃에서 [301 리디렉션이 페널티를 승계할 수 있다는 것]을 인정했습니다. 꼭 말해 두고 싶은 것은, 보통은 여기에 걸리는 일은 거의 없다는 것입니다.

만약에 오래된 도메인을 구입해 옛 사이트에 붙어 있던 링크 효과를 이어가려 하거나, 페널티를 피하기위해 새 도메인으로 옮긴 뒤 301 리디렉션을 걸어 버리거나 하지 않는 한 말입니다.

 

213. 크롬에서 차단된 사이트 (70%)

 

- Google은 2011년에 크롬으로 검색했을 경우, 유저가 임의의 사이트를 검색 결과에 표시하지 않게 할 수 있는 도구를 도입했습니다.

이들은 현재 사용자가 블록한 도메인의 데이터를 랭킹에 까지는 사용하지 않으나, 데이터를 사용할 수 있을지는 확인하려 한다고 말했습니다.

해당 요인이 현재까지 랭킹 요인에 적용된다는 보장은 없지만, Web 스팸 팀이 이 데이터를 보려고 하지 않는다고 말할 수는 없겠네요.

 

214. 짧은 체류 시간 (70%)

 

- Google의 특허에 따르면, 브랜드 쿼리에 대해 다음과 같은 조건을 요구하고 있다 해석할 수 있습니다.

[콘텐츠 마다 체류 시간을 설정하는 것으로, 해당 시스템은 방문객의 선택을 반영 할지도 모른다]

스티븐 레이(Steven Levy)는 [In The Plex] 라는 책에서, [이것이 Google이 가장 정확하게 검색 결과의 품질을 계측하는 방법] 이라고 말하고 있습니다.

Bing과 Yahoo!도 체류 시간을 반영하는 것을 암시하고 있고, 진작에 이용하고 있다는 카더라도 있습니다.

 

215. 높은 작업 완료 시간 (50%)

 

- 확증은 얻지 못했지만, 클릭률과 체류시간이 랭킹 요인으로 사용되고 있음을 시사하는 증거는 많이 발견되고 있습니다.

Google의 데이비드 미즈(David Mease)가 공동 저술한 연구 논문의 내용은, 어느 콘텐츠가 검색한 해당 유저의 요구를 채울 때까지 어느 정도의 시간이 걸리고 있는지를 분석합니다.

그리고 알고리즘의 일부를 변경해 어느 쪽이 더 빨리 만족하는 결과에 이르는지를 테스트한다는 것입니다.

 

216. 동일한 /24 IP로부터의 링크 (클래스 C 일치) (70%)

 

- 동일한 클래스 C IP로부터의 링크가 나쁘다는 이야기를 들은 적이 있을지도 모릅니다만, 현재의 인터넷이라는 것이 등급 체계에 의존하는 것이 아니기에, 기술적으로 말해 옳은 것은 아닙니다.

Krishna Bharat는 힐탑 연구에서 [만약 두 호스트가 동일하다면, 그 두 가지는 IP 주소의 첫 3개인 8비트 대를 공유하고 있을 것]이라고 말합니다. 이런 호스트 네임은 각각의 [experts]로 취급하지 않고, 평가 감소 대상이 됩니다.

맷 커츠는 [몇몇 제휴 사이트에서의 상호 링크 정도면 페널티 대상이 되지 않는다]고 했지만, 그 이상이 되면 페널티 소지가 있습니다.

 

링크 패턴에 관한 요인

 

217. 과도한 사이트 간 링크 구축 (100%)

 

- 여러 사이트를 운영하고 있을 경우, 링크 권위를 늘리기 위해 쓸데없이 서로 링크를 구축하는 것은 지양해야 합니다. 상호링크 도메인 수가 늘어남과 동시에 리스크도 증가합니다.

주인이 동일한 사이트는 도메인 등록자나 IP, 콘텐츠 유사성, 디자인 유사성 등에서 구글에 탐지되며, 거의 발생하지는 않으나 페널티를 일으키기도 합니다.

다만, 해당 행위를 통해 오히려 유저의 편리성을 향상시키는 경우에는 해당되지 않습니다.

 

218. 신선한 앵커 텍스트 (80%)

 

- 연결에 사용되는 앵커 텍스트, 특히 다른 사이트에서 변경되는 것으로 보이는 앵커 텍스트의 기간은 중대한 문제를 나타낼 수 있습니다.

왜냐하면, 이러한 링크는 순위를 조작하기 위해 붙여진 것으로 보이기 때문입니다.

 

219. 부자연스러운 앵커 비율 (80%)

 

- 어느 정도이긴 하지만, 링크의 앵커 텍스트는 페이지 주제와의 연관성을 만들어 냅니다. 다른 SEO 전략과 같이, 선을 넘으면 페널티 대상이 됩니다.

특정 앵커에 대한 경계치는 단순하게 10%로 설정되어 있는 것 같으며, 이것은 펭귄 업데이트의 기능입니다.

 

220. 부자연스러운 다양한 링크 사이트 (70%)

 

- Google이 사이트의 자연스러움을 주시하고 있고, 해당 사이트의 동일 앵커에서 10%의 비율을 넘겨서 펭귄 업데이트에 의해 심하게 페널티를 받고 있다는 여러 조사 결과를 받아들일 수 있다고 칩시다.

그렇다면, 어떤 종류의 외부 요인에 대한 부자연스러움도 네거티브 요인이 될 수 있다고 생각할 수 있지 않을까요?

이것을 보여주는 사례 연구법은 아직 발표되지 않았지만, 잘 짜여진 SEO 전략이 때로는 지나치게 욕심을 부려서 선을 넘어 페널티를 받는 장면을 여러 차례 목격했습니다.

 

221. 웹 스팸 디지털 흔적 (70%)

 

- [디지털 흔적(Digital footprint)]이란, 정말로 어떤 사소한 것이라도 될 수 있고 동일 소스가 일으킨 불법적인 행동이라고 Google이 판단한다면, 그 결과는 페널티로 연결 될 것입니다.

그것은 포럼의 유저네임이나 사람의 이름, 사진, 기고자명, 프라이빗 블로그와 관련이 있는 워드프레스 테마, 기타 어떤 사소한 것이라도 웹 스팸 행위를 일으키려 한 것과 관계가 있으면 그만입니다.

물론, 기본적으로 디지털 흔적 그 자체가 나쁜 것은 절대 아니지만, 단지 사이트에 약간의 Google 웹마스터 가이드라인을 위반하는 듯한 징후가 보이면, 흔적은 페널티를 불러일으키는 원인이 될 수 있습니다.

 

222. 어필리에이트 피링크 (20%)

 

- 우선 말해 두고 싶은 것은, 어필리에이트 링크(제휴사이트 링크)라고 하는 것은 대개 301 리디렉션이나, 매개변수 부여에 의한 중복 컨텐츠에 대한 평가가 되므로, 페이지 랭크 주고 받기에 영향이 있는 것 입니다.

어필리에이트 링크는 고의성 여부와 관계없이, 유료 링크 페널티가 존재하는 것과 같은 이유로 가치가 떨어질 가능성이 있다고 여겨집니다.

맷 커츠는 [유료 링크 페널티를 걱정한다면, 어필리에이트 發 링크에 nofollow를 붙이도록 권장하고 있지만, 대체로 문제없다] 고 덧붙였습니다.

 

223. 푸터(하단) 링크 (80%)

 

- 우선 분명히 해두어야 할 것은, 푸터에 채운 링크는 콘텐츠 부분에 설치한 링크와 비교하면 같은 가치를 주고받는 것이 아닙니다.

해당 컨셉은 페이지 레이아웃·알고리즘이 작용하는 것과 같은 구조로 구성되어 있지만, 푸터 부분의 링크는 처음 상단보다 아래에 설치된 컨텐츠보다 훨씬 나쁜 취급을 받는 것 같습니다.

게다가 푸터 쪽 링크에 대해 Google은 몇 번이나 주의를 하고 있기 때문입니다.

 

224. 헤더·사이드바 링크 (70%)

 

- 푸터 링크와 같이, Google은 헤더 부분이나 사이드바의 링크를 특정할 수 있습니다(그것이 고정인가 변동인가, 와이드인가 아닌가는 관련없음).

이들은 이것을 특허 내에서 [상용구 코드(boilerplate)]라고 정의하고 있으며, 특허에는 다음과 같이 기술되어 있습니다.

[어떤 콘텐츠가 상용구 코드가 삭제된 뒤 색인 되었다면 그 결과, 부여되는 무게는 더 정확해질 것이다. 왜냐하면, 그것이 상대적으로 상용구 코드가 아닌 것에 의존하는 비중이 높아지기 때문이다]

 

225. 작성자(저자) 소개 링크 (70%)

 

- 언제라도 링크 빌딩의 수법이 너무 간단하게 되버리면, Google은 금방 간파하여 해당 수법의 가치를 내려버립니다. 물론, 그렇다고 없어지지는 않겠지만요.

다만, 2010년 유행했던 게스트 투고 작전은 2005년 유행했던 기사 마케팅과 거의 비슷한데 수가 너무 많은 것 같았고, 결과적으로 기사 페이지의 가치가 떨어지면서 링크 장소는 블로그의 작성자 소개 페이지로 넘어갔습니다.

이것은 같은 인간을 대상으로 행하고 있는 게스트 투고, 예를 들면 뉴욕 타임스의 사설이나 정말로 가치가 있는 미디어 배치 등이지만, 행하고 있는 브랜드는 처벌받지 않는다는 것과는 대칭적입니다.

 

226. 문맥 없는 링크 비율 (50%)

 

- 만약 콘텐츠 주위에 문맥 없는 링크가 많이 있으며, 그것이 어느 일정량을 넘어서면 웹 스팸의 흔적으로 간주되지는 않을까? 해당 가설은 아래의 3가지 아이디어를 바탕으로 추측되고 있습니다.

하나는 구글 특허의 [참조 문맥 기준의 순위 결정] 이라고 하는 것으로, 링크 주위의 문맥이 품질 조사에 도움이 된다는 내용입니다.

두 번째는 맷 커츠가 자주 말하는 [웹 스팸 흔적]에 대한 논의이며, 마지막이 [어느 정도의 문맥도 없는 링크는 자연스럽지 않다] 는 사실입니다.

 

227. 급격한 링크 증가 (70%)

 

- Google의 특허를 인용하면.. [백링크의 급격한 증가는, 검색 엔진에 문서 스코어 결정의 요인으로서 이용될지도 모르나 또한, 검색 엔진에 대해 스팸 신호로서 취급될지도 모른다]

급격한 백링크의 발생은 웹 스팸 필터에 의한 보다 정밀한 조사를 부르게 될지도 모르지만, 만약에 인위적인 링크 조작이 아닌 정말로 자연스러운 확산이나 바이럴의 발생은 오히려 환영입니다.

 

228. 급격한 링크 감소 (80%)

 

- 급격한 링크 증가와 거의 같은 이유로 급격히 감소한 경우도 정밀 조사 대상이 될 수 있으며, 급격한 링크 감소는 논리적으로 생각하면 문제입니다.

왜냐하면 대부분의 경우, 웹 스팸은 기한이 지나면 링크를 한꺼번에 떼어버리기 때문이며, 덤으로 Google이 좋아하는 타입의 링크는 계속 안정적으로 달려있는 링크입니다.

 

229. 전혀 관계없는 사이트로부터 링크 (20%)

 

- 힐탑 알고리즘 이후, Google은 관련 있는 사이트로부터의 링크에 보너스를 주고 있습니다. 그 결과, 무관한 사이트로부터 링크는 본질적으로 위험하다는 SEO 미신과 수많은 위험한 [링크 해제] 서비스가 생겨나고 있습니다.

확실히, 관계없는 사이트로부터의 너무 많은 링크는 부자연스러운 흔적이 되기도 하지만, 반대로 관계있는 사이트로부터의 링크 밖에 없는 것 역시 부자연스럽기 짝이 없습니다.

 

230. 부정적인 페이지 링크 속도 (70%)

 

- Google의 특허에는 [문서(혹은 페이지) 로의 링크 증가·감소 누적 비율을 분석함으로써, 검색 엔진은 과연 그 문장이 얼마나 신선한 것인가를 평가하는 신호를 부여할 수 있을지도 모른다] 라는 기술이 있습니다.

이에 따르면, 피링크가 감소 비율에 있다면 피해를 줄 수 있다는 것입니다. 특히(그것으로 한정할 필요는 없지만) 검색 쿼리가 QDF에 관련되어 있을 때는 더욱 그렇습니다.

 

231. 부정적인 도메인 링크 속도 (50%)

 

- 사이트의 피링크들이 장기적으로 봤을 때, 부자연스럽거나 링크 획득 수보다 잃은 수가 더 많다면 무엇이 잘못됐다고 생각하지 않을까요? 상기한 요소들과 같지만, 도메인 단위에서도 적응할 법 합니다.

 

232. 페널티 받은 사이트로부터 링크 (80%)

 

- 구글은 오래 전부터 [나쁜 이웃]이라는 표현을 사용하여 페널티 발생 가능성이 높은 사이트들의 상호관계를 표현했습니다.

사이트에서 이미 어떤 이유로든 벌점을 받은 링크를 받는 경우, 해당 링크를 통해 사이트에 대한 추가 조사를 수행할 수 있으며 이러한 유형의 활동이 사이트에 대한 페널티를 가져올 수도 있습니다.

 

233. 선정된 콘텍스트가 없다 (5%)

 

- 맷 커츠는 모든 링크가 아웃바운드 링크가 되기 전, 신중하게 선정돼야 한다고 말합니다.

그러나, 모든 링크가 선정된 콘텍스트 안에 설치되어야 한다고는 말하지 않았습니다. 즉, 본문이나 콘텐츠 안에 반드시 설치할 필요는 없다는 것입니다.

 

스킴(Scheme) 관련 요인

 

234. 유료 링크 계획 (100%)

 

- 페이지 랭크를 주고받는 것을 목적으로 사이트 오너로부터 직접 링크를 구매해선 안 됩니다.

이것은 [FTC(연방 거래 위원회)의 유료 서명 거래에 관한 가이드 라인에 직접 영향을 받은 것]이라고 맷 커츠는 말했습니다.

바꿔 말하면, 백링크는 서명 같은 것으로 진짜 서명은 대가 없이 자연스럽게 발생해야 하는 것입니다.

 

235. 댓글 스팸 (70%)

 

- 만약 반복이나 부자연스러운 포맷에서의 댓글 스팸 등을 행하고 있다면, 그러한 링크는 평가감소나 페널티를 받을 것입니다.

특히, 댓글이 자동생성으로 이상한 앵커 텍스트, 아예 콘텐츠와 무관하거나 반복적으로 콘텐츠의 흔적을 남긴다면 최악입니다.

그렇기에 반대로, 제대로 된 코멘트는 오히려 권장되는 것으로 그럴 경우에는 오히려 본명을 이용하라고 맷 커츠는 권하고 있습니다.

 

236. 포럼 투고 스팸 (70%)

 

- 사람과 사람과의 커뮤니케이션을 목적으로 하고 있는 한, 포럼 투고는 전혀 문제가 없고 오히려 인바운드 마케팅의 좋은 수단이기도 합니다.

존 뮬러가 인정한 바에 의하면, Google은 포럼 투고 스팸을 시스템으로 감시하고 있다고 합니다.

 

237. 기사 광고 (네이티브 광고) (80%)

 

- 네이티브 광고로 알려진 기사 광고는 Google 스팸팀에 시스템적으로 발견되어 유료 링크로 간주될 것으로 보입니다.

광고 내의 링크는 그것임을 알 수 있도록 표기해야 하며, 페널티의 리스크를 없애기 위해 rel="nofollow"를 기재해야 합니다. 아마도 이것이 본래 nofollow가 존재하는 이유일 것입니다.

덧붙여서, 표기가 없는 네이티브 광고는 Google 뉴스로부터의 삭제 대상이기도 합니다.

 

238. 포럼 서명과 프로필 링크 (70%)

 

- Google은 보통의 본문과 같은 취급을 받아 페이지 랭크를 주고 받는 자연스러운 디스커션 내의 링크와 포럼 서명내의 링크를 구별할 수 있는 것 같습니다.

같은 것으로, 포럼의 프로필을 작성한다는 웹 스팸도 인기로 두 전술은 모두 궁극적으로 약간의 효과를 거두겠으나, 결국 페널티에 접근하는 것에 불과할 것입니다.

 

239. 워드프레스 스폰서 테마 (70%)

 

- 사이트 와이드의 푸터 링크에 가치가 낮다고 하는 이야기에 덧붙여 말한다면, 백링크를 워드프레스 테마의 푸터 부분에 넣는다고 하는 SEO 수법은, Google의 웹 스팸 팀에 완전하게 걸린 상태입니다.

예전에는 효과가 있었지만, 지금은 거의 의미가 없으며 이러한 수법은 스팸의 흔적을 완전히 남겨 버려, Google 웹마스터 가이드 라인에서 금지되어 있는 위젯의 예와 같은 것이기 때문입니다.

 

240. 위젯 링크 (70%)

 

- 위젯이 사용자에게 도움이 됐을 때는 이렇게 재미있는 링크 획득 전술은 없었습니다. 하지만 링크가 진짜 서명으로 취급되는 현재에는 낯설어 보입니다.

물론, 2015년 기준으로 위젯 배포를 하는 것은 나쁜 일이 아니지만, Google은 'nofollow'를 붙일 것과 앵커 텍스트를 포함하지 말 것을 요구하고 있습니다. Google의 요구를 따르지 않으면, 큰 코 다칠 것입니다.

 

241. 링크 휠 (80%)

 

- 래리 페이지의 페이지 랭크에 대한 논문을 읽은 적이 있다면, 같은 사이트에 몇번이나 페이지 랭크를 주고 받는 것을 목적으로, 사이트끼리를 삼각이나 원형상으로 링크 시키는 것을 생각해 냈던 적이 있을 것입니다.

단계적인 것이지만, 페이지 랭크의 감쇠는 일어날 수 있습니다. 만약 지금이 아직 2005년이라면 그 수법은 매우 효과적이고 생각해 낸 자신을 칭찬해 주고 싶을 것입니다.

다만, 2015년 기준으로 링크 휠(Link Wheel)에 휘말렸다면 극심한 평가절감이나 페널티 가능성을 각오하는 게 좋습니다.

 

242. 기사 디렉토리 (70%)

 

- Google은 판다 업데이트를 이용해 도메인 전체에서의 컨텐츠 스코어를 벌했습니다.

 

펭귄 업데이트로 부자연스러운 링크 패턴을 벌해왔지만, 과연 거기에 덧붙여 한층 더 기사 디렉토리(Article directory)까지 벌할 필요가 있는지는 수수께끼입니다.

그러나 2014년에 맷 커츠가 투고한 동영상을 보는 한, 기사 디렉토리는 일단 문제로 삼고 있는 것 같고, 그러한 수법을 사용하고 있다면 길게 볼때 문제가 될지도 모릅니다.

 

243. 이름없는 웹 디렉토리 (70%)

 

- 무명의 웹 디렉토리는 낡은 링크 구축 수단 중 하나입니다. [신중한 선정이 없는 웹 디렉토리를 이용하면, 유료 링크와 같은 페널티가 된다]고 맷 커츠도 말하고 있습니다.

그는 [예를 들어 Yahoo! 디렉토리라면 문제없다]고 말합니다. 그것이 유료 무료에 관계없이 신중한 선정이 이루어져 있으면 괜찮고, 그렇지 않은 [누구나 OK] 같은 것이라면 안 된다는 것인 것 같습니다.

 

244. 상호 링크 (80%)

 

- Google은 상호 링크에 관해, 외부 링크를 너무 붙인 것에 의한 [페이지 랭크 유실]의 영향 이상으로, 평가가 저하되는 경향인 것 같습니다.

꽤나 초기 링크 빌딩 수법이었던 상호 링크(Reciprocal Links)의 지나친 행동은, 해당 링크가 자연스럽지 않다고 광고 하는 것과 같습니다.

 

245. 사설망 (80%)

 

- SEO 전용 사이트의 대규모 개인 네트워크(사설망)에 관여 하는 것처럼, 자체 사이트를 교차 연결하면 페널티를 받을 수 있습니다.

Google은 웹 스팸 설치 공간을 분석하는 수많은 자동화된 방법을 통해 수동 작업으로 전체 네트워크를 파괴하는 등, 이러한 사이트에 대해 매우 공격적으로 대응하고 있습니다.

2015년에도 이러한 방법은 여전히 단기 블랙햇 체계로 널리 퍼져 있었지만, 길게 내다보면 모든 사설망이 처리되는 것으로 보입니다.

 

247. 링크 빌딩 (5%)

 

- 아직도 없어지지 않는 미신 중 하나가, 링크 빌딩이 나쁘다는 것입니다.

맷 커츠는 처음부터 줄곧, 링크 빌딩의 어드바이스를 하고 있었고 링크 빌딩은 전통적인 마케팅이 Web에 적용된 형태에 지나지 않습니다.

링크 빌딩이 Google의 규약에 반하는 것은, 수법이 검색 엔진 대책에 집중했을 경우에 불과합니다. 단지 마케팅일 뿐 입니다.

 

248. 링크 빌딩 서비스 (5%)

 

- 링크추적 서비스에 돈을 내는 것은 유료링크에 손을 대는 것과는 다릅니다. 물론 그러한 서비스는 뚜껑을 열어 보면, 어딘가의 누군가를 시켜 페이지 랭크를 건네줄 목적으로 링크를 사는 것이라면 이야기는 다르겠지만.

안전한 링크빌딩 전략은 일종의 홍보 서비스 같은 것입니다. 반드시 게재가 보증되지 않지만, 얻는 것이 큽니다.

 

249. 마이크로 사이트 (미니 사이트) (5%)

 

- 마이크로 사이트 경유로 페널티가 온다는 이야기를 들어본 적이 있을지도 모릅니다. 맷 커츠가 마이크로 사이트에 대한 Google의 견해를 가르쳐 주었습니다.

Google은 특별히 이러한 사이트를 감시하는 것도, 패널티를 주는 것도 아닙니다.

다만, 장기적인 전략으로 볼 때 그다지 효과적인 전략이라고 보기는 어렵고, EMD의 효과가 거의 고려되지 않았기 때문에 이를 겨냥해 마이크로 사이트를 만들 이유도 없어졌습니다.

 

250. 부정한 클릭 조작 (70%)

 

- 만일 클릭률이 긍정적인 랭킹요인으로 이용되고 있다면, 각각의 스팸대책이 필요하다는 것도 알 수 있을 것입니다.

Twitter를 사용한 클릭률 실험에서는, 많이 클릭한 페이지가 6위에서 1위까지 상승했으나, 그 후 12위까지 하락했다가 원래 순위인 6위로 돌아왔습니다. 이는 불과 며칠 사이에 벌어진 일입니다.

 

251. 부정한 브랜드 검색 조작 (50%)

 

- 만약, 특허가 제시한 대로 브랜드 검색이 랭킹 요인이라고 한다면 여기에도 스팸 대책을 세울 필요가 있을 것입니다. 그렇지 않으면, 해당 요인으로 스팸 판정을 당하는 것도 매우 간단하겠죠?

 

기타 간섭 가능성 요인

 

252. 구글 댄스 (70%)

 

- 이 용어는 Google의 연간 500개 알고리즘 업데이트에 수반되는 일시적인 개편을 설명합니다.

엄밀히 말하면, 이러한 효과는 긍정적일 수도 부정적일 수도 있습니다. 왜냐하면 그것은 순위를 재조정하는 것일 뿐이고, 누군가는 다른 사람을 내리기 위해 치고 올라가야 하기 때문입니다.

하지만, 구글 댄스(Google Dance)는 항상 예상치 못한 것이기 때문에 그것을 부정적으로 분류하고 있습니다.

 

253. 수동 대응 (100%)

 

- 다양한 랭킹 요인을 이용하고 있는 것은 차치하고, Google은 아직도 때때로이지만, 문제 해소로부터 회복할 때까지 반년에서 1년 정도 수동 대응을 실시하고 있습니다.

이러한 수동 대응은 통상, 서치 콘솔에서 확인할 수 있습니다.

 

254. 링크 거부 (80%)

 

- 2012년에 Google은 피링크를 완전히 무시해 달라고 신청하기 위한 툴을 웹마스터 툴에 추가했습니다. 정식 명칭은 [내 사이트로 연결되는 링크 거부하기] 입니다.

해당 툴의 영향은 영구적이고 불가역적이며, 그 때문에 올바르게 이용하지 않으면 브랜드가 시간을 들여 기른 검색 평가에 엄청난 손상을 주게 됩니다.

이것은 수동 대응에 대한 최후의 수단 또는, 과거에 실시한 링크 스팸을 없었던 것으로 하기 위해서만 사용해야 합니다.

 

255. 크롤링 속도 변경 (100%)

 

- 서치 콘솔을 이용하면, Google을 통한 사이트 크롤링 속도를 변경할 수 있습니다. 속도를 높일 수는 없지만, 크롤링 속도를 늦추거나 제로로 만들 수는 있습니다.

이것은 색인에 영향을 주기 때문에, 당연히 순위에도 영향을 미치게 됩니다. 특히 QDF가 관여할 경우에는 더욱 그렇습니다.

 

256. 국제 타겟팅 툴 (50%)

 

 

- 서치 콘솔은 국제 타켓팅을 올바르게 설정하지 못했을 때를 위한 툴을 준비하고 있습니다.

만약 이 툴이 타겟으로 삼는 지역 전부를 포함하지 않는 상태에서, 검색결과에 대한 표시지역을 한정해 버린다면 문제가 될지도 모릅니다.

 

257. 법적인 삭제 요청 (80%)

 

- 구글은 위법한 콘텐츠를 싣고 있는 사이트를 유저가 발견했을 때, 법적인 삭제 요청을 하기 위한 폼을 준비하고 있습니다. 이것은 어떤 콘텐츠든, Google로부터 삭제될 가능성이 있는 것입니다.

물론, 그렇다고 해서 구글이 해당 요청을 의미없이 받아 들일 리 없다고 믿고 있으며, 누구라도 쓸데없이 이러한 요청을 하지 않길 바랄 뿐입니다.

 

258. DMCA 리포트 (80%)

 

- 콘텐츠의 도용과 출처 미기재 콘텐츠 유용, 저작권 위반 등의 자동검출에 더해 Google은 이용자가 그러한 콘텐츠를 발견하는 대로 DMCA 리포트를 Google에 제출하도록 권장하고 있습니다.

이것에 의해, 미국의 DMCA 프로세스가 시동되어 인정하는 대로 Google은 하는 수 없이(?) 해당 콘텐츠를 도메인에서 삭제하기 위해 움직입니다.

 


  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기