티스토리 뷰

반응형

구글 검색엔진 최적화 유출의 진실

 난 꼭 이 정보가 유출되길 기대하고 있었습니다. 왜냐하면 새롭게 만든 도메인과 블로그가 정말 얼마간 검색엔진의 선택을 받지 못했기 때문입니다. 그리고 그 이후로 정말 어느 하나의 블로그에 마음을 쏟는 것 보다, 기계적으로 많은 도메인과 블로그를 만드는 것이 낫겠다고 느꼈습니다. 그리고 며칠 전 유출된 이 문서는 나의 심증을 확신으로 만들어 주었습니다. 일단 먼저 공개된 문서의 주소는 다음과 같습니다.

구글 검색엔진의 유출된 세부 정보는 다음 HEXDOCS에 공개 되었다.

요약하자면, 구글은 그동안 수집하지 않는다고 말했던 사용자의 선택, 체류 시간 등을 참고 자료로 사용하고 있었다. 그리고 구글은 그동안 참고하지 않는다고 말했던 도메인의 나이(언제 도메인을 생성했는지)를 실제로는 참고하고 있었다. 즉, 구글이 검색엔진에서 일종의 불이익을 주는 유예기간은 대략 6개월로 추정되고 있었다. 사람들이 내심 믿고 있었던 샌드박스가 결국 사실이었다.

 

  최근 익명의 소스로부터 구글의 검색 API 문서가 대량으로 유출되었다는 소식이 전해졌습니다. 이 문서들은 전직 구글 직원들에 의해 신뢰성이 확인되었고, 몇몇 전직 구글 직원들과의 대화로 추가 정보도 포함되어 있습니다. 이번 유출은 구글의 검색 순위 알고리즘과 관련된 중요한 정보를 담고 있어 큰 주목을 받고 있습니다.



이제 낭만 있는 블로거의 시대는 끝났다.
이제 낭만 있는 블로거의 시대는 끝났다.

 

 

클릭 기반 사용자 신호

 구글은 클릭 기반 사용자 신호를 사용하지 않는다고 반복적으로 부인해왔습니다. 그러나 유출된 문서들은 구글이 실제로 이러한 신호를 활용하고 있음을 시사합니다. 특히, 구글은 클릭스트림 데이터를 분석하여 검색 결과를 평가하는 데 활용하는 것으로 보입니다.

서브도메인(2차 도메인, 하위 도메인) 평가 및 새로운 웹사이트 샌드박스

 구글은 서브도메인을 별도로 평가하지 않으며, 새로운 웹사이트에 대한 샌드박스가 없고, 도메인 연령을 고려하지 않는다고 주장해왔습니다. 그러나 유출된 문서들은 이러한 주장을 반박하며, 구글이 실제로 서브도메인과 도메인 연령을 고려하고 있음을 보여줍니다.

NavBoost 시스템

 유출된 문서에 따르면, 구글 검색팀은 초기부터 검색 결과 품질을 향상시키기 위해 많은 웹 사용자의 클릭스트림 데이터를 필요로 했습니다. 특히 NavBoost 시스템은 구글 툴바 페이지랭크에서 데이터를 수집하고, 더 많은 클릭스트림 데이터를 얻기 위해 Chrome 브라우저를 개발하게 된 주요 동기였다고 합니다. NavBoost는 특정 키워드에 대한 검색 수, 검색 결과 클릭 수, 짧은 클릭과 긴 클릭을 분석하여 사용자 의도를 평가합니다.

클릭 데이터 활용

 구글은 쿠키 기록, 로그인된 Chrome 데이터, 패턴 감지 등을 사용하여 수동 및 자동 클릭 스팸을 방지하고, 사용자의 클릭 및 참여도를 분석하여 검색 결과에 반영합니다. 이 데이터는 사이트의 전체 품질을 평가하는 데 사용되며, 이를 기반으로 순위가 상승하거나 강등될 수 있습니다.

코로나19 및 선거 관련 화이트리스트

 유출된 문서에 따르면, 구글은 코로나19 및 선거 관련 검색 결과에 특정 사이트를 우선적으로 표시하는 화이트리스트를 적용하고 있습니다. 이는 특정 도메인을 우선적으로 표시하는 것을 통해 사용자에게 중요한 정보를 빠르게 제공하려는 의도로 보입니다.

문서의 신뢰성 검증

 유출된 문서의 신뢰성은 전 구글 직원 세 명 중 두 명과 기술 SEO 전문가 Mike King에 의해 확인되었습니다. 이 문서들은 Google/DOJ 사건에서 밝혀진 정보와 일부 겹치지만, 대부분은 새로운 내용입니다.

 

 

 

주요 발견 사항

  1. NavBoost와 클릭 데이터 활용: 구글은 클릭 데이터를 필터링하여 랭킹 시스템에 반영합니다. 클릭 길이와 노출 횟수를 측정하여 검색 결과의 순위를 결정합니다.
  2. Chrome 브라우저 클릭스트림 활용: 구글은 Chrome 브라우저의 클릭 데이터를 사용하여 Sitelinks를 결정합니다.
  3. 여행, 코로나, 정치 관련 화이트리스트: 구글은 특정 도메인을 우선적으로 표시합니다.
  4. 품질 평가자 피드백 활용: 품질 평가자의 평가가 검색 시스템에 직접적으로 사용될 가능성이 있습니다.
  5. 링크 랭킹 가중치 결정에 클릭 데이터 사용: 구글은 클릭 데이터를 사용하여 링크 인덱스를 분류합니다.

 

마케터를 위한 주요 시사점

  1. 브랜드 중요성: 구글은 큰 브랜드를 우선적으로 랭킹에 반영합니다.
  2. E-E-A-T 요소의 중요성 감소: 일부 SEO가 강조하는 경험, 전문성, 권위, 신뢰성 요소가 직접적으로 랭킹에 반영되지 않을 가능성이 있습니다.
  3. 사용자 의도와 클릭 패턴의 중요성: 사용자 의도와 클릭 패턴이 콘텐츠와 링크보다 더 중요한 랭킹 요소입니다.
  4. 전통적인 랭킹 요소의 중요성 감소: 페이지랭크, 앵커 텍스트 등 전통적인 랭킹 요소의 중요성이 감소하고 있습니다.
  5. SEO의 어려움: 중소기업과 새 창작자/퍼블리셔에게 SEO는 큰 브랜드와 경쟁하기가 더 어려워지고 있습니다.

 

신생 도메인은 처참한 유입을 견뎌내야 한다.
신생 도메인은 처참한 유입을 견뎌내야 한다.


블로거, 웹 사이트 관리자, 소규모 콘텐츠 창작자로서의 대처 방법

  1. 사용자 경험 최적화: 클릭 패턴과 사용자 의도가 중요해진 만큼, 사용자 경험을 최적화하는 것이 필수적입니다. 웹사이트의 로딩 속도를 개선하고, 유용한 콘텐츠를 제공하여 사용자가 사이트에 오래 머무르게 해야 합니다.
  2. 브랜드 인지도 향상: 큰 브랜드가 우선적으로 랭킹에 반영되는 경향이 있으므로, 브랜드 인지도를 높이기 위한 마케팅 전략을 강화해야 합니다.
  3. SEO 전략 재검토: 전통적인 SEO 요소보다는 사용자 의도와 클릭 데이터를 반영한 새로운 SEO 전략을 수립해야 합니다. 구글의 최신 알고리즘 변화에 맞춰 지속적으로 SEO 전략을 업데이트해야 합니다.
  4. 품질 높은 콘텐츠 제공: 클릭 데이터와 사용자 참여도가 중요해진 만큼, 품질 높은 콘텐츠를 제공하여 사용자 만족도를 높이는 것이 중요합니다. 이를 통해 자연스럽게 검색 순위를 올릴 수 있습니다.
  5. 데이터 분석 활용: 웹사이트의 클릭 데이터와 사용자 행동을 분석하여 이를 기반으로 검색 엔진 최적화 전략을 세우는 것이 필요합니다. Google Analytics 등의 도구를 활용해 데이터를 분석하고, 이를 바탕으로 웹사이트를 개선해야 합니다.

 

 이번 구글 검색 API 문서 유출 사건은 검색 엔진 최적화(SEO)와 디지털 마케팅에 큰 변화를 가져올 것으로 보입니다. 최근 티스토리 사태, 네이버와 구글의 검색 알고리즘 변경, AI의 급속한 발전으로 인해 블로그 환경이 녹록치 않은 것이 사실입니다. 소규모 창작자 입장에서는 대기업에서의 조그마한 변화도 크게 느껴지기 마련입니다. 네이버와 구글의 스니펫 공략처럼 소수의 사람만이 살아남고 나머지 소규모 창작자는 더 도태될 것이 확실합니다. 자기가 자신있는 분야 한 두가지에 집중하더라도 쉽지 않은 것이 현실입니다. 유튜브로 진출하고 블로그는 시작하지 않거나, 블로그를 시작한다면 물량 공세를 하거나 특수한 전략으로 접근해야 할 것입니다. 물론 제일 중요한 것은 방문자가 내가 창작한 컨텐츠를 보고 오래 체류할 만 해야 한다.

 

 

 

 

반응형
댓글
공지사항