Pages

Friday, September 20, 2013

Các yếu tố xếp hạng trên công cụ tìm kiếm 2013

Hôm qua tại MozCon , tôi đã trình bày các kết quả từ Moz của Ranking yếu tố nghiên cứu năm 2013 . Trong bài này tôi sẽ làm nổi bật các đồ ăn tay cầm chìa khóa , và chúng tôi sẽ làm theo nó với một báo cáo đầy đủ và tập dữ liệu đôi khi cuối mùa hè này .

Tổng quan


Mỗi hai năm, Moz chạy một yếu tố nghiên cứu xếp hạng để xác định các thuộc tính của các trang và các trang web có liên kết mạnh với xếp hạng cao trong Google . Nghiên cứu này bao gồm hai phần : một cuộc khảo sát của SEO chuyên nghiệp và nghiên cứu mối tương quan lớn .

Chúng tôi sẽ đi sâu vào dữ liệu trong một phút, nhưng một số kết quả quan trọng bao gồm:

    Trang Cơ quan tương quan cao hơn so với bất kỳ số liệu khác mà chúng tôi đo .
    Tín hiệu xã hội , đặc biệt là Google +1 s và cổ phiếu Facebook liên quan chặt chẽ .
    Mặc dù chim cánh cụt , tương quan neo văn bản vẫn là mạnh mẽ hơn bao giờ hết .
    Mối tương quan mới được đo schema.org và sử dụng dữ liệu có cấu trúc.
    Nhiều dữ liệu được thu thập trên các liên kết bên ngoài , từ khóa, và các lĩnh vực hợp chính xác.

Khảo sát


Cyrus Shepard và Matt Brown tổ chức cuộc khảo sát năm nay của 120 SEO. Trong vài tuần tới , chúng tôi sẽ phát hành số liệu điều tra đầy đủ . Cho bây giờ , cảm ơn tất cả những người tham gia ! Điều này sẽ không thể thực hiện được mà không cần sự giúp đỡ của bạn , và chúng tôi đánh giá cao thời gian và công sức bạn bỏ ra để trả lời các câu hỏi.

Cuộc khảo sát được hỏi trả lời để đánh giá nhiều yếu tố khác nhau trên thang điểm từ 1-10 theo tầm quan trọng của họ nghĩ rằng họ là trong thuật toán xếp hạng của Google. Chúng tôi trình bày Điểm số trung bình trên tất cả các câu trả lời. Các yếu tố đánh giá cao nhất trong cuộc khảo sát của chúng tôi có điểm số trung bình 7-8 với các yếu tố không quan trọng thường từ 4-6.

Tương quan


Để tính toán các mối tương quan , chúng tôi theo các quá trình tương tự như trong năm 2011. Chúng tôi bắt đầu với một tập lớn các từ khóa từ Google AdWords ( 14.000 + năm nay ) kéo dài một loạt các khối lượng tìm kiếm trên tất cả các loại chủ đề . Sau đó , chúng tôi thu thập trong 50 kết quả tìm kiếm hàng đầu từ Google -Mỹ một cách phi cá thể hóa . Tất cả các SERPs được thu thập vào đầu tháng Sáu , sau khi cập nhật 2.0 Penguin .

Đối với mỗi kết quả tìm kiếm , chúng tôi chiết xuất tất cả các yếu tố chúng tôi muốn phân tích và cuối cùng là tính toán các tương quan Spearman trung bình trên toàn bộ tập dữ liệu. Ngoại trừ một số chi tiết mà tôi sẽ thảo luận dưới đây , đây là quá trình chung cùng rằng cả hai Searchmetrics và Netmark gần đây được sử dụng trong nghiên cứu xuất sắc của họ . Jerry Feng và Mike O'Leary trong nhóm khoa học dữ liệu ở Moz làm việc chăm chỉ để trích xuất nhiều các tính năng này ( cảm ơn bạn! )

Khi giải thích các kết quả tương quan , điều quan trọng là phải nhớ rằng sự tương quan không chứng minh quan hệ nhân quả .
Rand có một bài đăng blog đẹp giải thích tầm quan trọng của kiểu phân tích này và làm thế nào để giải thích những nghiên cứu này . Như chúng tôi xem xét các kết quả dưới đây, tôi sẽ gọi ra những nơi có mối tương quan cao mà có thể không chỉ ra nguyên nhân .

Đủ về phương pháp nhàm chán, tôi muốn các dữ liệu !


Đây là tập đầu tiên , Mozscape liên kết tương quan :

Mối tương quan : mức độ trang
Mối tương quan : mức miền


Trang Authority là một mô hình học máy bên trong chỉ số Mozscape của chúng tôi có thể dự đoán khả năng xếp hạng từ các liên kết và nó là yếu tố tương quan cao nhất trong nghiên cứu của chúng tôi . Như trong năm 2011 , số liệu mà nắm bắt sự đa dạng của các nguồn liên kết ( C - khối, các khu công nghiệp , lĩnh vực ) cũng có mối tương quan cao . Tại tên miền cấp / sub-domain , tương quan miền phụ là lớn hơn sau đó mối tương quan miền .

Trong cuộc khảo sát , SEO cũng nghĩ rằng liên kết là rất quan trọng :

Khảo sát: Liên kết

Anchor text

Trong hai năm qua, chúng tôi đã nhìn thấy Google trấn áp quá tối ưu dành cho neo văn bản . Mặc dù vậy, mối tương quan neo văn bản cho phù hợp với cả hai phần và chính xác cũng khá lớn trong bộ dữ liệu của chúng tôi :


Điều thú vị là SEO được khảo sát cho rằng một phân phối văn bản neo hữu cơ ( một kết hợp tốt của nhãn hiệu và không thương hiệu ) là quan trọng hơn thì số lượng các liên kết :


Các mối tương quan neo văn bản là một trong những sự khác biệt quan trọng nhất giữa các kết quả của chúng tôi và nghiên cứu Searchmetrics . Chúng tôi không biết chính xác lý do tại sao đây là trường hợp , nhưng nghi ngờ đó là vì chúng tôi bao gồm các truy vấn định hướng trong khi Searchmetrics loại bỏ chúng từ dữ liệu của nó . Nhiều truy vấn định hướng mang nhãn hiệu , và hữu cơ sẽ có rất nhiều neo văn bản phù hợp với điều kiện tìm kiếm thương hiệu , vì vậy điều này có thể tài khoản cho sự khác biệt .

On-page

Là các từ khóa vẫn còn quan trọng trên trang ?

Chúng tôi đã đo mối quan hệ giữa các từ khóa và các tài liệu cả hai có điểm số TF- IDF và điểm mô hình ngôn ngữ và thấy rằng các thẻ tiêu đề, cơ thể của HTML , mô tả meta và các thẻ H1 đều có tương quan tương đối cao :

Mối tương quan : On-page

Xem bài đăng blog của tôi về sự liên quan so với xếp hạng cho một lặn sâu vào những con số này ( nhưng lưu ý rằng bài này trước đó sử dụng một phiên bản cũ của dữ liệu , do đó con số tương quan là hơi khác nhau ) .

SEO cũng đồng ý rằng các từ khóa trong tiêu đề và trên trang là những yếu tố quan trọng :

Khảo sát: On-page

Chúng tôi cũng tính toán một số mối tương quan trên trang bổ sung để kiểm tra xem đánh dấu cấu trúc ( schema.org hoặc Google+ tác giả / nhà xuất bản) có bất kỳ mối quan hệ với bảng xếp hạng. Tất cả những mối tương quan gần bằng không , vì vậy chúng tôi kết luận rằng họ không được sử dụng như là tín hiệu xếp hạng ( yet! ) .

Chính xác / một phần miền trận đấu


Khả năng xếp hạng các lĩnh vực kết hợp chính xác và một phần ( EMD / PMD) đã được tranh luận rất nhiều bởi SEO gần đây , và nó xuất hiện Google vẫn còn khả năng điều chỉnh xếp hạng của họ (ví dụ như bài này do tiến sĩ Pete ) . Trong dữ liệu của chúng tôi thu thập được vào đầu tháng sáu ( trước khi cập nhật 25 tháng Sáu) , chúng tôi thấy EMD mối tương quan tương đối cao tại 0.17 ( 0.20 nếu EMD cũng là một dot-com ) , chỉ là về ngang bằng với giá trị từ năm 2011 nghiên cứu của chúng tôi :

Điều này là đáng ngạc nhiên , do dữ liệu MozCast cho thấy EMD tỷ lệ phần trăm được giảm , vì vậy chúng tôi quyết định đào nhập thực tế, chúng tôi thấy rằng phần trăm EMD đã giảm trong năm qua hay như vậy ( đường màu xanh) :

Tuy nhiên , chúng ta thấy một thấy thấy mô hình trong các mối tương quan EMD (đường màu đỏ ), nơi họ giảm mùa thu năm ngoái , sau đó tăng trở lại trong vài tháng qua. Chúng tôi cho rằng sự giảm mùa thu năm ngoái để EMD cập nhật của Google ( theo công bố của Matt Cutts ) . Sự gia tăng trong mối tương quan giữa tháng Ba và tháng Sáu nói rằng EMDS mà vẫn còn hiện tại được xếp hạng tổng thể cao hơn trong SERPs , mặc dù họ là ít phổ biến . Điều này có thể được Google loại bỏ EMDS chất lượng thấp hơn?

Netmark gần đây tính toán mối tương quan là 0,43 cho EMD , và đó là mối tương quan tổng cao nhất trong bộ dữ liệu của họ . Đây là một sự khác biệt lớn so với giá trị của chúng ta về 0,17. Tuy nhiên , họ đã sử dụng sự tương quan cấp bậc biserial thay vì tương quan Spearman cho EMD , cho rằng nó là thích hợp hơn để sử dụng cho các giá trị nhị phân ( nếu họ sử dụng sự tương quan Spearman họ nhận được 0,15 cho sự tương quan EMD ) . Họ là đúng, tương quan cấp bậc biserial được ưa thích hơn Spearman trong trường hợp này . Tuy nhiên , kể từ thứ hạng - biserial chỉ là tương quan Pearson giữa các biến , chúng tôi cảm thấy đó là một chút của một so sánh táo với cam để trình bày cả hai Spearman và cấp bậc biserial cạnh nhau. Thay vào đó, chúng tôi sử dụng cho tất cả các yếu tố Spearman .

Mạng xã hội


Như trong năm 2011 , tín hiệu xã hội là một số yếu tố tương quan cao nhất của chúng tôi , với Google+ vượt qua cả Facebook và Twitter :

SEO , mặt khác , không nghĩ rằng các tín hiệu xã hội là rất quan trọng trong thuật toán tổng thể :


Đây là một trong những nơi mà các mối tương quan có thể giải thích được bởi các yếu tố khác như liên kết, và có thể không có nguyên nhân trực tiếp .

Trở lại vào năm 2011, sau khi chúng tôi công bố kết quả xã hội ban đầu của chúng tôi , tôi thấy làm thế nào Facebook mối tương quan có thể được giải thích chủ yếu là do các liên kết . Chúng tôi hy vọng Google thu thập nội dung Google+ của mình , và các liên kết trên Google+ được theo sau để họ vượt qua nước liên kết . Google cũng thu thập và lập chỉ mục các trang công khai trên Facebook và Twitter.

Hướng đi và tương lai của tìm kiếm


Theo khảo sát của chúng tôi , đây là cách thuật toán tổng thể của Google bị phá vỡ :

Chúng ta thấy :

    1. Liên kết vẫn còn được coi là phần quan trọng nhất của thuật toán ( khoảng 40% ) .
    2. Sử dụng từ khóa trên trang vẫn là cơ bản , và khác hơn là liên kết được cho là loại quan trọng nhất của yếu tố .
    3. SEO không nghĩ rằng yếu tố xã hội quan trọng trong thuật toán năm 2013 ( chỉ có 7% ) , trái ngược với các mối tương quan cao .

Nhìn vào tương lai , SEO thấy một sự thay đổi từ yếu tố xếp hạng truyền thống ( neo văn bản, lĩnh vực kết hợp chính xác , vv) để phân tích sâu hơn về một trang web đã nhận thức giá trị cho người sử dụng , tác giả , cấu trúc dữ liệu và tín hiệu xã hội :

0 comments:

Post a Comment