SEO 回顧:PageRank
作者的觀點完全是他或她自己的(不包括不太可能發生的催眠事件)並且可能並不總是反映觀點Moz.
有您有沒有想過 Moz 員工如何在內部學習? 那麼,這是您與 Tom Capper 一起先睹為快的機會,這是前所未有的內部網絡研討會視頻! 學習在 Moz 很重要,員工之間的信息共享對於確保我們忠於我們的核心價值觀至關重要。 知識共享讓我們保持透明,更輕鬆地合作,找到更好的做事方式,並為我們的客戶創造更好的工具和體驗。
Tom 在 2020 年每個人都在遠程工作時開始了這些會議。它讓我們以一種特殊的協作方式再次聚在一起。 所以,今天,我們給你所有的學習禮物! 在這次獨家網絡研討會中,Tom Capper 帶我們了解了 PageRank 的關鍵話題。
視頻轉錄
這實際上是我曾經讓可憐的、無辜的新員工通過的一個話題,尤其是當他們來自非營銷背景時。 儘管很多人認為這是一個高級主題,但我認為對於想要了解 SEO 的人來說,首先學習它實際上是有意義的,因為它是基礎。 而且,如果您從這個角度考慮許多其他技術 SEO 和鏈接構建主題,它們更有意義並且更簡單,您可以自己找出答案,而不需要閱讀 10,000 字的博客文章和專利,這之類的事情。
不管怎樣,保持那個想法,因為現在是1998年,我6歲了,這是一個光榮的狀態-我在學校電腦俱樂部玩的藝術視頻遊戲和互聯網瀏覽看起來有點像這樣。 我實際上沒有使用 Yahoo!。 我使用了 Excite,事後看來這是一個錯誤,但在我的辯護中我是 6。
你會注意到的一件事將此作為互聯網旅程的起點,與 Google 或您今天使用的任何東西相比,甚至可能像現在瀏覽器中內置的東西,此頁面上有很多鏈接,而且大部分都有鏈接到此頁面上有鏈接的頁面。 這有點像分類目錄系統。 這一點很重要,因為如果很多人使用鏈接瀏覽網頁,而鏈接主要是一種導航功能,那麼我們可以從查看鏈接中獲得一些見解。
它們是受歡迎程度的一種代表。 如果我們假設每個人都在 Yahoo! 上開始他們的互聯網之旅 1998 年,然後是從 Yahoo! 鏈接到的頁面將獲得大量流量。 根據定義,它們很受歡迎,並且這些頁面鏈接到的頁面也仍然會得到很多等等。 通過這個,我們可以建立某種關於哪些網站受歡迎的圖片。 受歡迎程度很重要,因為如果您在搜索結果中向用戶展示受歡迎的網站,那麼他們將更加值得信賴和可信,並且可能是好東西。
這是過於簡單化了,請耐心等待,但這就是谷歌獲勝的原因。 谷歌認識到了這一事實,他們提出了一項名為 PageRank 的創新,這使他們的搜索引擎比其他搜索引擎更好,隨後所有其他搜索引擎都在模仿它。
然而,不管是真是假,仍然有一個核心方法論支持谷歌在基礎層面上的工作方式。 1998 年,PageRank 就是 Google 真正運作的全部方式。 這只是 PageRank 加上相關性。 如今,頂部有很多細微差別和層次,甚至 PageRank 本身可能甚至都沒有被稱為它,並且可能已經改變並在邊緣進行了改進和調整。 可能 PageRank 不再用作流行度的代理,但可能用作信任或類似的代理,並且它在算法中的作用略有不同。
但關鍵是我們仍然完全通過經驗證據知道,改變鏈接到頁面的頁面數量和內容對有機性能有很大影響。 所以我們仍然知道這樣的事情正在發生。 谷歌談論鏈接如何工作及其算法的方式仍然反映了廣泛的基於 PageRank 的理解,就像 SEO 指令和 hreflang 和 rel 以及這類事情的發展一樣。 它仍然是基於 PageRank 的生態系統,如果不是僅限 PageRank 的生態系統的話。
更重要的是,它是如何工作的? 我不知道這裡是否有人討厭數學。 如果你這樣做,我很抱歉,但是會有數學。
所以最初的問題是或基礎所有這一切是想像,所以 A,在這裡的紅色框中,這是這個圖中要清楚的網頁,想像整個互聯網在這個圖中表示,只有一個網頁,這意味著這是 1970 年我想,隨機瀏覽器出現在這個頁面上的概率是多少? 我們可能會說它是一個或類似的東西。 如果你想對此有其他看法,那沒關係,因為這一切都將基於任何數字。 儘管如此,我們還是可以嘗試推斷出一些其他的事情。
所以不管你認為那是什麼概率,假設我們認為如果互聯網上有一個頁面,那麼每個人都在上面,隨機瀏覽器在一頁 A 上鍊接到的概率是多少? 所以說我們在這裡描繪了整個互聯網。 A 是鏈接到另一個無處鏈接的頁面的頁面。 我們首先說每個人都在這個頁面上。 那麼,在一個週期之後,現在每個人都會出現在這個頁面上的概率是多少? 好吧,我們假設有 85% 的機會,而 85% 的數字來自谷歌 1998 年的原始白皮書。 他們有 85% 的機會在他們的周期中進入這一頁,並且有 15% 的機會他們進行這些非基於瀏覽器的活動之一。 我們之所以假設人們在每個週期中都有機會退出以進行非基於瀏覽器的活動,是因為否則我們稍後會得到某種無限循環。 我們不需要為此擔心。 但是,是的,關鍵是如果你假設人們永遠不會離開他們的電腦,他們只是無休止地瀏覽鏈接,那麼你最終會假設每個頁面都有無限的流量,但事實並非如此。
這是我們擁有這個非常簡單的互聯網的起點,我們有一個帶有鏈接的頁面,一個沒有鏈接的頁面,那就是它。 對於這些系統,需要牢記的一點是,顯然,網頁上沒有我們的鏈接,而沒有鏈接的網頁幾乎聞所未聞,就像右邊的那個。 這變得非常複雜非常快。 如果我們試圖在 Moz 網站上製作一個只有兩個頁面的圖表,它就無法顯示在屏幕上。 所以我們在這裡討論的是真正簡化的版本,但這並不重要,因為原則是可擴展的。
這個頁面怎麼樣? 那麼如果這個頁面現在鏈接到另一個頁面,這個頁面的強度與頁面 A 有什麼關係? 所以這個是 0.85/2,這個是那個數字的 0.85 倍。 所以請注意,我們在進行過程中正在稀釋,因為我們在每一步都應用了 15% 的惡化。 這對我們來說很有用也很有趣,因為我們可以想像一個模型,在這個模型中,左邊的頁面 A 是我們的主頁,右邊的頁面是我們想要排名的某個頁面,我們在每一步都進行稀釋跳到那裡。 這是抓取深度,這是 Moz Pro 和大多數其他技術 SEO 工具公開的指標。 這就是為什麼爬取深度是人們感興趣的東西是這個,一部分是發現,我們今天不會講,但一部分也是這個稀釋因素。
然後如果這個頁面實際上鍊接到三個,那麼再一次,這些頁面中的每一個都只有三分之一的強度它只鏈接到一個。 所以我們越往下走,它就被分解和稀釋。虛構的網站。 不要恐慌。 我們想從中吸取的教訓非常簡單,儘管數學很快變得非常神秘。
所以我們要吸取的第一課是每個額外的鏈接深度稀釋值。 所以我們討論了這樣做的原因,但顯然它對網站結構有影響。 它還對其他一些事情有影響,我將在稍後介紹一些其他常見的技術 SEO 問題。
我們可以得到的另一個結論是鏈接越多意味著每個鏈接的價值越低。 因此,如果您在主頁上添加每一個附加鏈接,就會降低已經存在的鏈接的有效性。 所以這非常重要,因為如果你現在查看很多網站,你會發現頁面頂部有 600 個鏈接大型導航,頁面底部也有 600 個鏈接,等等。 這可能是一個不錯的選擇。 我並不是說這總是錯誤的,但這是一種選擇,它具有戲劇性的影響。
我在網站上看到的 SEO 性能來自於將主頁上的鏈接數量減少了 10 倍。如果您更改主頁,使其從鏈接到 600 個頁面變為鏈接到您實際使用的不到 100 個頁面想要排名,這幾乎總是會產生巨大的差異,巨大的影響,比外部鏈接建設所夢想的還要多,因為你不會通過外部鏈接建設獲得 10 倍的差異,除非它是一家初創公司或其他公司.
一些真實場景。 我想基本上談談 SEO 工具經常標記的一些事情,我們都熟悉談論 SEO 問題或優化或其他什麼,但我們經常這樣做 不想想為什麼,我們絕對不認為它們是可以追溯到谷歌歷史的東西。
所以重定向是一個鏈接,一個頁面上有一個鏈接的虛構想法是一個重定向,因為重定向只是一個鏈接到另一個頁面的頁面。 所以在這種情況下,左側的頁面可以直接鏈接到右上角的頁面,但因為它沒有,我們在這裡得到這個 0.85 的平方,即 0.7225。 您唯一需要知道的是它比 0.85 小。 因為我們沒有直接鏈接,我們通過這個重定向的頁面在這裡,感覺不像鏈接,而是這個生態系統中的鏈接,我們只是隨意決定在循環結束時稀釋頁面. 顯然,當我們考慮鏈重定向時,這尤其重要,這是 SEO 工具經常標記的另一件事。
所以,是的,更好的是直接鏈接。 更糟糕的是 302,儘管這是一個有爭議的話題,誰知道呢。 谷歌有時聲稱他們現在將 302 視為 301。 我們先不談這個。
Canonicals,非常相似,從 PageRank 的角度來看是規範的。 規範實際上是後來添加到搜索引擎的。 但是規範基本上等同於 301 重定向。 因此,如果我們有這個 badgers 頁面,它有兩個版本,那麼您可以通過轉到 badgers?colour=brown 來訪問它。 或者想像一下,我有一個網站出於某種原因以不同的顏色出售活獾,然後我可能將這兩個不同的 URL 變體用於我的獾電子商務頁面過濾為棕色。 而且我已經決定這個沒有任何參數的是規範版本,從字面上和比喻上來說。 如果主頁通過這個參數頁面鏈接到它,然後有指向正確版本的規範標籤,那麼我已經任意削弱了正確的版本而不是我本可以做的,這將是直接鏈接。 有趣的是,如果我們確實有這個直接鏈接,請注意這個頁面現在完全沒有力量。 它現在沒有入站鏈接,而且它可能不會在工具中被標記為錯誤,因為該工具找不到它。
你會注意到我在數字零前加了波浪號。 我們會談到這一點。
PageRank 雕刻是我認為有趣的另一件事,因為人們仍然嘗試這樣做,即使它已經很長時間沒有用了。 所以這是一個根本就不是虛構的虛構場景。 這真的很常見,Moz 可能有這種情況,您的主頁鏈接到您關心的一些頁面以及您並不真正關心的一些頁面,當然是從 SEO 的角度來看,例如您的隱私政策。 有點糟糕,因為在這個極端的例子中,擁有隱私政策只是隨機地將你關心的頁面的強度減半。 沒有人想要那個。
所以人們過去常常使用鏈接級別 nofollow。 他們使用鏈接級別 nofollow,其中 . . . 所以這個想法是,它在當時奏效了,到那時,我的意思是像 2002 年之類的。 但是今天人們仍然在新網站上嘗試這樣做。 這個想法是有效的鏈接級別 nofollow 刪除了這個鏈接,所以就好像你的主頁只鏈接到一個頁面。 太好了,每個人都是贏家。
我之前談到的旁注。 所以實際上沒有頁面的 PageRank 為零。 在 PageRank 模型中沒有鏈接的頁面的 PageRank 超過互聯網上的頁面數量。 這是播種概率,在一切開始並循環併計算出穩定平衡的 PageRank 是什麼之前,他們假設您在互聯網上的任何頁面上的機會均等。 一除以互聯網上的頁面數是一個很小的數字,所以我們可以認為它為零。
這已經改變了,我們的關卡 nofollow hack 在很久很久以前又被改變了,這樣如果你使用鏈接關卡nofollow,順便說一下,如果您使用 robots.txt 執行此操作,這也是正確的,當我們轉到此處時,第二個鏈接仍將被計入,我們將其除以二表示我們減半,機會均等你去這些頁面之一。 這個頁面仍然得到了減少,因為它是兩個鏈接之一,但底部的這個頁面現在完全沒有力量,因為它只是通過 nofollow 鏈接的。 因此,如果您現在這樣做,那將是兩全其美的最糟糕情況。 你可能會說,“哦,我真的不在乎我的隱私政策是否強度為零,”無論如何。 但是您確實很在意,因為您的隱私政策可能會通過頂部導航鏈接到您網站上的每個其他頁面。 所以你仍然在傷害自己。
第二個旁注,我說鏈接級別 nofollow,意思是 HTML 中的 nofollow 是鏈接的屬性。 還有頁面級別的 nofollow,我很難想出一個好的用例。 基本上,頁面級別的 nofollow 意味著我們將把該頁面上的每個鏈接都視為 nofollow。 所以我們只是要創建一個 PageRank 死胡同。 這是一件奇怪的事情。 有時人們使用 robots.txt,它基本上做同樣的事情。 如果我用 robota.txt 屏蔽這個頁面,那麼對於 PageRank 的影響是一樣的,除了有其他充分的理由這樣做,比如我可能不希望谷歌看到這個,或者我可能想防止大量浪費Google 抓取工具的時間,以便他們花更多時間抓取我網站的其餘部分或類似內容。 使用 robots.txt 是有原因的。 頁面級別的 nofollow 是我們要創建的死胡同,但我們也會浪費 Google 的時間來抓取它。
我剛才談到的一些極端情況,尤其是隱私政策,在 2004 年有了一個叫做合理衝浪者的東西,對每個人來說都變得更好了,你現在偶爾還會聽到人們談論它,但大多是隱含的. 它可能實際上是一個討論不足或未被考慮的話題。
所以這些天,到這些天,我的意思是在過去的 17 年裡,如果這些鏈接中的一個是那個巨大的電話到行動和這些鏈接中的另一個位於頁腳,就像隱私政策鏈接通常是這樣,然後谷歌會應用一些意義並說出人們點擊這個鏈接的機會。 . . 請記住,谷歌試圖在這裡計算概率。 所以我們會分開這個。 這個 0.9 和 0.1 仍然要加起來為 1,但我們將以更合理的方式拆分它們。 是的,他們很久以前就這樣做了。 他們現在可能已經非常非常擅長了。
Noindex 很有趣,因為傳統上,你會認為這與 PageRank 無關。 所以,是的,一個 noindex 標籤只是意味著它永遠不會出現在搜索結果中,這個頁面在底部,這很好。 這樣做有一些正當理由。 也許您擔心它會顯示您網站上的其他內容試圖顯示的錯誤查詢,或者它可能包含敏感信息或類似信息。 好的。 但是,當您在某些內容上放置 noindex 標籤時,Google 最終會停止抓取它。 每個人都憑直覺知道這個謎題的所有部分,但谷歌只承認這種行為是幾年前發生的事情。
所以穀歌最終停止抓取它,當谷歌停止抓取它時,它停止傳遞 PageRank。 所以沒有索引跟隨,這曾經是一件非常好的事情,或者我們認為對於像 HTML 站點地圖頁面或類似的東西,像 HTML 站點地圖頁面這樣的頁面,顯然你不想出現在搜索結果,因為它有點垃圾,對您的網站的反映很差,而不是好的用戶體驗和這類事情。 但這是將公平傳遞給一堆深度頁面的好方法,至少我們是這麼認為的。 結果可能不是。 相當於我們之前說的那種最壞的情況,從長遠來看頁面級nofollow。 再一次,這可能就是為什麼 noindex 在像 Moz Pro 這樣的工具中被標記為錯誤的原因,儘管它通常沒有得到很好的解釋或理解。
關於鏈接如何工作,我最喜歡的理論是,在這個階段,它們不再是受歡迎程度的代表,因為有更好的方法來做到這一點。 但它們是經常被引用的品牌的品牌代理。 引文和鏈接在這個行業中經常被用作同義詞,所以這是有道理的。 然而,一旦你真正開始排名前 5 或 10,我的經驗是鏈接變得越來越不相關,你所處的位置競爭越來越激烈,因為谷歌有越來越多的數據來判斷人們是否想點擊你與否。 這是 2009 年的一些數據,對比排名 6 到 10 與排名 1 到 5 的相關性。基本上,品牌和鏈接都變得不那麼相關,或者容易衡量的版本變得不那麼相關,這又是在探索那個理論你排名越高,它可能變得越定制和基於用戶信號。
這是一些舊數據,我在這裡基本上是看看你可以在多大程度上使用域權限來預測排名,這是這個藍色條,你可以在多大程度上使用品牌搜索量來預測排名,這是這個綠色條,以及你可以在多大程度上使用包含的模型它們都可以預測排名,這並不比僅使用品牌搜索量好多少。 這顯然是簡化和有缺陷的數據,但這是鏈接被用作品牌代理的假設的一些證據。
Speechpad.com 的視頻轉錄