Ipullrank dijital pazarlama ajansının kurucusu Mike King, Yandex kod sızıntısı ile ilgili oldukça kapsamlı bir blog yazısı yayımladı. Sizler için bir özetini çıkarttım.
Bu Google’ın Kodu Değil, O Halde Neden Önemsiyoruz?
Bazıları bu kod tabanını incelemenin dikkat dağıtıcı olduğuna ve SEO ile ilgili kararlarını etkileyecek hiçbir şey olmadığına inanıyor. Elbette, Yandex Google değil. Ancak yine de her ikisi de teknolojinin en ileri noktasında kalmaya devam eden son teknoloji web arama motorlarıdır.
Her iki şirketten yazılım mühendisleri aynı konferanslara (SIGIR, ECIR, vb.) katılmakta ve Bilgi Edinme, Doğal Dil İşleme/Anlama ve Makine Öğrenimi alanlarındaki bulgu ve yenilikleri paylaşmaktadır. Yandex’in Palo Alto’da ve Google’ın da daha önce Moskova’da bir varlığı vardı.
Hızlı bir LinkedIn araması, her iki şirkette de çalışmış birkaç yüz mühendisi ortaya çıkarıyor, ancak bunlardan kaçının her iki şirkette de Arama üzerinde çalıştığını bilmiyoruz.
Daha doğrudan bir örtüşme olarak Yandex, Google’ın TensorFlow, BERT, MapReduce ve çok daha az ölçüde Protocol Buffers gibi Arama alanındaki yenilikler için kritik öneme sahip açık kaynak teknolojilerini de kullanmaktadır.
Dolayısıyla, Yandex kesinlikle bir Google olmasa da, burada bahsettiğimiz rastgele bir araştırma projesi de değil. Bu kod tabanını inceleyerek modern bir arama motorunun nasıl inşa edildiği hakkında öğrenebileceğimiz çok şey var.
Sızan Kodlarda 17.854 Sıralama Faktörü Bulunmakta
Kod tabanına derinlemesine bakıldığında, Yandex’in sorgu işleme ve sıralama sistemlerinin farklı alt kümeleri için çok sayıda sıralama faktörü dosyası olduğu ortaya çıkıyor.
Bunları taradığımızda, toplamda 17.854 sıralama faktörü olduğunu görüyoruz. Bu sıralama faktörlerine aşağıdakilerle ilgili çeşitli ölçümler dahildir:
- Tıklamalar
- Bekleme süresi (Dwell Time)
- Yandex’in Google Analytics eşdeğeri Metrika’dan yararlanarak elde edilen veriler.
Yandex’in En Öncelikli Negatif Sıralama Faktörleri
Özetle, bu faktörler en iyi skoru elde etmek için şunları yapmanız gerektiğini göstermektedir:
- Reklamlardan kaçının
- Yeni sayfalar oluşturmak yerine eski içerikleri güncelleyin.
- Sitenize gelen backlink’lerin çoğunun markalı bağlantı metnine sahip olduğundan emin olun.
Yandex’in En Öncelikli Pozitif Sıralama Faktörleri
Sıralamalarınızın olumlu etkilenmesi için şunları yapmalısınız:
- Alan adınızı oluştururken kelime oyunları oynayın
- Alan adınızın .com olduğundan emin olun
- İnsanları Yandex Bar’da hedef anahtar kelimelerinizi aramaya teşvik edin
- Tıklama almaya devam edin
Pek Çok Beklenmedik İlk Sıralama Faktörü Var
İlk ağırlıklı sıralama faktörlerinde daha ilginç olan ise beklenmedik olanlar. Aşağıda göze çarpan on yedi faktörün bir listesi bulunmaktadır.
FI_PAGE_RANK: +0.1828678331 — PageRank, Yandex’in en yüksek ağırlıklı 17. faktörüdür. Daha önce backlink’leri sıralama sistemlerinden tamamen çıkarmışlardı, bu nedenle listede bu kadar düşük olması çok da şaşırtıcı değil.
FI_SPAM_KARMA: +0.00842682963 — SPAM karması adını “antispammer “lardan alır ve sunucunun spam olma olasılığıdır; Whois bilgilerine dayanır
FI_SUBQUERY_THEME_MATCH_A: +0.1786465163 — Sorgu ve belgenin tematik olarak ne kadar yakın eşleştiği. Bu, 19. en yüksek ağırlıklı faktördür.
FI_REG_HOST_RANK: +0.1567124399 — Yandex’in bir ana bilgisayar (veya alan adı) sıralama faktörü var.
FI_URL_LINK_PERCENT: +0,08940421124 — Bağlantı metni (metin yerine) URL olan bağlantıların toplam bağlantı sayısına oranı.
FI_PAGE_RANK_UKR: +0.08712279101 — Belirli bir Ukranya PageRank’i vardır
FI_IS_NOT_RU: +0.08128946612 — Alan adının .RU olmaması olumlu bir şeydir. Görünüşe göre, Rus arama motoru Rus sitelerine güvenmiyor 🙂
FI_YABAR_HOST_AVG_TIME2: +0.07417219313 — Bu, YandexBar tarafından bildirilen ortalama bekleme süresidir
FI_LERF_LR_LOG_RELEV: +0.06059448504 — Bu, her bir bağlantının kalitesine dayalı bağlantı alaka düzeyidir
FI_NUM_SLASHES: +0.05057609417 — URL’deki eğik çizgi sayısı bir sıralama faktörüdür.
FI_ADV_PRONOUNS_PORTION: -0.001250755075 — Sayfadaki zamir isimlerinin oranı.
FI_TEXT_HEAD_SYN: -0.01291908335 — Eş anlamlı kelimeler dikkate alınarak başlıkta [sorgu] kelimelerinin varlığı.
FI_PERCENT_FREQ_WORDS: -0.02021022114 — Dilin en sık kullanılan 200 kelimesi olan kelime sayısının metnin tüm kelime sayısına oranı.
FI_YANDEX_ADV: -0.09426121965 — Reklamlara yönelik hoşnutsuzlukla daha spesifik hale gelen Yandex, Yandex reklamları içeren sayfaları cezalandırır.
FI_AURA_DOC_LOG_SHARED: -0.09768630485 — Belgedeki benzersiz olmayan metin alanları sayısının logaritması.
FI_AURA_DOC_LOG_AUTHOR: -0.09727752961 — Belgenin bu sahibinin yazar olarak tanındığı metin alanları sayısının logaritması.
FI_CLASSIF_IS_SHOP: -0.1339319854 — Görünüşe göre, sayfanız bir mağaza ise Yandex size daha az ilgi gösterecek.
Bu tuhaf sıralama faktörlerini ve Yandex kod tabanındaki mevcut faktörleri incelediğimizde, sıralama faktörü olabilecek pek çok şey olduğunu görüyoruz.
Mike King, Google’ın bildirdiği “200 sinyalin” aslında 200 sinyal sınıfı olduğundan ve her bir sinyalin diğer birçok bileşenden oluşan bir bileşim olduğundan şüpheleniyor. King’e göre, Google Analytics’in birçok metrikle ilişkili boyutlara sahip olması gibi, Google Arama da muhtemelen birçok özellikten oluşan sıralama sinyalleri sınıflarına sahiptir.
Yandex Google, Bing, YouTube ve TikTok’u Kazıyor!
Kod tabanı, Yandex’in diğer web siteleri ve ilgili hizmetleri için birçok ayrıştırıcıya sahip olduğunu da ortaya koyuyor. Ayrıca, Yandex’in kendi servislerinin yanı sıra çeşitli servisler için de ayrıştırıcıları var.
Yandex Sızıntısından Google Hakkında Bildiklerimize Ne Katabiliriz?
Doğal olarak herkesin aklındaki soru hala bu. Yandex ve Google arasında kesinlikle pek çok benzerlik olsa da, doğrusu bu soruyu ancak Arama üzerinde çalışan bir Google Yazılım Mühendisi kesin olarak yanıtlayabilir.
Yine de bu yanlış bir soru.
Gerçekten de bu kod, modern arama hakkındaki düşüncelerimizi genişletmemize yardımcı olmalı. Arama konusundaki kolektif anlayışın büyük bir kısmı, SEO topluluğunun 2000’li yılların başında testler yoluyla ve aramanın çok daha az opak olduğu zamanlarda arama mühendislerinin ağzından öğrendiklerinden oluşuyor. Ne yazık ki bu, yeniliklerin hızlı temposuna ayak uyduramadı.
Yandex sızıntısının birçok özelliği ve sıralama faktörlerinden elde edilen bilgiler, Google’da sıralama için test edilmesi ve dikkate alınması gereken daha fazla hipotez ortaya koymalıdır. Ayrıca SEO tarama, bağlantı analizi ve sıralama araçları tarafından ayrıştırılabilecek ve ölçülebilecek daha fazla şey sunmalıdırlar.