Skip to main content

Ad Code

Google Veri Sızıntısı Açıklama

Amerika Birleşik Devletleri tatillerinde, Google sıralamasıyla ilgili verilerin sızdırıldığı iddiasıyla ilgili bazı gönderiler paylaşıldı. Sızıntılarla ilgili ilk gönderiler, Rand Fishkin’in uzun süredir savunduğu “doğrulayıcı” inançlara odaklandı, ancak bilginin bağlamına ve gerçekte ne anlama geldiğine pek dikkat edilmedi.

Bağlam Önemlidir: Belge AI Ambarı

Sızan belge, verileri analiz etmek, düzenlemek, aramak ve depolamak için kullanılan Document AI Warehouse adlı halka açık bir Google Cloud platformuyla ilişkisini paylaşıyor.

Ekran görüntüsü: Document AI Warehouse

Ekran görüntüsü

@DavidGQuaid tweet attı:

“Sanırım adından da anlaşılacağı gibi bir belge ambarı oluşturmaya yönelik harici bir API olduğu açık”

Bu, “sızdırılan” verilerin Google Arama’nın dahili bilgilerini temsil ettiği fikrine soğuk bir hava katıyor gibi görünüyor.

Şu anda bildiğimiz kadarıyla “sızdırılan veriler”, herkese açık Document AI Warehouse sayfasındaki verilerle benzerlik taşıyor.

Dahili Arama Verileri Sızıntısı mı?

SparkToro’da verilerin Google Arama’dan kaynaklandığı söylenmiyor. Bu iddiayı ortaya atan kişinin Rand Fishkin’e veriyi gönderen kişi olduğu söyleniyor.

Rand Fishkin hakkında hayran olduğum şeylerden biri de yazılarında, özellikle de uyarılar söz konusu olduğunda titizlikle titiz olmasıdır. Rand, verilerin Google Arama’dan kaynaklandığını iddia eden kişinin, verileri sağlayan kişi olduğunu kesinlikle belirtiyor. Kanıt yok, sadece iddia var.

O yazıyor:

“Google’ın Arama bölümünden büyük miktarda API dokümantasyonu sızıntısına erişimi olduğunu iddia eden bir kişiden bir e-posta aldım.”

Fishkin, verilerin eski Google çalışanları tarafından Google Arama’dan kaynaklandığının doğrulandığını doğrulamıyor. Verileri e-postayla gönderen kişinin bu iddiada bulunduğunu yazıyor.

“E-posta ayrıca, sızdırılan bu belgelerin gerçek olduğunun eski Google çalışanları tarafından onaylandığını ve bu eski çalışanların ve diğerlerinin Google’ın arama operasyonları hakkında ek, özel bilgiler paylaştıklarını iddia etti.”

Fishkin, sızıntıyı yapan kişinin eski Google çalışanlarıyla olan bağlantısının, onlarla bir arama endüstrisi etkinliğinde buluşma bağlamında olduğunu açıkladığı daha sonraki bir video toplantısı hakkında yazıyor. Yine, eski Google çalışanları hakkında bilgi sızdıranların söylediklerine kulak vermemiz gerekecek ve onların söyledikleri resmi olmayan bir yorum değil, verileri dikkatlice inceledikten sonra söylenmiştir.

Fishkin bu konuda üç eski Google çalışanıyla iletişime geçtiğini yazıyor. Dikkate değer olan şey, eski Google çalışanlarının, verilerin Google Arama’ya ait olduğunu açıkça doğrulamamış olmalarıdır. Verilerin Google Arama’dan kaynaklanmadığını değil, yalnızca Google’ın dahili bilgilerine benzediğini doğruladılar.

Fishkin, eski Google çalışanlarının kendisine söylediklerini yazıyor:

  • “Orada çalıştığımda bu koda erişimim yoktu. Ama bu kesinlikle yasal görünüyor.”
  • “Dahili bir Google API’sinin tüm özelliklerine sahip.”
  • “Java tabanlı bir API. Birisi de dokümantasyon ve isimlendirme konusunda Google’ın kendi dahili standartlarına bağlı kalmak için çok zaman harcadı.”
  • “Emin olmak için daha fazla zamana ihtiyacım var ama bu, aşina olduğum dahili belgelerle eşleşiyor.”
  • “Kısa bir incelemede gördüğüm hiçbir şey bunun yasal olmaktan başka bir şey olduğunu göstermiyor.”

Bir şeyin Google Arama’dan kaynaklandığını söylemek ile bunun Google’dan kaynaklandığını söylemek iki farklı şeydir.

Aklını Yeni fikirlere açık tut

Veriler konusunda açık fikirli olmak önemlidir çünkü verilerle ilgili doğrulanmamış pek çok şey vardır. Örneğin bunun dahili bir Arama Ekibi belgesi olup olmadığı bilinmiyor. Bu nedenle, bu verilerden eyleme geçirilebilir SEO tavsiyesi olarak herhangi bir şey almak muhtemelen iyi bir fikir değildir.

Ayrıca, uzun süredir inanılan inançları özel olarak doğrulamak için verilerin analiz edilmesi tavsiye edilmez. Kişi bu şekilde Onaylama Önyargısının tuzağına düşer.

Doğrulama Önyargısı:

“Doğrulama yanlılığı, kişinin önceki inançlarını veya değerlerini onaylayacak veya destekleyecek şekilde bilgiyi arama, yorumlama, tercih etme ve hatırlama eğilimidir.”

Doğrulama Önyargısı, kişinin ampirik olarak doğru olan şeyleri inkar etmesine yol açacaktır. Örneğin, Google’ın yeni bir sitenin sıralamasını otomatik olarak engellediğine dair onlarca yıllık bir fikir var. İnsanlar her gün yeni sitelerinin ve yeni sayfalarının neredeyse anında Google aramalarında ilk onda yer aldığını bildiriyor.

Ancak Sandbox’a sıkı sıkıya inanan biriyseniz, bunun gibi gerçek gözlemlenebilir deneyim, kaç kişi zıt deneyimi gözlemlerse gözlemlesin, bir kenara atılacaktır.

Brenda Malone, Serbest Kıdemli SEO Teknik Stratejisti ve Web Geliştiricisi (LinkedIn profili) Sandbox hakkındaki iddialar hakkında bana mesaj attı:

“Gerçek deneyimlerime dayanarak Sandbox teorisinin yanlış olduğunu kişisel olarak biliyorum. İki gün içinde iki yazı içeren kişisel bir blogu indeksledim. Sandbox teorisine göre iki gönderili küçük bir sitenin indekslenmesine imkan yok.”

Buradan çıkarılacak sonuç, dokümantasyonun Google Arama’dan kaynaklandığı ortaya çıkarsa, verileri analiz etmenin yanlış yolunun uzun süredir inanılan inançların onayını aramak olduğudur.

Google Veri Sızıntısı Neyle İlgili?

Sızan verilerle ilgili dikkate alınması gereken beş şey var:

  1. Sızdırılan bilgilerin içeriği bilinmiyor. Google Arama ile alakalı mı? Başka amaçlar için mi?
  2. Verilerin amacı. Bilgiler gerçek arama sonuçları için mi kullanıldı? Yoksa dahili olarak veri yönetimi veya manipülasyonu için mi kullanıldı?
  3. Eski Google çalışanları, verilerin Google Arama’ya özel olduğunu doğrulamadı. Yalnızca bunun Google’dan geldiğini doğruladılar.
  4. Aklını Yeni fikirlere açık tut. Uzun süredir inanılan inançların doğruluğunun peşinde koşarsanız tahmin edin ne olur? Onları her yerde bulacaksınız. Buna doğrulama yanlılığı denir.
  5. Kanıtlar, verilerin bir belge ambarı oluşturmaya yönelik harici bir API ile ilişkili olduğunu gösteriyor.

Başkaları “Sızan” Belgeler Hakkında Ne Diyor?

Yalnızca derin SEO deneyimine sahip olmakla kalmayıp aynı zamanda bilgisayar bilimi konusunda da müthiş bir anlayışa sahip olan Ryan Jones, sözde veri sızıntısı hakkında bazı makul gözlemlerini paylaştı.

Ryan tweet attı:

“Bunun üretim için mi yoksa test için mi olduğunu bilmiyoruz. Benim tahminime göre çoğunlukla potansiyel değişiklikleri test etmek için.

Web veya diğer sektörler için neyin kullanıldığını bilmiyoruz. Bazı şeyler yalnızca Google ana sayfası veya haberler vb. için kullanılabilir.

Makine öğrenimi algoritmasına neyin girdi olduğunu ve neye karşı eğitim için kullanıldığını bilmiyoruz. Tahminime göre tıklamalar doğrudan bir girdi değil, tıklanabilirliğin nasıl tahmin edileceğini bir model eğitmek için kullanılıyor. (Trendli artışların dışında)

Ayrıca bu alanlardan bazılarının yalnızca eğitim veri kümeleri için geçerli olduğunu ve tüm siteler için geçerli olmadığını da tahmin ediyorum.

Google’ın yalan söylemediğini mi söylüyorum? Hiç de bile. Ancak gelin bu sızıntıyı herhangi bir önyargıyla değil, itiraz ederek inceleyelim.”

@DavidGQuaid tweet attı:

“Ayrıca bunun Google araması için mi yoksa Google bulut dokümanı almak için mi olduğunu bilmiyoruz

API’ler seç ve seç gibi görünüyor – algoritmanın bu şekilde çalıştırılmasını beklemiyorum – bir mühendis tüm bu kalite kontrollerini atlamak isterse ne olur – bu, kurumsal bilgi tabanım için bir içerik ambarı uygulaması oluşturmak istediğime benziyor”

“Sızan” Veriler Google Aramayla İlgili mi?

Şu anda bu “sızdırılan” verilerin aslında Google Arama’dan geldiğine dair kesin bir kanıt yok. Verilerin amacının ne olduğu konusunda çok büyük bir belirsizlik var. Bu verilerin yalnızca “adından da anlaşılacağı gibi bir belge deposu oluşturmaya yönelik harici bir API” olduğuna ve web sitelerinin Google Arama’daki sıralamasıyla hiçbir şekilde ilgisi olmadığına dair ipuçlarının bulunması dikkat çekicidir.

Bu verinin Google Arama’dan kaynaklanmadığı sonucu şu an için kesin değil ancak kanıt rüzgarı o yönde esiyor gibi görünüyor.

Yorum Gönder

0 Yorumlar