Günümüzden 25 yıl öncesine gidersek, yani kendi gençlik yıllarımda tecrübe ettiğim internet deneyim dönemlerine bir göz atarsak, o dönemlerde var olan arama motorları anahtar kelime temelinde çalışan bir yapıya sahiptiler. O dönemde popüler olan altavista arama motorunu ele alırsak, bir sorgu yapıldığında aradığınız anahtar kelimeyi diğer websitelerinde tarıyor ve anahtar kelimenizin, başlıkta geçip geçmediği, URL içinde olup olmadığı ve içerikte kaç defa kullanıldığı gibi faktörleri göz önünde bulundurarak, kullanıcının karşısına getiriyordu.

altavista

Sonrasında ise bildiğiniz gibi Link temelli arama motoru olan Google devreye girdi. Larry Page ve Sergey Brin bu yıllarda Stanfort Üniversitesinde bir akademik proje üzerinde çalışıyorlardı. Projenin ilk adı aslında BackRub’dı. Burada Page Rank mantığının ilk temelleri atılıyordu. BackRub projesi sonrasında yerini bir matematik terimi olan Google’a bıraktı. Page Rank Google’un  websiteleri derecelendirdiği bir sistemdir. Kısaca bir web sitesinin başka bir websitesinden aldığı bağlantı sayısı ve kalitesi ile alakalı bir hesaplama mantığı bulunmaktadır. Bu yapı ile Google diğer arama motorları karşısında ezici bir güç elde etmiştir.

page rank formülü

Sonraki yıllarda ise Google’da çok daha fazla değişimler yaşanmıştır. Çünkü internet dünyası geliştikçe ve global anlamda kazançlar arttıkça kötüye kullanımlar da bir hayli artmaya başlamıştır. Artık sorgularda çok fazla spam içerikler görmeye başlandığında, Google çalışanları çok öncesinde çalışmaya başladıkları ve patentini aldıkları uygulamaları devreye sokmaya başladılar.

Detecting spam search results for context processed search queries

“Detecting spam search results for context processed search queries” patenti

Google 2005 yılında ilk temellerini attığı spam içerikleri tespit eden patenti 2013 yılında devreye aldı. Bizler bunu “Payday Loan” güncellemesinde net olarak öğrenmiş olduk.  Payday Loan güncellemesini nakit kredi veren firmalara ait websitelerin güvenilirliğini tespit etmek amacıyla yayına alınmıştı.

pay-day-loan pay-day-loan

Hatta o dönemler SEO uzmanlarının çok iyi tanıdığı Matts Cuts ABD içinde gerçekleşen sorguların %0.3’ünün spam olduğunu, Türkiye’deki sorguların ise %4’ünün spam olduğunu bildirmişti.

Buraya kadar olan dönemde anahtar kelime temeline dayanan bir arama motorunun bir içeriği tam olarak anlamadığını ve yüksek oranda kötüye kullanıma maruz kalınması ile kolayca manipüle edileceği görülmüştür.

Entity search along the route

Konu başlığımıza da burada girmiş oluyoruz. Google 2008 yılında ilk temellerini attığı “Determining entity popularity using search queries”,  2013 yılında başlatılan “Associating an entity with a search query” 2014 başlatılan “smart search engine”, “Methot and server for providing seach results”, 2015 yılında başlatılan “Entity search along the route” gibi patentler ile kullanıcılara en alakalı içerik veya bilgiyi verme odaklı çalışmaları başlatmış ve uygulamaya alınmıştır.

Entity Search tarafında kafa karışıklığı yaratmamak için kısaca açıklamaya çalışalım.

Entity  Nedir?

Entity kelimesinin Türkçe karşılığı varlıktır. Entity Search ise google tarama botlarının gelen sorguya en doğru cevabı vermek için, güvenilir kaynakları kullanarak ve kullanıcının amacını anlayarak cevap verdiği yöntemdir. Buradaki tüm patent çalışmaları Google’un son yıllarda iç yapısının ne kadar gelişmiş olduğunu göstermektedir.

Named entity recognition with personalized models NLP-based entity recognition and disambiguation Related-Entity-google-patents-us9830390b2-fig-8

Related-Entity-google-patents-us9830390b2-fig-3

Google tarafından yapılan bu paten çalışmalarında göze çarpan durum kısaca şudur.  Üstte yer alan şemada görüldüğü gibi, ilk olarak kullanıcı cihazından sorgu alınıyor, arama motoru mevcut indexinden ilgili Entity’leri buluyor, Entity’ler arasındaki odaklanan Entity’yi buluyor. Odaklanan Entity ve diğer Entity’ler arasındaki ilişkileri çıkartıyor. Sonrasında ise sorguda ikincil Entity isteğine göre aradaki bağlantıyı cevap olarak veren web sayfalarını sıralamada yükseltiyor.

Buradaki durumu bir örnekle açıklayalım.

Entity search örnek

Yukarıdaki örnekte görüldüğü gibi, kelime olarak benzerliği olmasa da tamamen yapılan sorguya göre kullanıcıya tam olarak hedef bilgiyi sunan bir yapı var karşımızda. Anahtar kelime temelinde çalışan bir arama motorunun vereceği cevaptan çok farklı olduğu aşikâr. Hatta sonuçlara bakarsak, aradaki ilişki durumu ve kaynak güvenilirliği durumuna göre sonuçlar featured snippetlerde veya direkt web sayfası olarak da karşımıza çıkabiliyor.

Goggle Related Entities patenti ile bir Entity yani varlık sorgusu yapıldığında mevcut indexini sorgulayarak, aradaki bağlantıyı kuruyor, bunu farklı kaynaklar ile doğruluyor ve karşımıza çıkartıyor.

topic clusters

Bu bilgiler ışığında tavsiyem,  Topic Clostters içerik kurgusu ile Piller contentlere bağlı Cluster content yapıları ile mevcut çalışmalarını bu yönde yaparak, daha derinlemesine analizler ile daha özgün ve kullanıcıyı doğru şekilde yönlendirecek içerikler hazırlamasıdır.  Artık yıllar öncesinin, anahtar kelime yoğunluğuna bakan, spam backlinkler ile ön plana çıkaran bir arama motoru yok karşımızda.

 

Goggle Related Entities Patentinin Mucitleri:

 

Peter Jin Hong

Pravir K. Gupta

Nathaniel J. Gaylinn

Ramakrishnan Kazhiyur-Mannar

Kavi J. Goel

Omer Bar-or

Jack W. Menzel

Christina R. Dhanaraj

Jared L. Levy

Shashidhar A. Thakur

Grace Chung

Benson Tsai