Google tarayıcıları
"Tarayıcı", bir web sayfasından diğerine giden bağlantıları izleyerek, web sitelerini otomatik bir biçimde keşfetmek ve taramak amacıyla kullanılan tüm programlar (robot veya örümcek gibi) için kullanılan genel bir terimdir. Google'ın ana tarayıcısına Googlebot adı verilir. Bu tabloda, yönlendiren günlüklerinizde görebileceğiniz yaygın kullanılan Google tarayıcılarıyla ilgili bilgiler ve bunların robots.txt, robots meta etiketleri ve X-Robots-Tag HTTP yönergelerinde nasıl belirtilmeleri gerektiği listelenmektedir.
Aşağıdaki tabloda, Google'daki çeşitli ürün ve hizmetler tarafından kullanılan tarayıcılar gösterilmektedir:
- Kullanıcı aracısı jetonu, robots.txt dosyanızdaki
User-agent:satırında, siteniz için tarama kuralları yazılırken genel tarayıcı türüyle eşleştirme yapmak için kullanılır. Bazı tarayıcılar tabloda gösterildiği gibi birden fazla jetonu vardır; bir kuralı uygulamak için yalnızca bir tarayıcı belirtecinizin eşleşmesi yeterlidir. Bu liste tam olmasa da, web sitenizde görebileceğiniz tarayıcıların çoğunu kapsamaktadır. - Tam kullanıcı aracısı dizesi, tarayıcının tam açıklamasıdır, istekte ve web günlüklerinizde görünür.
| Tarayıcı | Kullanıcı aracısı jetonu (ürün jetonu) | Tam kullanıcı aracısı dizesi |
|---|---|---|
| APIs-Google |
| APIs-Google (+https:/ |
| AdSense |
| Mediapartners-Google |
(Android web sayfası reklam kalitesini kontrol eder) |
| Mozilla/ |
(iPhone web sayfası reklam kalitesini kontrol eder) |
| Mozilla/ |
(Masaüstü web sayfası reklam kalitesini denetler) |
| AdsBot-Google (+http:/) |
| Googlebot Image |
| Googlebot-Image/ |
| Googlebot News |
| Googlebot-News |
| Googlebot Video |
| Googlebot-Video/ |
Googlebot (Masaüstü) |
|
|
Googlebot (Akıllı Telefon) |
|
|
| Mobil AdSense |
| (Çeşitli mobil cihaz türleri) (compatible; Mediapartners-Google/; +http:/) |
(Android uygulama sayfası reklam kalitesini kontrol eder. AdsBot-Google robotlarının kurallarına uyar.) |
| AdsBot-Google-Mobile-Apps |
Robots.txt kurallarına uymuyor - nedenini buradan öğrenebilirsiniz |
| |
Robots.txt kurallarına uymuyor - nedenini buradan öğrenebilirsiniz | Mevcut aracılar:
Eski aracı (kullanımdan kaldırıldı): | |
| Duplex on the Web |
Kullanıcı aracısı joker karakterini yok sayabilir - nedenini burada bulabilirsiniz | Mozilla/ |
Google Site Simgesi (Çeşitli hizmetler için site simgelerini alır) |
Kullanıcı tarafından başlatılan istekler için robots.txt kurallarını yok sayar | Mozilla/ |
| Web Light |
Robots.txt kurallarına uymuyor - nedenini buradan öğrenebilirsiniz | Mozilla/ |
Tablodaki kullanıcı aracısı dizelerinde Chrome/WXYZ ifadesini gördüğünüz her yerde, W.X.Y.Z aslında Chrome'un sürümünü temsil eden ve bu kullanıcı aracısı tarafından kullanılan bir yer tutucudur: Örneğin, 41.0.2272.96. Googlebot tarafından kullanılan en son Chromium sürümüyle eşleşmesi için bu sürüm numarası zaman içinde artar.
Günlüklerinizde arama yapıyorsanız veya sunucunuzu bu sürüm numarası kalıbına sahip bir kullanıcı aracısına göre filtreliyorsanız, büyük olasılıkla sürüm numarasını tam olarak belirtmek yerine için joker karakterler kullanmanız gerekir.
Robots.txt dosyasındaki kullanıcı aracıları
Robots.txt dosyasında çeşitli kullanıcı aracıları tanınsa da, Google en belirgin olanı izler. Google'ın tüm sayfalarınızı tarayabilmesini istiyorsanız, robots.txt dosyasına ihtiyacınız yoktur. Google'ın tarayıcılarının içeriğinizin bir kısmına erişimini engellemek veya buna izin vermek istiyorsanız, bunu yapmak için Googlebot'u kullanıcı-aracısı olarak belirtebilirsiniz. Örneğin, tüm sayfalarınızın Google aramasında görünmesini ve AdSense reklamlarının sayfalarınızda görünmesini istiyorsanız, robots.txt dosyasına ihtiyacınız yoktur. Benzer bir şekilde, Google'ın bazı sayfalara erişimini toplu olarak engellemek istiyorsanız, Googlebot kullanıcı-aracısını engellediğinizde, Google'ın diğer tüm kullanıcı-aracıları da engellenir.
Ancak, daha hassas bir denetime sahip olmak isterseniz daha kesin davranabilirsiniz. Örneğin, tüm sayfalarınızın Google Arama'da görünmesini istiyor, ancak kişisel dizininizdeki resimlerin taranmasını istemiyor olabilirsiniz. Bu durumda, Googlebot-image kullanıcı-aracısının /personal dizininizdeki dosyaları taramamasını (ancak, diğer tüm dosyaları taramasına izin vermeyi) şu şekilde sağlayabilirsiniz:
Başka bir örneği ele alırsak tüm sayfalarınızda reklamların bulunmasını istediğinizi, ancak bu sayfaların Google Arama'da görünmesini istemediğinizi düşünelim. Burada, Googlebot'u engelleyebilir, Mediapartners-Google tarayıcısına izin verebilirsiniz:Robots meta etiketlerindeki kullanıcı aracıları
Bazı sayfalar, farklı tarayıcılara ilişkin yönergeleri belirtmek için birden çok robots meta etiketi kullanır. Örneğin:
Bu durumda, Google negatif yönergelerin toplamını kullanır ve Googlebot hem noindex hem de nofollow yönergelerini izler. Google'ın sitenizi nasıl tarayacağını ve dizine ekleyeceğini kontrol etme hakkında daha ayrıntılı bilgi edinin.
Yorumlar
Yorum Gönder