Arama motorları mantığı
Tarih : 25-04-2009 | imza : Burak | Kategori : Yazılarım
0
Bu yazımda arama motorlarının ne işe yaradığından ve çalışma nantığından bahsedeceğim.
Biliyorsunuz ki internet çok büyük bir bilgi dünyası. Ama şöyle bir düşündüğümüzde o bilgiye arama motorları sayesinde ulaşıyoruz. Arama motorlarının olmadığını varsayarsak site adreslerine ve aradığımız bilgiye şans eseri ulaşmış olacaktık, belkide ulaşamayacaktık saatlerce uğraşıcaktık.Bu yüzden interneti internet yapan arama motorlarıdır diye düşünüyorum.
Arama motorlarının veritabanı sistemleri çok gelişmiş ve büyüktür. Bize sadece anahtar kelime girmek kalır. Arama motorlarını en iyi şekilde kullanabilmek için aradığımız veriye göre uygun olan anahtar kelime veya kelimeleri girmek gerekir.
Girdiğimiz anahtar kelime veya kelimelere göre araştırma yapılıp, veritabanında bulunan linkler ayıklanıp bize bir liste halinde sunulacaktır. Bizde bu linklerin açıklamalarına ve başlıklarına göre içeriğine bakıyoruz.
2 türlü arama motoru tipi vardır. Crawlerlar ve dizinler.
Crawlerlar
Crawlerlar web
Lorem Ipsum, dizgi ve baskı endüstrisinde kullanılan mıgır metinlerdir. Lorem Ipsum, adı bilinmeyen bir matbaacının bir hurufat numune kitabı oluşturmak üzere bir yazı galerisini alarak karıştırdığı 1500'lerden beri endüstri standardı sahte metinler olarak kullanılmıştır. sitelerini belli periyotlarla otomatik olarak ziyaret eder. Çoğu sayfayı hafızasına alır. Bir robot gibi düşünün. Sitemizi ziyaret ettiklerinde sayfalarımızdaki her linkide dolaşarak kontrol eder. Backlink denilen olayın amacıda budur. Backlink verdiğimiz siteyi gezerlerken, robotun bizim sayfamızada uğramasını sağlamak.
Crawlerların Bölümleri
Spider :
Crawler olarakda adlandırılır. Spider siteyi ziyaret eder, okur ve sayfamızdaki linkleride dolaşır. Spider siteyi 1 veya 2 ay gibi bir periyotla tekrar ziyaret eder. Aslında buna kesin bir zaman aralığı vermek doğru olmaz. Arama motorlarındaki crawlerlar geniş bir yapay zekaya sahiptir. Kesin bir ziyaret zamanı olmaz.
Index
Spiderın bulduğu bütün sayfalar arama motorunun indexine girer. Indexte spiderin bulduğu sayfaların kopyaları bulunur. Spider tekrar ziyaret ettiğinde eğer güncellenmişse eski indexteki sayfaları yenisiyle değiştirir.
Yazılım
Arama motoru yazılımı ise indexten aldığı sayfaları kullanıcının sorgusuna göre arar bulur ve listeler. Gördüğünüz gibi hepsi birbiriyle ilişkili şekilde çalışır.
Dizin
Dizinlerde; web
Lorem Ipsum, dizgi ve baskı endüstrisinde kullanılan mıgır metinlerdir. Lorem Ipsum, adı bilinmeyen bir matbaacının bir hurufat numune kitabı oluşturmak üzere bir yazı galerisini alarak karıştırdığı 1500'lerden beri endüstri standardı sahte metinler olarak kullanılmıştır. sitelerini, arama motorlarındaki gibi yapayzeka değilde bizim gibi insanlar kontrol eder ve dizine alır. Bu işi bir editör yada moderatör grubu yapar. web
Lorem Ipsum, dizgi ve baskı endüstrisinde kullanılan mıgır metinlerdir. Lorem Ipsum, adı bilinmeyen bir matbaacının bir hurufat numune kitabı oluşturmak üzere bir yazı galerisini alarak karıştırdığı 1500'lerden beri endüstri standardı sahte metinler olarak kullanılmıştır. siteleri kategorilenir faydalı olarak görülen web siteleri dizine alınır. Bunlara kayıt olarak arama motorlarının sitemizi bulmasınıda kolaylaştırmış oluruz.
Bir sonraki yazılarımda site haritalarından bahsedip, php ile site haritası yapımına değineceğim.

İnternette rastladığım ve inceleyip sipariş verdiğim bir baskı firmasının çalışmasından bahsetmek istiyorum. 
