Apa itu Web Crawler, Web Spider, Web Robot, WebBot?

Web crawler adalah suatu program atau script otomat yang relatif simple, yang dengan metode tertentu melakukan scan atau “crawl” ke semua halaman-halaman Internet untuk membuat index dari data yang dicarinya. Nama lain untuk web crawl adalah web spider, web robot, bot, crawl dan automatic indexer.

Web crawl dapat digunakan untuk beragam tujuan. Penggunaan yang paling umum adalah yang terkait dengan search engine. Search engine menggunakan web crawl untuk mengumpulkan informasi mengenai apa yang ada di halaman-halaman web publik. Tujuan utamanya adalah mengumpukan data sehingga ketika pengguna Internet mengetikkan kata pencarian di komputernya, search engine dapat dengan segera menampilkan web site yang relevan.

Ketika web crawl suatu search engine mengunjungi halaman web, ia “membaca” teks yang terlihat, hyperlink, dan konten berbagai tag yang digunakan dalam situs seperti meta tag yang banyak berisi keyword. Berdasar informasi yang dikumpulkan web crawl, search engine akan menentukan mengenai apakah suatu situs dan mengindex informasinya. Website itu kemudian dimasukkan ke dalam database search engine dan dilakukan proses penentuan ranking halaman-halamannya.

Namun search engine bukanlah satu-satunya pengguna web crawl. Linguist bisa menggunakan web crawl untuk melakukan analisis tekstual; yakni, mereka bisa menyisir Internet untuk menentukan kata apa yang paling umum digunakan hari ini. Peneliti pasar dapat menggunakan web crawl untuk menentukan dan memanipulasi trend pada suatu pasar tertentu. Ini semua merupakan contoh beragam penggunaan web crawl. Web crawl dapat digunakan oleh siapapun yang melakukan pencarian informasi di Internet.

Web crawl bisa beroperasi hanya sekali, misalnya untuk suatu projek yang hanya sekali jalan, atau jika tujuannya untuk jangka panjang seperti pada kasus search engine, mereka bisa diprogram untuk menyisir Internet secara periodik untuk menentukan apakah sudah berlangsung perubahan signifikan. Jika suatu situs mengalami trafik sangat padat atau kesulitan teknis, spider atau crawl dapat diprogram untuk mencatat hal ini dan mengunjunginya kembali setelah kesulitan teknis itu terselesaikan.

Home | About | Blogging | Daily Life | Insights | News | Videos | SEO

24 thoughts on “Apa itu Web Crawler, Web Spider, Web Robot, WebBot?

  1. wah saya masih ga ngerti, jadi penting ga seh crawler itu??
    bisa ditaro di blog apa gmn neh??
    mohon penjelasan, masih ga ngerti neh hehehe

    Reply
  2. Pingback: Apa itu Web Crawler, Web Spider, Web Robot, WebBot | yanmieonline.com

  3. iya mas ga jelas tolong di detail lg gmana cara pkenya, kalo msti pake script gmana dl nya n use guide komplit lah ya>………………….

    Reply
  4. sob mohon maaf, saya nulis artikel itu dari makalah yang ada di perpustakaan, disana ga tercantum sumber yang ini, ga ada sumber sama sekali, saya juga buat paragraf pertama disana dengan tulisan saya sendiri, pas saya cek di google pun ternyata ada yang menulis artikel yang sama, tapi saya nulis bukan copas dari blog ini atau yang ada di google, makannya saya tidak menyertakan sumbernya.

    Reply
  5. Pingback: Penelusuran Search Engine | Oshigita's Page

  6. Pingback: analisis web | fajarpram

  7. Pingback: Web dan Perilaku pengguna / Interaksi Manusia dengan Komputer | I put my assignments, here

  8. Pingback: Tugas 4 Softskill – Analisis Web dan Ekonomi Web | lusitrirahayu

  9. Pingback: Info Seputar Search Engine | danielkuncoro2

  10. Pingback: Menerapkan Teknik Penelusuran Search Engine – Technology and Information

  11. Pingback: S2.P2. SIMDIG – technoteacher

Leave a comment