Web crawler adalah
program yang secara otomatis memproses halaman web, sering juga disebut
dengan web spider atau web robot. Cara kerja
hampir sama seperti kita ketika surfing di
internet, bermula dari suatu web, program ini mendownload data kemudian membuka
halaman web berikutnya dari Hyperlink yang ditemui.
Cara kerja :
1. Mengidentifikasikan Hyperlink.
Hyperlink
yang ditemui pada konten akan ditambahkan pada daftar visit
2. Melakukan proses visit secara
rekursif.
Dari
setiap hyperlink, Web crawler akan menjelajahinya dan melakukan
proses berulang, dengan ketentuan yang disesuaikan dengan keperluan
aplikasi.
Kebetulan sekali saya mendapatkan tugas yang didalamnya harus menggunakan software web crawler. Untuk itu saya mencari-cari software web crawler yang akan saya gunakan. Akhirnya saya menemukan Software WWC (Win Web Crawler). Saya sendiri masih bisa dibilang sedikit awam dengan software ini, tetapi saya akan mencoba mereview sedikit tentang Win Web Crawling.
Untuk menggunakan software ini,
kita harus membuat session baru dengan mengklik tombol yang ada pada interface
program tersebut. Dari situ kita bisa memilih sumber apa yang akan kita gunakan
entah itu Search engine, website maupun url. Kemudian setelah itu kita masukan
keyword apa yang akan kita cari untuk kerperluan data tugas kita. Lalu klik Ok,
maka win web crawler secara otomatis akan mencari sendiri data yang kita
inginkan
Alasan saya memakai software ini untuk mengerjakan tugas saya karena software ini cukup simpel untuk digunakan, kemudian dengan sini, pemrosesan data terasa cepat. Satu hal lagi mengapa saya menggunakan software ini, yaitu mudah didapatkan ketika kita surfing di internet.
Kelebihan
- Ukuran file kecil, sehingga memudahkan penginstalan software
- User interface yang simpel sehingga mudah digunakan
Kekurangan
- software bersifat trial selama 15 hari
- pemrosesan data lambat
1 komentar:
ok, terimakasih sudah mengingatkan. Saya sudah menambahkannya.. :)
Post a Comment