TELKOMNIKA (Telecommunication Computing Electronics and Control), 2011
Selama ukuran dari Web terus berkembang, pencarian informasi yang berguna pada Web telah menjadi ... more Selama ukuran dari Web terus berkembang, pencarian informasi yang berguna pada Web telah menjadi semakin sulit. Focused crawler bertujuan untuk menelusuri Web dengan menyesuaikan kepada sebuah topik tertentu. Makalah ini mendiskusikan permasalahan yang disebabkan oleh algoritma pencarian lokal. Crawler dapat terjebak di dalam sejumlah komunitas Web yang terbatas dan mengabaikan halaman Web yang relevan di luar jalur penelusurannya. Sebuah algoritma genetik sebagai algoritma pencarian global dimodifikasi untuk mengatasi permasalahan tersebut. Algoritma genetik digunakan untuk mengoptimalkan penelusuran pada Web dan memilih halaman Web yang lebih sesuai untuk diunduh oleh crawler. Beberapa percobaan evaluasi diselenggarakan untuk memeriksa efektifitas dari pendekatan yang diajukan pada makalah. Peneluran crawler menghasilkan koleksi berisi 3396 halaman Web dari 5390 link yang ditelusuri, atau tingkat penyaringan seleksi Roda-Roulette sebesar 63% dan tingkat keakuratan 93% pada 5 kategori yang berbeda. Hasil tersebut menunjukkan bahwa penggunaan algoritma genetik telah memampukan focused crawler untuk menelusuri Web secara komprehensif, meskipun koleksinya relatif kecil. Selanjutnya, penelitian ini membawa potensi yang besar untuk membangun koleksi yang lebih baik dibandingkan dengan metode focused crawling tradisional.
TELKOMNIKA (Telecommunication Computing Electronics and Control), 2011
Selama ukuran dari Web terus berkembang, pencarian informasi yang berguna pada Web telah menjadi ... more Selama ukuran dari Web terus berkembang, pencarian informasi yang berguna pada Web telah menjadi semakin sulit. Focused crawler bertujuan untuk menelusuri Web dengan menyesuaikan kepada sebuah topik tertentu. Makalah ini mendiskusikan permasalahan yang disebabkan oleh algoritma pencarian lokal. Crawler dapat terjebak di dalam sejumlah komunitas Web yang terbatas dan mengabaikan halaman Web yang relevan di luar jalur penelusurannya. Sebuah algoritma genetik sebagai algoritma pencarian global dimodifikasi untuk mengatasi permasalahan tersebut. Algoritma genetik digunakan untuk mengoptimalkan penelusuran pada Web dan memilih halaman Web yang lebih sesuai untuk diunduh oleh crawler. Beberapa percobaan evaluasi diselenggarakan untuk memeriksa efektifitas dari pendekatan yang diajukan pada makalah. Peneluran crawler menghasilkan koleksi berisi 3396 halaman Web dari 5390 link yang ditelusuri, atau tingkat penyaringan seleksi Roda-Roulette sebesar 63% dan tingkat keakuratan 93% pada 5 kategori yang berbeda. Hasil tersebut menunjukkan bahwa penggunaan algoritma genetik telah memampukan focused crawler untuk menelusuri Web secara komprehensif, meskipun koleksinya relatif kecil. Selanjutnya, penelitian ini membawa potensi yang besar untuk membangun koleksi yang lebih baik dibandingkan dengan metode focused crawling tradisional.
Uploads
Papers by Peter Handoko