Senin, 19 Januari 2009

google



GOOGLE


Semester akhir memang semester yang paling sibuk buat mahasiswa, terutama yang lagi memepersiapkan Tugas Akhir-nya. Kebetulan aku ingin TA yang berhubungan dengan Internet. Saat mencari-cari makalah untuk bahan TA, aku ketemu dengan satu makalah yang kayaknya seru banget.

Dan ternyata benar, makalah berjudul The Anatomy of a Large-Scale Hypertextual
Web Search Engine ini merupakan formula berisi resep dibalik mesin pencari Google.

tulisan ini dibuat dengan meniru dua orang pendiri Google, Larry Page dan Sergey Brin, saat mereka masih kuliah di Stanford University Amerika. Makalah ini dibawakan pada The Seventh International World Wide Web Conference pada tahun 1998 lalu. Google berawal dari riset mereka untuk membuat mesin pencari yang sanggup untuk
.. crawl and index the Web efficiently and produce much more satisfying search results than existing systems.
( menjelajahi dan mengindeks Web secara efisien dan menghasilkan hasil pencarian yang jauh lebih memuaskan dari sistem yang sudah ada).

Google, tampaknya dibuat atas dasar kekecewaan Larry dan Brin atas mesin pencari yang ada saat itu, macam Yahoo, Altavista dan sebagainya. Dua orang ini dalam memberi contoh 'parah'nya kualitas search engine waktu itu pada makalahnya,
In fact, as of November 1997, only one of the top four commercial search engines finds itself (returns its own search page in response to its name in the top ten results).
Atau, kalau diterjemahkan secara kasar, hanya satu dari empat mesin pencari saat itu yang menghasilkan situsnya sendiri jika mencari namanya sendiri. Parah bukan? Selain itu, meskipun banyak

Diawali itulah, dua orang ini kemudian memulai proyek yang mereka namakan Google, dari istilah googol, yang artinya 10 pangkat 100.

Salah satu inovasi penting yang dilakukan Larry dan Brin saat merancang Google adalah apa yang disebut dengan PageRank. Sebelum Google, hasil pencarian ditampilkan tanpa aturan yang
jelas.

Dalam Google, hasil pencarian diatur agar menampilkan hasil ang terbaik. Ada beberapa cara yang diapakai. Yang paling utama adalah PageRank tadi. Suatu halaman dinilai rangkingnya berdasarkan berapa banyak link yang mengarah ke halaman itu, anchor text dari link,dan ukuran huruf (biasaya yang ditulis dengan huruf besar adalah yang lebih penting). Selain itu hasil pencarian di-cluster (dikelompokkan) berdasarkan server sehingga hasil yang berasal dari situs yang sama akan ditampilkan berdekatan.

Berbeda dengan search engine sebelumnya yang menganalisa content text web, Google menggunakan hiperlink secara besar-besar untuk mengindeks dan mendapatkan informasi dari internet.

Dalam paper ini Larry dan Brin juga menjelaskan tentang 'anatomi' dari mesin pencariannya, mulia dari tipe data yang dibutuhkn hingga arsitektus server.

dan seperti kita tahu, cerita selanjutnya lebih dari sekedar presentasi makalah atau proyek mahasiswa, tapi kisah sukses dua entreprenuer IT yang merubah teknologi menjdai produk yang dinikmati seleruh dunia, dan tentu saja, salah satu perusahaan IT terbesar saat ini.

Buat yang tertarik dengan bidang Internet atau Information Retrieval saya sangat menyarankan untuk membaca makalah legendaris ini:

The Anatomy of a Large-Scale Hypertextual Web Search Engine,
Sergey Brin and Lawrence Page, Computer Science Department,
Stanford University, Stanford, CA, USA

. Google Trend

1. Masukkan kata, untuk melakukan pencarian trend pada object tertentu. Untuk melakukan komparasi pada lebih dari satu object, pisahkan dengan tanda koma.

2. Grafik. Pada contoh di atas, aku pengin cari tahu tentang trend digital camera, canon, nikon.
Setelah kamu klik Search Trends, google akan menampilkan hasil komparasi 3 object perncarian tersebut dalam bentuk grafik.
Bisa kamu lihat, pada legend warnanya untuk bedain digital camera, canon, nikon.

Cara membaca Grafik:

Urutan: Dari grafik bisa diliat dengan jelas bahwa keyword Canon, berada di urutan teratas, diikuti digital camera dan nikon.
Peak: Pada bulan-bulan tertentu, di grafik terlihat setiap akhir tahun, 2/3 bulan terakhir yaitu bulan Oktober, November, Desember, 3 keyword memiliki peak pencarian tertinggi.
Ini disebabkan oleh trend shopping masyarakat selalu meninggi dan memuncak di akhir tahun dan christmas.
Year Range: 2004 - 2008. 2008 dihitung hingga bulan April 2008.

3. Detail Statistik. Google Trends bahkan memberitahukan ke kita tentang keyword² spesifik yang menjadi trend pada satu kurun tertentu. Bisa kamu lihat di legend huruf, A - F.

4. Regional. Aku ngambil region United States. Sudah bisa dipastikan, kalo kamu milih regional laen, hasilnya akan berbeda. Pilihan lainnya, kamu bisa juga milih “All Regions”. Yang tentu saja hasilnya diambil dari cross-kalkulasi semua regional di seluruh dunia selama 2004-2008.

Konklusi dari Riset di Google Trends:

Untuk Satu pilihan keyword, Digital Camera, di komparasi dengan Canon dan Nikon, diketahui bahwa, Canon mempunyai trend paling tinggi. Artinya dalam kurun waktu 2004 - April 2008,
orang lebih banyak ngetik keyword pencarian “Canon” ketimbang keyword Nikon dan digital camera.



Password dalam Google


googleMesin pencari Google disebut-sebut bisa bertindak sebagai password cracker. Hal itu ditegaskan oleh para peneliti di Departemen Ilmu Komputer Cambridge University. Dengan memanfaatkan mesin cari Google, konon password berformat Message-Digest Algorithm 5 (MD5) bisa di-crack.

Steven Murdoch, peneliti keamanan yang mengelola situs blog Light Blue Touchpaper, mendeteksi seorang penyusup yang telah berhasil menyusupi situsnya dan membuat sebuah account administrator pada software blogging WordPress yang diinstal di server. Murdoch lalu tertarik mempelajari password WordPress hacker tersebut.

Password WordPress itu di-hash dan disimpan di dalam database user. Murdoch lalu membuat skrip yang akan meng-hash semua kata dalam kamus bahasa Inggris yang kemudian akan dicocokkan dengan data password yang ada dalam database WordPress.

Hash sendiri merupakan sebuah metode algoritma yang berguna untuk mengaburkan karakter aslinya dengan cara perhitungan matematika. Sedangkan MD5 merupakan salah satu metode hash.

Lebih lanjut, ketika kata tersebut tidak ditemukan, Murdoch beralih ke kamus Rusia namun gagal juga. Murdoch lalu beralih ke mesin cari Google. Ia menginputkan password tersebut ke Google, dan hasil keluaran yang muncul di Google adalah “anthony”. Dipastikan, “anthony” adalah password-nya.

“Dengan teknik seperti ini, Google bisa bertindak sebagai penemu hash,” jelas Murdoch dari Vnunet



Tidak ada komentar:

Posting Komentar