uTha: Juni 2011

Ilmu Kerangka Jaringan

Ringkasan

Tulisan ini mengemukakan sebuah rangkaian permulaan untuk penganalisaan dan perpaduan dalam Jaringan Dunia Luas dan jaringan lain seperti rangkaian informasi. Sebuah kumpulan meliputi pencarian soa-soal adalah garis besar, bersama dengan sebuah disipliner pokok perincian, penekanan pada segi permukaan alami dalam jaringan dan segi kedisiplinan alami dalam pembelajarannya dan perkembangannya. Pernyataan-pernyataan dan rangkaian ini mengemukakan sebuah agenda untuk Ilmu Penjaringan, Ilmu Sistem Informasi Desentralisasi. Ilmu jaringan ini membutuhkan kedua jalan untuk di mengerti dalam jaringan, dan sebagai sebuah jalan untuk focus dalam perkembangannya sebagai kunci komunikasi dan pengajuan syarat-syarat. Tulisan ini membuktikan persoalan-persoalan pusat tekinik mesin, seperti perkembangan dalam Arti kata penjaringan, Pelayanan jaringan dan P2P. Permulaan analisis untuk menemukan Topologi Jaringan, atau grafiknya seperti struktur, adalah pengujian. Akhirnya , Jaringan itu adalah sebuah teknologi yang menanamkan esensial sosialisasi: lebih dari itu bermacam persoalan-persoalan dan syarat-syarat untuk penggunaan Jaringan dan penguasaannya juga peninjauannya.
1
Perkenalan

Jaringan Dunia Luas adalah sebuah teknologi yang hanya berumur beberapa tahun, perkembangannya, dan efeknya dalam perkembangan sosialisasi, tingkah lakunya. Permulaannya dalam mendukung kebutuhan informasi dalam pencarian fisik energy tinggi. Dalam penyebaran tidak dapat ditawarkan dalam ilmiah ketertiban lainnya, akademik umum, peniagaan, hiburan, politik dan dimanapun juga di mana komunikasi melayani sebuah maksud [142, 143]. Pembebasan dari paksaan pencetakan dan distribusi pemeriksaan, hasil dari pencarian ilmiah, dan data atas bahwa pencarian adalah membawa, bisa jadi penyebaran luas. Pengubungan membolehkan pekerjaan untuk situasi dalam konteks campuran. Sementara itu, inofasi melebrkan posibilitas untuk komunikasi. Weblogs dan wikis membolehkan imediasi dalam percakapan, dalam potensi multimedia dan interaksi luas.

Tetapi, tidak dengan jaringan tidak juga dunia static. Jaringan menyusun dalam jawaban untuk beberapa tekanan dari ilmu, perniagaan, masyarakat dan polotik. Untuk itu pertumbuhan dalam ilmu dikreasikan sebuah kenutuhan untuk menintegrasikan kualitas besar dalam bermacam-macam atau heterogen data; e-pemerintahan dan e- perniagaan juga bergantung lebih efektif difunakan dalam informasi [34]. Kita diharuskan untuk mengerti evolusi ini dan keterpaksaan untun menkembangkan.

Tanpa sebuah kesempatan apresiasi untuk menambahkan nilai Jaringan dengan fasilitas lebih komunikatif dan kemungkinan gambaran yang mungkin hilang. Tetapi perkembangan tidak seluruhnya adalah sejarah. Walupun segi permukaan dan ekstensibel, Jaringan adalah sebuah susunan dasar artikulasi yang membutuhkan perhatian. Lebih dari itu, Jaringan adalah sebuah teknologi sosial yang tumbuh dalm perkembangannya dan lebih membutuhkan untuk menjadi kepercayaan oleh sebuah perkembanganpengguna dasar-layak dipercaya, control individual melebihi informasi, dan respek terhadap kebenaran dan pilihan lain adalah aspek penting dalam Jaringan. Aspek ini juga membutuhkan pengertian dan penjelasan sebagai penganti Jaringan.

Sebuah agenda pencarian yang dapat membantu mengidentifikasi apa yang dibutuhkan untuk tetap jelas dan di mana perubahan bisa menjadi sebuah keuntungan adalah imperative. Tujuan Ilmu Jaringan ini yang bertujuan untuk merencanakan bagaimana informasi struktrul desentralisasi dapat menjalani ilmiah ini, gambaran dan kebutuhan komunikasi, serta untuk memproduksikan gambaran serta gambaran pemerintahan prinsipalseperti struktur[34]. Kita berpendapat bahwa ilmiah dalam struktur informasi desentralisasi ini adalah hal-hal penting untuk dimengerti bagaimana ketidak umuman dan tidak adanaya rencana jaringan informasi antara orang, agen, database, dan organisasi serta aktor-aktor lainnya dan sumber penghasilan lainnya dapat dilihat informasi itu membutuhkan pengmudi penting seperti e-ilmiah dan e-pemerintahan. Bagaimana menesensialkan sisten desentralisasi dapat memiliki gambaran performa ke dalam kunci jawaban ke dalam Ilmu Jaringan[34].

‘Ilmu Jaringan’ adalah sebuah frase yang berarti ganda. Ilmu-ilmu eksakta adalah sebuah analisi kedisiplinan yang bertujuan untuk menemukan hukum-hukum yang membangkitkan atau menjelaskan pengamatan fenomena; ilmu computer adalah keutamaan ( tidak berfikir secara sekilas) sintetis, dalam formalisme dan algoritma mengkreasikan kedalam perintah untuk mendukung pertikulasi perilaku. Ilmu jaringan harus menjadi pergabungan dalam dua paradigm; Jaringan itu membutuhkan untuk belajar dan mengerti, dan itu membutuhkan, sebuah keahlian teknik. Pada skala mikro, jaringan ini adalah sebuah infrastruktur pembuatan bahasa dan ptotokol; itu adalah sebuah artikel keahlian teknik . tetapi filosofi hubungan ini yang menguasai jaringan dan itu menggunakan komunikasi, hasilnya dalam properti keadaan pada skala marko( beberapa yang diinginkan dan lebih dari itu untuk menjadi sebuah keahlian teknik, yang lainnya tidak diinginkan, dan jika mungkin untuk menjadi keahliannya). Dan tentu saja penggunaan jaringan dalam komunikasi adalah sebuah kelompok dalam sebuah pelebaran sistem dalam interaksi manusia oleh konvensi dan hukum-hukum. Tingkatan fariasi dalam jaringan teknologi interaksi dengan sosialisasi manusia yang berarti bahwa kedisiplinan adalah sebuah kebutuhan ketetapan dalam Ilmu Jaringan.

Seperti sebuah kedisiplinan pencarian agenda, juga untuk mengendalikan lingkungan jaringan dalam sosialisasi dan ilmiah menggunakan berbagai macam jalan, itu tidak tampak dan membutuhkan untuk menjadikan kreatifitas. Pada akhir bulan September 2005 sebuah seminar ilmu jaringan berlangsung di London. UK ( menjelaskan dalam kontribusi seminar itu diberikan dalam ilmu pengakuan-pengakuan). Seinar itu menjelaskan sebuah nomor dalam persoalan-persoalan, mencangkup
• Kemunculan Jurusan pada jaringan
• Tantangan untuk mengerti dan menjelaskan dalam lingkungan jaringan
• Struktur pencarian untuk mendukung eksploitasi dalam kesempatan kreatifitas oleh ( inter alia ) mobilitas, media baru dan penambahan data variable online.
• Penjaminan penting sifat-sifat sosial seperti kepribadian menghormati
• Mengidentifikasi dan pelindungan sesensial tanpa berlainan dalam pengalaman Jaringan

Dalam tuliasan ini pengembangan Seminar Ilmu Jaringan, dan itu di ujico bakan untuk melengkapi, memperluas dan mengomentari dalam debat. Pendekatan sebuah kedisiplinan dibutuhkan persetujuan oleh semuanya, meliputi ilmu computer dan kesahlian teknik, secara fisik dan ilmu metematika, ilmu sosial dan kepemimpinan. Ilmu jaringan , lebuh dari itu, tidak hanya tentang metode untuk permodelan, analisis dan pengertian jaringan macam-macam micro- dan tingkat makroskopik. Itu juga tentang keahlian teknik protocol dan infrastruktur jasa dan sosialisasi yang memimpinnya. Ilmu Jaringan harus jaminan harus mengkordinasi energy dengan sebuah agenda sosial , polis dengan teknik kontrasnya dan kemungkinannya, menganalisi dengan sintetis- itu sudah menjadi sifat kedisiplinan dan tulisan ini adalah struktur untuk mereflesikkannya.
Lingkungan jaringan juga mencangkup penentuan factor-faktor apa yang mencangkup pengalaman jaringan, dan penjaminan bahwa mereka tinggal di tempat. Contohnya pada arsitektur keputusan dasar yang menyangkal jaringan termasuk: 404 erroe, yang berarti bahwa kegagalan itu untuk hubungan jalan lain bukan karena bencana besar; digunakan dalam Uniform Resource Indicator ( URI ); Dan eksploitasi penuh dari infrastruktur Internet yang sudah ada (seperti Domain Name System) sebagai platform yang theWeb dibangun.
Standar juga penting, dan World Wide Web Consortium's
(W3C) bekerja untuk menciptakan dan merekomendasikan standar sementara menjaga-
ing konsensus stakeholder menunjukkan bahwa rekayasa perlu pergi tangan di
tangan dengan proses negosiasi sosial.
Bagian 2 tinjauan prinsip-prinsip ilmiah dan arsitektur dasar
lebih terinci. Menjelajahi metafora dari 'evolusi' dapat membantu kita
untuk menggambarkan Web sebagai ekologi populasi, dan sebagai masyarakat dengan
persyaratan sosial biasa kebijakan dan aturan. Menghubungkan rele-
vant pendekatan, yang meliputi metodologi varian, bervariasi spatiotem-
ukuran butir poral dan pemodelan di berbagai domain, akan
menantang.
Bagian 3 membahas beberapa isu yang harus dilakukan dengan rekayasa
Web, dan bagaimana mempromosikan, dan dipromosikan oleh, teknologi baru seperti
sebagai grid atau jasa. Mungkin salah satu potensi jawab yang paling penting-
opments yang akan dibahas dalam bagian ini adalah SemanticWeb. TheWeb adalah
biasanya ditandai sebagai jaringan banyak dokumen terkait yang
dirancang untuk dibaca oleh manusia, sehingga mesin-pembacaan membutuhkan
heuristik pengolahan bahasa alami. Namun, Semantic
Web, sebuah visi untuk memperluas dan menambahkan nilai ke Web, dimaksudkan untuk
mengeksploitasi kemungkinan pernyataan logis atas data relasional terkait
untuk memungkinkan otomatisasi pengolahan informasi yang banyak. Penelitian dan
pembangunan telah berlangsung selama beberapa waktu sekarang pada pengembangan
bahasa dan formalisms yang akan mendukung query, inferensi, menyelaraskan-
ing model data, visualisasi dan pemodelan.
Untuk berkembang, Semantic Web membutuhkan filsafat desentralisasi yang sama-
ophy sebagai World Wide Web. Salah satu tantangan adalah untuk memastikan bahwa berbagai
data individu sistem dapat digabung dengan konsistensi lokal
tanpa mencoba tugas yang tidak mungkin mencoba untuk menegakkan secara konsisten
Tency global. Selain itu, penggunaan dasar seperangkat simbol -
URI - oleh sejumlah formalisms dengan sifat yang kontras, seperti
aturan dan logika, tanpa mengasumsikan apapun terpusat atau 'dasar' untuk-
malism untuk menggambarkan Web juga non-sepele. Masalah ketiga adalah untuk melakukan
dengan membawa data bersama-sama untuk memanfaatkan kekuatan amalgamasi dan
kebetulan kembali; paling data yang saat ini duduk di repositories6 standalone Pendahuluan
dan tidak diterbitkan (dalam kontras dengan WWW, dimana dokumen
secara rutin tersedia untuk khalayak yang lebih luas).
Bagian 4 membahas upaya untuk menganalisis Web dalam cara yang dapat
umpan balik dalam upaya rekayasa. Sebagai contoh, pemodelan Web
matematis akan memungkinkan pencarian dan pengambilan informasi untuk menjaga
berpacu dengan perkembangannya, terutama jika dikaitkan dengan bidang-bidang penting seperti
pengolahan bahasa alami, analisa jaringan dan pemodelan proses.
Memahami struktur muncul dan topologi makroskopik akan membantu
untuk menghasilkan hukum konektivitas dan skala yang Web
sesuai.
Sebagaimana dicatat, nilai web tergantung pada penggunaannya oleh dan dalam masyarakat,
dan kemampuannya untuk melayani kebutuhan komunikasi tanpa merusak lainnya
berharga jenis interaksi. Ini berarti memahami kebutuhan-kebutuhan,
mereka hubungannya dengan struktur sosial lainnya, dan interaksi dua arah
dengan perkembangan teknologi. isu-isu sosial seperti ini dis-
didiskusikan dalam Bagian 5, dan termasuk isu-isu filosofis yang harus dilakukan dengan
arti simbol, masalah logis seperti metode penalaran,
dan sosial termasuk penciptaan dan pemeliharaan kepercayaan, dan
pemetaan komunitas sosial melalui kegiatan mereka di Web.
Beberapa interaksi antara masyarakat dan teknologi Web
saat ini dan memerlukan peraturan dan kebijakan untuk mengekspresikan preferensi.
Sebagai contoh, Web Semantic jelas memotivasi sebuah perusahaan dan indikator-
keharusan budaya vidual untuk mempublikasikan dan data saham sumber daya, yang
gilirannya akan memerlukan kebijakan berhubungan dengan kontrol akses, privasi, identitas
dan properti intelektual (serta sebagai antarmuka dan sistem yang dapat
mengungkapkan aturan kebijakan untuk basis pengguna heterogen). Kebijakan, tata pemerintahan
dan isu-isu politik seperti ini dibahas dalam Bagian 6.
Bagian 7 menyediakan sebuah kesimpulan singkat, meringkas kasus untuk
Ilmu Web, dan encapsulating visi bahwa teks ini, dalam
formulir diperpanjang, telah disajikan.

2
Web dan Ilmu nya

Kita mungkin parafrase Web Sains sebagai ilmu dari Web. Sementara ini
kesetaraan mungkin jelas kita akan mulai dengan memecah frase
dan membuat sketsa komponen yang memungkinkan Web berfungsi sebagai
informasi yang efektif sistem yang terdesentralisasi. Kami akan meninjau dasar
prinsip-prinsip arsitektur dari Web, yang dirancang untuk mendukung pertumbuhan dan
nilai sosial perilaku berbagi informasi dan dapat dipercaya dalam
Bagian 2.1. Bagian 2.2 akan menawarkan beberapa refleksi metodologis
pada penyelidikan ilmiah dari Web.
1 Web arsitektur
Arsitektur dari Web eksploitasi teknologi sederhana yang menghubungkan
efisien, untuk mengaktifkan ruang informasi yang sangat fleksibel dan
bermanfaat, dan yang paling penting, skala. Web adalah sudah menjadi
mengesankan platform tempat ribuan bunga telah mekar,
dan harapan itu dapat tumbuh lebih lanjut, meliputi bahasa lebih lanjut,
lebih media dan kegiatan lebih, hosting informasi lebih lanjut, serta
menyediakan alat dan metode untuk menginterogasi data yang ada di luar sana. Dalam bagian pembukaan kita akan meninjau secara singkat prinsip utama
78 Web dan Ilmu nya mendasari arsitektur Web; bagian ini adalah berhutang budi kepada [155], dan untuk detail lebih lanjut, lihat dokumen itu.
Web adalah ruang di mana sumber daya yang diidentifikasi oleh Seragam
Resource Identifier (URI - [33]). Ada protokol untuk mendukung
interaksi antara agen, dan format untuk mewakili informasi
sumber daya. Ini adalah bahan dasar dari Web. Pada desain mereka
tergantung utilitas dan efisiensi interaksi Web, dan desain yang
tergantung pada gilirannya pada sejumlah prinsip, beberapa di antaranya merupakan bagian dari
konsepsi asli, sementara yang lain harus belajar dari pengalaman.
Identifikasi sumber daya penting untuk dapat berbagi
informasi tentang mereka, alasan tentang mereka, memodifikasi atau pertukaran mereka.
sumber daya tersebut dapat berupa apa saja yang dapat dihubungkan atau dibicarakan;
banyak sumber daya adalah murni informasi, tetapi yang lain tidak. Selanjutnya,
tidak semua sumber daya yang di Web, di bahwa mereka mungkin dapat diidentifikasi dari
Web, tetapi tidak mungkin dapat diambil dari itu. Sumber daya yang
pada dasarnya informasi, dan yang karenanya dapat diberikan dengan
keluar abstraksi dan dicirikan sepenuhnya dalam pesan disebut
informasi sumber daya.
Untuk penalaran dan fungsi mengacu terjadi pada global
skala, sistem identifikasi diperlukan untuk menyediakan satu global
standar; URI menyediakan sistem itu. Akan mungkin bagi alterna-
sistem tive untuk URI untuk dikembangkan, tetapi nilai tambah satu
global sistem pengidentifikasi, memungkinkan menghubungkan, bookmark dan lainnya
fungsi berbagai aplikasi heterogen, tinggi. Sumber Daya telah
URI terkait dengan mereka, dan setiap URI idealnya mengidentifikasi satu
sumber daya secara konteks-independen. URI bertindak sebagai nama (dan
alamat - lihat Bagian 3.1.2 di bawah ini untuk pembahasan masalah ini), dan sebagainya
apakah mungkin untuk menebak sifat sumber daya dari perusahaan URI, yang merupakan
Hal kontingen, dalam URI umumnya lihat opaquely. Prinsip-prinsip
hubungan antara URI dan sumber daya yang diinginkan tetapi tidak tegas
dilaksanakan, biaya gagal mengaitkan URI dengan sumber daya adalah
ketidakmampuan untuk merujuk ke sana, sedangkan biaya penempatan dua sumber
ke URI akan error, sebagai data tentang salah satu sumber daya akan diterapkan ke
lainnya.
URI juga menghubungkan Web dengan dunia sosial offline, di
mereka mewajibkan lembaga. Mereka berada di bawah skema didefinisikan tertentu, 2.1. Web arsitektur 9
yang mungkin yang paling umum dipahami adalah HTTP, FTP
dan mailto, skema tersebut terdaftar dengan internet Ditugaskan
Nomor Authority (IANA - http://www.iana.org/assignments/uri-
skema). Skema ini harus dioperasikan pada jalur berprinsip pada
Agar efektif.
Jadi jika kita ambil HTTP sebagai contoh, HTTP URI dimiliki dan dis-
bursed oleh orang atau organisasi, dan maka dapat dialokasikan bertanggung
sibly atau tidak bertanggung jawab. Sebagai contoh, sebuah URI HTTP harus mengacu ke
sumber tunggal, dan dialokasikan untuk pemilik tunggal. Hal ini juga diinginkan
untuk suatu URI untuk merujuk kepada sumber daya yang permanen, dan tidak mengubah
referensi dari waktu ke waktu (lihat Bagian 5.4.6 di bawah). Komunikasi melalui
Web melibatkan pertukaran pesan yang dapat berisi data atau
metadata tentang sumber daya. Salah satu tujuan umum dari komunikasi adalah
mengakses sumber daya melalui URI, atau untuk dereference URI. Jika sumber daya
telah diberi sebuah identifier, sumber daya harus dalam beberapa cara-recov
erable dari pengenal agar bisa nilai. Dereferencing biasanya
melibatkan menemukan indeks yang tepat untuk mencari pengenal. Ada
sering petunjuk dalam pengenal, atau penggunaan bantuan identifier, yang
di sini, terutama jika pihak berwenang penamaan memiliki semacam hierar-
chical struktur.
Sebagai contoh, alamat pos memiliki struktur hirarkis yang
memungkinkan sebuah bangunan tertentu yang akan berada. Satu akan berkonsultasi dengan
indeks AZ London untuk menemukan jalan tertentu yang namanya satu
tahu dan yang satu tahu terletak di London, tapi ada lagi
tentang hal itu. Demikian pula, Domain Name System (DNS) eksploit hierar-
struktur chical untuk membantu dengan dereferencing, sehingga untuk menghubungi server
"Foo.cs.bar.edu" melibatkan pengiriman pesan dari beberapa macam beberapa server
dikendalikan oleh Bar University di Amerika Serikat. Semakin banyak informasi
tion yang tersedia dalam nama atau identifier dari sumber daya, semakin mudah
itu adalah untuk dereference, walaupun tentu saja dalam hal sumber daya yang membatasi
nama perlu mengandung ada informasi sama sekali untuk membantu dereferencing itu
(Kadang-kadang ini adalah titik nama). Selanjutnya, identifikasi
sistem sering harus dipertahankan oleh otoritas untuk dereferencing
menjadi mungkin - jika AZ London tidak diperbarui setiap begitu sering, itu
akan menjadi mustahil untuk menggunakannya (edisi terbaru) untuk mencari topik tertentu-
ular rumah, dengan cara yang sama bahwa perubahan di Universitas Bar server10 Web dan Ilmu nya
program pemeliharaan dapat berarti bahwa beberapa sumber daya yang diselenggarakan pada nya
server yang unlocatable.
Apa mengakses sumber informasi memerlukan bervariasi dari konteks
konteks, tapi mungkin pengalaman yang paling umum adalah menerima
representasi dari (keadaan) sumber daya pada browser. Tentu
tidak perlu kasus yang dereferencing URI otomatis mengarah ke
agen mendapatkan akses istimewa ke sumber daya. Ini mungkin bahwa tidak ada
representasi dari sumber daya tersedia, atau bahwa akses ke sumber daya
aman (misalnya kata sandi terkontrol), tetapi mungkin untuk merujuk
ke sumber daya menggunakan perusahaan URI tanpa memaparkan sumber daya yang untuk umum
tampilan. Pengembangan Web sebagai spasi, bukan yang besar
dan papan pengumuman kompleks, mengikuti dari kemampuan agen untuk menggunakan
interaksi untuk mengubah negara dari sumber daya, dan menanggung kewajiban dan
tanggung jawab. Mengambil representasi adalah contoh dari apa yang disebut
interaksi yang aman di mana perubahan tidak terjadi, sementara posting daftar adalah
interaksi yang tidak aman di mana negara-negara sumber daya 'dapat diubah. Perhatikan bahwa
sifat universal URI membantu identifikasi dan pelacakan
kewajiban yang timbul secara online melalui interaksi yang tidak aman.
Tidak semua URI dimaksudkan untuk memberikan akses kepada perwakilan
reaksi yang diharapkan dari sumber daya yang mereka mengidentifikasi. Misalnya, mailto ini:
skema mengidentifikasi sumber daya yang dicapai dengan menggunakan Internet mail (misalnya
mailto: romeo@example.edu mengidentifikasi kotak surat tertentu), tetapi mereka
sumber daya yang tidak dapat dipulihkan dari URI dengan cara yang sama sebagai web-
halaman. Sebaliknya, URI digunakan untuk surat langsung ke mail tertentu-
kotak, atau alternatif untuk menemukan mail dari itu.
Web mendukung berbagai format file, yang paling
terkenal adalah HTML. Beberapa format yang diperlukan, dan format perlu
fleksibel, karena sifat heterogen dari interaksi selama
Web. Konten dapat diakses melalui segala macam perangkat, paling sering
PC atau perangkat mobile, dan nilai lebih dapat diekstraksi dari
Web jika penyajian konten adalah perangkat-independen sejauh pos-
jawab (idealnya kompatibel dengan perangkat yang belum bermimpi). Memisahkan
representasi dari isi dari keprihatinan presentasi dan
interaksi adalah praktik yang baik di sini; bawah seperti konten, rezim, presen-
tation dan interaksi perlu digabungkan dengan cara yang maximally2.1. Web arsitektur 11
berguna, yang umumnya dilakukan sebagian oleh server dan sebagian oleh
klien, rasio yang tepat antara kedua tergantung pada konteks
interaksi.
Kekuatan Web berasal dari mengaitkannya memungkinkan.
sumber daya dapat berisi referensi ke sumber lain dalam bentuk
tertanam URI yang dapat digunakan untuk mengakses sumber daya kedua. Ini
Link memungkinkan navigasi asosiatif theWeb. Untuk memfasilitasi menghubungkan, untuk-
tikar harus mencakup cara-cara untuk membuat dan mengidentifikasi link ke sumber daya lainnya,
harus memungkinkan link ke setiap sumber daya di mana saja melalui Web, dan harus
tidak membatasi penulis konten untuk menggunakan skema tertentu URI.
Sebuah tujuan penting dari Web Ilmu adalah untuk mengidentifikasi aspek-aspek penting
identifikasi, interaksi dan representasi yang membuat Web
kerja, dan untuk memungkinkan pelaksanaan sistem yang dapat mendukung
atau mempromosikan perilaku yang diinginkan. Pengalaman menghubungkan dokumen
dan, semakin, data rilis kekuatan besar, baik untuk penulis dan pengguna.
Kemungkinan kembali kebetulan konten memberdayakan penulis oleh
meningkatkan pengaruh mereka, dan pengguna dengan menyediakan akses lebih
informasi dari yang dimungkinkan dengan menggunakan teknologi lainnya.
Secara khusus, tiga fungsi identifikasi, interaksi dan
representasi harus dipisahkan. Mengubah atau menambahkan skema
untuk identifikasi, misalnya, seharusnya tidak berpengaruh pada skema untuk interaksi
atau representasi, memungkinkan independen, evolusi modular Web
arsitektur sebagai teknologi baru dan aplikasi baru mulai beroperasi
(Yang tidak berarti bahwa spesifikasi ortogonal tidak mungkin co-berevolusi
siklis dengan satu sama lain). Demikian pula, teknologi harus diperluas,
yaitu mereka harus mampu berkembang secara terpisah tanpa mengancam
mereka interoperabilitas dengan teknologi lainnya.
Akhirnya, prinsip penting arsitektur Web yang error
harus ditangani secara sederhana dan fleksibel. Kesalahan sangat penting - dalam informasi an-
mation ruang yang ukurannya dapat diukur dalam ribuan terabyte,
dan jumlah pengguna dalam ratusan juta, heterogenitas
tujuan dan kualitas beragam kepengarangan berarti bahwa akan ada
banyak sekali kesalahan desain. Keberadaan link menjuntai (link menggunakan URI
tanpa sumber daya di akhir itu), konten yang tidak baik-formed atau lainnya
diprediksi kesalahan seharusnya tidak menyebabkan sistem crash, sedangkan demands12 Web serta Sains
interoperabilitas mensyaratkan bahwa agen harus dapat pulih dari
kesalahan, tanpa, tentu saja, kompromi kesadaran pengguna bahwa kesalahan
telah terjadi.
Sebagai Web tumbuh dan berkembang untuk memenuhi situasi baru dan pur-
pose, arsitektur harus berkembang. Tapi evolusi perlu
bertahap dan hati-hati (yang lambat dan selalu telaten negosiasi
standar komite adalah cara yang baik untuk menggabungkan gradualisme dengan fit-
ness untuk tujuan), dan prinsip menjaga perkembangan ortogonal
terpisah berarti bahwa evolusi di satu daerah tidak boleh mempengaruhi evolusi
tempat lain. evolusi perlu menghormati invariants penting
Web, seperti ruang URI, dan penting bahwa pengembang
setiap saat bekerja untuk melestarikan aspek-aspek Web yang perlu
diawetkan. Ini merupakan bagian dari misi W3C Teknis Archi-
tecture Group [154], meskipun standar dapat hanya pernah menjadi bagian dari
cerita. prinsip-prinsip arsitektur Web akan selalu diperdebatkan di luar
W3C, cukup baik, serta di dalamnya.
Web 2.2 sains: Metodologi
Jika penyelidikan dari Web yang akan dihitung sebagai benar scien-
tific, maka pertanyaan segera adalah bagaimana metode ilmiah harus berlaku
ini domain tertentu. Bagaimana seharusnya peneliti dan insinyur
Web pendekatan untuk memahami dan hubungannya dengan lebih luas
masyarakat, dan untuk berinovasi?
Berbagai aspek dari Web relatif baik dipahami, dan sebagai
sebuah contoh rekayasa blok bangunan yang dibuat, tidak phe alam
nomena. Namun demikian, sebagai Web telah berkembang dalam kompleksitas dan
jumlah dan jenis interaksi yang terjadi telah membengkak, itu
tetap kasus yang kita tahu lebih banyak tentang beberapa phe alam yang kompleks
nomena (contoh jelas adalah genom manusia) daripada kita lakukan
yang satu ini rekayasa tertentu.
Namun itu benar-benar berkembang, ada Web Ilmu layak nama
perlu memenuhi beberapa kondisi yang jelas. Ada perlu
menjadi falsifiabilty hipotesis dan pengulangan penyelidikan. Ada
akan perlu prinsip-prinsip independen dan standar untuk menilai
ketika hipotesis telah dibentuk. Ada masalah nyata seperti to2.2. Web ilmu: Metodologi 13
bagaimana prinsip-prinsip dan standar harus tiba di. Dan tentu saja
harus ada metode untuk bergerak dari penilaian dari Web dan
yang evolusi untuk pengembangan dan pelaksanaan inovasi.
Untuk mengambil satu contoh, ada sejumlah teknologi dan meth-
ods untuk pemetaan Web dan menandai keluar topologi nya (lihat Bagian 4.1
bawah). Apa peta seperti kepada kita (lih. misalnya [80])? The visualisasi
seringkali sangat mengesankan, dengan interpretasi tiga-dimensi dan
warna-kode link antara node. Tapi bagaimana diverifikasi adalah peta seperti itu? Dalam
indra apa yang mereka katakan kami 'bagaimana Web adalah'? Apa keterbatasan?
Aplikasi jelas, dalam hal metodologis, peta dan
grafik struktur Web adalah untuk langsung sampling, dengan menentukan
properti yang model dan sampel dari Web seharusnya. The cepat
pertumbuhan Web membuat survei yang lengkap dari tahun-tahun pertanyaan
lalu, dan ilmuwan kebutuhan informasi statistik yang cepat dan tepat waktu tentang
isi sastra Web tersedia. Perwakilan sampling adalah kunci
untuk metode tersebut, tapi bagaimana seharusnya sebuah sampel dikumpulkan dalam rangka
secara tepat disebut wakil [188]? Untuk menjadi benar bermanfaat, sam a-
Misalnya harus acak; 'keacakan' biasanya ditetapkan untuk tertentu
domain, dan pada umumnya berarti bahwa semua individu dalam domain memiliki
kemungkinan yang sama yang dipilih sebagai sampel. Tapi untuk Web
yang memerlukan, misalnya, memahami apa yang individu, karena
Misalnya, apakah kita peduli dengan website atau halaman Web? Jika mantan,
maka orang bisa membayangkan kesulitan karena tidak ada pencacahan lengkap
mereka. Dan metode sampling berdasarkan, mengatakan, alamat IP-komplikasi
berdedikasi oleh penduduk tentu jarang dari ruang alamat [219].
Selanjutnya, begitu murah adalah operasi di Web bahwa num kecil
ber dari operator bisa miring namun hati-hati hasil sampel adalah
dipilih. Sebuah survei melaporkan secara lebih rinci di bawah ini [99] tampaknya dis-
ditutupi bahwa 27% dari halaman dalam domain de. diubah setiap minggu, sebagai
dibandingkan dengan 3% untuk Web secara keseluruhan. Penjelasan ternyata
tidak menjadi kerajinan khas Jerman, melainkan di atas
juta URL, sebagian tetapi tidak semua pada server Jerman, yang memutuskan untuk suatu
satu alamat IP, yang secara otomatis dihasilkan dan terus berubah
situs pornografi.
Web memiliki banyak sifat yang tidak biasa yang membuat sampling rumit;
bagaimana bisa rasa hormat metode sampling apa yang tampaknya papan nama prima significant14 Web dan Ilmu nya
sifat seperti, misalnya, persentase halaman diperbarui setiap hari,
mingguan, dll? Bagaimana kita bisa faktor dalam isu-isu seperti kemerdekaan
mendasari sumber data? Apakah kita memiliki banyak pemahaman dari distribusi
bahasa di seluruh Web (dan istilah dalam bahasa -. cf [167]),
dan bagaimana meningkatkan kepandaian dalam memberikan mempengaruhi hal-hal [138]?
Dan bahkan jika kita senang dengan metodologi sampling kami, di tengah-tengah bagaimana semua suara bisa kita menemukan struktur menarik efisien [191]?
Selanjutnya, meskipun untuk banyak tujuan Web dapat diobati
sebagai ruang informasi statis, tentunya dinamis dan berkembang.
Jadi segala upaya untuk memahami longitudinal Web akan membutuhkan
untuk mengambil evolusi itu ke dalam account [218], dan model idealnya
memiliki pertumbuhan sistem (dalam hal penambahan konstan baru
titik dan sisi ke grafik), bersama-sama dengan struktur link yang
tidak invarian dari waktu ke waktu, dan hubungan domain hirarkis yang
selalu rentan terhadap revisi, dibangun ke dalam mereka (lih. misalnya [253]).
Analytic pemodelan dikombinasikan dengan data empiris yang dikumpulkan dengan hati-hati
dapat digunakan untuk menentukan probabilitas halaman Web yang sedang diedit
(Mengubah konten informasi mereka) atau tidak dihapus. Satu percobaan
pengawasan ratusan ribu halaman selama beberapa bulan
Hasil menarik yang dihasilkan: setiap putaran satu waktu sekitar 20% dari web-
halaman di bawah 11 hari tua, sedangkan 50% muncul di sebelumnya
tiga bulan. Di sisi lain, 25% lebih dari berumur tahun - usia yang
didefinisikan di sini sebagai perbedaan antara waktu modifikasi terakhir
tion ke halaman dan waktu download [43]. Percobaan lain
terlibat merayapi 150m halaman HTML sekali seminggu selama 11 minggu,
dan menemukan, misalnya, kuat hubungan antara tingkat-top
domain dan frekuensi perubahan (. halaman com diubah lebih fre-
paling sering dari gov atau.. halaman edu), dan bahwa dokumen-dokumen besar (mungkin
counterintuitively) diubah lebih sering dari yang kecil.
Frekuensi perubahan terakhir adalah prediktor yang baik di masa depan
perubahan, hasil potensial penting bagi perayap Web incremental
[99]. Perkembangan metode sampling feed Web yang sangat
cepat ke dalam pengembangan pencarian lebih efisien dan akurat.
Metode untuk menemukan informasi secara online, baik logis atau heuristik,
apakah data-berpusat atau pada model sistem temu kembali informasi, memerlukan
mapping.2.2 akurat. Web ilmu: Metodologi 15
Jadi salah satu aspek dari Web Ilmu adalah investigasi Web dalam
untuk tempat ancaman, peluang dan invariants untuk pengembangannya.
Lain adalah rekayasa yang baru, mungkin metode tak terduga
berurusan dengan informasi, yang menciptakan ekstensi non-konservatif
Web. teknik tersebut dapat berbasis penelitian, atau industri berbasis.
Sintesis sistem baru, bahasa, algoritma dan alat-alat adalah kunci
untuk pengembangan koheren dari Web, seperti, misalnya, dengan
studi tentang sistem kognitif, dimana banyak kemajuan beberapa tahun terakhir
tahun telah datang dengan teknik eksplorasi serta analisis dan
deskripsi (lih. misalnya [51]). Jadi, misalnya, satu-satunya cara untuk menemukan
dampak dari file sharing radikal desentralisasi adalah untuk mengembangkan peer to peer
sistem dan operasi mereka amati pada skala semakin besar. Seperti
upaya rekayasa perintis sangat penting untuk pengembangan Web, melainkan
adalah setelah semua konstruksi. Hal ini penting untuk Web secara keseluruhan yang
implementasi sistem berinteraksi dan tidak mengganggu, yang mana
badan standar memainkan peranan penting.
Oleh karena itu Web Sains adalah kombinasi dari sintesis, analisis dan pemerintah-
kelola. Dalam sisa teks ini, kami akan mengambil tiga aspek pada gilirannya,
dimulai dengan sintesis, maka analisis, dan kemudian isu-isu sosial yang
berdampak pada pengembangan Web, sebelum berakhir dengan diskusi
masalah pemerintahan.

3
Rekayasa Web
Pelacakan pengembangan Web, yang menentukan inovasi
baik (misalnya P2P) dan yang buruk (phishing misalnya), dan memberikan kontribusi bagi
perkembangan menguntungkan adalah kunci bertujuan Ilmu ofWeb. Pada bagian ini, kita
akan meninjau beberapa petunjuk saat pembangun Web. Kami
akan melihat Web Semantic dan beberapa isu dan kontroversi
sekitarnya yang (Bagian 3.1), masalah berkaitan dengan referensi dan identitas
(Yang penting untuk Web Semantic untuk memastikan, tetapi juga untuk setiap
jenis analisis informasi berbuah - Bagian 3.2), dan kemudian pilihan
inisiatif lebih lanjut, termasuk layanan Web, P2P, komputasi grid dan
sebagainya (Bab 3.3).
3.1 Web semantik
Web adalah arsitektur berprinsip standar, bahasa dan
formalisms yang menyediakan platform untuk aplikasi heterogen banyak
subpopulasi. Hasilnya bisa mudah menjadi kusut, dan keputusan yang dibuat tentang
standar yang mengatur satu formalisme dapat memiliki konsekuensi di luar,
yang dapat timbal tentu saja untuk keputusan desain yang kompleks (cf. [146]). Memang,
beberapa tuntutan di Web membuat godaan untuk model yang
semantik dengan formalisms sangat ekspresif, namun expressivity seperti
perdagangan umum off melawan kegunaan dan satu set kecil baik dipahami
prinsip-prinsip.
Namun, sering terjadi bahwa trade-off antara expressivity
dan kegunaan adalah akibat dari penyalahgunaan umum dari formalisms tersebut. Untuk
contoh - kita akan membahas contoh ini secara lebih rinci di bawah ini - menggunakan
dari mesin, diimplementasikan dan diusulkan, dari Web Semantic
[35, 17] untuk memperpanjang Web merupakan tujuan umum. Tapi desain
SW dan terkait formalisms dan alat-alat dimaksudkan untuk memperpanjang
Web untuk menutupi data terkait, tidak, seperti yang sering diasumsikan, untuk meningkatkan pencarian
atau mendapatkan kekuatan yang lebih besar dari teks beranotasi (yang lain, terpisah,
jenis ekstensi dari Web).
Ini mungkin, sebagai klaim banyak dan berharap, bahwa lokal model dan muncul
semantik merupakan bagian penting dari cara kita memahami
Web. Jika demikian, akan ada serius trade-off dengan interoperabil-
ity: manfaat dari pencarian didistribusikan terstruktur dan berbagi data
besar namun memerlukan semantik interoperable. Meninggalkan semantik underde-
termined berarti memaksa pengguna (manusia) untuk melakukan pembuatan rasa, seperti untuk
Misalnya dengan sistem P2P saat ini yang, jika mereka memaksakan semantik di
semua, cenderung hanya menggunakan sangat sederhana, tingkat rendah, struktur tugas-relatif. Dalam tertentu, asumsi bahwa aparat dari Web Semantic adalah
dirancang untuk memperpanjang teknologi yang tersedia untuk melihat dokumen
dapat menyebabkan khawatir tentang trade-off antara Seman "mudah" muncul-
tics dan "sulit" logika yang salah, kita harus berhati-hati untuk tidak
bingung dua area aplikasi terpisah.

3.1.1 Web Semantic
Web memulai hidup sebagai upaya untuk membuat orang untuk mengubah mereka
perilaku dalam cara penting. Banyak orang membuat dokumen, namun
Web pra-asumsi bahwa dokumen adalah swasta prop-
kemiskinan dari penciptanya, dan keputusan untuk mempublikasikan miliknya nya atau sendirian.
Selain itu, teknologi untuk memungkinkan orang untuk menerbitkan dan dissemi-
dokumen nate murah dan mudah sangat kurang. Tujuan Web adalah
untuk mengubah perilaku yang radikal dan menyediakan teknologi untuk melakukannya:
orang akan membuat dokumen mereka tersedia bagi orang lain dengan menambahkan links18 Rekayasa Web
untuk membuat mereka dapat diakses dengan mengikuti link. Pesatnya pertumbuhan theWeb,
dan cara di mana perubahan ini cepat diadopsi di semua sektor
masyarakat Barat mungkin mengaburkan radikalisme dari langkah ini.
Web Semantik (SW) merupakan upaya untuk memperluas potensi
Web dengan ekstensi analog perilaku orang. SW
mencoba untuk membuat orang untuk membuat data tersedia untuk orang lain, dan menambahkan
link untuk membuat mereka dapat diakses dengan mengikuti link. Jadi visi
SW adalah sebagai perluasan dari prinsip-prinsip Web dari dokumen untuk data. Ini
ekstensi, jika hal itu terjadi dan diterima, akan memenuhi lebih dari Web
potensial, dalam hal ini akan memungkinkan data yang akan dibagi secara efektif dengan yang lebih luas
masyarakat, dan untuk diproses secara otomatis oleh alat serta
manual [34]. Hal ini tentu saja menciptakan suatu persyaratan besar: seperti alat-alat harus
dapat memproses data dalam format bersama heterogen, berkumpul
menggunakan prinsip yang berbeda untuk berbagai tugas utama. The Web
kekuasaan akan yang jauh lebih besar jika data dapat didefinisikan dan terkait sehingga
bahwa mesin bisa melampaui tampilan, dan bukannya mengintegrasikan dan alasan
tentang data berbagai aplikasi (dan di seluruh organisasi atau masyarakat
batas). Saat ini, Web yang sangat tidak baik pada teks, musik dan
gambar, dan boleh juga di video dan jasa, namun data tidak dapat dengan mudah
digunakan pada skala Web [135]. Tujuan dari SW adalah untuk memfasilitasi menggunakan
data serta penemuan mereka, melampaui Google dalam hal ini.
Dalam konteks ini adalah layak disebut perbedaan antara
pengambilan informasi dan pengambilan data (alias otomatis pertanyaan-
menjawab). Tujuan yang pertama adalah untuk menghasilkan dokumen yang
relevan dengan query; dokumen ini tidak perlu menjadi unik, dan dua
episode berhasil pencarian informasi tetap dapat menghasilkan
hasil yang sama sekali berbeda. Tujuan yang terakhir adalah untuk menghasilkan
benar jawaban query. Ada perbedaan besar antara
dua jenis pencarian, dan kepatuhan ketat terhadap prinsip-prinsip formal
bahwa proyek terakhir membutuhkan mungkin menjadi penentu utama dari apa yang
struktur seseorang harus pilih ketika salah satu adalah menemukan skema untuk memberikan
signifikansi istilah dalam kueri seseorang. Data dalam arti yang sangat nyata
lebih fundamental dari sebuah dokumen, maka potensi kenaikan
Web kekuasaan. Ada juga banyak data di luar sana.
Masalah terbuka kedua adalah apa fungsi dapat dicapai
dengan membawa keluar hubungan antara berbagai data sources.3.1. Web semantik 19
Secara tradisional, di AI misalnya, basis pengetahuan atau sistem pakar,
atau bahkan database dalam sebuah organisasi, yang digunakan untuk mewakili certi-
fied informasi yang handal, dapat dipercaya, mungkin konsisten dan
sering didasarkan pada strategi akuisisi terpusat dan representasi
protokol. Di Web, tentu saja, asumsi ini tidak selalu
berlaku. Sebagai contoh, kita harus memastikan bahwa inkonsistensi (yang kita
harus berharap menemukan di Web) tidak menggelincirkan semua kesimpulan dari
kelompok tertentu sumber-sumber pengetahuan yang saling tidak konsisten. Banyak
aplikasi untuk SW belum mulai beroperasi, tetapi beberapa cara
datang untuk berdamai dengan potensi scruffiness bahkan baik terstruktur
data dari beberapa sumber adalah sebuah isu [278].
Strategi SW berikut, oleh karena itu, adalah untuk menyediakan umum
kerangka kerja untuk pembebasan data, berdasarkan deskripsi Resource-
tion Framework (RDF), yang mengintegrasikan berbagai aplikasi
menggunakan XML sebagai pertukaran sintaks [195]. Raw data dalam database
dibawa bersama-sama, dan terhubung ke model dunia (melalui
ontologi - lihat di bawah), yang kemudian memungkinkan agregasi dan analisa
data dengan memproduksi interpretasi konsisten di seluruh heterogen
sumber data. fokus, oleh karena itu, pada data itu sendiri. SW ini tidak
hanya masalah menandai dokumen HTML di Web, ataupun
varian pada masalah IR tradisional pengambilan dokumen. Ini adalah
berusaha untuk membawa bersama data di seluruh Web sehingga membuat luas
database melampaui komponennya, yang membuat aplikasi mungkin-
tions yang menyimpulkan seluruh data heterogen, seperti CS AKTive Space
yang memungkinkan browsing dan kesimpulan di berbagai sumber data
kronik keadaan disiplin ilmu komputer di Amerika
Kerajaan [251].
Model SWdata sangat berhubungan dengan dunia relasional
data (di mana data direpresentasikan sebagai hubungan n-ary, yang sesuai
ke sebuah meja - [62]), begitu dekat memang bahwa ada langsung
pemetaan dari database relasional untuk RDF. Sebuah database relasional adalah
tabel yang terdiri dari catatan, yang merupakan baris. Setiap record
terdiri dari ladang, yang analog dengan kolom, dan seorang individu
catatan tidak lebih dari isi dari bidangnya (isi
sel-sel dari matriks yang jatuh dalam baris). Catatan node RDF,
bidang adalah properti RDF dan bidang rekaman nilai [28] .20 Rekayasa Web
Jadi, misalnya, seperti meja mungkin merepresentasikan data tentang mobil. Setiap
baris (record) akan terkait dengan mobil tertentu, dan setiap kolom
beberapa properti atau lapangan (warna, pemilik, nomor registrasi, jenis, baru-baru ini
mekanik sejarah dan sebagainya). Jadi beberapa properti tertentu dari mobil
diwakili dalam merekam akan diwakili dalam rekaman yang sesuai
lapangan. Tabel tersebut juga mungkin berisi informasi tambahan yang lebih sulit untuk
mengungkapkan dalam RDF atau dalam model relasional itu sendiri. Misalnya, Mas-
Negara sachusetts mungkin memiliki database relasional mobil yang mencakup
bidang untuk pelat Massachusetts. Dalam hal ini, database mungkin
dimaksudkan untuk menjadi definitif, yaitu mobil direpresentasikan dalam database
jika dan hanya jika memiliki plat Massachusetts hukum. Itu tentu saja suatu
harta penting dari meja [28].
Semacam ini database adalah jenis sumber pengetahuan yang eksploitasi
tion dipahami sebagai dasar untuk SW. Jadi SW adalah perpanjangan
dari WWW dalam hal yang menjadi tahap berikutnya menghubungkan - menghubungkan
data tidak dokumen. Ini bukan satu set metode untuk secara khusus menangani
dokumen yang saat ini di Web, bukan seperangkat kesimpulan
metode berdasarkan metadata atau cara mengelompokkan halaman web saat ini,
atau cara super-pintar pencarian. Hal ini dimaksudkan untuk berfungsi dalam
konteks model relasional data.
Menghubungkan adalah kunci untuk SW tersebut. Secara khusus, meskipun penerbitan
data dan penggunaan RDF sangat penting, dalam banyak kasus praktek
telah menjadi konversi data ke RDF dan publikasi yang bercerai
dari dataflow dunia nyata dan manajemen. Bahasa, metode
dan alat-alat yang masih terguling keluar untuk lapisan SW, demi lapis, dan
mungkin mengherankan bahwa menang cepat tidak muncul dari publi-
kation RDF sebelum alat untuk melihat, query dan manipulat-
database ing telah mencapai pasar. Memang, sebagai data publikasi
sering menghapus data dari konteks organisasi, situasi baru
bagi banyak akan tampak lebih buruk dari era pra-SW: aplikasi dan
organisasi-spesifik alat untuk memanipulasi data yang telah berevolusi dengan
organisasi akan telah menyediakan banyak fungsi yang mungkin
telah hilang atau terkikis. Sementara itu, kurangnya menghubungkan antara data
potensi merusak yang lebih besar dari SW.
Lapisan berikutnya dari SW adalah Web Ontologi Bahasa OWL
[198], yang menyediakan sarana ekspresif dapat terhubung data ke world3.1. Web semantik 21
Gambar. 3.1 Lapisan dari Web Semantic.

(Seperti juga melakukan RDF RDF Schema atau-S - [44]). RDF dan OWL memungkinkan
pertukaran data dalam konteks dunia nyata, di atas inti ini akan
duduk bahasa query untuk RDF yang akan memungkinkan didistribusikan dataset untuk
di-query dengan cara yang standar dan dengan beberapa implementasi.
SPARQL memungkinkan interogasi dataset digabungkan untuk memberikan
akses ke informasi gabungan mereka [232].
Visi asli dari SW telah dirumuskan dalam bentuk terkenal
berlapis diagram ditunjukkan pada Gambar 3.1. Seperti dapat dilihat, pengembangan
Proses SW bergerak ke atas, dengan perhubungan / RDF OWL di
tengah. RDF seperti yang tercantum duduk di atas XML, dan tingkat terendah dari semua adalah
bahwa dari Uniform Resource Identifier (URI). Dalam ayat berikutnya
kita meneliti peran mendasar bahwa URI bermain di visi SW.

Gambar. 3.2 Semantic Web Stack c.2006.
Visi telah bergerak dengan upaya pelaksanaan, sebagai salah satu
harapkan. Setelah implementasi ontologi menggunakan OWL,
perhatian beralih ke bahasa aturan layer dan sesuai untuk
menyatakan aturan; pemikiran terkini menunjukkan bahwa Interchange Peraturan
Format (RIF) saat ini dalam pengembangan [112] harus duduk bersama
OWL sebagai perpanjangan RDF-S. Lapisan tersebut tercakup dalam
bahasa query SPARQL. Visi revisi SW stack, bersama-sama
dengan pengakuan akan kebutuhan user interface yang efektif dan aplikasi-
tions, ditunjukkan pada Gambar 3.2.3.1.
3.1.2 URI: Nama atau alamat? Atau keduanya?
RDF didasarkan pada identifikasi sumber daya melalui URI, dan menggambarkan
mereka dalam hal sifat dan nilai properti [195]. Membandingkan
RDF dengan XLink, bahasa menghubungkan untuk XML, yang menyediakan beberapa
informasi tentang link tetapi tidak memberikan rujukan eksternal untuk
apapun sehubungan dengan yang link relevan. Sebaliknya, RDF
memberikan URI khusus untuk hal-hal pribadi, seperti yang kita lihat di bawah ini
contoh. Ketika kami membuat grafik RDF node dan busur (Gambar 3.3),
kita dapat melihat bahwa URI bahkan digunakan untuk hubungan. Sebuah referensi URI
digunakan sebagai node dalam sebuah grafik RDF mengidentifikasi apa yang mewakili node;
URI digunakan sebagai predikat suatu mengidentifikasi hubungan antara hal-hal
diidentifikasi oleh node yang terhubung [172].

http://www.w3.org/2000/10/swap/pim/contact # orang
http://www.w3.org/2000/10/swap/pim/contact # nama lengkap
http://www.w3.org/2000/10/swap/pim/contact # kotak
http://www.w3.org/2000/10/swap/pim/contact # personalTitle
mailto: em@w3.org
Eric miller
Dr
http://www.w3.org/1999/02/22-rdf-syntax-ns # jenis
http://www.w3.org/People/EM/contact # saya
Gambar. RDF 3.3 grafik yang menunjukkan URIs.24 Rekayasa Web

RDF <: RDF xmlns: RDF = "http://www.w3.org/1999/02/22-rdf-syntax-ns #"
xmlns: kontak = "http://www.w3.org/2000/10/swap/pim/contact #">

Eric Miller

Dr

Secara umum, menggunakan URI untuk mengidentifikasi sumber daya merupakan faktor penting
dalam pengembangan Web [33]. Menggunakan sintaks penamaan global con-
pernah ditemukan (namun sintaks qua sewenang-wenang) memberikan efek jaringan global,
dari mana manfaat dari berasal Web; URI memiliki lingkup global dan
diinterpretasikan secara konsisten di seluruh konteks. Bergaul dengan URI
sumber daya harus terjadi jika ada cukup mungkin ingin link ke sana,
lihat atau mengambil representasi itu [155].
Hubungan, diidentifikasi dengan URI, link sumber daya yang juga diidentifikasi-
fied oleh URI. Untuk mendapatkan mesin-pembacaan yang dimaksudkan SW
aman, maka mesin harus bisa mendapatkan pada hubungan,
dan karenanya harus dapat dereference URI yang mengidentifikasi
relasi dan mengambil sebuah representasi dari sumber daya diidentifikasi. Jika
informasi yang relevan tentang hubungan (misalnya, properti pembatasan
tions) juga tersedia di URI, maka mesin akan dapat
membuat kesimpulan mengenai hubungan menegaskan. RDFS dan semakin com-
OWL kompleks memungkinkan pernyataan dari pembatasan hak kekayaan yang pada gilirannya
memungkinkan mesin untuk membuat kesimpulan dengan cara ini. Dengan cara ini, SW
ini diperkuat oleh URI, penggunaan URI memungkinkan mesin untuk proses
data secara langsung memungkinkan pergeseran penekanan dimaksudkan dari dokumen
data. Kami mencatat di atas bahwa banyak inspirasi bagi SW datang
dari database relasional, dalam rangka mencapai keuntungan yang diantisipasi dalam
fungsi sehubungan dengan database tertentu, benda-benda di
database harus diekspor sebagai objek kelas pertama ke Web, dan di sana-
kedepan perlu untuk dipetakan ke dalam sistem URI. Para menghubungkan bahwa di bawah-
SW pin yang tentu saja dimaksudkan untuk menyediakan infrastruktur generik
untuk konten web mesin-processable, tetapi telah berpendapat bahwa ini
infrastruktur juga membahas banyak kekhawatiran tradisional
hypermedia komunitas [278] .
3.1. Web semantik
Melakukan fungsi ini memerlukan pergeseran mendasar dalam kita di bawah-
berdiri tentang bagaimana kita menggunakan URI. Biasanya, nama dan alamat-alamat
berbeda, nama sesuatu merujuk langsung ke sana, alamat yang mengatakan
Anda mana (jika tidak tepat bagaimana untuk mendapatkan itu). Dalam tradisional com-
pengidentifikasi menempatkan muncul dalam bahasa pemrograman, alamat adalah
lokasi di memori. Nama yang dipakukan ke obyek, alamat ke tempat-tempat,
dan karena itu obyek harus memiliki satu nama selamanya sementara alamatnya
bisa berubah sewenang-wenang sering. Hal ini dalam beberapa hal dimasukkan ke dalam "klasik"
melihat dari Web: ada asumsi bahwa identifier (URI)
akan menjadi salah satu dari dua macam hal. Itu baik akan menjadi nama
sesuatu, dipahami secara terpisah dari lokasi - sebuah URN - atau menentukan
lokasi hal - URL. Jadi kelas URI dipartisi
ke dalam kelas guci-guci dan kelas URL (dan mungkin satu atau dua
lain, seperti Uniform Resource Citations). Skema HTTP, untuk
misalnya, dilihat sebagai skema URL.
Lapisan ini tambahan komplikasi konseptual secara bertahap terlihat
bisa berguna kurang, dan gagasan tentang URI menjadi primer. URI bisa
melakukan yang mengidentifikasi baik secara langsung atau melalui lokasi, namun ini bukan
konseptual dalam perbedaan. Oleh karena HTTP adalah skema URI, meskipun
sebuah URI HTTP mengidentifikasi objek dengan mewakili akses primer
mekanisme, dan sebagainya (informal) kita bisa bicara tentang URI HTTP yang
URL. Nama / alamat Perbedaan adalah sebuah metafora spasial yang bekerja
dengan baik dalam lingkungan komputasi standar, tapi dalam jaringan
sistem komputasi perbedaan rusak. Demikian pula, objek dapat
diganti, dan sering adalah (alasan mengapa mereka tidak boleh dibahas
dalam Bagian 5.4.6 di bawah). Jika sistem hirarki penamaan sudah diatur dan
dikelola oleh otoritas, maka nama tersebut akan berfungsi hanya selama
sebagai otoritas yang mendukung bahwa sistem hirarkis, dan pada batas
hanya selama sebagai otoritas itu sendiri tetap ada.
Jadi kita harus berhati-hati dari menekan analogi spasial
nama / sistem alamat terlalu dekat. Lokasi literal adalah titik di
ruang 3-D, dan dalam sistem komputer jaringan kita tidak harus mendapatkan
juga tetap pada apa yang kita harus memanggil nama, atau alamat, atau fisik
lokasi sel memori yang akan menyimpannya. Seorang anggota komputer
Alamat ORY sering alamat dalam ruang memori virtual yang dialokasikan
suatu benda, yang diterjemahkan digunakan oleh perangkat keras ke dalam fisik
alamat memori. alamat IP yang tidak terikat pada komputer tertentu, 26 Rekayasa Web
namun secara implisit berisi referensi ke informasi routing, sehingga com-
puter sesuai dengan alamat IP yang diberikan tidak dapat dipindahkan jauh di
struktur routing. Nama domain bisa digunakan untuk merujuk ke komputer atau
apa komputer menyajikan ketika kita ingin berhak untuk memindahkan
hal yang berhubungan dengan identifikasi dari satu bagian dari Inter-
bersih yang lain. Jadi Domain Name System (DNS), karena kemerdekaan-
penyok dari sistem routing, tidak membatasi alamat IP yang
dapat diberikan ke komputer dari sebuah nama domain yang diberikan. DNS memang terlihat
seperti sistem nama, sedangkan alamat IP lakukan tampaknya berfungsi seperti
alamat [26].
Namun, juga sangat diamati bahwa domain nama untuk tertentu
sumber daya melakukan perubahan, karena protokol yang digunakan untuk penamaan mereka
diubah - alasan adalah bahwa ada informasi tertanam dalam
nama. Dalam dunia offline, nama bisa bertahan kegagalan tersebut embed-
informasi DED untuk tetap benar (John Stuart Mill memberikan contoh
'Dartmouth' sebagai tempat yang lokasinya mungkin atau tidak mungkin tetap di
muara Sungai Dart). Perubahan tersebut ada yang dipermasalahkan. Tapi online,
ini lebih sulit untuk memastikan.
Pertimbangkan contoh http://pegasus.cs.example.edu/disk1/
siswa / romeo / keren / terbaru / readthis.html [26]. Ada berbagai macam
alasan mengapa hal ini URI bisa berubah. 'Pegasus', 'cs', dll 'mahasiswa' mungkin
semua perubahan selama bertahun-tahun sebagai komputer yang berbeda terbiasa dengan tuan rumah
informasi, atau sebagai lulusan Romeo dan menjadi anggota fakultas.
pendapat-Nya tentang apa yang 'keren' atau apa yang 'terbaru' juga akan berevolusi
dari waktu ke waktu (satu harapan). 'Http', yang merupakan protokol yang digunakan untuk mempresentasikan
sumber daya, dan 'readthis' yang relatif bermakna adalah yang paling mungkin
bagian dari URI yang terkait dengan sumber daya tertentu untuk berubah.
Alasan informasi tersebut disertakan adalah karena nama harus
dereferenced dalam rangka untuk mencari tahu apa pun tentang apa nama
adalah penamaan. Biasanya yang melibatkan menggunakan semacam index atau set
indeks, yang mungkin resmi dan kanonik, atau informal dan tidak resmi,
untuk mencari nama. indeks tersebut sering hirarkis untuk memfasilitasi
lookup, sebagai DNS namanya. Ini mungkin untuk menghilangkan semua informasi
dari nama domain, dan memastikan identifikasi unik untuk sumber daya
(Dan memang ada maka akan ada alasan yang jelas, segala sesuatu yang
sama, mengapa identifier tidak boleh permanen juga), pada biaya
membuat sulit untuk mencari dan dereference.3.1.
hal-hal seperti itu yang penting relatif kecil sebagai manusia selama
adalah pengguna utama dan pemeras Web - setelah semua, satu terutama
setelah sumber daya dan konten yang mengandung, dan meskipun mungkin
frustasi untuk mengikuti URI hanya untuk menemukan sumber daya tidak lagi tinggal
sana, yang adalah iritasi daripada gangguan serius dalam sistem-
tem. Orang juga relatif fleksibel dalam temu online dan dapat toler-
makan ambiguitas. Tetapi beberapa jenis resolusi untuk nama / alamat masalah
diperlukan jika kita mengharapkan sistem formal untuk menangani dengan URI. SW ini
alat untuk melakukan hal-hal dalam ruang sosial, bukan hanya satu set aturan untuk
memanipulasi formula, jadi kita perlu tahu apa yang kita maksud, dan
bagaimana mendapatkan pada saat-referen mana yang sesuai. Hal ini diinginkan untuk e-
sistem perdagangan, misalnya, untuk merujuk tanpa ambiguitas ke suatu nomor
hal: dokumen seperti tagihan dan faktur, barang-barang abstrak seperti
harga, dan hal-hal konkret seperti pembeli dan barang-barang yang sebenarnya
dibeli dan dijual. merangkum [31] dan memberikan kritik dari num besar
ber cara pemahaman masalah ini dalam konteks HTTP.
Penamaan, pada akhirnya, adalah satu set pengaturan kontrak sosial. Kami
seharusnya tidak membiarkan sifat virtual dunia maya membutakan kita pada fakta
bahwa orang-orang meminta dan membayar, dan mendapatkan diberikan, nama domain dan ruang
pada server. Pihak berwenang menjaga hal-hal ini, dan juga bertindak sebagai akar untuk
dereferencing tujuan. Stabilitas setup ini kelembagaan
membantu menentukan stabilitas sistem Web penamaan.
3.1.3 ontologi
Di atas RDF dan RDFS pada Gambar 3.2 duduk ontologi. Pada tradisional
konsepsi [123], ontologi berisi spesifikasi dari konsep yang
diperlukan untuk memahami sebuah domain, dan kosa kata yang diperlukan untuk
masuk ke dalam wacana tentang hal itu, dan bagaimana konsep-konsep dan kosakata-
ulary saling berhubungan, bagaimana kelas dan contoh dan sifat mereka
didefinisikan, dijelaskan dan disebut. Sebuah ontologi dapat formal atau
informal. Keuntungan dari formalitas adalah bahwa hal itu membuat ontologi
mesin-dibaca, dan karena itu memungkinkan mesin untuk melakukan lebih dalam
penalaran atas sumber daya web. Kerugiannya adalah bahwa seperti formal
konstruksi yang dianggap sulit untuk create.28 Rekayasa Web
Data dapat dipetakan ke sebuah ontologi, menggunakannya sebagai lingua franca untuk
memfasilitasi berbagi. Ontologi karena itu dimaksudkan untuk menaruh semacam
urutan ke informasi dalam format heterogen dan representasi,
sehingga berkontribusi pada ideal melihat Web sebagai pengetahuan tunggal
sumber. Sejauh itu, ontologi adalah mirip dengan skema database,
kecuali bahwa itu akan ditulis dengan relatif kaya dan ekspresif
bahasa, informasi akan kurang terstruktur, dan menentukan
teori domain, tidak hanya struktur sebuah wadah data [96].
Jadi ontologi dipandang sebagai tambahan berarti yang penting untuk berbagi data, dan
Tujuan utama memperlakukan Web sebagai satu-satunya sumber informasi, tetapi
mereka juga memiliki penentangnya. Banyak komentator khawatir bahwa fokus
pada ontologi ketika datang ke mendalilkan formalisms untuk masa depan
Web adalah untuk membuat kesalahan klasifikasi atas-privileging ketika
datang untuk memahami bahasa manusia dan komunikasi [113]. Ini
tentu harus ditunjukkan bahwa banyak ontologi sebenarnya digunakan, untuk
Misalnya di industri, adalah taksonomi untuk klasifikasi tujuan khusus
dokumen atau halaman Web, cenderung tidak rumit, dan tidak bergantung
pada formalisms sangat ekspresif [88].
OWL memiliki akar di bahasa sebelumnya DAML + MINYAK [65] yang
termasuk deskripsi logika (DL - [42]) di antara berbagai pengaruh.
Melampaui OWL DL, yang menetapkan konsep domain dan terminologi
dengan cara terstruktur, dengan menggunakan link yang disediakan oleh RDF untuk memungkinkan
ontologi akan didistribusikan ke seluruh sistem, kompatibel dengan standar web-
menerima standar, terbuka, extensible dan scalable. Ontologi dapat menjadi didistribusikan
sebagai OWL memungkinkan ontologi untuk merujuk pada ketentuan dalam ontologi lainnya. Dalam hal ini
OWL cara adalah rekayasa khusus untuk Web dan Semantic Web,
dan simbol banyak bahasa berbagi ([cf 134.]).
Sulit untuk menentukan formalisme yang akan menangkap semua pengetahuan yang-
tepi, dari tipe sewenang-wenang, dalam suatu domain tertentu. Ontologi, tentu saja,
melayani tujuan yang berbeda, dan bisa lebih dalam (mengungkapkan ilmiah
konsensus dalam disiplin, dan Sejalan padat karya untuk con-
struct) atau lebih dangkal (dengan istilah yang relatif sedikit yang mengatur besar
jumlah data - [34]). Memang, ada banyak jenis wacana
melampaui ontologi tentu saja, dan banyak logika mengekspresikan mereka, untuk
contoh kausal, temporal dan probabilistik logic.3.1. Web semantik 29
Causal logika [mis 258] dikembangkan dari logika tindakan di AI, dan
dimaksudkan untuk menangkap aspek penting dari akal sehat mengerti-
ing mekanisme dan sistem fisik. Temporal logika formalises yang
aturan untuk penalaran dengan proposisi diindeks untuk waktu tertentu, dalam
konteks dari Web yang berkembang pesat, prevalensi waktu-stamping
online dan risiko dari informasi yang digunakan yaitu dari tanggal menjamin
relevansi itu. Tentu saja pendekatan logika temporal telah
disarankan untuk manajemen versi ontologi [149].
logika Probabilistik adalah kalkuli yang memanipulasi konjungsi prob-
kemampuan peristiwa individu atau negara, yang mungkin paling baik
dikenal adalah Bayesian, yang dapat digunakan untuk menurunkan probabilitas untuk acara-acara
didasarkan pada teori sebelumnya tentang bagaimana probabilitas didistribusikan (dan
sangat terbatas data real). penalaran Bayesian merupakan hal yang biasa dalam pencarian
mesin, dan bahkan mencari spam (cf. [117]). Di domain mana rea-
soning bawah ketidakpastian sangat penting, seperti bioinformatika, Bayesian
ontologi telah diusulkan untuk mendukung perluasan dari Web
untuk memasukkan penalaran seperti [19]. Utilitas pendekatan Bayesian dalam
sistem komputasi tidak dapat diragukan; lebih kontroversial beberapa
juga mengklaim bahwa penalaran manusia sesuai dengan pola Bayesian [118],
meskipun tubuh signifikan kerja menunjukkan manusia tidak Bayesian
estimator [162]. Meskipun, pada mesin sangat sedikit yang con-
sistently menyesuaikan probabilitas mereka dalam terang pengalaman akan memiliki
melengkapi peran pendukung pengambilan keputusan manusia.
Web sering salah dipahami sebagai statis, sementara itu
terus berubah. Dynamic semantik berhubungan dengan kegiatan sur-
pembulatan isi dari Web: membuat konten, tindakan pengguna-dipandu,
waktu, pengguna pribadi profil dan seterusnya [104]. Fry et al, yang dukungan-
kuli proyek SW, berpendapat bahwa asumsi yang mendasari
visi SW adalah bahwa semantik adalah deklaratif - kita berurusan
dengan data pasif yang dapat diambil dari server - dan bahwa perubahan
lambat - peristiwa penerbitan lebih jarang daripada browsing atau mengklik
pada link. Di sisi lain, konteks pengambilan, seperti pengguna
profil dan apa tugas-tugas ia terlibat dalam pada waktu pengambilan, juga
suatu masalah, seperti konteks browsing (pola yang berbeda navigasi
mungkin berarti set berbeda hubungan dan konteks informasi perlu
untuk dipahami), agen dinamis komputasi metadata, atau
proses yang biasa mengedit web menciptakan edisi yang berbeda dari page.30 Rekayasa Web
Oleh karena itu ada tentu aparat logis dan konseptual yang akan
memungkinkan beragam alasan untuk diekspresikan, meskipun lebih dalam
argumen yang dibuat oleh banyak kritikus, seperti [113], bahwa banyak sekali-lim
itations hasil dari sifat terletak, diwujudkan dan tertanam
penalaran banyak dan konseptualisasi, tidak akan ditangani oleh pro-
liferation dari formalisms abstrak. Tapi sama kita harus berusaha menghindari
asumsi bahwa SW dimaksudkan sebagai sistem menyeluruh tunggal,
dengan cara tunggal berinteraksi dan satu set tertentu representasi
persyaratan yang memaksa semua pengetahuan menjadi satu bentuk (cf. [158]).
Sebagaimana telah kita lihat, SW dimaksudkan terutama untuk mengeksploitasi satu
jenis data, data relasional. Jika data tersebut memiliki nilai dalam konteks, maka
SW teknologi juga harus memiliki nilai, dan memang harus menambahkan
nilai sebagaimana mestinya (a) memungkinkan inferensi lebih lanjut harus dilakukan pada
data, dan (b) memungkinkan, melalui ontologi, data yang akan dihubungkan dengan potensial
luas menyimpan data di tempat lain. Klaim SW, maka, bukankah itu semua data
atau pengetahuan harus ditampilkan dalam beberapa set yang sempit formalisms,
melainkan bahwa kekuatan menghubungkan data yang memungkinkan banyak yang harus
dilakukan dengan itu. Untuk banyak tujuan, dan dalam beberapa konteks untuk paling biasa
tujuan, skema representasi ambisius yang mungkin muncul kurangnya
kaya berbagai kemungkinan ekspresif mungkin sepenuhnya memadai.
SW tidak dimaksudkan untuk menjadi sebuah sistem yang akan memenuhi segala keperluan, tetapi
itu adalah perluasan dari Web yang dimaksudkan untuk memanfaatkan potensi
yang menghubungkan kuantitas data belum pernah terjadi sebelumnya. Ontologi akan memungkinkan
pemahaman umum mengumpulkan data dari heterogen
sumber, selama bagian yang relevan mereka sesuai untuk tugas
di tangan. ambisi ini pada kisaran data yang pendekatan semacam
dapat memanfaatkan, dan nilai SW teknologi berharap dapat menambah, bukan dalam
perpanjangan dari berbagai inferensi yang bisa dicapai secara otomatis
(Meskipun memperluas jangkauan juga harus mungkin).
3.1.4 folksonomi dan struktur sosial muncul
Penggunaan ontologi menambah struktur data. Namun, struktur
dapat muncul secara organik dari manajemen individu mereka sendiri
persyaratan informasi, selama ada orang cukup.
Ada semakin banyak aplikasi didorong oleh desentralisasi
komunitas dari-bawah ke atas, yang pergi di bawah but3.1 tidak jelas. Web semantik 31
populer nama perangkat lunak sosial. Sebagai contoh, wiki adalah sebuah situs web
yang memungkinkan pengguna dan pembaca untuk menambah dan mengedit konten, yang memungkinkan
komunikasi, argumen dan komentar, Wikipedia (http://en.
wikipedia.org / wiki / Halaman Utama untuk versi bahasa Inggris), sebuah
ensiklopedi online yang ditulis oleh komunitas pengguna, telah menjadi sangat
handal meskipun kekhawatiran yang sedang berlangsung tentang kepercayaan entri yang
dan ketakutan dari vandalisme. Ontologi dapat dilengkapi dengan rakyat-
sonomies, yang timbul ketika sejumlah besar orang yang tertarik
dalam beberapa informasi, dan didorong untuk menggambarkan itu - atau tag itu (mereka
mungkin tag egois, untuk mengatur pengambilan sendiri isi, atau altruisti-
Cally untuk membantu navigasi orang lain '). Daripada bentuk terpusat diklasifikasikan
sification, pengguna dapat menetapkan kata kunci ke dokumen atau informasi
tion sumber. Dan ketika tag tersebut dikumpulkan, hasilnya sangat
menarik. Contoh aplikasi yang telah berhasil memanfaatkan
dan mengeksploitasi penandaan adalah Flickr (http://www.flickr.com/ - fotografer a-
phy publikasi dan situs berbagi) dan del.icio.us (http://del.icio.us/ -
sebuah situs untuk penanda berbagi). Penjaga resmi weblog (blog) tag
mereka output. British Broadcasting Corporation (BBC) telah melihat
kesempatan di sini dengan program radio didorong oleh 'pengguna penandaan
(Via ponsel) dari lagu-lagu pop [61].
Karena jumlah tag pada peningkatan aplikasi, meningkatkan struktur-
mendatang terdeteksi - tag cenderung digunakan kembali, dan diterapkan kembali untuk baru
item dengan pengguna baru, dan semua hubungan biasa subsumption,
dll, mulai muncul. Struktur kasar yang dihasilkan folksonomi
(= Taksonomi rakyat). Mereka tentu tidak logis dan istimewa, dan
berisi banyak contoh membingungkan sinonim (kata beberapa makna
hal yang sama - fiksi ilmiah, sci-fi dan SF) dan polisemi (beberapa
makna yang dicakup oleh kata yang sama - tidak SF = fiksi ilmiah atau
San Francisco), yang akan menghambat pencarian yang lebih efisien -? Dan tentu saja
tergantung pada bahasa. Tidak hanya itu, tapi membayangkan bahwa sebagai tag
struktur semakin sering digunakan untuk mengatur Web tertentu
aplikasi, para spammer akan mulai penandaan otomatis untuk meningkatkan
kemungkinan data yang diambil. Di sisi lain, tag
dihasilkan oleh interaksi dunia nyata dengan isi tag, dan
jadi jangan mengungkapkan pola asli keterlibatan antara konten
penyedia dan pengguna. Evolusi tag, lebih sangat besar set of32 Rekayasa Web
penandaan data, dapat dilacak untuk menunjukkan pola-pola ini berkembang melalui
waktu [84].
struktur tersebut memungkinkan semantik untuk muncul dari implisit setuju-
KASIH, yang bertentangan dengan pembangunan ontologi yang menunjukkan eksplisit
perjanjian; bidang dinamika semiotik ini didasarkan pada gagasan
bahwa komunikasi yang disepakati atau sistem informasi organisasi sering
berkembang melalui proses desentralisasi yang sama penemuan dan nego-
tiation [268]. Telah dikatakan bahwa kesepakatan implisit, dalam bentuk
terjemahan on-demand di skema informasi dapat memadai
untuk mendukung semantik interoperable untuk, dan pencarian disalurkan melalui,
Sistem P2P - meskipun apakah terjemahan implisit tersebut akan mudah
untuk menghasilkan seluruh sumber informasi yang dirancang untuk tugas-tugas yang berbeda
sangat banyak pertanyaan terbuka [2].
3.1.5 ontologi folksonomi v?
Dikatakan - meskipun saat ini argumen yang hanya penyaringan perlahan
ke dalam literatur akademik - yang folksonomi lebih disukai untuk
penggunaan dikendalikan, ontologi terpusat [mis 259]. Annotating Web
halaman menggunakan kosakata terkontrol akan meningkatkan kemungkinan seseorang
balik halaman di pencarian Web yang 'benar', namun di sisi lain
basis pengguna besar heterogen dari Web tidak mungkin mengandung
banyak orang (atau organisasi) bersedia untuk mengadopsi atau mempertahankan kompleks
ontologi. Menggunakan sebuah ontologi melibatkan membeli ke cara tertentu
ukiran Facebook dunia, dan menciptakan suatu ontologi memerlukan investasi ke
metodologi dan bahasa, sedangkan penandaan informal dan cepat.
tag seseorang mungkin tidak membantu atau tidak akurat, dan tidak diragukan lagi ada suatu seni
untuk penandaan berhasil, tapi satu mendapatkan hasil (dan tanggapan) sebagai salah satu belajar;
ontologi, di sisi lain, memerlukan sesuatu dari suatu investasi
waktu dan sumber daya, dengan masukan yang datang lebih lambat. Dan, yang terpenting,
alat untuk menurunkan hambatan untuk masuk ke kosakata terkontrol yang
muncul jauh lebih lambat daripada yang digunakan untuk dukungan sosial
Software [61].
Tagging tentu perkembangan menarik dan menarik-phe
nomenon, tetapi kita harus waspada terhadap asumsi bahwa tag dan ontologi
bersaing untuk ruang yang sama. Tagging menyediakan source3.1 potensial. Web semantik 33
metadata, dengan semua kekurangan informalitas dan semua Advan the-
tages hambatan rendah untuk masuk dan basis pengguna yang tinggi. Tapi tag hanya
bagian dari cerita tentang sumber daya Web [128].
Ontologi dan folksonomi telah karikatur sebagai berlawanan. Dalam
kenyataannya, mereka adalah dua hal yang terpisah, meskipun beberapa fungsi-
ality ontologies uncontroversially dapat diambil alih oleh folksonomi
dalam berbagai konteks. Ada dua terpisah (kelompok) poin untuk
membuat. Yang pertama harus dilakukan dengan seharusnya trade-off antara ontolo-
gies dan folksonomi, yang kedua berkaitan dengan persepsi tentang ontologi.
Ontologi dan folksonomi ada di sana untuk melakukan hal yang berbeda, dan
menangani kasus-kasus yang berbeda. Folksonomi adalah varian pada kata kunci-
cari tema, dan merupakan upaya yang muncul menarik di informasi
pengambilan - bagaimana saya bisa mengambil dokumen (foto, katakanlah) yang relevan
dengan konsep di mana saya tertarik? Ontologi merupakan upaya untuk
mengatur bagian dari dunia data, dan untuk memungkinkan pemetaan dan interaksi-
tions antara data dalam format yang berbeda atau lokasi, atau yang telah
telah dikumpulkan oleh organisasi yang berbeda dengan asumsi yang berbeda.
Apa yang telah ditampilkan sebagai sebuah kompetisi-off perdagangan, atau, atau bahkan
zero-sum game mungkin lebih baik diwakili sebagai dua pendekatan yang terpisah
untuk dua jenis masalah. Ini mungkin bahwa masalah set
mereka pendekatan tumpang tindih, dalam hal ini ada pada mungkin kesempatan
menjadi pilihan yang harus dibuat antara mereka, tetapi bahkan sehingga kedua ontologi
dan folksonomi memiliki kegunaan yang pasti dan sama-sama berpotensi berbuah
jalan penelitian [257].
Telah berpendapat bahwa ontologi berguna bisa menggabungkan-mate
Material dari jaringan sosial dan perangkat lunak, sebagai informasi yang
dimodelkan memiliki dimensi sosial [201]. Hal ini mungkin menawarkan satu set baru
kesempatan - untuk contoh adalah perangkat lunak blog yang secara otomatis CRE-
Ates metadata bisa menjadi cara untuk memanfaatkan bottom up sosial lunak
Pendekatan ware [163]. Selain itu, seharusnya dasar dari pembedaan
antara kedua - yang folksonomi berkembang secara organik dan tanpa rasa sakit
sedangkan ontologi pemeliharaan tinggi dan overhead tinggi - adalah anyway
meragukan. Dimana ada yang dianggap perlu untuk ontologi, ringan
tapi yang kuat jangan muncul dan secara luas digunakan, seperti misalnya
dengan Friend-of-a-Friend (FOAF - [45]), dan aplikasi yang terkait
seperti Flink [200]. Hal ini sesuai pada umumnya dengan panggilan untuk dual and34 Rekayasa Web
pelengkap pengembangan teknologi SW dan teknologi yang
mengeksploitasi organisasi-diri dari Web [misalnya 101].
Persepsi ontologies tergantung pada pemahaman ini dis-
tinction. Perhatikan, misalnya, biaya ontologi. Dalam pertama
tempat, akan ada daerah di mana biaya, akan mereka pernah begitu besar, akan
mudah untuk menutup. Di daerah baik terstruktur seperti aplikasi ilmiah,
upaya untuk menciptakan spesifikasi kanonik kosakata akan sering
senilai keuntungan, dan mungkin penting, memang, Semantic Web tech-
tehnik yang mendapatkan tanah dalam konteks ilmiah dengan data yang kaya di mana
terdapat kebutuhan untuk pengolahan data dan kemauan untuk mencapai
konsensus tentang istilah. Dalam aplikasi komersial tertentu, potensial the-
TiAl keuntungan dari penggunaan spesifikasi baik terstruktur dan terkoordinasi
kosakata akan lebih besar daripada biaya tenggelam untuk mengembangkan atau menerapkan
ontologi, dan biaya marjinal pemeliharaan. Misalnya, facil-
itating pencocokan istilah dalam persediaan pengecer dengan orang-orang dari
agen pembelian akan menguntungkan kedua belah pihak.
Dan biaya ontologies berkembang mungkin berkurang pengguna
dasar dari ontologi meningkat. Jika kita menganggap bahwa biaya pembangunan
ontologi tersebar di komunitas pengguna, jumlah ontologi
insinyur yang dibutuhkan meningkat seiring dengan log ukuran komunitas pengguna,
dan jumlah waktu meningkat bangunan sebagai kuadrat dari jumlah
insinyur - asumsi yang sederhana saja tapi yang wajar untuk dasar
model - upaya yang terlibat per pengguna dalam ontologi bangunan besar
masyarakat menjadi sangat kecil sangat cepat [29]. Selain itu, karena
penggunaan menyebar ontologies, teknik untuk digunakan kembali mereka, segmentasi dan
penggabungan juga akan menjadi lebih akrab [212, 256, 10], dan memang ada
akan menjadi dasar meningkat dan semakin terkenal ontologies
ada untuk digunakan kembali.
Kedua, ada persepsi ontologies sebagai top-down dan beberapa-
apa yang otoriter konstruksi, tidak terkait, atau hanya tenuously istimewa, untuk
orang-orang yang sebenarnya praktek, dengan berbagai tugas potensial di domain,
atau pengoperasian konteks (lih. misalnya [158]). Dalam beberapa hal, ini
persepsi mungkin berhubungan dengan gagasan pengembangan tunggal
Ontologi konsisten Segalanya, seperti misalnya dengan CYC [183].
Seperti ontologi luas dan mencakup semua mungkin memiliki
jumlah aplikasi menarik, tapi jelas tidak akan skala dan its3.1. Web semantik 35
penggunaan yang tidak bisa ditegakkan. Jika SW dilihat sebagai memerlukan luas membeli-
ke suatu titik tertentu pandang, maka dapat dimengerti bahwa yang muncul
struktur seperti folksonomi mulai tampak lebih menarik (cf. [259]).
Namun ini bukan merupakan persyaratan SW. Bahkan, sikap SW untuk
ontologi tidak lebih dari rasionalisasi data aktual-berbagi
praktek. Aplikasi dapat dan memang berinteraksi tanpa mencapai atau
mencoba untuk mencapai konsistensi global dan cakupan. Sebuah sistem yang
menyajikan barang-barang ritel untuk pelanggan akan panen informasi dari
pemasok 'database (sendiri cenderung menggunakan format heterogen)
dan peta itu ke format data yang diinginkan pengecer untuk kembali presentasi.
Otomatis pajak perangkat lunak kembali mengambil data bank, di bank pilihan
format, dan peta mereka ke formulir pajak. Tidak ada persyaratan untuk
global ontologi di sini. Bahkan tidak ada persyaratan untuk persetujuan atau
Terjemahan global antara ontologi spesifik digunakan kecuali dalam
subset dari istilah yang relevan untuk transaksi tertentu. Perjanjian
hanya perlu lokal.
Tujuan dari SW harus dilihat dalam konteks rutin
sifat jenis perjanjian. SW ini dimaksudkan untuk menciptakan dan
mengelola standar untuk membuka dan membuat rutin ini sebagian setuju-
pemerintah dalam format data, standard tersebut harus memungkinkan untuk
eksploitasi data relasional pada skala global, dengan bersamaan
leverage bahwa skala yang membeli.
3.1.6 Metadata
Isu-isu yang berkaitan dengan semantik atau penafsiran Web
melampaui Semantic Web. Sebagai contoh, metadata dapat digunakan untuk
menggambarkan atau membubuhi keterangan sumber daya dalam rangka untuk membuatnya (lebih) dimengerti
untuk pengguna. Pengguna ini mungkin menjadi manusia, dalam hal metadata dapat
menjadi tidak terstruktur, atau mesin, dalam hal metadata harus
mesin-dibaca. Biasanya, metadata adalah deskriptif, termasuk misalnya
elemen dasar sebagai nama penulis, judul atau abstrak dokumen, dan
administrasi informasi seperti jenis file, hak akses, menyatakan HKI,
tanggal, nomor versi dan sebagainya. item multimedia dapat dijelaskan
dengan deskripsi tekstual konten, atau kata-kata kunci untuk membantu berbasis teks
search.36 Rekayasa Web
Secara umum, metadata yang penting untuk pencarian yang efektif (mereka membiarkan
sumber daya yang ditemukan oleh berbagai kriteria, dan membantu-
berguna dalam menambah struktur dicari sumber daya non-teks), organis-
berbagai sumber daya (misalnya, memungkinkan portal untuk berkumpul komposit
laman web secara otomatis dari sumber daya yang sesuai-beranotasi beberapa),
pengarsipan bimbingan (cf. [58]), dan informasi mengidentifikasi (seperti
nomor referensi yang unik, yang membantu memecahkan masalah satu ketika
sumber daya Web adalah 'sama' seperti yang lain). Mungkin penggunaan paling penting
untuk metadata adalah untuk mempromosikan interoperabilitas, memungkinkan kombinasi
sumber daya heterogen di seluruh platform tanpa kehilangan konten.
skema Metadata memfasilitasi pembuatan metadata dalam standar
format, untuk memaksimalkan interoperabilitas, dan ada sejumlah
seperti skema, termasuk Dublin Core (http://dublincore.org/) dan
Teks Encoding Initiative (TEI - http://www.tei-c.org/). RDF pro-
vides mekanisme untuk mengintegrasikan skema metadata tersebut.
Ada sejumlah pertanyaan menarik yang berkaitan dengan metadata.
Di tempat pertama, apa metadata perlu diterapkan untuk konten? Sec-
ondly, bagaimana metadescription mempengaruhi inferensi? Apakah itu membuat lebih sulit?
Apa yang dapat dilakukan tentang annotating isi warisan? Banyak yang telah
tertulis tentang semua pertanyaan ini, tetapi itu sangat berharga sebuah penyimpangan kecil untuk
melihat beberapa pendekatan yang pertama.
Sehubungan dengan metadata yang diperlukan, tentu saja banyak tergantung pada
tujuan untuk sumber daya yang dijelaskan. Untuk berbagai tujuan -
misalnya, foto digital berbagi - metadata dapat melihat setelah mereka-
diri, sebagai keberhasilan situs seperti Flickr show.More umumnya, menarik
kemungkinan untuk metadata termasuk waktu-stamping, asalnya, ketidakpastian-
tainty dan perizinan pembatasan.
Time-stamping adalah kepentingan karena unsur temporal con-
teks adalah penting untuk memahami teks (untuk mengambil sebuah contoh nyata,
ketika membaca sebuah makalah tentang geopolitik global pada tahun 2006 adalah penting untuk mengetahui
apakah itu ditulis sebelum atau setelah peristiwa 11 September, 2001). Selanjutnya-
lebih, beberapa informasi memiliki 'menjual-menurut tanggal': setelah titik tertentu mungkin
menjadi tidak dapat diandalkan. Seringkali hal ini tidak mudah ditebak persis, tapi luas
indikasi dapat diberikan; alami banyak tergantung pada apakah informasi tersebut-
mation sedang digunakan dalam beberapa sistem misi kritis dan bagaimana toleran
kegagalan sistem. Umum temporal informasi tentang resource3.1. Web semantik 37
dapat diberikan dalam tag XML dengan cara biasa. Namun, di dalam tubuh
sumber daya, yang kita tidak bisa berasumsi menjadi terstruktur, mungkin ada
kebutuhan informasi temporal juga, bagi pengguna untuk menemukan secara manual. Dalam
kasus, sulit untuk mengidentifikasi informasi temporal yang diperlukan dalam tubuh
teks tidak terstruktur, dan untuk menentukan apakah suatu cap waktu mengacu pada
perusahaan memiliki bagian atau beberapa bagian lain dari sumber daya. Mungkin
beberapa ide dapat diimpor dari organisasi temporal lebih
sumber daya terstruktur seperti database, selama over-resep
dihindari [173]. Dalam kasus apapun, adalah penting untuk mengetahui waktu penciptaan
dan asumsi tentang umur panjang kualitas informasi yang mendasari;
jika isi dari sumber daya 'dapat berubah atau penarikan dengan-
keluar pemberitahuan, maka integritasnya dapat dikompromikan dan nilainya sebagai
catatan budaya sangat berkurang '[107].
PROVENANSI informasi sangat penting untuk menentukan
nilai dan integritas sumber daya. Banyak pengarsipan standar digital yang disetel
dengan jelas informasi apa yang diperlukan asalnya. Misalnya,
Terbuka Sistem Informasi Kearsipan model (OAIS) dari Consulta-
Komite tive di Ruang Data Systems tuntutan metadata tentang
sumber atau asal sumber daya, log dari perubahan yang telah diambil
tempat, dan di bawah naungan yang, dan catatan dari rantai
[57]. Eksemplar CURL ini dalam proyek Arsip Digital (Cedars) pergi
lebih lanjut, menuntut sebuah sejarah tentang asal (termasuk alasan mengapa
sumber daya diciptakan, daftar lengkap kustodian bertanggung jawab sejak
penciptaan dan alasan itu sedang diusulkan untuk pengarsipan), teknis
informasi tentang lingkungan penciptaan dokumen (termasuk
ing perangkat lunak dan sistem operasi), sejarah pengelolaan (termasuk
sejarah proses pengarsipan dan kebijakan dan tindakan diterapkan
untuk itu sejak diarsipkan), dan catatan yang berhubungan dengan HKI
dokumen [58]. Konteks teknologi seperti e-ilmu pengetahuan dan grid
komputasi telah mendorong penelitian teknologi-independen
representasi dari asalnya, informasi asalnya yang perlu
harus dikodekan, peran kunci untuk arsitektur asal-pencatatan dan
proses-item terkait seperti distribusi arsitektur dan secu-
rity persyaratan (cf. [122] - ironisnya dokumen saat ini berkembang
pada saat penulisan yang mencakup account terstruktur sendiri
asalnya) 38 Rekayasa Web
Faktor kunci dalam menilai kepercayaan dokumen
adalah keandalan atau klaim disajikan di dalamnya; meta-
data tentang asal tidak diragukan lagi akan membantu dalam penilaian seperti ini, tetapi perlu
belum tentu mengatasinya. Mewakili kepercayaan dalam keandalan memiliki
selalu sulit di logika epistemic. Dalam konteks pengetahuan
pendekatan representasi meliputi: logika subjektif, yang merupakan
pendapat sebagai (, percaya ketidakpastian keyakinan,) real-nilai triple mana
tiga item menambahkan hingga 1 [, 159 160]; grading berdasarkan kualitatif-hakim
KASIH, walaupun nilai kualitatif tersebut dapat diberikan numerik antar
pretations dan kemudian beralasan tentang matematis [110, 115]; fuzzy
logika (cf. [248]); dan probabilitas [148]. Sekali lagi kita melihat trade-off yang
the formalisms yang paling ekspresif mungkin yang paling sulit
untuk digunakan.
Akhirnya, metadata yang berhubungan dengan pembatasan lisensi telah berkembang
dengan gerakan untuk, 'creative commons' perlindungan fleksibel berdasarkan
hak cipta yang lebih tepat untuk Web dan weblike con-
teks. Daripada hanya menggunakan instrumen tumpul hukum hak cipta, CRE-
ative commons lisensi memungkinkan penulis untuk menyempurnakan pelaksanaan mereka
hak oleh waiving beberapa dari mereka untuk memfasilitasi penggunaan pekerjaan mereka dalam
konteks berbagai specifiable [187]. Kami membahas hak cipta lebih terinci
dalam Bagian 6.2 di bawah ini.
Pertanyaan-pertanyaan tentang kesulitan penalaran dengan metadata,
dan tugas raksasa annotating data warisan, tetap sangat terbuka. Ini
telah berpendapat bahwa annotating Web akan memerlukan otomatis skala besar-
metode matic, dan metode tersebut pada gilirannya akan memerlukan tertentu yang kuat
pengetahuan komitmen pemodelan [170], apakah ini akan melanggar
semangat desentralisasi dari Web ini belum jelas. Banyak akan tergantung
pada pendekatan kreatif seperti annotating on the fly seperti penjelasan yang
diperlukan, atau sumber daya warisan annotating seperti database bawah
berbaring Web mendalam [283].
3.2 Referensi dan identitas
Semantic Web mengandalkan konvensi penamaan dengan URI, dan
Tentu saja setiap bagian dari sistem pelabelan Web yang bergantung pada beberapa con-
pernah ditemukan atau lainnya. Masalah dengan label di Web adalah bahwa any3.2. Referensi dan identitas 39
sistem desentralisasi dan dasarnya tidak diawasi, sesuai dengan
Web yang mengatur prinsip-prinsip, tetapi ini tidak sentralisasi memungkinkan
skema yang berbeda dan konvensi, dan memang kecerobohan, untuk berkembang,
yang pada gilirannya membuka kemungkinan kegagalan referensi unik.
3.2.1 Referensi: Kapan dua benda yang sama?
Desentralisasi adalah masalah dari sudut pandang logis, meskipun besar
keuntungan dari yang pencipta konten. Obyek yang sama mungkin
disebut online, sempurna benar, sebagai 'Jane Doe', 'Janey Doe', 'Jane
A. Doe ',' Doe, J.A. 'dan sebagainya. Selanjutnya, setiap atau semua istilah ini
dapat digunakan untuk merujuk ke objek yang berbeda. Dan, tentu saja, orig the-
inal Jane Doe mungkin misnamed atau salah eja: 'Jnae Doe', dll
kegagalan referensi unik relatif sepele bagi pengguna manusia untuk dis-
melibatkan, tetapi tentu saja sangat sulit bagi mesin untuk bekerja keluar. Dan
jika kita berharap untuk mengekstrak informasi yang berguna dari reposi sangat besar
Tories informasi, di mana solusi kerajinan tangan dan memeriksa merujuk-
ence oleh mata tidak layak, pengolahan mesin tidak bisa dihindari. Referensi
masalah yang sangat mungkin terjadi ketika sumber-sumber informasi
digabung, masalah di mana-mana tapi yang serius dalam konteks
dari Web Semantic. Dan desentralisasi Web menghalangi
membuat asumsi nama yang unik, dalam cara [240].
Di sisi lain, URI menyediakan Web dengan sumber daya
untuk menghindari setidaknya beberapa masalah grounding tradisional, ketika
dapat diatasi bahwa dua istilah ini menunjuk ke URI yang sama.
Jadi jika "bintang pagi" dan "bintang malam" menunjuk langsung kepada
http://ex.org/planets.owl # venus maka setiap landasan lebih lanjut super-
fluous. Di sisi lain, dua URI yang berbeda mungkin mengacu sama
objek non-jelas, dan mungkin melakukannya hanya dengan melalui beberapa operasi
di mana ia digunakan. Kadang-kadang ini akan terdeteksi melalui algoritma-
rithmic analisis sintaksis (misalnya, nama domain tidak case
sensitif, jadi ini dapat digunakan untuk mendeteksi kesamaan), tetapi tidak secara umum.
Masalahnya tidak pergi dengan penggunaan URI, tetapi mereka berada di
setidaknya satu set pengidentifikasi memberikan dasar potensial bagi stabilitas di beberapa
situasi - situasi khususnya ilmiah di mana perjanjian di atas simbol-
bols dan definisi sering formalised.40 Rekayasa Web
Sebuah metode heuristik untuk menyelesaikan bentrokan tersebut, di dunia nyata, adalah
untuk membuat penilaian cerdas berdasarkan informasi jaminan, dan
ini telah menirukan online dengan perhitungan komunitas
praktek nama, berdasarkan jaringan hubungan sekitarnya
masing-masing instansi yang disengketakan. Misalnya, jika 'Jane Doe' dan 'Doe,
JA 'memiliki keduanya punya asosiasi yang kuat dengan' Universitas Loamshire ',
satu karena dia bekerja di sana, yang lain karena dia telah bekerja pada
proyek yang UoL adalah partner, maka itu adalah bukti prima facie
bahwa dua istilah mengacu pada objek yang sama - meskipun tentu saja seperti
penghakiman akan selalu sangat yg dpt dibatalkan [11].
Secara umum, manajemen referensi, dan resolusi referensi
masalah, akan selalu sulit mengingat bahwa theWeb mencakup sejumlah besar
mengumpulkan informasi untuk sejumlah alasan yang berbeda dan untuk
memecahkan berbagai tugas, makna dan interpretasi sering shift, dan ada
mungkin pada kesempatan menjadi kesepakatan sedikit tentang referen istilah. Sebuah
isu penting untuk Web Sains justru bagaimana memahami merujuk-
pengalaman dan representasi, dan menentukan sistem yang manajemen
dan formalisms akan memungkinkan pemahaman yang lebih besar dan pelacakan dari apa yang
Web ini dimaksudkan untuk mengatakan tentang yang objek.
3.2.2 Kapan dua halaman yang sama?
Alternatif mengambil masalah referensi adalah bahwa penentuan
ketika dua halaman web adalah halaman yang sama. Hal ini tentu saja akan menjadi sepele
dalam banyak kasus, tetapi sering kali "utama" teks yang disalin dari satu halaman ke
lain, tetapi dikelilingi oleh iklan yang berbeda, logo, header
dan footer. Banyak metrik yang tersedia yang dimaksudkan untuk menentukan
kuantitatif tingkat hubungan antara dua halaman. Kesamaan
penilaian bisa sembarangan dan pragmatis, tergantung pada konteks (misalnya
memutuskan plagiat atau kasus pelanggaran hak cipta), tetapi teknik
dari teori informasi yang ada untuk menghasilkan set nomor tujuan
untuk memberi makan ke dalam proses penilaian - misalnya, Levenshtein edit
jarak, dan varian algoritma, diberikan dengan jumlah minimum
operasi dari beberapa basis yang diperlukan untuk bisa mengubah satu string menjadi
lain (bdk. [38]) .3.3. Rekayasa web: arah baru 41
Dasar untuk membuat penilaian kemiripan tidak perlu hanya menjadi
konten pada halaman, tetapi juga bisa menjadi struktur hyperlink dalam
halaman yang tertanam. Informasi yang mengharuskan pengguna
tidak perlu berasal dari satu halaman, tapi malah bisa dipetik dari
cluster dokumen seputar topik dasar, dan keterkaitan the
struktur ada bisa sangat penting. Dan lebih jauh kemungkinan
cara kesamaan pemahaman antara pola penggunaan tertentu
halaman - dua halaman yang sering diakses pada titik-titik serupa di Web
sesi surfing [76]?
Konten berbasis kesamaan dapat didekati dengan mencocokkan kata-kata atau
subsequences dari dua halaman. Teknik yang relatif sederhana
digunakan untuk menentukan kemiripan antara dua halaman (rasio
antara ukuran persimpangan dari subsequences dan ukuran
serikat mereka), dan penahanan satu dengan yang lain (rasio
antara persimpangan dan ukuran dari himpunan yang terkandung) [48]. Link-
berdasarkan metrik berasal dari bibliometrics dan analisis kutipan, dan fokus
pada keluar link dan link dalam dua halaman memiliki kesamaan, relatif
ke ruang umum link di cluster topik. Penggunaan berbasis metrik
memanfaatkan informasi yang dikumpulkan dari server log dan sumber-sumber lain tentang
ketika halaman yang dikunjungi, pada asumsi bahwa kunjungan dari yang sama
pengguna dalam sesi yang sama di situs yang sama kemungkinan akan konseptual
terkait, dan semakin besar kesamaan antara waktu akses pengguna
untuk halaman web, semakin besar kemungkinan halaman tersebut yang entah bagaimana
terkait secara konseptual [227].
Web 3.3 rekayasa: arah Baru
pembangunan Web adalah campuran dari standar-setting, tidak terstruktur,
desentralisasi kegiatan dan inovasi, dan rekayasa yang disengaja.
Pada bagian ini kita akan fokus pada yang terakhir, dan review menonjol
teknik isu dan keharusan terbuka. Pertumbuhan Web
jelas merupakan sesuatu yg diinginkan kunci. Penyimpanan jumlah yang selalu lebih besar dari informasi-
mation, dalam konteks perhitungan pernah-cepat, akan sangat vital untuk
masa mendatang. Tanpa lebih cerdas pengambilan penyimpanan dan cepat untuk
media memori-lapar seperti video, maka pada akhirnya akan tumbuh terlalu theWeb
besar untuk teknologi sendiri. Sebagai contoh, PageRank membutuhkan merangkak
dan caching dari bagian signifikan dari theWeb; keberhasilan Google depends42 Rekayasa Web
pada kemampuan untuk menjaga cache penurut sementara juga ukuran yang signifikan.
Greater permintaan untuk layanan personalisasi dan pencari juga akan menempatkan tekanan-
yakin pada sistem. Memperluas cakupan pencarian untuk mencakup item
seperti multimedia, jasa atau komponen ontologi, juga akan memerlukan
mengejar program penelitian akademik, interface efektif dan
model bisnis yang masuk akal sebelum layanan komersial mulai beroperasi.
Yang ada dan mengembangkan pendekatan untuk memanfaatkan Web harus
diperluas ke lingkungan Web yang baru sebagaimana yang diciptakan (seperti P2P
jaringan, misalnya).
3.3.1 Web layanan
Layanan area utama di mana kami rekayasa model kebutuhan Web
untuk terlibat dan jasa extended.Web didistribusikan potongan kode
ditulis untuk memecahkan tugas-tugas tertentu, yang dapat berkomunikasi dengan pelayanan lain-
kejahatan melalui pesan. tugas yang berskala lebih luas dapat dianalisis dan secara rekursif
dipecah menjadi sub-tugas yang dengan keberuntungan peta akan ke spe the-
tugas yang spesifik yang dapat ditangani oleh layanan. Jika itu terjadi, dan
jika layanan ditempatkan dalam konteks Web, yang berarti bahwa pengguna dapat
memanggil layanan yang bersama-sama dan kooperatif memenuhi kebutuhan mereka.
Software abstrak jauh dari hardware dan memungkinkan kita untuk menentukan
komputasi mesin dalam hal fungsi logis, yang memfasilitasi
spesifikasi masalah dan solusi dengan cara yang relatif intuitif. The
evolusi dari Web untuk memasukkan penyediaan dan difusi layanan
membuka prospek abstraksi baru: pertanyaan sekarang adalah bagaimana kita bisa
melakukan abstraksi yang sama jauh dari perangkat lunak. Apa metode
menggambarkan layanan akan memungkinkan kita untuk berhenti khawatir tentang bagaimana mereka akan
dilakukan?
Sejumlah metode proses menentukan telah berkembang selama
beberapa tahun terakhir dan diterapkan pada domain layanan Web. Misalnya,
WS-Net adalah bahasa deskripsi arsitektural berdasarkan teori
Petri jaring berwarna (yaitu perluasan dari teori Petri sederhana bersih dengan
terhormat, token diidentifikasi - lihat Bagian 4.2.5 untuk diskusi singkat
Petri jaring), yang menggambarkan komponen layanan Web dalam hal
jasa yang memberikan untuk komponen lain, layanan yang diperlukan untuk
fungsi, dan operasi internal. Hasil akhirnya adalah model yang
mencakup baik global dan aspek-aspek lokal dari sistem pelayanan, 3.3. rekayasa Web: Baru arah 43 memfasilitasi integrasi layanan Web untuk mencapai tujuan-tujuan baru, sementara juga pro-
masi sebuah formalisme untuk evaluasi integrasi [296].
Proses aljabar (lihat Bagian 4.2.5) juga telah diterapkan untuk
layanan. Sekali lagi, seperti dengan pendekatan Petri net, penggunaan formal
aljabar memungkinkan baik desain dan evaluasi untuk mengambil tempat (atau memang salah satu
atau yang lain, tergantung pada apa metode alternatif yang tersedia untuk
menghasilkan atau survei kode). Sebagai contoh, [98] menggambarkan pemetaan
antara aljabar proses ekspresif dan BPEL4WS (standar-
notasi yang tidak sah berbasis XML untuk mendeskripsikan proses bisnis executable),
yang memungkinkan baik pembentukan jasa di BPEL4WS diikuti oleh
mereka evaluasi dan verifikasi menggunakan aljabar proses, atau gen yang-
timbangkan kode BPEL4WS otomatis dari penggunaan aljabar
untuk menentukan layanan yang diinginkan. Secara umum, spesifikasi aljabar
pelayanan pada tingkat abstrak dan penalaran tentang mereka telah menjadi
utama bidang penelitian pada layanan [mis 75, 105, 208].
BPEL4WS adalah versi panjang dari Eksekusi Proses Bisnis
Bahasa BPEL, yang menjadi cara yang semakin penting untuk
Sun Web layanan dengan proses bisnis. BPEL ada batasnya,
tapi memungkinkan penciptaan layanan komposit dari layanan yang telah ada. The
Tahap selanjutnya adalah menyesuaikan pendekatan ini untuk lingkungan P2P, dan
kendaraan saat ini dalam pengembangan untuk itu adalah CDL, akaWS-CDL, alias
Koreografi (Web Services Choreography Description Language -
[164]), sebuah bahasa berbasis XML untuk mendefinisikan umum dan pelengkap-
mentary diamati perilaku dalam kolaborasi P2P. Tujuannya adalah agar
interoperable P2P kolaborasi dapat disusun dengan menggunakan Koreografi
tanpa memperhatikan spesifik seperti platform dasar yang digunakan;
bukan fokus pada tujuan umum dari kolaborator. Sedangkan
BPEL memungkinkan ada pelayanan yang akan digabungkan bersama-sama, Koreografi
pergeseran fokus ke deskripsi global kolaborasi, informasi
tion pertukaran, pemesanan tindakan dan sebagainya, untuk mencapai tujuan yang disepakati.
3.3.2 Distributed pendekatan: komputasi Pervasif,
P2P dan grid
Ada banyak lingkungan hardware yang akan Web
diharapkan untuk menembus, namun asumsi teknik mana yang apply44 Rekayasa Web
untuk skala besar, lebih-atau-kurang tetap mesin komputasi khusus tidak
harus berlaku. contoh nyata termasuk mobile computing, ubiqui-
tous (atau meresap) komputasi mana interoperabilitas menjadi masalah,
P2P sistem dan komputasi grid. komputasi Mobile membuat segala macam
tuntutan rekayasa, daya komputasi yang tersedia tidak luas dan
pengguna harus diasumsikan terus-menerus bergerak dengan variabel
bandwidth dan akses. Selain itu, menyajikan informasi kepada pengguna
memerlukan paradigma yang berbeda dari PC, misalnya untuk memungkinkan
pengguna untuk menerima informasi yang cukup pada layar kecil untuk membuat alis-
ing menarik [20, 193]. Akses mobile ke Web dapat menjadi
mode dominan di banyak negara, terutama yang berkembang, terima kasih
untuk harga yang relatif rendah dan keandalan koneksi nirkabel dan kelelawar-
daya tery [222]. Penelitian di bidang ini penting untuk adil
distribusi sumber daya web.
Mana-mana komputasi, P2P dan berbagi komputasi grid banyak seri
ous penelitian masalah, terutama koordinasi perilaku dalam jumlah besar
terdistribusi skala sistem. membayangkan komputasi Ubiquitous kecil, rel-
perangkat komputasi bertenaga rendah atively tertanam di lingkungan
pervasively berinteraksi dengan orang. Ada berbagai-pos imajinatif
jawabnya, seperti benang cerdas yang dapat ditenun menjadi pakaian. Tapi
tanpa menebak-nebak kecenderungan jelaslah bahwa perangkat yang lebih kecil akan
perlu koneksi nirkabel ke jaringan arsitektur yang memungkinkan otomatis
ad hoc konfigurasi, dan ada sejumlah kesulitan rekayasa
yang terkait dengan masalah (cf. [244, 176]).
Sebagai contoh, penemuan layanan dalam paradigma meresap harus mengambil
tempat tanpa manusia dalam loop. Layanan harus mampu adver-
tise diri untuk memfasilitasi penemuan. Standar layanan penerbitan
akan diperlukan untuk menjamin keamanan dan privasi, kepercayaan dari layanan
keandalan, kompensasi untuk penyedia layanan, dan tepat bagaimana
layanan akan terdiri dengan layanan dipanggil lain untuk mencapai
beberapa tujuan atau memecahkan masalah yang dihadapi [179].
Ini hanyalah salah satu contoh lingkungan komputasi saat ini berkembang-
pemerintah yang kemungkinan akan semakin penting. Dalam konteks ofWeb Sains
dan mencari dan deskripsi dari invariants dari pengalaman Web
ence, adalah penting bahwa asumsi kita buat tentang lingkungan,
dan teknologi yang hidup di dalamnya, adalah minimised.3.3. Rekayasa web: arah baru 45
P2P jaringan, ditandai dengan otonomi dari server pusat,
konektivitas intermittent oportunistik dan penggunaan sumber daya [220],
lain adalah lingkungan yang menarik bagi generasi Web berikutnya. Dalam
seperti jaringan (termasuk jaringan file-sharing seperti Napster, com-
munication jaringan seperti Skype, dan jaringan komputasi seperti
sebagai SETI @ home), komputer menjadi komponen dalam terdistribusi
sistem, dan mungkin melakukan berbagai hal: back up orang lain
file, menyimpan fragmen dienkripsi file, melakukan pengolahan untuk besar
skala usaha di latar belakang, dan sebagainya. Ada banyak jelas
potensi aplikasi untuk baik bersih P2P terstruktur dan tidak terstruktur-
bekerja dalam konteks Web. Pertanyaan bagi para ilmuwan Web adalah apa yang
fungsi penting bagi pengalaman Web dapat disimpan dalam longgar
ditambah sistem otonomi. Mengingat karakteristik yang tidak biasa P2P,
termasuk nomor yang berpotensi besar dan heterogenitas dari node P2P,
tradisional rekayasa metode seperti eksperimentasi online (yang
akan membutuhkan jumlah unfeasibly besar pengguna untuk mendaftar ke arsitektur-
tecture dan memungkinkan transaksi mereka yang akan dimonitor) atau skala besar sim-
modulasi (skala hanya terlalu besar) akan tidak pantas. Skala
izin dari Web, yang kami akan terus melihat dalam jaringan P2P,
membuat jaringan teori model penting (lih. misalnya [249, 189]), tapi kami
harus mengharapkan eksperimentasi radikal, inovasi dan kewirausahaan-
isme untuk memimpin upaya dalam bidang ini.
Godaan untuk mengeksploitasi lingkungan radikal desentralisasi seperti
sebagai jaringan P2P pada generasi berikutnya dari Web adalah kuat; decentral-
isation adalah aspek kunci dari keberhasilan Web. Jadi, misalnya, orang bisa
bayangkan P2P jaringan yang digunakan untuk menemukan halaman cache untuk backup di
hal terjadi kegagalan atau kesalahan yang mengarah ke halaman yang hilang atau link menggantung.
Perlu dibentuk apakah kemampuan jaringan P2P untuk melakukan
bahwa (yang sendiri saat ini belum terbukti) akan merusak domain
nama sistem atau mendukungnya.
Sedangkan sistem distribusi P2P mengeksploitasi skala besar untuk mencapai banyak
dari ujung kecil, komputasi grid [102] sering merupakan pendekatan didistribusikan ke
masalah skala besar menggunakan daya komputasi substansial untuk menganalisis enor-
MoU jumlah data. Masalahnya adalah mengkoordinasikan perilaku
sejumlah besar komputer, mengeksploitasi peluang-sumber daya yang tidak terpakai
tunistically seperti P2P; lagi seperti P2P, dan tidak seperti tradisional distributed46 Rekayasa Web komputasi, komputasi grid ini dimaksudkan untuk menjadi netral tentang administrasi
atau platform batas. Standar terbuka Oleh karena itu diperlukan, dan
Grid membutuhkan deskripsi abstrak sumber daya komputasi.
Dengan analogi ke Web Semantic, Grid telah melahirkan Seman-
tic Grid, di mana informasi dan sumber daya komputasi yang dijelaskan
dengan metadata (dan sebagai dengan RDF SW adalah bahasa pilihan),
memungkinkan eksploitasi spesifikasi mesin yang dapat dibaca untuk
otomatis koordinasi sumber daya untuk memecahkan tertentu skala besar prob-
memiliki kualifikasi [72]. Penerapan Grid dan Grid Semantic hingga besar
masalah skala menunjukkan janji besar - memang sebagai data dari CERN
Large Hadron Collider akan mulai beroperasi pada gigabyte / detik, Grid
sangat diperlukan.
Grid dan Grid Semantik meningkatkan sejumlah pertanyaan tua di
penyamaran baru. Mengingat bahwa sumber daya komputasi seseorang diberikan ke
luar, kepercayaan dan keamanan akan membutuhkan peninjauan kembali [23]. Sosial,
issue yang menarik adalah memahami apakah akan benar-benar Grid
perubahan ilmu pengetahuan, atau hanya memungkinkan pengolahan data yang lebih dan lebih
[207].
Secara umum, semua paradigma komputasi baru meningkatkan pertanyaan
tentang bagaimana banyak individu yang relatif otonom dapat bekerja sama untuk
menghasilkan hasil yang saling menguntungkan (baik hasil yang bermanfaat untuk masing-masing
individu, atau untuk masyarakat secara keseluruhan). Koordinasi masalah seperti
ini selalu tampak besar dalam banyak disiplin, dan kita seharusnya tidak
akan terkejut menemukan mereka di pusat Web Science.
3.3.3 Personalisasi
Hal ini sering mengklaim bahwa personalisasi penting bagi leverag-
ing nilai jaringan [81], dan meningkatkan konsumen lock-in [281].
Mengizinkan pengguna untuk menyesuaikan alat-alat mereka dan berarti ruang kerja yang
Web tetap lebih dari commoditised satu ukuran cocok untuk semua daerah dan
malah menjadi sebuah ruang di mana orang dapat mengukir sendiri
niche. Selain itu, mereka juga harus dapat menerima pelayanan yang lebih baik-
kejahatan, disesuaikan dengan keadaan khusus mereka sendiri dan preferensi,
untuk sama atau hanya sedikit lebih biaya [90]. sistem industri tersebut adalah
jelas aplikasi teknologi [6] .
3.3. Rekayasa web
Untuk mendapatkan personalisasi yang efektif, harus ada pemanfaatan yang terintegrasi dari
informasi dari sejumlah sumber, termasuk data tentang pengguna (klik-
data stream, download pola, profil online), sumber daya yang
dikirim (konten situs, struktur situs) dan pengetahuan domain, bersama-sama
dengan data teknis pertambangan yang cukup untuk menciptakan pandangan holistik dari
sumber daya yang meliputi sebanyak mungkin informasi yang dibutuhkan pengguna,
dalam representasi yang akan masuk akal bagi mereka, sementara tidak termasuk informasi-
mation mereka tidak akan mau, dan yang bisa memperhitungkan dinamika
sifat model pengguna. Semua itu, sambil tetap mempertahankan hubungan
antara invariants dari pengalaman Web dan con tertentu-
teks menggunakan individu yang memberdayakan dia untuk klaim sudut
dari dunia maya dan mulai menggunakannya sebagai perpanjangan dari ruang pribadi.
Mengingat bahwa, di Web, informasi yang relevan mungkin sangat
didistribusikan dan dinamis, personalisasi diharapkan dapat menjadi salah satu
besar keuntungan dari Web Semantic, yang unggul struktur yang
memungkinkan penalaran atas sumber data dan didistribusikan.
Ada banyak program teknik berjalan menyelidiki
heuristik untuk personalisasi dari informasi yang tersedia, termasuk
menggunakan mesin belajar [120], ontologi [74, 165], jaringan P2P [126],
dan menghasilkan representasi untuk memfasilitasi pengumpulan informasi pengguna
mation [74, 157, 223], serta menyediakan lingkungan yang memfasilitasi
personalisasi [136, 53, 194] dan link asosiatif didasarkan pada user-bukan
dari penulis-preferensi [54]. Lain benang penting dari personalisa-
rekayasa tion adalah pengembangan alat untuk memungkinkan neophytes relatif
untuk menciptakan atau meningkatkan pengetahuan teknik artefak kompleks, seperti
ontologi [213, 211] atau pembungkus [250].
3.3.4 Multimedia
Web adalah lingkungan multimedia, yang membuat untuk kompleks
semantik - ini tentu saja tidak masalah yang unik ke Web. Meta-
epistemologi penalaran dan sering menganggap media tekstual, bahkan
meskipun sebenarnya banyak penalaran dalam bentuk analog. Misalnya
ahli sering menggunakan diagram untuk mengekspresikan pengetahuan mereka [174, 263]. Ada
memiliki upaya telah menghasilkan taksonomi generatif 'bahasa-seperti'
representasi visual [190], tetapi ini tidak tampak have48 Rekayasa Web
menarik aplikasi. Beberapa peneliti telah mencoba untuk menemukan
prinsip-prinsip yang mungkin mendasari penalaran diagramatik [60]. Ada
juga telah aplikasi penting untuk decoding dari perwakilan visual-
tions untuk [147] gangguan penglihatan dan koleksi gambar visualisasi
terhadap ontologi domain [8]. Pada akhirnya, integrasi multi-
representasi modal dari adegan yang sama atau entitas adalah prob sangat keras-
lem [224]. Secara umum, tidak diketahui bagaimana mengambil semantik dari
representasi non-tekstual andal; fenomena ini dikenal sebagai
semantik kesenjangan.
Namun demikian, generasi Web berikutnya tidak harus didasarkan pada
palsu asumsi bahwa teks adalah pencarian dominan dan kata kunci berbasis
akan mencukupi untuk semua tujuan yang wajar [127]. Memang, isu-isu
berkaitan dengan navigasi melalui repositori multimedia seperti video
arsip dan melalui theWeb tidak berhubungan: keduanya kebutuhan informasi
link untuk mendukung browsing, dan keduanya perlu untuk mendukung mesin manual
link traversal. Namun, pendekatan kata kunci dapat goyah di mul-
timedia konteks karena kekayaan yang lebih besar dari banyak non-tekstual
Media [264]. Pendekatan gambar Google pencarian bergantung pada surround-
ing teks untuk gambar, misalnya, yang memungkinkan pencarian yang relatif cepat,
dan sekali lagi pada umumnya pengguna seringkali mampu membuat pilihan final
memilah-milah rekomendasi yang disampaikan (gambar kata kunci berbasis
pencarian cenderung menghasilkan banyak hits lebih sedikit, yang mungkin berarti mereka
banyak kemungkinan hilang masuk akal). Kehadiran manusia dalam
loop sulit untuk menghindari saat ini: intervensi manusia dalam proses
mengintegrasikan bahasa visi dengan modalitas lain yang biasanya diperlukan
[224], meskipun ada sejumlah teknik yang menarik untuk menggunakan
struktur yang dihasilkan dari teks yang terkait dengan koleksi gambar untuk
bantuan pencarian dalam konteks terbatas [7].
Tetapi selalu mungkin untuk mengeluarkan lebih banyak sumber daya pada analisis suatu
gambar (katakanlah) untuk menghasilkan pertandingan yang lebih baik untuk pencarian kata kunci,
jika kecepatan tidak merupakan faktor utama [293]. Dalam analisis fitur tersebut, sebuah
isu yang penting adalah kepentingan relatif dari fitur tingkat rendah seperti
'Dominan warna', dan tingkat tinggi, fitur abstrak atau konsep, seperti
sebagai 'Madonna' atau 'masih hidup'. Cari pada fitur-fitur tingkat rendah mungkin cepat
dan lebih akurat, namun pengguna cenderung ingin pencarian cukup abstrak
istilah [121] .3.3. Rekayasa web: arah baru 49
Sebagai hybrid menarik telah disarankan bahwa kesenjangan semantik
bisa diisi dengan ontologi dari visual yang mencakup istilah tingkat rendah
dan memberikan semacam pemetaan konsep-konsep abstrak ke tingkat yang lebih tinggi
disajikan dalam query dan metadata [229]. Infrastruktur tersebut telah
telah dibuat, dengan menggunakan (i) ontologi descriptor visual berdasarkan RDF
representasi dari MPEG-7 deskripsi visual, (ii) struktur-multimedia
mendatang ontologi berdasarkan skema deskripsi-7 multimedia MPEG
dan (iii) pemodelan ontologi inti primitif pada akar con-
kecuali bahwa hierarki yang dimaksudkan untuk bertindak sebagai jembatan antara ontologi,
semua ditambah dengan ontologi domain [260]. A penting yang lebih jauh
terbuka adalah isu interoperabilitas teknologi Semantic Web dengan
non-RDF berbasis metadata seperti metadata EXIF di file JPEG atau
tag gambar informal dibuat di Flickr [279]. Pekerjaan lebih lanjut diperlukan
pada hubungan antara kebutuhan manusia dan sistem temu kembali citra
kemungkinan otomatisasi [156, 206], termasuk lebih dalam di bawah-
berdiri dari kemampuan relatif folksonomi dan ontologi (lihat
Bagian 3.1.4-3.1.5).
Tentu saja, media di sini tergambar adalah foto dan video; terbuka
pertanyaan penelitian tetap tidak hanya tentang seberapa jauh orang bisa masuk
pencarian dengan pendekatan semacam, tetapi juga tentang berapa banyak media akan SUC-
cumb sedemikian pendekatan dengan cara yang terintegrasikan.
3.3.5 pemrosesan bahasa Alam
Akhirnya, ada masalah substansial yang berkaitan dengan bahasa alami pro-
cessing (NLP), analisis komputasi data tidak terstruktur dalam teks-teks
untuk menghasilkan pemahaman mesin (pada tingkat tertentu) dari teks yang.
NLP berhubungan dengan Web dalam beberapa cara. Di tempat pertama, nat-
bahasa Ural adalah domain yang sangat jarang, dalam kalimat yang paling diucapkan
atau tertulis hanya terjadi sekali atau sangat jarang, dan skala raksasa
Web menyediakan sebuah korpus menarik untuk penalaran NLP. Sebuah terbaru guessti-
mate untuk ukuran dari Web adalah dua ribu miliar kata, yang
71% adalah bahasa Inggris, Jepang 6,8% dan 5,1% Jerman. Banyak yang relatif
bahasa umum seperti Slovenia atau Melayu yang memegahkan diri kata 100m
online, ukuran yang sama dengan Nasional Inggris digunakan secara luas dan dihormati
Corpus. Ada argumen tentang bagaimana wakil Web adalah as50 Rekayasa Web
korpus, tapi gagasan tentang apa yang harus mewakili corpus - harus
itu termasuk pidato, menulis, bahasa latar belakang seperti bergumam atau
berbicara dalam tidur seseorang, atau kesalahan misalnya? - Sulit untuk dijabarkan dengan
presisi setiap [167].
Kedua, mengingat masalah skala Web, teknik NLP akan
menjadi penting dalam tugas-tugas seperti summarisation (lihat, misalnya,
Dokumen Memahami tahunan Konferensi - http://duc.nist.gov/
dan [69]), yang dapat memberikan dukungan yang berguna untuk bagian-bagian manusia
tugas pencarian.
Ketiga, NLP memiliki potensi besar untuk pembangunan jenis-jenis
antarmuka intuitif yang heterogen dan tidak selalu komputer
literateWeb komunitas pengguna membutuhkan. Memang mungkin membantu menjembatani kesenjangan
antara SWvision dari aWeb terdiri dari data dimanipulasi secara logis,
dan visi yang lebih tradisional dari Web sebagai tempat yang berguna
dokumen diambil. Sebagai contoh, dapat digunakan teknik NLP
untuk menemukan dan mengekspresikan metadata [153]? Teks yang mengandung tidak terstruktur
data sekarang dapat dipetakan ke sumber daya yang ada seperti ontologi untuk
menyediakan markup dan penjelasan, setelah sesi pelatihan awal.
ontologi Computing seperti yang kita jumpai berbeda
dalam tujuan dan struktur dari thesaurus dan taksonomi dari
NLP dunia, meskipun ada perdebatan tentang tingkat dan sifat
dari perbedaan [125, 289]. WordNet, misalnya, bukanlah ontol-
ogy ketat, misalnya yang mengandung unsur leksikal dengan pengertian yang berbeda
di mana suatu ontologi mencoba untuk memastikan interpretasi yang unik untuk istilah
yang digunakannya. Tapi sama WordNet memang mengandung hubungan ontologis seperti diatur
inklusi dan keanggotaan di dalamnya. sumber daya NLP juga memiliki beberapa-
hal yang sama dengan folksonomi dan sejenisnya, serta pentingnya
perbedaan.
Dari sudut pandang Web Sains, pertanyaan terbuka yang penting
ada untuk hubungan antara NLP dan Web, adalah statisti-
kal teknik yang digunakan dalam NLP bertentangan atau saling melengkapi dengan logis
dan semantis berdasarkan teknik interogasi data yang digunakan oleh
SW masyarakat? Atau alternatif ada divisi optimal ana-
tenaga kerja lytical antara dua jenis pendekatan yang kita dapat memanfaatkan?
Banyak tergantung pada bagaimana kita menafsirkan pengembangan Web. Untuk
Misalnya, jika seseorang melihat tugas utama sebagai untuk membubuhi keterangan dan provide3.3. Rekayasa web: arah baru 51
kaya konteks untuk konten dan struktur ('menjinakkan Web', seperti yang dijelaskan
di [196]), maka NLP akan memainkan peran penting dalam hal itu, termasuk pemetaan
drift dalam arti dari waktu ke waktu [290]. Jika kita memahami Semantic Web
sebagai berfokus pada data dan model database relasional, maka logis
syarat dan URI gigih menjadi pusat.
NLP bekerja dengan baik statistik, SW, sebaliknya, membutuhkan logika
dan belum menggunakan substansial statistik. Bahasa alami
demokratis, seperti yang diungkapkan dalam slogan 'artinya adalah menggunakan' (lihat Bagian 5.1
untuk diskusi lebih dari ini). Setara dalam SW kata-kata
bahasa alami adalah istilah-istilah logis, yang URI yang menonjol. Demikian
kita memiliki disanalogy langsung antara NLP dan SW, yang
yang URI, tidak seperti kata-kata, mempunyai pemilik, dan sehingga dapat diatur. Yang
bukan untuk mengatakan bahwa peraturan tersebut akan menjamin kekebalan dari makna
drift bahwa linguis mendeteksi, tetapi juga dapat memberikan stabilitas yang cukup selama
jangka pendek medium.

4
Analisis Web
Belajar sifat-sifat dari Web sebagai objek formal di dalam dirinya sendiri
menyediakan cukup banyak leverage untuk desainer dari sistem baru, dan bahkan
lebih mungkin untuk badan standar yang tugasnya adalah untuk menemukan dan
menjaga invariants penting dari pengalaman Web pada makro
skala. Pada bagian ini kita akan meninjau secara singkat upaya untuk peta Web
topologi, dan metode kemudian matematika penyelidikan.
Web 4.1 topologi
4.1.1 Struktur Web
investigasi Topological upaya untuk memahami struktur dari dasar
unsur-unsur arsitektur dan hubungan antara mereka. Struktur
dapat memberi tahu kita banyak. Penyelidikan struktur dari Web adalah
selalu tergantung pada tingkat abstraksi dari deskripsi saja.
Tersebut adalah ukuran dari Web yang bahkan sangat kecil perbedaan di
kinerja komponen ini dapat membuat perbedaan besar di
tingkat makro. Sebagai contoh, meskipun satu tidak akan umumnya khawatir
oleh perbedaan antara algoritma O (n) dan algoritma
O (n log n) di ruang masalah kebanyakan, pada skala Web log n istilah
bisa mulai untuk mendapatkan lumayan besar [191]. Oleh karena itu perilaku
komponen jaringan skala besar adalah relevansi bahkan ketika mencari
pada sifat global dari Web.
Selanjutnya, struktur pada gilirannya memberikan bukti apa-konversi dari
sations sedang berlangsung melalui Web. Oleh karena itu pemahaman struktur
adalah penting untuk sejumlah aplikasi, seperti navigasi, pencarian,
menyediakan sumber daya untuk mendukung komunitas online, atau ameliorating
efek dari perubahan mendadak dalam permintaan informasi.
Web adalah demokratis sejauh bahwa tidak ada sentralisasi
atau pusat koordinasi menghubungkan. Dipahami sebagai struktur hypertext,
kegunaan bergantung sangat besar pada efektif menghubungkan; berikut
rantai halaman buruk terkait mengarah pada disorientasi terkenal
fenomena menjadi 'tersesat di angkasa'. Setelah rantai link adalah
juga diberikan kurang berisiko oleh Web browser yang berisi 'kembali' tombol,
yang berlaku memberikan kebalikan dari hyperlink apapun. Dan navigasi
tidak perlu hanya menjadi santai berjalan seenaknya sekitar rantai hyperlink, terima kasih
untuk mencari mesin yang menemukan halaman dengan karakteristik yang menarik bagi
pengguna.
Topologi Web berisi kompleksitas lebih dari rantai linear sederhana.
Pada bagian ini, kita akan membahas upaya untuk mengukur global struktur-
mendatang dari Web, dan bagaimana halaman web individu masuk ke dalam konteks itu. Apakah ada pernyataan menarik yang menetapkan atau menyarankan penting prop-
erti? Sebagai contoh, mungkin itu mungkin untuk pengetahuan peta di theWeb?
Seperti peta mungkin memungkinkan kemungkinan pemahaman com online-
komunitas perikanan, atau untuk melakukan 'tracing membanggakan' dalam - setelah meme, atau ide,
atau rumor, atau Factoid, atau teori, dari perkecambahan membuahkan hasil, atau sebaliknya
sebaliknya, dengan menelusuri cara itu muncul dalam berbagai halaman dan link mereka [5].
Mengingat peta tersebut, kita dapat membayangkan bercak masalah seperti Slashdot
surge (yang memperlambat atau penutupan sebuah website setelah baru dan besar
Populasi pengguna mengikuti link untuk itu dari sebuah website populer, sebagaimana telah
terjadi dari situs dari majalah online Slashdot) sebelum mereka
terjadi - atau setidaknya mampu mengintervensi cukup cepat untuk memulihkan
normal atau jasa dapat diterima segera setelah itu. Memang, kita bahkan mungkin
menemukan berkat apakah dampak lonjakan Slashdot telah menolak
ekspansi konstan dari Web, seperti yang telah dikatakan baru-baru ini [166].
Banyak menulis tentang Web tampaknya menunjukkan bahwa, di beberapa
cara, hidup, berkembang dan di luar kendali [misalnya 87], dan decentralised54 Analisis Web
model theWeb pasti mempromosikan pandangan bahwa pertumbuhannya berada di luar
kontrol. Web-sebagai model-platform berarti bahwa ada asli dan
kuat indra di mana "pencipta" dari Web (yang dapat con-
Perangkat ini mendapat sebagai: conceptualisers awal hubungan meluas antara pengetahuan-
tepi dan pengetahuan representasi, pencetus yang kuat
standar dan bahasa yang mendasari Web seperti yang kita tahu, yang banyak
profesional saat ini dan tanpa pamrih melaksanakan nego telaten-
tiations pada badan standar W3C, atau para penulis yang sebenarnya con-
tenda yang kita lihat online) tidak mengontrol struktur makroskopik. Ini
model sangat kuat, tetapi itu tidak berarti bahwa Web telah nec-
essarily menjadi sup dibeda-bedakan halaman yang terhubung.
Metode analisis web melihat pola link [171] telah
ternyata sangat menarik, mencerahkan dan kuat dalam
struktur mereka menemukan. Sebagai contoh, beberapa situs sepertinya harus diambil
sebagai berwibawa dalam beberapa cara - dengan kata lain, banyak situs lain link
ke dalamnya. Situs lain mengandung banyak link keluar - salah satu cara untuk hamil
ini akan menjadi yang berwenang seperti indeks situs mengenai topik tertentu - dan
situs ini berguna bertindak sebagai hub. hub tersebut juga dapat otoritas, tetapi
sama mereka mungkin ditunjukkan oleh beberapa halaman atau bahkan tidak ada halaman sama sekali.
Ketika metode seperti yang dipelopori oleh Kleinberg, Brin dan Page
mengambil link matriks Web dan menemukan vektor eigen, ternyata
bahwa mereka sesuai dengan cluster sekitar konsep bahwa halaman
tentang. Seperti otoritas-hub struktur sangat penting besar untuk kami
analisis pemahaman dari Web, dan membutuhkan dari link matriks
temukan. Memang, niat asli Kleinberg adalah untuk menemukan otoritas,
dan online mana-mana dari struktur otoritas-hub lebih kompleks
awalnya mengejutkan [171].
Beberapa pihak berwenang pada topik yang sama kasar mungkin menunjuk
oleh semua atau sebagian besar hub yang mengkhususkan diri di daerah tersebut. Oleh karena itu bahkan jika berbagai pihak berwenang tidak menunjuk satu sama lain (mungkin karena
dari persaingan komersial), mereka semua masih terkait dalam sub yang cukup ketat
jaringan dengan hub. Struktur tersebut dapat dilihat sebagai mendefinisikan de facto
subjek atau topik, seperti yang diciptakan oleh komunitas penulis halaman aktual.
Topik-topik tersebut dan masyarakat alternatif cara ukiran up
isi Web di sepanjang garis wacana klasifikasi standar
[137] .4.1.
4.1.2 Grafik-teori investigasi
Mungkin paradigma yang paling terkenal untuk mempelajari Web adalah grafik
teori. Web dapat dilihat sebagai grafik yang node halaman dan
yang (diarahkan) tepi adalah link. Karena weblinks sangat sedikit acak,
jelas bahwa tepi grafik mengkodekan struktur banyak yang terlihat
oleh desainer dan penulis konten yang sama pentingnya. Sangat tersambung
bagian webgraph yang sesuai dengan apa yang disebut cybercommunities
dan penyelidikan awal, misalnya dengan Kumar et al, menyebabkan discov the-
ery dan pemetaan ratusan dan ribuan masyarakat seperti [175].
Namun, identifikasi cybercommunities oleh pemetaan pengetahuan
masih sesuatu yang seni, dan bisa kontroversial - pendekatan yang sering
menghasilkan "masyarakat" dengan anggota tak terduga atau hilang, dan dif-
pendekatan ferent sering mengukir ruang yang berbeda [137].
Konektivitas webgraph telah dianalisis secara rinci, menggunakan
struktural seperti indikator seperti bagaimana node yang terhubung. Berbagai makro
struktur scopic telah dilihat dan diukur, misalnya satu
merangkak dari lebih dari 200 juta halaman menemukan bahwa 90% dari Web
sebenarnya tersambung, jika link diambil sebagai non-directional, dan bahwa
56m dari halaman ini sangat sangat berhubungan [49] cf. [80]. The struktur-
mendatang sehingga ditemukan sering disebut sebagai bentuk bowtie, seperti yang ditunjukkan
pada Gambar 4.1. The 'simpul' dasi adalah sangat berhubungan cluster
(SCC) dari webgraph di mana terdapat jalur antara setiap pasangan
node. SCC ini diapit oleh dua set cluster, mereka yang link ke
SCC tetapi dari yang tidak ada backlink (ditandai sebagai DI dalam
gambar), dan mereka yang terkait dengan dari SCC tetapi tidak link
kembali (OUT). Hubungan antara SCC, IN dan OUT memberikan
bentuk bowtie. Implikasi dari penemuan ini masih topologi
perlu dipahami. Meskipun beberapa telah mengusulkan perubahan terhadap
algoritma PageRank untuk mengambil keuntungan dari Topol mendasari-
ogy [18], masih ada banyak pekerjaan yang harus dilakukan untuk mengeksploitasi struktur
terlihat.
Memang, struktur bowtie adalah lazim di berbagai skala.
Dill di al telah menemukan bahwa himpunan bagian yang lebih kecil dari Web juga memiliki
bentuk bowtie, sebuah petunjuk bahwa Web mempunyai sifat fraktal yang menarik -
yaitu bahwa setiap menampilkan daerah tematis-terpadu (banyak dari) same56 Analisis Web
Gambar. 4.1 Bentuk bowtie dari Web dan sifat fraktal nya [78].

karakteristik sebagai Web pada umumnya [78]. Web cukup jarang
tersambung berarti bahwa subgraph disebabkan oleh satu set acak
node akan hampir kosong, tetapi jika kita mencari kelompok non-acak
(Cluster tematis-bersatu atau TUCs) yang jauh lebih con-
dihubungkan, maka kita melihat bentuk bowtie muncul lagi. Setiap TUC akan
memiliki SCC sendiri, dan sendiri IN dan OUT sisi, termuat di dalam
SCC yang lebih luas. SCC skala yang lebih besar, karena sangat berhubungan,
kemudian dapat bertindak sebagai tulang punggung navigasi antara TUCs.
Dengan cara ini sifat fraktal dari Web memberi kita indikasi
dari seberapa baik ia membawa kompromi antara stabilitas dan penyelam-
sity, sejumlah cukup konstan koneksi pada berbagai tingkat
skala alat komunikasi yang lebih efektif [29]. Terlalu banyak koneksi
menghasilkan overhead yang tinggi untuk komunikasi, sementara terlalu sedikit berarti bahwa
komunikasi penting mungkin gagal terjadi. Asumsi bahwa lev-
els konektivitas yang cukup konstan pada setiap tingkat skala adalah
penting untuk perencanaan jangka panjang dan jangka pendek Capac bandwidth-
ity, misalnya. TheWeb berkembang sebagai akibat dari sejumlah dasarnya
proses stokastik independen yang berevolusi pada berbagai skala, yang
mengapa sifat struktural tetap konstan seperti yang kita perubahan skala. Jika we4.1. Web topologi 57
mengasumsikan bahwa Web memiliki semacam ini properti fraktal, maka untuk desain-
ing algoritma efisien untuk layanan data di Web pada berbagai skala itu
sudah cukup untuk memahami struktur yang muncul dari satu sederhana
proses stokastik [78].
Ada beberapa metrik yang tersedia untuk teori grafik ([40] dan
lihat [76] untuk survei terbaru). langkah-langkah Sentralisasi memberitahu kita bagaimana tersambung
sebuah node dibandingkan dengan node lain grafik, dan karena itu dapat membantu
memberitahu kita mana yang paling "pusat" node. Jumlah jarak ke
node lain (jarak keluar) dan jumlah jarak dari yang lain
node (dalam jarak), dinormalkan untuk ukuran grafik itu sendiri, dapat
menjadi informatif. Sebuah node sentral akan menjadi salah satu yang memiliki relatif rendah
total masuk dan keluar jarak, dalam kontras node terkubur jauh dari
node pusat kurang mungkin dicapai oleh suatu rantai link. Pengetahuan
yang merupakan node pusat, khususnya node yang relatif luar
pusat (misal ada banyak link dari yang node ke node lain), adalah
suatu langkah penting pertama untuk menavigasi melalui hyperspace. Pusat tersebut
node berguna untuk mencapai poin sewenang-wenang dalam grafik [76].
Global metrik melihat penggalian informasi tentang grafik sebagai
keseluruhan. Kekompakan adalah ukuran tentang bagaimana terhubung grafik, sebuah
grafik kompak berarti bahwa, secara umum, adalah mudah untuk mencapai secara acak
dipilih node dari yang lain. Ukuran biasa memiliki jangkauan antara
0 (benar-benar terputus node) dan 1 (sambungan universal). Kompak
pemberdayaan 0 jelas harapan untuk ruang informasi, tapi mungkin
kurang jelas grafik tidak boleh terlalu kompak baik, jika penulis
halaman Web yang hemat dan bijaksana tentang apa yang mereka link ke, mereka
link yang lebih mungkin untuk digunakan. Ada juga metode untuk menemukan-
ing apakah grafik seimbang atau tidak seimbang, yaitu beberapa bagian
grafik kurang baik terhubung dibandingkan dengan orang lain, dan karena itu per-
kejadian hilang informasi. Saldo adalah properti dari sebuah node individu
pada grafik, dan dimaksudkan untuk mengekspresikan intuisi bahwa, dalam sebuah rea-
sonably sumber daya ekspresif Web, link dapat diartikan sebagai lebih lanjut
perkembangan ide-ide dalam sumber daya, dan oleh karena itu jika beberapa dari
link yang sangat luas dan lain-lain agak jarang tersambung,
maka mungkin saja kasus yang menunjukkan mantan sangat baik dikembangkan
topik sementara yang kedua dapat ditingkatkan dengan penambahan lebih lanjut
link [40] 58 Analisis Web
metrik global lainnya dapat mengukur linieritas grafik, maka dis-
tribution link, atau diameter (yaitu jarak maksimum antara
node). Diameter webgraph telah diperkirakan 500, dan
diameter inti yang sangat dihubungkan pusat di 28 [49]. Pada tahun 1999
diperkirakan bahwa jarak rata-rata antara dua secara acak-cho
sen dokumen sekitar 19 [13], meningkat menjadi 21 satu atau dua tahun kemudian
[21]. Struktur Web adalah hipotesis menjadi grafik dunia kecil,
di mana jalur terpendek antara node lebih kecil dari satu mungkin
mengharapkan grafik yang ukuran [284].
Dimana area topik tertentu dipahami, analisis dapat didasarkan pada
kata kunci, merangkak Web dengan berbagai mesin pencari untuk menghasilkan
sekitar grafik yang menunjukkan hubungan antara situs-situs yang mengandung kata kunci.
grafik tersebut telah digunakan untuk keahlian peta ilmiah di beberapa
topik daerah, misalnya [252] diselidiki grafik sekitar tentang iklim
perubahan untuk menentukan sifat struktural mereka seperti konektivitas
dan sentralitas. Bersamaan dengan wawancara pakar, analisis itu
digunakan untuk mengungkap pola penggunaan, dan melemparkan cahaya pada pertanyaan
apakah struktur Web menciptakan ilmu pengetahuan, demokratis terdesentralisasi
mana pemasok berbagai informasi yang digunakan, atau alternatif
pemenang-mengambil-semua Web di mana ada pusat informasi yang penting
mendapatkan pasokan diperkuat. hasil sementara mereka memberikan dukungan beberapa
untuk kedua pola, serta mengarah ke kebutuhan data
yang mencakup periode yang lebih lama dan triangulasi kelompok ahli
wawancara, analisis webmetric dan lebih studi kasus mendalam.
Struktur dan evolusi jaringan besar sering mod- elled sebagai apa yang disebut "grafik acak", yang N node masing-masing memiliki probability p menjadi terhubung ke node lain. Probabilitas bahwa sebuah node memiliki hubungan k itu mengikuti distribusi Poisson [89]. Namun, dalam kasus Web, tentunya tidak mungkin bahwa hubungan antara node benar-benar
acak. Jadi, misalnya, segala sesuatunya sama sebuah node akan ditautkan
ke banyak node lain jika yang terintegrasi dengan baik ke dalam wacana sebuah domain,
dan tantangan untuk teori graph adalah untuk mengungkap aspek non-acak
topologi Web, dan mewakili itu. [21] menunjukkan mekanika statistik
sebagai sumber potensial inspirasi, karena dapat digunakan untuk menduga sifat
dari Web secara keseluruhan dari sampel yang terbatas (bahkan indeks Google
miliaran halaman Web adalah proporsi terbatas) .4.1.
Sejumlah putaran studi paralel tentang pergantian abad
menunjukkan bahwa probabilitas dari sebuah halaman memiliki link k tidak, seperti berlari-
dom teori graph memprediksi, mengikuti distribusi binomial dan con-
ambang untuk Poisson untuk jaringan besar, melainkan meluruh melalui kuasa hukum.
Menurut ASI Barab ', probabilitas dari halaman web yang dipilih secara acak
memiliki link k adalah k-G dimana G = 2,45 untuk link keluar dan G = 2,1
untuk link masuk. Perbedaan topologi yang berikut ini adalah secara signifikan
cant, misalnya, dengan jaringan dengan distribusi Poisson, maka akan
akan secara eksponensial jarang ditemukan node dengan link substansial lebih dari
mean, sedangkan distribusi kuasa hukum menentukan sebuah topologi
mana banyak node beberapa link, dan sejumlah kecil tapi signifikan
sudah sangat banyak.
Dalam jenis grafik yang biasa acak, jumlah rata-rata link per
node sangat penting untuk menentukan struktur, karena
Distribusi Poisson jumlah link. Namun untuk tipe yang diuraikan
et al ASI Barab ', rata-rata yang penting sedikit jaringan;
karena alasan itu mereka merujuk kepada mereka sebagai jaringan skala bebas [22]. Barab 'ASI
et al awalnya diharapkan dapat menemukan penyebaran acak dari koneksi, pada
tanah yang orang mengikuti minat mereka yang unik dan beragam bila
mereka link ke dokumen, dan diberi sejumlah besar dokumen
Grafik hasil koneksi akan muncul cukup acak. Bahkan,
konektivitas Web tidak seperti that.What kita lihat adalah bahwa node paling con-
hubungkan ke beberapa node lain, tetapi beberapa node (hub) memiliki besar
jumlah koneksi, kadang-kadang dalam jutaan. Tampaknya tidak ada
batasan untuk jumlah koneksi yang hub memiliki, dan tidak ada node typi-
kal yang lain, sehingga dalam pengertian ini adalah skala jaringan bebas. Skala bebas
jaringan memiliki beberapa properti diprediksi, meskipun - mereka menolak kecelakaan
gigi kegagalan, tetapi rentan terhadap serangan terkoordinasi di hub.
Menariknya jaringan fisik itu sendiri juga merupakan jaringan skala bebas
yang mengikuti suatu distribusi kuasa hukum dengan eksponen G = 2,5 untuk
jaringan router dan G = 2,2 untuk peta domain [92]. Selain itu,
juga telah melaporkan bahwa probabilitas untuk menemukan situs web yang dibuat
dari laman web n lagi didistribusikan menurut kuasa hukum [150].
Sifat skala bebas dari Web belum benar dimanfaatkan untuk
meningkatkan algoritma signifikansi seperti PageRank. Hal ini mungkin
daerah yang berpotensi sangat bermanfaat untuk penelitian mendatang [178] 0,60 Analisis Web
Konektivitas dari Web juga terdistorsi oleh clustering, sedangkan
probabilitas dari dua tetangga dari node yang diberikan juga dihubungkan
jauh lebih tinggi daripada acak (lih. misalnya [4]). clustering ini menyumbang
dengan nilai dari Web sebagai ruang informasi, bahkan berlari-
dom eksplorasi dari cluster dihubungkan erat-kemungkinan (a) untuk menjaga
pengguna dalam cluster halaman Web yang relevan, dan (b) memberikan beberapa baru
pengetahuan atau miring menarik pada topik di tangan. Berbagai jenis
cluster, atau pola-pola interaksi, dapat menghasilkan menarik yang berbeda
subgraphs dengan distribusi potensial yang berbeda. Misalnya, beberapa
bagian dari Web ditujukan untuk bekerja kolaboratif, seperti akademik dis-
ciplines (cf. [252]). Lain terutama dalam mempublikasikan modus, seperti dengan
besar media. Yang lain dimaksudkan untuk interaksi pribadi
yang bisa sangat dinamis dan kompleks, seperti topik blogging
(Cf. [3, 5]). pinggiran tertentu dari Web akan memiliki secara dramatis berbeda
dinamis pola konektivitas dari satu sama lain, dan dari Web
secara keseluruhan.
Pemetaan invariants tidak hanya membawa kita lebih dekat dengan deskripsi yang jelas-
tion fenomena Web, tetapi juga memungkinkan standar untuk un berikutnya
asi (s) dari Web untuk dikembangkan yang melestarikan aspek-aspek penting
struktur Web saat memungkinkan untuk pertumbuhan dan peningkatan usabil-
ity, expressivity dan desiderata lainnya. Sebagai contoh, pemahaman
jaringan sifat dari Web akan membantu menyediakan model untuk secu nya-
ritas persyaratan dan kerentanan, kecenderungan untuk kemacetan, maka
tingkat demokratisasi itu akan mendukung, atau apa yang akan terjadi jika
'Dua-kecepatan' Web muncul menjadi ada sebagai hasil dari perlakuan istimewa
yang ditawarkan kepada pengguna Web tertentu dan berakhirnya netralitas bersih.
Lihat Bagian
4.2.4 untuk diskusi lebih lanjut dari aplikasi praktis
pemetaan Web.
Teori graph tradisional cenderung bekerja dengan model ukuran tetap.
Namun, pertumbuhan web tidak hanya menuntut grafik yang dinamis
teori, juga membutuhkan model yang menghormati kualitas pertumbuhan itu.
Jadi, misalnya, link baru tidak secara acak, lagi
dari link lama adalah; kemungkinan adalah bahwa link baru akan con-
dihubungkan ke halaman yang tersambung sendiri sangat sudah (dengan demikian
menampilkan konektivitas preferensial). Mengingat bahwa kendala, Barab 'ASI et
al memiliki model jaringan Web-seperti dalam grafik di mana sebuah node baru gets4.2. Web matematika 61
ditambahkan pada setiap langkah waktu, yang link ke node lain didistribusikan non-
secara acak, dengan probabilitas yang lebih besar koneksi ke sangat-tersambung
node. Seperti grafik juga skala bebas, dan probabilitas bahwa simpul
memiliki hubungan k adalah kuasa hukum sekali lagi, dengan eksponen G = 3. Dalam
model, node yang terhubung sangat jelas meningkatkan konektivitas cepat
dari node lain [21]. model skala-bebas seperti itu adalah contoh sederhana dari jaringan berkembang - mereka terlalu sederhana? Secara khusus, asumsi kuasa hukum [92] mungkin
terlalu rapi, dan pembagian derajat node, meskipun sangat variabel-
mampu, mungkin tidak cocok dengan kuasa hukum [59]. Alternatif model mulai
emerge [94]. Satu baris penting dalam Web Ilmu harus menjadi daya eksploratif-
ransum topologi grafik dinamis, untuk menyelidiki bagaimana aneh
pola pertumbuhan Web bisa terjadi, dan bagaimana mereka mungkin mod-
elled. Selanjutnya, efek skala masih belum dipahami. Apakah ada
beberapa jenis batas atas skalabilitas dari Web? Jika demikian, adalah bahwa
batas satu berprinsip, atau tidak tergantung pada ketersediaan layak
teknologi? Berapa besar bisa theWeb tumbuh sambil tetap sebuah dunia kecil
dalam arti yang dijelaskan di atas.
Memang, pertanyaan skala dipotong dua arah. Ada yang lain, lebih kecil
Webs sekitar, dan sedangkan web itu sendiri datang sebagai sesuatu dari
kejutan bagi matematikawan dan ilmuwan komputer pada saat itu dimulai,
sekarang studi Web cenderung melihat terutama di Web. Struktur tersebut
sebagai Intranets mempunyai sifat yang sangat berbeda, dalam hal ukuran, connectiv-
ity, koherensi dan pencarian sifat; beberapa sifat terbawa dari
Internet secara keseluruhan, sementara yang lainnya tidak. Telah ada sedikit pekerjaan
atas struktur kontras, meskipun melihat [91] untuk investigasi
Intranet, dan [252] untuk subgraphs sesuai dengan sci tertentu-
entific topik.
Web 4.2 matematika
opez L '-Ortiz, dalam survei yang berguna [191], terlihat di sejumlah paradigma
berguna untuk memahami dasar-dasar algoritmik Internet
pada umumnya dan Web pada khususnya. Menerapkan wawasan tentang algoritma-
rithms masalah jaringan, dalam konteks protokol tertentu
mendasari Web, berpotensi sangat bermanfaat. Dan bahwa konteks is62 Analisis Web
vital - fungsi (atau sebaliknya) dari algoritma dalam konteks
Web menyediakan beberapa bukti yang paling meyakinkan bagi mereka yang
ingin berpendapat bahwa itu adalah lingkungan yang penting unik. Pertumbuhan
dari theWeb, sebagai opez-Ortiz L 'menunjukkan, adalah seperti yang paling canggih
teks algoritma pengindeksan yang beroperasi baik di dalam zona kenyamanan mereka
dalam aplikasi standar pada awal tahun 1995, namun berjuang keras
pada akhir tahun itu.
4.2.1 Rasional model
Salah satu paradigma penting adalah bahwa dari ekonomi mikro, mathemat diskrit
ics, teori pilihan rasional dan teori permainan. Meskipun pengguna individu
mungkin atau mungkin tidak "rasional", itu telah lama mencatat bahwa secara masal
orang berperilaku sebagai maximisers utilitas. Dalam hal ini, pemahaman
insentif yang tersedia bagi pengguna Web harus menyediakan metode untuk
model menghasilkan perilaku, dan karenanya pandangan tentang apa global
set perilaku yang diinginkan bisa direkayasa, dan apa yang bisa sistem
mendukung perilaku tersebut.
Web tidak memiliki mekanisme koordinasi pusat, namun menghasilkan sistem-
tematically menarik perilaku berkat insentif dan kendala
dikenakan baik oleh arsitektur, protokol dan standar, dan mereka
interaksi dengan sifat sosial atau psikologis dari pengguna atau desainer
(Memang, hal ini bisa dibilang fakta bahwa Web dibangun, dikelola dan digunakan oleh
banyak pengguna dunia nyata dengan hampir tak terbayangkan beragam antar
EST dan preferensi yang yang terpenting untuk aplikasi
paradigma / ekonomi teori permainan). Apakah ada batas atas untuk
utilitas kebebasan yang desentralisasi telah menghasilkan? Sebagai
meningkatnya jumlah pengguna, akan kemungkinan bahwa pilihan yang satu
membuat menimpa pada berbagai pilihan yang tersedia untuk meningkatkan orang lain, atau
bahwa ekstrapolasi tidak sah dari dunia nyata dengan tata ruang tetap
parameter? Jawaban untuk pertanyaan itu, bagaimanapun matematika, akan
memiliki efek mendalam pada pemerintahan Web [186]. Dengan kata lain, apa
adalah frekuensi dengan yang ditemukan kesetimbangan Nash yang
optimal bagi semua pihak? Dalam Web desentralisasi dan berkembang, di mana
tidak ada "pemilik" seperti itu, kita bisa yakin bahwa keputusan yang membuat
akal bagi seorang individu tidak merusak kepentingan pengguna secara keseluruhan?
Situasi seperti ini, yang dikenal sebagai 'tragedi milik bersama ", terjadi di
banyak sosial sistem yang menjauhkan diri hak milik dan lembaga terpusat-
tutions begitu jumlah pengguna menjadi terlalu besar untuk mengkoordinasikan menggunakan
peer tekanan dan prinsip-prinsip moral.
Kunci keberhasilan dari Web terletak pada efek jaringan
menghubungkan ke sumber daya, jika yang baik memiliki efek jaringan, kemudian nilai
itu meningkat baik untuk pemilik individu pemilik semakin banyak
adalah, dan semua hal yang sama dengan lebih kaya set link besarnya penggunaan
Penyambungan. Jaringan efek dapat berupa langsung atau tidak langsung. A langsung
efek adalah di mana permintaan untuk barang dihubungkan dengan jumlah orang
yang memilikinya - telepon dan email menjadi contoh utama. Secara intuitif,
kita dapat melihat bahwa model pasar untuk barang-barang tersebut bermasalah, sebagai
permintaan tampaknya tergantung pada sejumlah Deci tampaknya tidak terkait-
aksesi (untuk mengadopsi atau tidak dalam tahap awal), jika 'cukup' orang pergi untuk
lebih dini di pasar akan melambung, jika tidak. Tapi bagaimana kita mendefinisikan
'Cukup' di sini? Memasukkan lebih teknis, apa artinya ini adalah bahwa pasar
dengan efek jaringan memiliki beberapa kesetimbangan. Karena jumlah pengadopsi
(Ukuran jaringan) meningkat, kesediaan marjinal konsumen
membayar meningkat karena keuntungan yang lebih besar akan mereka terima dari
layanan untuk harga yang diberikan - keuntungan, ditentukan oleh tindakan
pihak ketiga daripada kedua pihak transaksi yang sebenarnya, adalah
disebut eksternalitas positif. Tapi di luar batas tertentu, akan-
ingness untuk membayar jatuh, sebagai pengadopsi kemudian biasanya mendapatkan kurang dari
jaringan.
Jadi, misalnya, mempertimbangkan layanan VOIP berlangganan dengan gratis
panggilan ke sesama pelanggan. Sejumlah kecil pelanggan umumnya
mengurangi nilai pelayanan kepada pengguna potensial, tetapi jika kita asumsikan
harga tetap stabil, jika meningkatnya jumlah pengguna, jumlah
orang siap untuk membayar harga akan meningkat, dan akan ada
saleh lingkaran pertumbuhan. Namun, mereka bergabung nantinya akan mereka
yang lebih skeptis tentang nilai layanan - sangat mungkin bahwa
mereka tidak terlalu memiliki banyak kebutuhan untuk VOIP. Jadi di beberapa titik
maksimum akan tercapai, bahkan ketika jaringan sangat besar, dengan banyak
kemungkinan komunikasi, tidak akan menarik pengguna baru apapun tanpa
menurunkan harga. layanan online Banyak struktur jaringan,
misalnya untuk jaringan mobile atau poker interaktif atau perjudian sites.64 Analisis Web
Jika, seperti dalam Gambar 4.2, kurva penawaran adalah elastis sempurna (misalnya hor-
izontal), ada tiga kesetimbangan: dua titik di mana suplai
persilangan kurva kurva permintaan (pada jaringan ukuran B dan C), dan
titik di mana kurva penawaran hits sumbu y (A = 0). Jika jaringan
ukuran tetap pada 0, maka permintaan tetap nihil, dan kami tinggal di posisi A.
Pada C, posisi ini juga stabil; jaringan berisi semua cus-
tomers siap untuk membayar tarif pasar, dan tidak bisa tumbuh karena ada
tidak ada orang lain siap untuk membayar. Jika jaringan tumbuh, itu harus karena
harga telah jatuh (yaitu kurva penawaran telah bergerak ke bawah; jika
menyusut jaringan, yang harus karena seseorang telah mengubah
preferensi dan sekarang tidak lagi siap untuk membayar harga pasar (yaitu
kurva permintaan telah bergerak ke bawah). Jika kita berasumsi bahwa dua
kurva tetap diam, maka setiap perubahan akan mengakibatkan slip kembali ke
C. Kuncinya adalah B, yang meskipun suatu kesetimbangan tidak stabil. Jika
ukuran jaringan tergelincir di bawah B, maka tidak cukup banyak orang akan siap
untuk membayar tingkat pasar dan permintaan secara bertahap akan tergelincir kembali ke
nol. Jika di sisi lain bisa mendapatkan dari B, maka tiba-tiba banyak
lebih banyak konsumen akan muncul yang siap untuk membayar harga pasar
atau lebih, dan ukuran jaringan akan meningkat secara dramatis, mendapatkan lebih dari
punuk kurva permintaan dan mencapai C. Jadi B adalah massa kritis
untuk jaringan [281].
Menafsirkan grafik inWeb istilah ini, 'jaringan ukuran' bisa diberi glos
sebagai 'jumlah node dalam webgraph yang' atau 'jumlah link' alternatif.
'Kesediaan untuk membayar' mengacu pada biaya yang pengguna Web adalah siap
menyerap. Ini termasuk biaya keuangan rutin seperti menyewa dari luas
garis band, biaya keuangan dimuka seperti pembelian komputer,
muka biaya non-keuangan, seperti upaya yang terlibat dalam mendaki
kurva belajar yang terkait dengan formalisms tertentu atau aplikasi,
dan teratur biaya non-keuangan seperti terus-menerus memastikan bahwa seseorang
sistem aman. 'User' itu yang dimaksud juga akan bervariasi: grafik
bisa merujuk ke pengguna web biasa (konsumen konten, yang biaya
biasanya akan keuangan), tetapi mungkin juga merujuk kepada penulis web (CRE-
ators isi, biaya yang biasanya akan dalam hal waktu dan
usaha). Tapi either way, kelanjutan dari efek jaringan yang positif
diamati di Web tergantung pada mempertahankan kinerja luar
yang kedua, tidak stabil equilibrium.4.2. Web matematika 65
Gambar. 4.2 Permintaan dan penawaran untuk jaringan yang baik [281].

jaringan efek tidak langsung juga berlaku ke Web. Jaringan tidak langsung
efek ditemukan dalam industri seperti DVD - saya beli DVD
pemain tidak dipengaruhi oleh siapa lagi yang memiliki satu, tetapi semakin besar jumlah
pemilik DVD player, segala sesuatunya sama yang lebih besar dan lebih kaya yang
jumlah konten DVD yang tersedia akan (dan memang lebih murah itu
akan). Pemodelan efek tidak langsung seperti juga merupakan bagian penting dari
memahami bagaimana Web dapat terus berkembang.
Bagaimana itu akan mudah untuk menggambarkan Web dalam permainan teori / rasional
pilihan kata? Apakah ada perbedaan intrinsik antara, katakanlah, 'biasa'
pengguna dan penyedia layanan? Dan lagi, bagaimana kita memahami, pada
paradigma ini, pertumbuhan Web dan invariants dari Web
pengalaman? Ini adalah kunci untuk pemodelan evolusi pandangan pemain
diberikan umpan balik yang mereka terima dari pengalaman. Bagaimana kita menilai
tetap titik-titik dalam sistem? Atau membangun kesetimbangan untuk tertentu
game setup? Atau mekanisme desain untuk menegakkan "baik" perilaku? Atau
model perilaku evolusi kelompok sedemikian sistem skala besar-
sistem pendokumentasian? Mungkin yang paling penting, bagaimana kita melakukan kebalikannya teori permainan kesetimbangan mengidentifikasi masalah biaya terjangkau
dan mekanisme insinyur untuk mencegah mereka datang tentang? 66 Analisis Web
Jawaban untuk pertanyaan-pertanyaan tersebut muncul pada (setidaknya) dua tingkat. Pertama
semua, perilaku pengguna dalam hal (netral-dikandung) tuntutan
untuk informasi perlu dikoordinasikan dalam kemampuan
jaringan fisik arus informasi di sepanjang kabel fisik yang sebenarnya.
Koordinasi dan routing informasi perlu terjadi tanpa fric-
tion, dan teori permainan harus nilai dalam pemodelan tersebut. Dan detik-
ondly, perilaku ditafsirkan pengguna Web harus sedemikian rupa sehingga
potensi penipuan dan bentuk mahal lainnya perilaku min-
imised. Tidak ada solusi rekayasa untuk masalah kepercayaan (lihat
Bagian 5.4.4), namun di sisi lain mungkin ada cara-cara teknik
Web sehingga perilaku trustworthy bisa adil dihargai tanpa
membebankan biaya terlalu banyak pada pengguna atau mengurangi jumlah interaksi-
tions begitu drastis bahwa efek jaringan menguntungkan diminimalkan.
4.2.2 Pencarian informasi model
Sebuah paradigma penting kedua adalah bahwa pencarian informasi. IR adalah
fokus untuk perlombaan senjata antara algoritma untuk mengekstrak informasi
dari repositori yang kedua repositori mendapatkan lebih besar dan lebih kompleks,
dan tuntutan pengguna lebih sulit untuk memuaskan (baik dalam hal respon
waktu atau kompleksitas dari query).
Satu masalah yang jelas berkenaan dengan IR melalui Web adalah bahwa Web
tidak memiliki otoritas QA. Siapapun dengan account ISP dapat menempatkan halaman di
Web, dan dikenal Web telah menjadi situs prolifer a-
asi teori konspirasi, legenda perkotaan, trivia dan fantasi, serta
sebagai penderitaan dari semua gejala informasi unmanaged seperti
out-of-date halaman dan duplikasi, semua kesulitan yang berkaitan dengan mul-
timedia representasi, dan semua indeterminacies diperkenalkan oleh
kurangnya ketat terkendala representasi pengetahuan. Memahami
persis informasi apa yang tersedia pada halaman yang menunggu untuk diambil
tetap menjadi masalah serius.
Mungkin lebih tepatnya, IR tradisional telah digunakan di jinak
lingkungan di mana massa data ditambang untuk nugget akal;
masalah khas adalah kompleksitas dan kurangnya pola. Benchmark
koleksi dokumen bagi para peneliti IR cenderung berkualitas tinggi dan
hampir tidak pernah sengaja menyesatkan, seperti koleksi scientific4.2. Web matematika 67
makalah dalam jurnal khusus. Web-lain seperti mini-struktur yang dapat
digunakan, seperti Intranet, juga ditandai dengan itikad baik dengan
informasi yang disajikan. Namun upaya berbahaya untuk menumbangkan
sangat IR sistem yang theWeb dukungan baik yang semakin umum.
IR berbasis web harus menghadapi tidak hanya skala dan kompleksitas
informasi, tetapi upaya potensi untuk condong hasilnya dengan konten
dimaksudkan untuk menyesatkan [139].
4.2.3 Struktur berbasis pencarian
Hasil IR yang benar-benar dibawa ke dalam usia pencarian Web adalah
penemuan bahwa adalah mungkin untuk membuat perbedaan heuristik antara
link tersebut yang muncul untuk menunjukkan kualitas terkait-ke situs, dan mereka
yang tidak [171, 221], hanya berdasarkan perhitungan nilai eigen
matriks yang berhubungan dengan struktur link subgraphs lokal. Juga tidak
HITS algoritma juga tidak Kleinberg Page et al PageRank dibutuhkan dalam
lain masukan dari struktur dinyatakan uninterpreted dari hyperlink
ke dan dari halaman Web.
Masalah duplikasi menarik dalam konteks ini
paradigma. Metode apa yang dapat ditemukan untuk mengidentifikasi halaman duplikat
saat struktur hyperlink mungkin telah berubah secara dramatis, dan ketika
aspek lain dari konten seperti header, footer atau format mungkin
telah berubah serta [76]? Bisakah metode tersebut dapat membantu dalam mengungkap
cache halaman yang tidak tersedia di lokasi asli mereka?
Apakah kegigihan menghasilkan informasi dalam halaman Web sebenarnya
menjadi hal yang baik, mengingat bahwa pemeliharaan informasi online
repositori sudah salah satu biaya utama pengetahuan berbasis web
manajemen? Mengevaluasi efektivitas pencarian Web dan pengambilan
teknik, terutama mengingat uang yang harus dibuat dari pencarian [25] -
IPO Google pada tahun 2004 senilai perusahaan sekitar $ 30 milyar dalam bimbang-
ing pasar saham - secara alami fokus dari banyak penelitian. Metrik
kinerja mesin yang muncul sepanjang waktu, berfokus pada efektivitas-
keefektifan dari pencarian, dan perbandingan mesin yang berbeda [76].
Tujuan pencarian adalah untuk mengambil halaman yang relevan dengan pengguna
query, yaitu mereka halaman yang, ketika diakses, baik memberikan pembaca
dengan informasi terkait, atau titik pembaca ke sumber daya lain that68 Analisis Web
mengandung itu. Jadi kita bisa melihat tindakan IR berbasis mesin pencari
presisi - dengan kata lain, proporsi halaman kembali yang
yang relevan - atau recal l, proporsi halaman relevan yang dikembalikan
(Cf. [280]). Tak usah dikatakan bahwa apa yang mesin pencari mereka-
diri mencari (di metalevel, sehingga untuk berbicara) adalah sihir-combi
bangsa presisi tinggi dan recall tinggi - meskipun menentukan recall
meliputi penentuan, setidaknya sekitar, jumlah yang relevan
di halaman Web secara keseluruhan, yang perlu untuk mengatakan sebuah terutama perempuan,
larly masalah yang sulit.
Search engine juga harus berjuang untuk tetap saat ini, oleh Mengindeks ulang
sesering mungkin, konsisten dengan menekan biaya, sebagai Web
tumbuh dan halaman individu diedit atau diubah sebagai database
mendasari mereka mengubah [43]. Search engine dapat dibandingkan dengan menggunakan
berbagai parameter, baik itu liputan mereka (jumlah hits kembali
query yang diberikan, terutama melihat jumlah hits hanya dicapai
oleh mesin pencari), relevansi dari halaman kembali; waktu
diambil, atau kualitas kembali. Sebagai salah satu harapkan, mesin yang berbeda
melakukannya dengan baik pada metrik yang berbeda [76].
4.2.4 Matematika metode untuk menggambarkan struktur
Memahami matematika dan topologi dari Web adalah praktis-
kal impor untuk memahami invariants dari pengalaman Web dan
Oleh karena itu menyediakan peta jalan untuk ekstensi untuk theWeb. Yang penting
properti yang memiliki Web adalah ketahanan dalam menghadapi undermin-
ing pengaruh; baik hacker maupun kesalahan yang tak terelakkan dalam fisik
jaringan sangat mengganggu theWeb, meskipun sesuatu seperti satu router
dalam empat puluh turun di setiap saat satu. ASI Barab dan kolega [253] advokasi-
peduli penggunaan teori perkolasi, studi tentang proses dalam ideal
acak 2 (atau lebih) media dimensi [119], untuk melihat topologi
kontribusi terhadap toleransi kesalahan. Sebagai contoh telah ditunjukkan bahwa untuk
bebas skala jaringan, untuk konektivitas eksponen G <3 (pada asumsi yang-
tion konektivitas node didistribusikan menurut kuasa hukum),
acak menghapus node tidak akan fragmen jaringan ke discon-
pulau dihubungkan [63]. Sebagaimana telah kita lihat, pada asumsi bahwa Web
adalah jaringan skala bebas dengan distribusi power law, eksponen G is4.2. Web matematika 69
secara signifikan kurang dari tiga, dan Web harus sangat sulit untuk
fragmen (walaupun [63] difokuskan pada menunjukkan ketahanan Internet
secara keseluruhan). Para teoritis hasil back up komputer empiris-sim
ketentuan-yang menunjukkan bahwa menghapus sampai 80% dari node dari yang besar
jaringan skala bebas masih menyisakan cluster dihubungkan kompak [21].
Di sisi lain, teori perkolasi menunjukkan bahwa skala bebas net-
karya agak lebih rentan terhadap terarah, serangan terkoordinasi,
bahkan jika mereka tahan terhadap kegagalan acak. Non-acak kegagalan
bisa merusak jika mereka menargetkan situs yang sangat-terhubung dalam par-
khusus mereka, kegagalan sejumlah kecil hub secara dramatis dapat meningkatkan
diameter Web (dalam hal jumlah terkecil klik
diperlukan untuk pergi dari satu halaman yang dipilih secara acak lain), dan kegagalan
dari sejumlah besar situs yang sangat-tersambung bisa menyebabkan fragmen-
tation [64].
4.2.5 Matematika metode untuk menggambarkan layanan
Sebagai Web berkembang untuk memasukkan model layanan, di mana perangkat lunak agen
dan layanan Web akan hidup online dan dipanggil oleh pengguna, dan di mana
metafora yang semakin penting adalah bahwa klien menghubungi
penyedia layanan, representasi matematika baru, formalisms dan
teori menjadi berguna untuk menggambarkan hubungan ini.
Teori Petri jaring sistem terdistribusi [269, 298] model diskrit
U raian, dari mana Web adalah contoh utama. Teori yang berlaku menambahkan
pengertian concurrency dengan ide dari mesin negara, dan telah
disarankan sebagai sarana penting model layanan Web [296]. Pro-
aljabar cess, seperti CSP [141] atau CCS [203] juga dapat model paralel
pengolahan. Mereka menyediakan sebuah array konstruksi untuk model dinamika
pengolahan informasi dan komunikasi output dan meminta
input, seperti kebijakan, urutan tindakan, fungsi pilihan, proses
dan metode sinkronisasi.
Salah satu perkembangan terbaru adalah π-kalkulus (bernama analogi ke
λ-kalkulus), yang merupakan pengembangan aljabar proses (khusus suatu
cabang CCS) dirancang untuk menyediakan mobilitas dalam pemodelan pro-
proses-proses. The π-kalkulus sengaja minim (mengandung sedikit lebih
dari saluran komunikasi, variabel, replikasi dan concurrency), 70 Analisis Web
tetapi dapat diperluas dengan mudah untuk mencakup functions urutan pertama dan dasar
pemrograman konstruksi [204, 1].
Sebagaimana telah kita lihat (Bagian 3.3.1) ada kebutuhan untuk bahasa untuk
menggambarkan layanan web (seperti CDL atau BPEL), dan mungkin bahwa
matematika yang tercantum di sini bisa mendukung bahasa tersebut. Ada
hidup perdebatan tentang jala Petri dan π-kalkulus [24], berfokus pada
manfaat relatif dari, jaring negara berbasis grafis, dan semakin tekstual,
linier, aljabar proses-event [276] .

5
Aspek Sosial
Web adalah bagian dari komputasi tertanam dalam pengaturan sosial, dan
perkembangannya adalah sebagai banyak tentang mendapatkan hak embedding seperti yang
melakukan rekayasa. Pada bagian ini kita akan melihat sosial, kognitif-
efektif dan moral konteks Web, dan membahas cara-cara yang sosial
persyaratan dapat memberi makan ke dalam keputusan rekayasa. Diskusi ini tidak
tidak termasuk penegakan standar atau lembaga pemerintahan,
yang tercakup dalam Bagian 6.
5.1 Arti, supervenience dan landasan simbol
Web sering disebut sebagai seperangkat lapisan, dengan standar, bahasa
atau protokol bertindak sebagai platform atas yang baru, lebih kaya, lebih ekspresi-
formalisms komprehensif bisa duduk. platform tersebut, seperti TCP / IP, secara sengaja
dengan tujuan sebagai netral mungkin. Semantic Web adalah jelas
contoh arsitektur berlapis namun unprescriptive [32].
representasi berlapis tersebut tidak reduktif - yaitu bagian atas
tingkat tidak hanya singkatan ekspresi di tingkat yang lebih rendah. Tapi
ada pertanyaan yang menarik untuk dilakukan dengan signifikansi seperti lay-
Ered representasi arsitektur. Secara khusus, semakin dekat ke Aspek Sosial
ekspresi atas yang ditemukan, semakin besar kemungkinan untuk memiliki makna.
Dengan yang kami berarti bahwa meskipun bahasa ekspresif perlu memiliki
sintaks formal (dan mungkin semantik), untuk menjadi signifikan masih perlu
untuk memetakan ke wacana manusia dalam cara yang dimengerti.
Dalam model Semantic Web, ontologi dimaksudkan untuk melakukan
pemetaan ini, dan untuk membuat dialog yang bermakna antara manusia dan
mungkin [97] mesin, meskipun penting untuk menjadi jelas bahwa seperti
pemetaan tidak sihir: ontologi, sebagai ciptaan buatan, berdiri hanya dalam
sebagai kebutuhan banyak pemetaan ke wacana manusia sebagai struktur mereka
peta [113, 289]). Dan dalam hal ini, mereka tidak berbeda dengan terstruktur lainnya
formalisms, seperti query [39].
Satu pandangan ini mengingatkan pada gagasan filosofis supervenience
[168, 169]). Salah satu wacana atau serangkaian ekspresi A supervenes yang lain
himpunan B bila ada perubahan pada A memerlukan perubahan dalam B namun tidak sebaliknya.
Jadi, pada teori supervenience dari pikiran / otak, setiap perubahan pada pria-
tal negara memerlukan beberapa perubahan di negara bagian otak, namun perubahan di otak
negara tidak perlu mengakibatkan perubahan pada kondisi mental. Super-
venience adalah sebuah konsep yang kurang kuat dari pengurangan (reduksionis seorang the-
ORY dari pikiran / otak berarti orang bisa menyimpulkan keadaan mental
dari negara bagian otak, psikologi bahwa berikut dari neuroscience). Dan
telah dipikirkan selama bertahun-tahun yang supervenience adalah cara yang baik
menjelaskan generasi makna: materi uninterpreted di
lapisan bawah wacana ini disusun dengan cara yang signifikan sehingga
bahan dalam lapisan atas terkendala menjadi bermakna. Ini
mungkin cocok untuk berpikir dari Web memiliki semacam ini super-
venience layering: tersebut berdampak konstruksi di bagian atas tergantung
krusial pada konstruksi makna dalam HTML atau XML atau apapun
di bawah ini.
Jika kita melihat tingkat yang lebih tinggi dari Web sebagai yg datang setelah di
lebih rendah, kemudian muncul pertanyaan untuk apa dasar tingkat
Web adalah, dan pertanyaan lebih lanjut apakah mereka harus mengambil
beberapa bentuk tertentu atau lainnya. Orang tidak harus berlangganan ke
persyaratan untuk grounding simbol (yaitu kebutuhan untuk menghindari simbol berarti-
ing yang 'membumi' hanya dalam simbol-simbol lain, dan sebaliknya yang membumi
oleh beberapa hubungan langsung dengan rujukan - persyaratan - [129, 130]
bahwa Wittgenstein, antara lain, membantah dapat dipenuhi - [291]) to5.2. Web penalaran 73
mengharapkan untuk melihat beberapa jenis wacana simbol uninterpreted bermain
peran mendasar.
'Artinya adalah menggunakan' adalah slogan terkenal yang mewakili wawasan kunci
inWittgenstein nanti filsafat bahasa. Ini jelas berisi sangat
wawasan penting, dan diterapkan untuk bahasa alami adalah cara yang ampuh mes-
bijak untuk memahami makna dalam hal apa yang orang menggunakan bahasa mereka
lakukan. Pemahaman yang sama berlaku untuk Web Semantic, tetapi ada
pertanyaan yang lebih luas 'memakai' apa yang terdiri masuk Dalam dunia mesin pro-
cessing dan interoperabilitas data, banyak penggunaan atau wacana adalah
secara otomatis oleh komputer. Untuk alasan itu, tidak jelas
bahwa definisi dalam kata-kata, atau kode, atau menggunakan cukup spesifik, tidak akan cukup
untuk dijabarkan istilah untuk Web Semantic dengan akurasi yang cukup untuk
memungkinkan deduksi logis untuk mengambil tempat. Stabilitas dari referen kunci
URI, misalnya, bisa memungkinkan banyak otomasi dalam spesifik
topik daerah - gagasan ilmu sebagai makna mendasari mengingatkan
dari teori Hilary Putnam [233]. Fakta bahwa Semantic
Web bekerja di dunia data relasional, dengan mesin melakukan banyak
kerja, berarti bahwa tidak selalu berwewenang untuk menyelesaikan
masalah definisi dan logika yang telah terbukti sangat tahan terhadap
analisis dalam dunia bahasa alamiah, meskipun mungkin wawasan baru
diperoleh dari landasan di URI dibahas dalam bagian 3.1.2 di atas.
Web 5.2 penalaran
5.2.1 Plus • Ubah ca?
Sebagaimana telah kita lihat, ada berbagai isu dalam ilmu Web
dengan akar semantik, filosofis atau logis. Ini bukan pertama kalinya
bahwa praktisi paradigma komputasi tiba-tiba harus
membiasakan diri dengan Philosophical Logic. Proyek umum
dalam Artificial Intelligence (AI) mencoba untuk menghasilkan umum beradaptasi
masalah-pemecah berdasarkan deskripsi simbolik dan penalaran,
sopir (dan prima facie masuk akal) yang kuat dari penelitian AI melalui
1960-an dan 1970-an, akhirnya kandas pada kesulitan-Speci
fying segala sesuatu yang diperlukan untuk komputer untuk alasan tentang sewenang-wenang duduk-
asi. Kegagalan ini menyebabkan nama meremehkan 'GOFAI' (Good Lama
Kuno AI) untuk project.74 Aspek Sosial
Beberapa berpendapat bahwa GOFAI terhambat oleh kegagalan untuk memecahkan bingkai
masalah, kenyataan bahwa dunia nyata penalaran tampaknya sangat situ-
diciptakan, dan bahwa setiap deskripsi atau representasi tidak pernah dapat dibatasi
untuk berdamai dengan signifikansi lokal - untuk mengerti apa-apa komputer
harus mengerti segala sesuatu [133, 82]). Lain mengatakan bahwa AI
tidak bisa alasan tentang apa-apa sampai ada hubungan yang solid antara
syarat dengan mana suatu alasan komputer dan referen nya, sambungan
tidak disediakan oleh program programmer 'di [129, 130]. Ada
juga telah klaim tentang jenis hal komputer atau robot
adalah, walaupun kritik dari hardware kurang penting di sini dari
kekurangan dari dasar-dasar semantik dan logis GOFAI
(Cf. [255]).
Ada, itu harus berkata, argumen AI-independen yang akan
tampaknya mendukung proyek GOFAI, bahwa (misalnya) 'mengetahui bagaimana'
hanyalah spesies 'yang mengetahui', dan bahwa pengetahuan prosedural
adalah, apapun penampilan, hubungan antara agen dan propo a-
sition [267], tetapi argumen tersebut tidak tampaknya harus ditanggung oleh
teknologi. Sebuah alternatif untuk GOFAI, ia berpendapat, relatif bodoh
metode berdasarkan sintaks dan komputasi numerik - unintel ini '-
ligent 'metode (seperti PageRank, IR, NLP) ternyata banyak berperilaku
lebih efektif.
Hal ini dikatakan oleh beberapa bahwa Web - dan khususnya Seman-
Proyek Web tic - mengancam untuk membuat semua kesalahan yang sama seperti GOFAI.
Secara khusus, kebutuhan untuk menciptakan ontologi untuk membantu berbagi data dan sebagainya
pada telah dilihat sebagai memerlukan konteks teori-bebas dari segala sesuatu [158].
Proyek CYC banyak dikutip, untuk menghasilkan sebuah basis pengetahuan raksasa dan
penalaran 'akal sehat' mesin inferensi untuk mendukung [183] tidak
tampaknya telah rusak bagian belakang masalah, sedangkan ontologi pro-
diproduksi oleh gerakan ontologi formal filosofis [124, 106, 210]
tampak agak rumit dan menakutkan, meskipun telah disarankan
bahwa mereka dapat digunakan (sebagai semacam ontologi 'dalam') untuk membawa bersama-sama tumpang tindih ontologi ringan dan berhubungan mereka untuk setiap [228] lainnya.
Pada akhirnya, pergi argumen, itu adalah sifat terletak dari gigi manusia
menghasilkan suatu definisi yang memungkinkan bagi pikiran manusia untuk melakukan indah pro- cessing dari knowledge.5.2 didistribusikan dan multimodal. Web penalaran 75
Di sisi lain, klaim bahwa Web, dan SW di tertentu, akan memukul masalah yang sama seperti GOFAI harus dilihat dalam \konteks berbagi, manipulasi dan interogasi dari relasional
data seperti yang disebutkan pada program SW. Data yang sudah dibagi dan
digabung dalam sejumlah konteks oleh aplikasi tujuan khusus,
yang menjahit bersama mendasari ontologi dengan pemetaan yang relevan dan
Terjemahan. Terjemahan ini tidak perlu bersifat universal, dan tidak perlu bertujuan
untuk menghasilkan suatu ontologi yang konsisten secara global. SW generalises semacam ini
pendekatan untuk sistem data bersama dengan mengembangkan standar untuk peta-
ping antara set data; argumen lebih lanjut diperlukan untuk menetapkan bahwa
program ini akan jatuh busuk keberatan standar dan praktis
hambatan untuk GOFAI.
Secara khusus, SW tidak bergantung pada, atau selalu bercita-cita,
produksi tingkat kecerdasan dipertimbangkan oleh theo GOFAI-
rists. solusi parsial akan bekerja, dan akan ditujukan, di SW. Ini
tentunya baik jika agen buatan dapat menghasilkan rentang
dari kesimpulan yang mungkin manusia, tapi itu bukan tujuan eksplisit
SW, dan SW tidak akan gagal jika seperti agen adalah tidak diproduksi.
Tujuannya adalah untuk menghasilkan ekstensi ke Web yang akan memungkinkan lebih
informasi yang akan diproduksi lebih mudah dalam menanggapi pertanyaan. GOFAI
bertujuan untuk menghasilkan suatu sistem yang cerdas menunjukkan manusia-tingkat
intelijen; yang SWshould membantu sesuatu tingkat kecerdasan manusia
(Biasanya seorang manusia) dalam akuisisi penemuan informasi sehari-hari, dan
pemrosesan [17].
Ada juga argumen bahwa ontologi tampaknya kurang prob-
lematic bila dilihat dari perspektif ini. Bouquet et al menjelaskan
C-OWL (atau Konteks-OWL), perpanjangan dari OWL yang memungkinkan konteks-
ontologi tergantung untuk diwakili [41]. Dan setidaknya satu com-
mentator telah melihat SW sebagai calon penyelamat dari sistem pakar
program penelitian. Sedangkan besar kekuatan pengetahuan basis pengetahuan
ke dalam jaket, di mana hal-hal yang tidak sesuai tidak mendapatkan diwakili, dan
representasi pengetahuan adalah hal yang sedikit demi sedikit didorong oleh kontingensi the-
cies dari KRL itu, SW menyediakan sarana untuk fleksibilitas yang lebih besar
representasi dan menangkap dari alasan. Ulet hiper-pengetahuan
basis, mengandung banyak link keluar dan representasi beberapa the76 Aspek Sosial
pengetahuan yang sama atau yang terkait harus lebih adaptif terhadap perubahan dan
kembali [110].
5.2.2 Alternatif cara penalaran
Ada berbagai jenis penalaran, tetapi tidak terlalu banyak
berhasil otomatis di luar penalaran deduktif linier dan var-
IOUs metode statistik. Apa metode alternatif memiliki fasilitas Web-
tated? Salah satu kandidat yang jelas adalah penalaran asosiatif, dimana penalaran
atas dasar asosiasi - yang dapat sangat tidak terduga dan
personalisasi - mengambil satu menuruni kereta pemikiran [202]. Jadi, untuk ujian-
Misalnya, kasus klasik dari penalaran asosiatif diberikan dalam novel Proust
Remembrance of Things Past, di mana narator setengah baya, setelah
makan Madeleine yang telah dicelup dalam teh, menemukan dirinya diangkut kepada anaknya-
kap di Combray, ketika eonie Bibi L 'akan memberinya Madeleine
pada hari Minggu pagi. Di Web, potensi nalar asosiatif-
ing sangat besar, mengingat jumlah besar hyperlink asosiatif, dan
sifat dunia kecil dari Web. Google-seperti pencarian, berharga
meskipun mereka diragukan lagi adalah, tidak bisa seluruh cerita di dunia
kecil merasuk perangkat, perangkat lunak agen dan sistem terdistribusi [127].
Namun, asosiatif penalaran melalui hyperlink, meskipun yang menarik
dan metode penting, bukan satu-satunya cara untuk pergi tentang itu. Jenis ini
penalaran penalaran tidak ketat asosiatif yang tepat, sebagai diasosiasikan the-
negosiasi adalah dari penulis, orang yang menempatkan hyperlink ke
dokumen. Dalam adegan Proust, hal ini seperti Marcel mengambil gigitan nya
Madeleine dan tiba-tiba dan tak terduga mempersepsikan kenangan
tukang roti. Buka hyperlink memungkinkan pembaca untuk menempatkan struktur link
lebih dari yang ada halaman Web, menggunakan informasi seperti metadata tentang
halaman yang dimaksud, ontologi yang relevan dan model user [54]. Associativity
jelas salah satu kekuatan pendorong utama dari Web sebagai penyimpan pengetahuan-
tepi dan sumber informasi. Asosiatif penalaran, misalnya,
telah digunakan untuk kolaborasi dalam sistem penyaringan rekomendasi [177].
Tipe lain dari penalaran penalaran analogis, sangat lain
pasti jenis penalaran bahwa manusia sangat berhasil menggunakan. Penalaran dengan bekerja analogi dengan mengenali karakteristik serupa antara dua subyek, dan kemudian dengan asumsi bahwa mereka subjek memiliki more5.2. Web penalaran 77
karakteristik yang sama - secara khusus bahwa jika subjek A memiliki aset
P, maka dengan analogi begitu juga subjek B [109]. Jelas keberhasilan
penalaran analogi tergantung pada memiliki representasi dari dua sub-
jects yang memungkinkan untuk tempat analogi, dan yang sesuai
hati-hati (tetapi kreatif) secara benar penalaran. Kasus berbasis penalaran
(CBR) adalah jenis baik dieksplorasi penalaran analogis.
Penalaran analogi dapat dibuat untuk bekerja di con menarik-
teks [199], dan mesin penalaran ada [266]. Sketsa suatu pendekatan
menggunakan penalaran analogi untuk menghasilkan metadata tentang sumber daya telah
muncul baru-baru ini [299], dan penjelasan berbasis kasus dapat berguna dalam
domain mana model kausal yang lemah [214]. Dalam sebuah domain dijelaskan oleh
beberapa ontologi, teknik penalaran analogi mungkin akan digunakan-
berguna sebagai penalaran bergerak dari satu set deskripsi ontologis terhadap
lain, meskipun sama perubahan sudut pandang juga dapat komplikasi-
peduli hal. Ada telah mencoba menarik untuk mendukung ana-
alasan logis (yaitu CBR) di seluruh pengetahuan desentralisasi seperti kompleks-
struktur tepi [70], dan juga ekstensi untuk XML untuk mengungkapkan kasus berbasis
pengetahuan [66].
5.2.3 Penalaran bawah inkonsistensi
Web adalah media demokratis. Penerbitan murah, tetapi itu berarti
bahwa kita harus mengharapkan inkonsistensi. Untuk Web-prinsip klasik
ciple mantan quodlibet falso, bahwa pernyataan bersama dan
penyangkalan memerlukan setiap proposisi apa pun, jelas terlalu kuat.
Menegakkan konsistensi memeriksa dan mencoba kontradiksi penjahat adalah
non-starter berkat tekanan sosial terhadap inkonsistensi pada
Web, atau bahkan lainnya sistem terdistribusi berskala besar. Kemungkinannya
kesalahan (entri data yang tidak benar) tentu saja tinggi. Berbahaya atau orang-
konten dacious akan ada. Tapi yang paling penting, akan ada yang serius
perselisihan dengan itikad baik dalam segala macam bidang. Kekuatan sosial ini
membuat inkonsistensi tak terelakkan di setiap bagian yang layak berukuran dari
Web - dan memang sudah didorong banyak strategi penalaran-
gies di AI, dimana sistem dirancang dengan harapan memiliki
untuk mengatasi dengan basis pengetahuan bertentangan, atau di mana kemungkinan
ada yang pernyataan yang benar dalam model pada satu titik mungkin not78 Aspek Sosial
benar lebih lanjut. Strategi-strategi semacam menganggap kesimpulan yang terletak,
dan bahwa keinginan untuk menemukan dan mengekspos kontradiksi adalah
tergantung pada konteks (lih. misalnya [140] untuk contoh awal dari AI).
Keuntungan utama dari logika klasik adalah bahwa hal itu skala. Maka salah satu
solusi untuk masalah ketidaksesuaian adalah untuk mengembangkan strategi untuk menangani
dengan kontradiksi karena mereka muncul. Misalnya, sesuatu di theWeb
ditegaskan oleh beberapa formula dalam dokumen, tetapi berbeda dokumen
tidak perlu dipercaya pada tingkat yang sama. Terkait dengan dokumen
akan metadata dari berbagai jenis, yang dapat membantu memutuskan apakah
pernyataan dalam satu dokumen harus menimpa penyangkalan tempat lain.
Atau, ini merupakan kesempatan aplikasi untuk paraconsistent
logika, yang memungkinkan ekspresi inkonsistensi tanpa corre-
sponding deduktif free-untuk-semua. logika Paraconsistent melokalisasi efek
ketidakkonsistenan, dan sering memerlukan relevansi semantik proposisi
digunakan dalam pengurangan (bukti quodlibet falso mantan membutuhkan conjunc-
tion sebuah proposisi tidak relevan dengan yang bertentangan), yang
mencegah efek dari penyebaran luar hotspot bertentangan
[15, 262], dan lihat [231] untuk survei).
pendekatan lainnya termasuk memiliki nilai kebenaran ganda untuk komplikasi-
peduli analisis kontradiksi (dan munculnya kontradiksi-
tion mungkin memang sering terjadi karena berbagai faktor kontekstual yang
sangat sulit untuk menganalisis dan meresmikan). Dan salah satu dari beberapa jenis
logika paraconsistent dengan sejarah implementasi terhormat sebagai
serta bersih dan teori semantik bukti dijelaskan logika [95, 271]).
Modal logika, yang mungkin treatWeb sumber daya sebagai dunia mungkin dalam
inkonsistensi yang buruk, tetapi antara yang diperbolehkan, akan
sudut lain, tentu pendekatan ini penting dalam agen
masyarakat [mis 270].
Dalam istilah Web Science, isu dari "benar" logika untuk Web
akan tergantung pada konteks, tujuan analisis dan sebagainya. Tetapi jelas
bahwa pemodelan Web adalah penting untuk beberapa tujuan di mana
bukti yang diperlukan tentang apa yang mensyaratkan oleh serangkaian laporan (untuk
Misalnya, dalam menemukan apakah informasi telah digunakan dengan benar atau
salah - cf. [287]). Dan di SW, logika memainkan peran yang lebih besar. Yang
logika sesuai untuk Web, atau SW? Masalah apa yang skala
harus kita mengantisipasi? Apakah ada metode ad hoc yang mungkin akan round5.3. Web epistemologi 79 masalah logis dalam, dan biarkan logika relatif mudah untuk
fungsi dengan daerah terbatas dari aplikasi? Dan bagaimana bisa standar
kerja, dan pengaturan standar membantu menyelesaikan masalah-masalah logis?
Web 5.3 epistemologi
Komputer telah merevolusi epistemologi, dan yang paling Web dari semua.
Ide seperti Web Semantic bertahan kemungkinan sebuah exten-
sion otomatisasi pengolahan informasi. Gerakan e-ilmu
telah terbukti sangat menarik. Filosofis, metode ilmiah telah
terbukti sulit untuk memakukan, tapi ini sebagian karena logis
struktur penelitian dan kesimpulan yang pasti dirusak oleh
manusia dan sifat kolektif dari proses, yang berarti bahwa sosial
proses, proses politik dan heuristik penemuan setidaknya sebagai
penting sebagai logika.
Selain itu, dengan memungkinkan penjelasan tentang asal dan lainnya
isu-isu yang mendasari pengetahuan generasi, Web memungkinkan yang kuat dan
dilembagakan apresiasi konteks pengetahuan (apa yang
mengasumsikan, metode apa yang menciptakannya, dan akhirnya apa politik dan
sosial berakhir pengetahuan dikembangkan untuk melayani). metadata tersebut
seringkali penting dalam evaluasi heuristik pengetahuan, dan Web
memberikan kesempatan untuk memahami sejarah sepotong-pengetahuan
tepi, dan kontribusi bahwa sejarah yang membuat untuk trustworthi nya-
ness [110].
Ada dua pertanyaan epistemologis penting untuk Web Science.
Yang pertama adalah sifat-sifat apa yang akan platform masa depan perlu dalam rangka
untuk memungkinkan informasi sebanyak mungkin untuk tertarik ke Web dengan-
keluar memaksakan teori struktur atau pemerintahan atasnya? Salah satu tujuan dari
Web adalah untuk memfasilitasi diskusi rasional ide-ide, bukan jenis
penuh benci serangan ad hominem yang membentuk agak terlalu banyak dari apa yang
secara longgar disebut perdebatan [30].
Dan kedua, Web memiliki struktur desentralisasi radikal.
Mengingat bahwa, tentu saja dapat digunakan frivolously atau jahat. Bagaimana
bisa kita buat lebih mungkin daripada kurang, yang baik ilmu dan baik
epistemologi berakhir di Web, dan bukan takhayul? Memang, adalah bahwa
hal yang baik? Pada umumnya, kebanyakan orang berperilaku dengan itikad baik with80 Aspek Sosial
menghormati satu sama lain di sebagian kalangan. Dan pendapat berbeda, bahkan
dengan itikad baik. Tapi ada tetesan konstan bukti bahwa Web
sedang digunakan untuk semen pendapat, dalam situasi politik yang terpolarisasi [3],
dalam kelompok-kelompok marjinal [272], dan bahkan di kalangan teroris [245, 285].
Bisakah kita menemukan keseimbangan terbaik antara pertukaran bebas dari pendapat dan
membatasi kesempatan untuk marginalisasi disengaja diri?
Web 5.4 sosiologi
Web adalah cermin untuk masyarakat manusia, dan mencerminkan kepentingan, obses-
aksesi dan keharusan eksistensi manusia abad ke-21 diperpanjang selama
jangkauan yang sangat luas (mungkin jangkauan terluas dari setiap informasi manusia
ruang) nilai, budaya set dan asumsi. Analisis pencarian
syarat diketik ke Google mungkin menjadi sumber kunci untuk sejarawan
masa depan. Pada bagian ini kita akan melihat hubungan antara
Web dan penggunanya, pembaca dan penulis. Apa orang dan com-
komunitas perikanan ingin dari Web, dan apa online perilaku yang diperlukan
untuk Web untuk bekerja? Ini adalah terutama pertanyaan yang sulit mengingat
heterogenitas radikal dari Web - beberapa orang ingin menggunakan Web
untuk berbagi informasi, beberapa untuk liburan dan hiburan, beberapa ingin
untuk mengeksploitasi informasi yang didistribusikan di Web untuk melakukan ilmu
dengan cara-cara baru yang radikal, yang lain menginginkan arena untuk perdagangan, sementara masih
lain ingin membuat dan orang-orang semacam utopia anarkis yang telah
terbukti offline begitu sulit dipahami (cf. [186]).
5.4.1 Komunitas kepentingan
Web telah melahirkan sejumlah komunitas menarik dan novel
dengan sifat menarik. Sebagai contoh, Massively Multiplayer Online
Peran-Playing Game (MMORPG), di mana penerbit menyediakan per-
ruang online sisten di mana permainan berlangsung, telah melahirkan raksasa
ekonomi dan kode etik saleh sebagai komunitas yang sangat besar
pemain (kadang-kadang urutan juta) menghabiskan semakin besar
jumlah waktu online [55]. Potensi untuk perilaku di com seperti-
komunitas perikanan akan tentu saja tergantung untuk sebagian besar pada apa yang arsitektur-
membangun struktur memungkinkan [186], dan ukuran masyarakat tersebut dapat sangat besar.
Pada awal 2001, telah dilaporkan bahwa 84% dari Amerika users5.4 Internet. Web sosiologi 81
(90m orang) menggunakan internet untuk tetap berhubungan dengan semacam kelompok;
bahwa laporan, oleh proyek penelitian Pew Internet, sangat informatif
tentang cara-cara yang Amerika menggunakan Web untuk tetap berhubungan dengan
segala macam kelompok kepentingan [145].
Kita telah melihat beberapa metode struktur berbasis
mengungkap cybercommunities; masyarakat juga dapat dipelajari oleh
melihat komunikasi antara anggota dan pengetahuan
mereka berbagi [185]. Proxy atas kepercayaan (misalnya, bekerja kolaboratif
atau email jaringan) juga dapat digunakan untuk memetakan penyebaran masyarakat
kepentingan atau praktek [12, 216, 151, 297], yang dapat memiliki manfaat nyata dalam
sejumlah daerah. Misalnya, evaluasi program pendanaan
dirancang untuk mendorong penelitian lintas disiplin dapat didukung oleh bukti yang-
insidens untuk pembentukan atau sebuah komunitas baru dengan melihat
pola kolaboratif kerja [10]; grafik email diarahkan telah
digunakan untuk mengidentifikasi peran kepemimpinan [151]; konflik kepentingan yang potensial antara penulis dan pengulas karya ilmiah yang telah memantau
pola menggunakan Tored dari kenalan di jaringan sosial [14]. Sebuah studi
blog politik di pemilihan presiden AS tahun 2004 menunjukkan pola menarik-
terns karakteristik perilaku politikus liberal dan konservatif-
komentator kal; kedua belah pihak menemukan item berita yang berbeda signifikan,
dan dihubungkan lebih erat ke situs ideologis menyenangkan, meskipun
blogger konservatif terkait lebih padat baik satu sama lain dan
oposisi liberal [3]. Temuan ini sejalan dengan prediksi hukum
Cass sarjana Sunstein [272] tentang perilaku orang dalam sebuah online
dunia di mana personalisasi konten yang mungkin dan rutin, meskipun
survei terbaru dari para ahli terkemuka menunjukkan bahwa prediksi tersebut tetap
kontroversial dan diperdebatkan [103].
Web dan Internet pada umumnya, mendukung jenis baru
interaksi, dan memberikan perspektif abad ke-21 pada beberapa lama
yang. survei terbaru telah menemukan peningkatan besar dalam jumlah
orang menjual sesuatu online [184], menggunakan mesin pencari [236], menggunakan
Webcam [237] dan mendengarkan podcast [238]. Web, dan lainnya baru
teknologi seperti komputer luas telah memungkinkan konsep-konsep baru
ruang untuk mengembangkan dan mendukung metode baru berinteraksi online
(Cf. [55]), atau interaksi baru antara ruang virtual, ruang fisik
atau ruang teoritis atau diukur seperti peta dan rencana [79]. Web82 Aspek Sosial
interaksi yang penting sehubungan dengan masyarakat yang ada di tiga
cara: meningkatkan transparansi, memungkinkan komunitas offline untuk tumbuh
luar 'alami' mereka batas-batas, dan memungkinkan berbeda, lebih dikodifikasikan,
jenis komunikasi antara anggota masyarakat [71].
Secara umum, promosi metode baru berinteraksi dan semen-
ing masyarakat - dan memang jenis baru masyarakat - adalah salah satu
Tujuan dari generasi Web berikutnya, sebagai bagian dari tujuan yang lebih umum untuk
meningkatkan jumlah bahan di Web, untuk membuatnya lebih relevan
kepada lebih banyak orang, dan untuk membuat orang untuk menambahkan sumber daya ke Web tanpa
dipaksa untuk. Tidak mungkin untuk memprediksi apa masyarakat atau
jenis interaksi akan mengembangkan, tetapi segala sesuatunya sama meninggalkan sebanyak
pilihan mungkin terbuka harus memfasilitasi perkembangan novel (cf. [186]).
Orang-orang akan menggunakan platform baru dengan cara baru dan tak terduga,
yang sering berkembang selama jangka panjang (membuat mereka sulit untuk mengamati
bahkan ketika perilaku berubah). Selanjutnya, mengikuti tren pertama
tangan melibatkan mengamati pengguna dalam lingkungan sehari-hari mereka; con lab-
kondisi baik tidak pantas [108]. Oleh karena itu pemahaman teknik apa
dan persyaratan arsitektur yang ditempatkan di Web oleh kebutuhan
masyarakat merupakan masalah yang [277]. Dan Web Ilmu kebutuhan
tidak hanya analisis efektif interaksi pengguna "di alam bebas" sehingga untuk
berbicara; ini harus berjalan seiring dengan perkembangan teori
(Baik di tingkat sosiologis dan teknis) tentang apa itu tentang
sukses partisipatif teknologi seperti RSS, folksonomi, wiki
dan blog, yang umum di seluruh ruang. Dan, last but not least,
apa antarmuka yang penting?
5.4.2 Informasi struktur dan struktur sosial
Struktur sosial dari Web tergantung pada struktur rekayasa
kain yang mendasari tingkat atas. Pemahaman dari relasi
antara manusia dan teknologi, implikasi bagi masyarakat
manusia menjadi alat-dengan menggunakan hewan, telah menjadi ciri dari Philo yang banyak
sophical, politik dan sosial komentar Pencerahan-posting
periode, misalnya dalam karya Marx dan Heidegger. Web adalah
refleksi dari kehidupan intelektual dan sosial manusia, tetapi juga secara khusus
direkayasa untuk menjadi tool.5.4. Web sosiologi 83
Secara khusus, struktur theWeb adalah uang muka pada tradisi yang lebih lain-
internasional struktur data. Semua struktur data berskala besar akhirnya pasti
dengan beberapa bentuk kongruensi dengan konteks manusia, misalnya
dalam suatu organisasi atau perusahaan [50]. Informasi hirarki, untuk
Misalnya, telah dikembangkan dalam hierarki sebagai struktur informasi
tertentu yang memenuhi kebutuhan organisasi embedding itu. Masalahnya
dengan hirarki adalah informasi yang cenderung digunakan dalam konteks itu
awalnya dibuat untuk. Reuse informasi sering bermasalah,
tetapi dalam sebuah organisasi yang sangat hirarkis dengan Sejalan hierar-
sistem informasi chical, masalahnya adalah finessed oleh pengetahuan tidak
biasanya yang diambil di luar konteks yang diciptakan (bdk.
misalnya [295]).
Ini bukan untuk mengatakan bahwa pohon tentu jenis buruk struktur-
mendatang, dunia pohon-berorientasi XML perbaikan pada line-
orientasi UNIX. Pohon memungkinkan kemungkinan yang penting, seperti
top-down terstruktur desain, menyembunyikan informasi, dan derajat kontrol
dikombinasikan dengan fleksibilitas. Namun perilaku dalam struktur semacam itu
dibikin adalah: laporan GOTO dianggap berbahaya, misalnya,
karena kontrol pengolahan hilang, dan analisis dan verifikasi
program menjadi sewenang-wenang keras (cf. [77]). Untuk mendapatkan dari satu bagian
hirarki informasi satu sama lain biasanya harus naik sampai
node umum untuk setiap subtree tercapai dan kemudian turun di detik-
o ligasi subtree. Untuk terstruktur, lingkungan terpusat di mana kontrol
penting, ini adalah inovasi penting.
Inovasi rekayasa dari Web adalah apa yang menciptakan nilai tambah
untuk pengguna manusianya. Pengembangan URI memungkinkan cepat dan
traversal tidak dibatasi ruang informasi ke segala arah; dari
setiap titik dalam satu ruang web bisa mencapai titik lain dengan segera (satu
dapat memilih untuk dibatasi oleh link berikut atau output dari pencarian
mesin, tentu saja). Dengan kata lain, GOTO adalah kembali; gotos global
yang disahkan, karena ketika gerakan semacam itu dibiarkan kemungkinan
dibuka dari reuse kebetulan. Reuse dalam situasi diprediksi, sebagai
terjadi dengan struktur hirarki informasi, juga bisa terjadi pada
Web, dan gotos memiliki biaya mereka. Analisis interaksi
dan kerjasama yang lebih keras, sebagai Dijkstra diprediksi, dan juga sistem
tergantung pada fungsi pemeliharaan dan tepat dari space.84 URI Aspek Sosial
Demikian pula, kesederhanaan menyediakan halaman error 404 bila tidak ada
sumber daya yang ada pada URI disodorkan merupakan insinyur penting-
ing faktor, yaitu browser telah berhasil berkomunikasi dengan server
tapi server itu baik mampu atau tidak mau kembali halaman. Kunci
adalah bahwa tampilan kesalahan 404 merupakan tanggapan ringan untuk kegagalan
yang tidak menghambat aktivitas pengguna dengan cara apapun; menekan tombol 'back'
tombol pada browser mengembalikan segalanya kepada status quo ante. The
Web tidak dapat berfungsi tanpa ini toleransi kesalahan.
Informasi struktur bukanlah struktur sosial berbasis hanya pada
Web; pengguna lain memiliki satu set proses yang lebih berorientasi persyaratan.
Bagi banyak isu penting adalah tidak berbagi informasi melainkan
berbagi keahlian; untuk pengguna tersebut, kuncinya adalah tidak begitu banyak untuk menyediakan
ontologi sebagai cara untuk mengekspresikan alur kerja. Dan pemodelan informasi
aliran daripada negara telah menyediakan rute yang menarik ke dalam CRE the-
asi dan penemuan layanan web [208, 98]. Di sisi lain, seperti dalam
daerah lain, ontologi dan alur kerja yang tidak sesuai, meskipun mereka
menangani isu-isu yang berbeda, memang, pembangunan alur kerja dapat ontologi-
dimediasi [225]. Dan pemodelan bijaksana alur kerja dapat menghasilkan dis-
didistribusikan dan dinamis tugas pemahaman (misalnya untuk komponen layanan Web-
sition) yang menghindari over-sentralisasi ditetapkan alur kerja [282].
Menyediakan informasi yang theWeb digunakan dalam proses yang berguna embed-
DED dalam masyarakat manusia, mungkin yang paling jelas produktif manusia
bekerja. Memahami cara yang informasi dan teknologi Web
digunakan untuk tujuan tertentu merupakan tujuan penting untuk Web Science.
Data tentang ini bisa sulit didapat, tapi ketika data set lakukan menjadi
tersedia, penelitian sangat menarik bisa dilakukan (seperti [52]).
5.4.3 Signifikansi dan metrik yang
Sebuah konsep yang terkait dengan penggunaan sumber daya Web tertentu dalam suatu proses
adalah maknanya. Satu bisa menebak makna dari sebuah halaman kepada pengguna atau
masyarakat sampai tingkat tertentu intuitif: orang mungkin mengharapkan pembayar pajak AS
menjadi relatif lebih tertarik dalam halaman FAQ IRS daripada sewenang-wenang
halaman, sebuah Goth di homepage Nine Inch Nails ', dan wanita konservatif
di angryrepublicanmom.com. Ada beberapa metode untuk memperbaiki
potensi berbagai penafsiran intuisi seperti melalui beberapa hard5.4. Web sosiologi 85
matematika, yang merupakan cara yang baik untuk mulai memahami sosial
dimensi Web. Dan pemahaman pentingnya halaman
adalah penting untuk tugas non-sepele halaman pemesanan diambil selama
Web pencarian dan pengambilan.
Signifikansi dapat didekomposisi menjadi dua jenis metrik: relevansi
dan kualitas [76]. Relevansi dihubungkan dengan gagasan query: bagaimana
banyak pertanyaan tidak halaman menangani? Perbedaan cara menjawab
pertanyaan yang telah menyebabkan perkembangan sejumlah penting
algoritma, namun pada dasarnya idenya adalah bahwa sebuah halaman menangani query ketika
baik itu berisi informasi yang relevan dengan query, atau titik-titik pembaca
ke sumber daya yang berisi informasi seperti [294]. Satu pendekatan adalah untuk
melihat struktur hyperlink yang memberikan konteks untuk halaman web,
dan mencoba untuk menyimpulkan ukuran relevansi dari struktur-struktur.
Jadi, misalnya, model Boolean sederhana menghitung jumlah
query istilah yang muncul dalam dokumen, yang dapat peringkat halaman berdasarkan
pada permintaan kata penghubung, atau transformasi dari disjunctions atau negations
menjadi konjungsi. Maka itu adalah langkah cukup logis untuk menggunakan rekursif
menyebarkan algoritma aktivasi untuk menyebarkan query, dengan mencari
permintaan ketentuan dalam dokumen tetangga, mengurangi signifikansi coef-
ficients sebagai sumber daya diuji mendapatkan lebih jauh dari aslinya
Halaman [294].
Di paling-dikutip model, halaman diberi skor yang merupakan
jumlah jumlah kata-kata query yang terkandung dalam halaman-halaman yang
link ke sana. Jadi model-paling dikutip menemukan otoritas daripada hub,
relevansi meskipun sederhana (tanpa berusaha otoriter-hak istimewa
hubungan lebih dari hub) juga dapat dihasilkan menggunakan aktivasi menyebar
Algoritma [76].
Selain konektivitas hyperlink sederhana, lebih canggih langkah-langkah
didasarkan pada model ruang vektor yang dokumen dan query
dipandang sebagai vektor [76]. Jadi, misalnya, TFxIDF memberikan relevansi sebuah
skor ke dokumen berdasarkan jumlah bobot dari istilah permintaan
dinormalisasi dengan panjang vektor Euclidian dokumen; bobot
istilah dihitung sebagai produk-salib Term Frekuensi (TF)
dan Frekuensi Dokumen Invers (IDF). Sebuah TF adalah ukuran dari
frekuensi kemunculan istilah dalam dokumen, sedangkan IDF adalah
mengukur jumlah dokumen terkait yang berisi [180] 0,86 jangka Aspek Sosial
TFxIDF gagal memperhitungkan informasi penting pro-
yang diberikan oleh sambungan hyperlink halaman [47], tapi bahkan termasuk seperti
informasi dalam suatu algoritma yang lebih luas tidak mengungguli TFxIDF oleh
jarak [294, 76] besar.
Lain mengukur relevansi jelas dalam e-commerce atau
e-publishing lingkungan adalah untuk mengukur jumlah download per
kunjungi. pola seperti penggunaan dan akuisisi dapat dipelajari untuk menghasilkan
peta atau jejak jalan bahwa pengetahuan sedang ditransfer ke dan
digunakan oleh komunitas pengguna. Percobaan di sepanjang garis-garis ini telah menunjukkan
bahwa perubahan signifikan sering terjadi sangat tiba-tiba, bersama terkait
acara-acara seperti pembuatan link ke sumber daya dari luar
situs, atau beberapa diskusi situs oleh komentator eksternal [9].
Struktur hyperlink di mana halaman web menemukan konteksnya juga
informatif tentang proxy kualitas. Jika ada link dari satu halaman ke
lain, yang dapat dibaca sebagai dukungan dari kertas kedua dengan
yang pertama. Itu adalah hipotesis yg dpt dibatalkan yang tergantung untuk sebagian besar
pada perilaku orang-orang yang benar-benar menciptakan halaman web - ternyata
bahwa sejumlah besar link yang memang mendukung dokumen lainnya
untuk beberapa derajat, bahkan jika hanya sebagai alternatif sumber informasi tentang
topik yang sama. Ukuran matematika ini tertanam dengan kuat di
kontingen sosiologi Web. Selanjutnya, metode tersebut dapat
diterapkan ke item multimedia di Web yang tidak mungkin mengandung
terutama menarik teks yang untuk mencari, seperti misalnya dengan
sistem temu bergambar PicASHOW [182].
Ada dua teknik utama untuk mengekstraksi informasi yang berkualitas
dari struktur hyperlink [76]. metode Co-kutipan berbasis didasarkan
pada wawasan yang link ke atau dari halaman cenderung berkonotasi beberapa
kesamaan jenis. Jika dua halaman menunjuk ke halaman ketiga, maka
dua halaman pertama mungkin berbagi topik yang menarik, jika sebuah poin halaman ke
dua halaman lainnya, maka dua terakhir juga dapat berbagi topik. Acak
metode berjalan berbasis menggunakan model dari Web sebagai grafik dengan halaman sebagai
node dan link sebagai ujungnya diarahkan (lihat Bagian 4.1.2 di atas) dan mengembangkan
probabilitas statistik berdasarkan random walk sekitarnya. Ukuran
kualitas halaman keluar dari metode tersebut dengan mengukur kualitas
dari halaman lain terhubung ke, dan penyaringan oleh derajat those5.4. Web sosiologi 87
koneksi. Bersama dengan metrik relevansi, metrik kualitas kemudian dapat
peringkat hasil pencarian [76].
Yang mengukur kualitas yang paling terkenal adalah PageRank [221], dibahas
sebelumnya, yang dibangun pada intuisi bahwa halaman yang dikutip oleh
halaman lainnya kemungkinan akan kualitas yang signifikan. Wawasan dari
PageRank adalah bahwa cara yang jelas untuk menumbangkan model yang mengatur
beban halaman dummy untuk mengutip halaman mana yang ingin meningkatkan.
Tetapi jika halaman yang dikutip oleh halaman lain yang memiliki sendiri
PageRank yang tinggi, maka kemungkinan untuk menjadi berkualitas tinggi. PageRank
metode memiliki karakterisasi lain intuitif yang pada pandangan pertama tampaknya
untuk tidak ada hubungannya dengan kualitas: ini adalah probabilitas bahwa acak
surfer akan mencapai halaman [47]. Nilai dari tindakan ini tercermin
dalam keberhasilan Google dalam hal umur panjang, nilai pasar dan saham
pasar mesin pencari. Selanjutnya, untuk lain kualitas mengeksploitasi
ide random walk [181], kadang-kadang eksplisit memperluas ide-ide
mendasari PageRank [235].
Ide terkait HITS algoritma Kleinberg, berdasarkan ide
faktor dampak dari bibliometrics [171]. Penjelasan asli
faktor dampak untuk jurnal akademik adalah bahwa orang bisa melihat
jumlah kutipan untuk jurnal dalam konteks disiplin sebagai
keseluruhan. Satu kemudian dapat model berat pengaruh jurnal sebagai
fungsi bobot pengaruh jurnal mengutip dan fraksi
kutipan dari jurnal-jurnal tersebut mengutip yang mengutip jurnal yang bersangkutan.
Analog penalaran menetapkan sebuah algoritma untuk mengukur laman web
kualitas, baik dari segi nilai otoritas dan nilai hub nya.
Pola penggunaan dapat dikarakterisasi secara independen dari langkah-langkah
kualitas atau relevansi. Apa kemungkinan dokumen yang
diakses dalam waktu tertentu? Apa adalah waktu yang diharapkan sebelum
selanjutnya akses dokumen itu? Mengetahui jawaban atas pertanyaan-pertanyaan seperti
memungkinkan identifikasi halaman, sumber daya dan dokumen yang
mungkin sering diakses, dalam hal ini mereka dapat PREFETCHED,
atau dibuat lebih tersedia bagi pengguna. Prefetching dapat dilakukan pada
nama pengguna, berdasarkan menggunakan profil tertentu nya, atau dengan server
berdasarkan statistik tentang pola penggunaan dalam populasi secara keseluruhan.
Aplikasi lain dari statistik tersebut adalah pengembangan adaptive88 Aspek Sosial
situs web, di mana penyajian materi dan hyperlink intra-situs
struktur dapat bervariasi secara otomatis berdasarkan situs belajar
dari penggunaan sebelumnya [227]. Variabel yang berhubungan dengan pola penggunaan dapat
menggali keluar dari log server yang berisi waktu dan URI mengakses
permintaan, bersama dengan model bagaimana tergantung probabilitas masa depan
pada penggunaan terakhir [76].
5.4.4 Kepercayaan dan reputasi
Kualitas dan signifikansi berkaitan dengan resepsi halaman menerima
dari seorang pembaca, keyakinan pembaca tentang halaman secara inheren lebih
subjektif dari metrik yang diuraikan di atas. Ini subjektif keyakinan
cenderung berkumpul di bawah kepercayaan pos. Kami telah melihat
kecenderungan bagi otoritas dan hub untuk muncul sebagai fokus cyber-
masyarakat. situs tersebut dengan cara-cara penting terpercaya: kewenangan
dipercaya oleh penulis laman web lain untuk mengandung informasi yang dapat dipercaya, sedangkan
(Berhasil) hub dipercaya oleh pengguna untuk menunjuk ke tempat-tempat yang dapat diandalkan
informasi dapat diperoleh.
Kepercayaan adalah, tentu saja, merupakan faktor penting dalam pengembangan
Web, dengan berbagai bidang. Ilmiah atau makalah akademis yang terpercaya
untuk melaporkan hasil yang benar. Penulis halaman dipercaya untuk menjadi diri mereka
mengatakan mereka. Web services dipercaya untuk melakukan apa yang mereka katakan mereka akan
melakukan tanpa kerusakan kepada orang lain. E-commerce situs yang dipercaya untuk membuat
penggunaan yang tepat dari rincian kartu kredit, untuk mengirim barang yang dipesan, dan untuk menjaga
data yang aman. Arsitektur dari Web, yang secara eksplisit memfasilitasi
anonimitas dan menyalin akurat, membuat kepercayaan sangat penting
masalah.
Belajar online kepercayaan sangat sulit karena beberapa
konteks di mana terjadi interaksi secara online. Sebuah survei terbaru [116]
menemukan bahwa penelitian sering gagal untuk membedakan antara kepercayaan,
penyebab kepercayaan dan pendahulunya yang dapat dipercaya. Kepercayaan adalah berbagai
pasti, 'harapan percaya diri' sebagai 'kesediaan menjadi rentan', 'a
sikap positif umum '. Kepercayaan dalam sistem dan kepercayaan pada individu
adalah berasimilasi seolah-olah hal ini dipermasalahkan. Fokus studi empiris
sering ketat dan cukup benar mendefinisikan istilah mereka, tetapi definisi
jarang umum di studi, dan perbandingan sulit jika not5.4. Web sosiologi 89
tidak mungkin, dan kadang-kadang didefinisikan ketat hampir tidak membangun
dikenali sebagai (folk-psikologis) kepercayaan [215]. Kepercayaan adalah juga bukan statis
Fenomena, itu adalah dinamis, sering ada periode waktu di mana
kepercayaan sebuah situs dibangun. Pengguna web pada berbagai tingkat pengalaman
juga memiliki tingkat kepercayaan yang khas yang berbeda [85].
Semua ini sangat berarti kepercayaan yang tidak dapat diproduksi oleh CRE-
Ating alat yang tepat dan teknologi - bahkan jika itu otomatis merupakan
hal yang baik untuk menghasilkan kepercayaan, yang tidak (tujuan utama adalah untuk insinyur-
Neer hubungan kausal antara kepercayaan dan kepercayaan). Trust tidak akan
ajaib muncul online. Sama seperti orang tidak akan otomatis mengikuti
kode etik, yang lain tidak akan secara otomatis mengasumsikan bahwa orang fol-
rendah kode etik. Dan karena kepercayaan adalah tidak hanya pribadi baik tapi
satu publik, orang akan selalu dapat 'tumpangan gratis' untuk di 'orang lain baik
perilaku [56].
Ada dua tingkat signifikansi sehubungan dengan diundangkan
kepercayaan di seluruh Web yang menuntut pendekatan yang berbeda. Pertama ada
adalah tingkat sistem secara keseluruhan, dimana seseorang mencoba untuk memverifikasi bahwa peraturan yang mengatur gaya interaksi semua aktor untuk jujur.
Strategi itu utama pada tingkat sistem adalah untuk menyediakan infrastruktur untuk
menjamin keamanan, misalnya dengan menggunakan skema sertifikasi [230]
atau teknologi privasi-meningkatkan [234], dan mengambil rute Hobbes
untuk menghalangi perilaku tidak bermoral - itu membuat terlalu mahal untuk melakukan, untuk
satu alasan atau yang lain. Untuk itu, mekanisme tersebut sangat
terkait dengan isu-isu yang harus dilakukan dengan Web Pemerintahan.
Kedua, ada tingkat individu, di mana satu harapan bahwa
mitra interaktif seseorang atau lawan jujur, reciprocative dan
aturan-berikut ini. Di sini cenderung mengandalkan pada umpan balik tentang perilaku, beberapa- bagaimana keuntungan pengguna Web reputasi. reputasi adalah suatu elemen kunci untuk percaya, karena menyajikan sketsa trustee diabstraksikan (mandiri)
dari sejarah [205]. Berdasarkan sejarah sebagai itu, reputasi tidak
dan tidak dapat mengikat perilaku masa depan, karena itu tidak menghapus risiko.
Berdasarkan berbagai pertimbangan, sebagian besar yang subjektif atau
memiliki unsur subyektif yang kuat, fungsi diagregasi dari perwakilan a-
utation dimaksudkan untuk kelancaran keluar pendapat jahat tertentu atau tunggal
events.90 Aspek Sosial
Beberapa baris penelitian adalah penting untuk memahami cara terbaik
untuk mengumpulkan dan memahami reputasi (cf. [239]). Metode apa yang akan
memungkinkan peringkat untuk dikumpulkan yang menentukan kepercayaan dari Web
pengguna? Bagaimana seharusnya peringkat tersebut digabungkan? Bagaimana seharusnya kita alasan
atas agregasi ini? Dan bagaimana mereka harus dipublikasikan? Dan sebagai
dengan banyak pertanyaan tentang Web, apa trade-off antara
hati-hati mengasah dan sistem akurat yang mungkin mahal untuk digunakan, dan
sistem kasar-dan-siap yang memiliki utilitas untuk 90% dari tujuan, yang
adalah sepele untuk menggunakan dan memiliki besar buy-in dari basis pengguna yang besar.
reputasi eBay dan mekanisme umpan balik [86], dimana peringkat yang
mentah +1 atau -1 nilai dijumlahkan bersama dengan penjelasan tekstual, adalah
tentu saja contoh terbaik dari mekanisme reputasi terkenal. Nya
keandalan terbuka untuk menantang: beberapa pembeli tidak kembali peringkat; bias
dapat terjadi (tergantung pada apakah pengalaman baik atau buruk lebih
mungkin dilaporkan); reputasi bootstrap, sebelum seseorang memiliki antar-
bertindak sama sekali, mungkin sulit, salah bisa membayangkan cara memanipulasi
proses (cf. [242]). Di sisi lain, keberhasilan komersial eBay
adalah jelas, dan jumlah aktual dari penipuan di eBay, meskipun beberapa
kasus dipublikasikan dengan baik, tampaknya tidak menjadi sangat besar. Seperti Google,
ini kasus di mana suatu sistem, sederhana scalable tampaknya melakukannya dengan sangat baik?
Isu yang terkait dan kompleks adalah menemukan metrik untuk mengukur
kepercayaan untuk peringkat individu dan algoritma untuk agregasi masuk akal.
Kebanyakan metrik melibatkan beberapa skor antara +1 dan -1, biasanya yang nyata
nomor. Dua masalah yang jelas muncul. Pertama, karena kepercayaan kita / ketidakpercayaan adalah jarang sempurna, bagaimana seharusnya salah pilih nomor tertentu? Dan detik-
ondly, bagaimana harus membedakan antara dua interpretasi yang mungkin
0, yang bisa berarti 'saya tidak memiliki pengalaman dengan orang ini, sehingga memiliki
tidak ada pendapat ', atau' saya memiliki pengalaman, tapi saya netral tentang dia atau 'nya.
Selain itu, ada beberapa sumber informasi tentang kepercayaan yang
tampaknya menjadi penting dalam membuat penilaian: misalnya, sebelumnya
interaksi satu telah dengan wali amanat; laporan saksi-saksi; sertifikasi-
Cates, dan peran yang wali amanat adalah bermain [152]. Dan, tergantung
mengenai persyaratan, orang dapat memilih nilai kepercayaan dihitung atas dasar
dari beberapa perspektif obyektif atau Archimedean, atau di sisi lain
nilai yang dihitung dalam konteks sendiri, kepercayaan dan preferensi
kepentingan (dan karenanya nilai trustee's bisa bervariasi dari Enquirer to5.4. Web sosiologi 91
Enquirer). Evaluasi metrik kepercayaan adalah pasti sulit, meskipun tidak
mustahil jika konteksnya cukup dapat diberikan untuk membuat evaluasi
bermakna (cf. [114]).
Kepercayaan menjadi orde kedua yang baik, sulit untuk dihitung, dan tugas-relatif,
akan terlihat bahwa semua metrik harus perkiraan dan akan
tergantung pada apa yang akan bekerja terbaik; yang lain argumen untuk rel-
atively mentah pendekatan eBay. Karena itu, ada sistem, seperti
sebagai MENYESAL [246], yang memungkinkan pengguna untuk memberikan rating konten mereka lebih kaya oleh annotating mereka; agregasi dilakukan oleh penalaran fuzzy.
Kadang-kadang metrik kuantitatif tidak pantas. Untuk
Misalnya, ketika menilai sumber informasi, itu mungkin bahwa pengguna
benar-benar perlu melihat penjelasan dan analisis oleh pengguna lain. tepuk The-
terns penggunaan informasi tentu sulit untuk dihitung, dan bulu-
thermore mungkin bertentangan atau tidak lengkap, dalam hal bahwa mungkin
jadi, dalam kompak, domain dipahami dengan baik paling tidak, semantik
markup dokumen mungkin cara paling membantu maju [111]. The
Pertanyaannya kemudian adalah bagaimana cara terbaik untuk mengeksploitasi expressivity tambahan sehingga diperoleh: apakah investasi berharga dalam bahasa formal, atau gabungan
formal / semi formal / informal pendekatan? Namun demikian, kisah nyata oleh
pengguna yang sebenarnya, meskipun mereka membutuhkan bandwidth yang tinggi, seringkali sangat informatif.
Kesaksian orang lain, bagaimanapun berkumpul, mewakili atau efisiensi secara agregat dalam gated, jelas yang penting bagi pengembangan dan pendukungan
kepercayaan dapat diandalkan. Struktur Web telah terbukti sugestif dalam hal ini
lapangan, dalam struktur yang sangat Web-seperti yang membuat Anda ke sewenang-wenang
halaman web di World Wide Web juga bisa membuat Anda cepat ke Testi-
Mony seseorang yang Anda tidak tahu di Web Trust. Sebagai orang selama
menyimpan pengalaman mereka dengan cara yang dapat diandalkan, maka mereka dapat memanfaatkan oleh pengguna lain dengan menggunakan algoritma agregasi [misalnya 243].
Persyaratan untuk sistem tersebut adalah bahwa ada beberapa informasi
tion suatu tempat di mana orang telah menggambarkan keyakinan mereka tentang lain-
ers, dan telah dikaitkan bahwa informasi ke dalam Web Trust beberapa-
bagaimana. Setelah informasi tersebut tersedia, dapat digunakan untuk membantu mencegah-
tambang reputasi. Aplikasi ini mulai muncul, salah
yang paling menonjol adalah FOAF [45] - http://www.foaf-project.org/),
sebuah RDF / OWL berbasis ontologi yang telah diperpanjang dengan A92 Aspek Sosial
kosakata untuk menggambarkan hubungan seseorang dengan dan pendapat
teman [115].
Trust, seperti yang sering ditunjukkan, tidak transitif (yaitu, jika
A B percaya dan B trust C, itu tidak berarti bahwa A trust C). Itu
tampaknya akan melemahkan Web pendekatan Trust. Namun, jika A trust
B, B percaya C dan B merekomendasikan C ke A, maka itu merupakan alasan untuk A
percaya C. rantai akan memecah akhirnya, tetapi belum tentu
segera, dan mungkin menurunkan anggun. Jadi selama pengertian tentang
degradasi dibangun ke generasi ukuran kepercayaan berdasarkan
Web pendekatan Trust, maka masih mungkin untuk model atau
menghasilkan kepercayaan berdasarkan laporan saksi mata atau pendapat disimpan [115]. Ini
telah berpendapat bahwa expressivity dari Web Semantic diperlukan
untuk memastikan bahwa agregasi informasi kepercayaan adalah bukan hanya heuris-
tic di alam; itu adalah isi dari atribusi dari kepercayaan atau
dinyatakan yang diperhitungkan. Setelah seseorang menerbitkan sebuah file yang mengatakan yang mereka tahu dan berapa banyak mereka percaya mereka, bahwa informasi sosial dapat
diproses tanpa perantara [115, 243].
Masa Depan bekerja dalam memahami bagaimana informasi dapat kepercayaan
diekstrak keluar struktur ofWeb-seperti adalah topik sentral dalam eksplorasi
jaringan sosial dan representasi mereka Web-seperti. Richardson et al
telah menunjukkan bahwa path aljabar dan interpretasi probabilistik dari
eksplorasi grafik Web dari Trust hampir identik [243];
hasil ini dapat digunakan sebagai metode halaman peringkat dalam pencarian Web?
Dan semua metode yang mengeksploitasi Web dari Trust menyederhanakan atribusi
kepercayaan; dapat metode diperluas untuk mencakup keyakinan multi-dihargai dan
data lainnya (seperti metadata tentang asal)? Mengingat pentingnya
dari konten ke pemetaan Webs kepercayaan, maka bisa jadi bahwa
kepercayaan-menghasilkan teknik dapat memainkan peran yang serupa dengan Semantic
Web sebagai algoritma seperti PageRank, yang mengekstrak informasi dari
link uninterpreted struktur, bermain di WWW.
5.4.5 Trust (II): bukti Mechanising
Ada, akhirnya, sebuah coda sosiologis berkaitan dengan kepercayaan: kita mempercayai
mesin dan proses otomatis yang diletakkan di bawah cara ketika kita
bekerja atau bermain di Web? Telah dikatakan bahwa budaya kita now5.4. Web sosiologi 93
berurusan dengan dua pengertian tentang bukti. Dalam satu tampilan, seperti Wittgenstein berpendapat, sebuah bukti adalah gambar yang berdiri di membutuhkan ratifikasi, yang akan saat
kita bekerja melalui itu [292]; itu meyakinkan kita. Ini menjelaskan dan menunjukkan
kebenaran proposisi terbukti secara bersamaan.
Jenis lain bukti mekanis dan algoritmik, ini mungkin
lebih dapat diandalkan daripada bukti-gambar sebagai-, tetapi untuk dapat diterima memerlukan itu diambil pada kepercayaan bahwa langkah-langkah dalam bukti harus dilakukan dengan benar. Kepercayaan diperlukan (a) karena bukti mungkin unsurveyable, dan (b) bahkan
jika tidak tidak efisien atau biaya-efektif untuk memeriksa setiap bukti mekanis
dengan tangan. Wittgenstein tidak hidup untuk melihat bukti mekanik kompleks
menjadi biasa, tapi ia mencurahkan waktu untuk berpikir tentang
implikasi, dalam (pada saat itu tidak biasa) pandangannya matematika sebagai
kegiatan, dan berhati-hati untuk membedakan antara bukti-gambar sebagai-dan
mekanik bukti. Dia menyimpulkan bahwa keputusan kita untuk percaya mekanik-
bukti kal secara sukarela dan bahwa hasil mereka tidak dipaksa
kami [292].
Ketika bukti mekanik yang luas dan kompleks muncul di
adegan, dilema yang Wittgenstein diperkirakan diikuti. Untuk ujian-
Misalnya kemungkinan bukti formal dari kebenaran program adalah
diperdebatkan di beberapa artikel terkenal dan kontroversial. DeMillo
et al menyatakan bahwa bukti-as-gambar yang diperlukan untuk sistem yang akan
(Sosial) yang dapat digunakan, tetapi mesin tidak bisa memberikan mereka [73]. FET-
Zer berpendapat bahwa ada kebingungan terus-menerus antara dua jenis
bukti mekanik, yang satu urutan logis formula mana
setiap rumus dapat berupa aksioma berasal dari formula di atas dengan
kebenaran-melestarikan aturan, dan yang lainnya yang dibuat oleh sebuah mesin [100].
Either way, artikel, dan respon sengit kepada mereka, menunjukkan bahwa
gagasan bukti otomatis adalah kontroversial.
Saat ini, lebih banyak aspek kehidupan sehari-hari (keuangan, kesehatan dan
keamanan, fungsi utilitas) berada di bawah naungan sistem otomatis
sistem pendokumentasian. Dan ketika Web mengambil lebih banyak informasi rutin pengguna-
mation pengolahan tugas (seperti dengan SW), kebutuhan akan kepercayaan manusia
dalam sistem mekanik adalah jauh lebih besar. Banyak kepercayaan yang merupakan
fungsi tak terduga dari pengalaman [85], dan kita tidak dapat meniadakan
kebutuhan untuk kepercayaan dalam penilaian manusia kolektif serta mesin
sendiri [192]. Hubungan antara kepercayaan dalam kolektif kita selves94 Aspek Sosial
dan kepercayaan di hardware dan software adalah satu sulit untuk menguraikan,
namun pengembangan Web akan tergantung krusial di atasnya.
5.4.6 Web moralitas dan aspek konvensional menggunakan Web
Moral dan pertanyaan etika adalah bagian penting dari Web Science
agenda. Mereka diperlukan untuk pemahaman kita tentang bagaimana Web
bekerja, dan, tidak kalah pentingnya, bagaimana Web dapat tumbuh.
Kesederhanaan hubungan antara URI dan khusus Web
sumber daya merupakan kunci untuk meningkatkan ruang informasi. Upaya untuk sub-
vert hubungan ini bisa sangat merusak Web dan Seman-
tic Web. Ancaman terhadap struktur yang akan merusak hubungan antara
URI dan apa yang ditampilkan pada layar, dan semakin com-
kompleks rekayasa mendapatkan, semakin sulit akan untuk mendeteksi seperti
subversi.
Web adalah struktur sengaja desentralisasi. Sisi lain dari
yaitu bahwa tidak ada otoritas untuk menegakkan perilaku yang baik. Meskipun
tentu kasus yang banyak jenis perilaku penting untuk Web
untuk bekerja (artinya, konvensi, komitmen) dapat dipahami dari
sudut pandang rasional kepentingan diri [261], jika kita asumsikan ada
hadiah untuk perilaku buruk, baik dari komisi (peluang untuk memperoleh oleh
kecurangan) atau kelalaian (kegagalan untuk memelihara sebuah website memuaskan), maka
rasionalitas kepentingan sendiri tidak bisa sepenuhnya menjelaskan bagaimana seperti koperasi
perilaku mendapat dari tanah [144]. analisis Namun jauh seperti pergi, ada
merupakan unsur non-rasional yang mendalam untuk perilaku seperti [254]; orang harus
berperilaku baik.
Ada banyak teks tentang perilaku yang baik, tentu saja. The
Tujuan teks ini bukan untuk saham klaim ke salah satu dari wilayah itu. Apa
penting dalam Web Ilmu adalah cara bahwa rekayasa, sambungan
antara URI dan apa yang ditampilkan pada layar, tergantung pada par-
konvensi khusus mereka perilaku yang pada suatu tingkat altruistik. Ada
mungkin hal-hal untuk mengatakan tentang sanksi untuk menegakkan perilaku yang baik seperti
(Lihat Bagian 6), tetapi bukan tempat suatu ilmu dari Web untuk bekerja
tahu cara memberikan kepemimpinan moral, atau berolahraga beberapa-
kali konflik sulit yang keinginan untuk bertindak secara moral sering muntah.
Namun ada peran untuk Web Ilmu untuk menentukan apa engineering5.4. Web sosiologi 95
praktek yang penting, dan bagaimana mereka berhubungan dengan kesediaan orang
untuk berperilaku dengan cara yang kooperatif. Analisis semacam itu dapat menyebabkan kode
perilaku yang mungkin tidak berlaku tetapi dalam arti menentukan
moral perilaku dalam konteks Web. Moralitas dan putar rekayasa
keluar yang akan dihubungkan.
Mari kita ikuti contoh hubungan antara URI dan apa
menunjuk pada detail. Sayangnya, sebagai orang yang telah mempertahankan
Website akan tahu, lebih dari tekanan waktu merusak sambungan
terbentuk. Beberapa tekanan disebabkan oleh kesulitan rekayasa asli,
tekanan beberapa hanya godaan atau kemalasan. Tapi Web akan berfungsi
URI lebih baik jika tidak berubah, jika mereka selalu menunjuk ke dokumen yang sama
(Yang tentu saja dapat diperbarui secara berkala).
Jumlah kerja link sebenarnya menurun cukup pesat. Sebuah
eksperimen yang disebutkan sebelumnya merangkak 150m laman web selama 11 minggu, dan
pada minggu ke-9 para peneliti telah kehilangan akses ke lebih dari 10% dari mereka
halaman (sekitar 4% telah hilang dalam minggu pertama). Sekitar 3%
kembali 4XX kesalahan, kebanyakan dari mereka 404 kesalahan (tidak ditemukan), dan sebagian besar yang 403s sisanya (dilarang). Sekitar 3% dari halaman diblokir oleh Web
server 'robots.txt file yang terdeteksi dan ditolak crawler Web. 2 -
3% dari kegagalan adalah jaringan terkait, seperti DNS lookup kegagalan,
koneksi ditolak atau timeout TCP, sementara sekitar 2% adalah 3xx kesalahan,
menunjukkan halaman telah pindah. Yang bersih dan.. Domain com adalah Appar-
ently pelanggar terburuk [99].
Menghindari URI perubahan ini lebih mudah dikatakan daripada dilakukan. Misalnya, ketika website adalah reorganisasi, godaan adalah untuk menyediakan rapi baru rasio-
nal (tidak sah) set URI mengekspresikan filosofi organisasi baru. Ini
yang menggoda, tetapi akhirnya tidak bijaksana. link menggantung membuat frustasi, dan
benar-benar melakukan banyak untuk melemahkan kepercayaan dalam website dan perusahaan (a berfungsi, baik disajikan dan website yang tampak profesional menjadi seorang
penting penguat kepercayaan online - cf. [116]). Namun, mengingat bahwa ref semua
erences untuk URI oleh pihak yang berkepentingan adalah 'ketinggalan zaman', dalam bahwa mereka
catatan, disimpan dalam daftar orang-orang favorit, menulis di atas kertas atau eksplisit
link dari situs lain, penemuan yang dibuat di masa lalu, mereka tidak dapat
mudah diperbarui [27].
Hal ini sebagian pertanyaan gaya. [27] mencakup seperangkat saran
tentang apa yang tidak termasuk dalam penamaan direktori dan file: authors'96 Aspek Sosial
nama, subyek, status, hak akses, dll Semua yang kedua bisa tampak
cukup masuk akal sebagai nama file, tapi selama skala waktu dari Web ini
dapat mengubah, yang bisa menciptakan tekanan untuk mengubah atau membuat URI
nama file menyesatkan (yaitu lebih buruk dari artinya). Ini berarti bahwa
URI memproduksi kebutuhan berpikir agak lebih dari satu akan sebaliknya
bayangkan, dalam bahwa webmaster perlu memikirkan bagaimana untuk menyajikan
suite informasi, dan mengatur itu, sedemikian rupa sehingga masuk akal dalam
masa depan - setidaknya dalam jangka menengah. Ini adalah biaya yang nyata, tetapi jika
Web berfungsi dengan baik, kebanyakan jika tidak semua webmaster harus mengikuti seperti
konvensi.
Ini adalah contoh dari cara moralitas hits rekayasa di Web.
Berbeda dengan pembangunan suatu artefak kompleks seperti mesin pesawat terbang atau
kapal, 'pekerja' individu di Web belum dicabut keputusan
hak melalui kontrak. Di Web, semua orang sukarelawan. Tapi ada
adalah kewajiban, tugas yang satu incurs dengan menjadi online karena
sifat koperasi dari Web, dan pertemuan kewajiban-kewajiban ini adalah bagian
dari tugas menciptakan invariants penting dalam pengalaman Web.
Contoh lain, pada tingkat pribadi, adalah menjaga konten up to date
dan akurat.
Sosial, penting untuk mengidentifikasi dan mencoba, mana mungkin, insinyur-
Neer keluar perilaku berbahaya (yang berbahaya baik untuk individu dan ke
Web secara keseluruhan) seperti phishing, atau hoaxing PageRank dan lainnya
algoritma mesin pencari. Tidak akan ada solusi rekayasa yang benar-benar
terhadap perilaku tersebut; itu terjadi dalam konteks Web diberikan, dan mereka
yang memanjakan diri di dalamnya akan selalu tergoda untuk bekerja di sekitar skr pun-
sewa blok. Tapi kode etik dan jenis lain diskusi tentang
Web dapat membuat konsensus tentang apa yang merupakan tugas online dan
apa yang merupakan perilaku buruk (konteks adalah penting: mengapa spam
suatu zat iritasi yang serius, dan surat sampah relatif kecil?) dan, akibatnya,
tentang perilaku apa yang harus disahkan, apa yang diamanatkan, dan
apa fungsi terkait arsitektur mungkin diharapkan untuk menyediakan.
Online hubungan erat antara teknik dan moralitas tidak biasa jika
tidak unik. Keluar fleshing kewajiban ini adalah aspek luar biasa
pemahaman kita tentang Web, dan di bagian akhir substantif kami
kita melihat beberapa masalah yang menimbulkan lebih terinci.

6
Web Pemerintahan, Keamanan dan Standar
Pengetahuan, pergi e clich ', adalah kekuatan. TheWeb, dengan secara dramatis menggeser
struktur yang mendasari pengetahuan dan aksesibilitas, telah diubah
struktur kekuasaan dengan cara-cara yang akhirnya tak terduga. Waktu-
kurang kebenaran politik dan masyarakat belum diubah oleh kedatangan para
dari Web, [217] tetapi konteksnya telah. Power telah bergeser, dan ini
menimbulkan pertanyaan tentang pemerintahan Web. Bagaimana seharusnya hal-hal yang diatur
untuk memastikan perkembangan mantap dan berbuah dari Web?
Kita telah lihat, dalam Bagian 5.4.6, peraturan yang tidak bisa
jawaban atas segalanya. Masalah umum tata Web adalah
bahwa dengan struktur desentralisasi sulit untuk menegakkan standar, dan
dengan jumlah yang sangat besar pengguna tidak terlatih atau relatif tidak tertarik
hal-hal yang harus dijaga sangat sederhana. Tapi kesederhanaan yang tidak dapat diijinkan
untuk berdiri di jalan orang-orang yang mampu merumuskan kebijakan tentang
akses dan kontrol, dan untuk melaksanakannya. Hal ini dikatakan bahwa
Kurangnya kontrol informasi yang canggih telah menghambat
pertumbuhan Web dengan membuat orang enggan untuk membuat informasi
tersedia, dan dengan demikian untuk berbagi dengan masyarakat [287]; keamanan dan
privasi adalah masalah yang sangat penting juga.
Penyedia informasi yang berbeda, dengan kebijakan berbeda yang mengatur
kontrol informasi (atau memang tidak ada kebijakan sama sekali), akan memiliki prob-
memiliki kualifikasi berbagi, dan masalah akan bertambah buruk jika pembagian dilakukan pada
kasar tingkat laman web, dokumen atau website, bukan pada
halus-grained tingkat individu bagian informasi. Di sisi lain
tangan, adalah sama benar bahwa ada sejumlah platform, proto-
cols dan arsitektur yang memfasilitasi keamanan informasi, tetapi
tidak banyak digunakan. Dan kendala yang ditambahkan adalah infrastruktur yang
harus mengaktifkan keamanan, privasi dan kepercayaan tanpa mengganggu pengguna dengan
konstan informasi atau permintaan untuk izin. Pemerintahan
Web tidak dapat diabaikan oleh Web Science. Kita mulai diskusi kita
dari aspek ruang dengan proses penetapan standar dan
pembuatan kebijakan.
6.1 Standar dan kebijakan
Pengaturan standar memungkinkan penghematan biaya untuk ekonomi berkat industri-lebar
skala (lih. misalnya [281]), dan begitu juga secara umum hal yang baik. Tapi
ada perangkap tersembunyi [36]. Mungkin satu atau dua perusahaan besar
memiliki kemampuan dalam industri untuk mendominasi standar, dan memastikan
bahwa pesaing yang lebih kecil dan pemasok ikuti. pemimpin pasar dapat menggunakan
standar seperti untuk tinggal satu atau dua langkah di depan pak. Standar
perang bisa boros dari upaya R & D (cf. pertempuran baru-baru ini atas
generasi berikutnya dari format DVD). Negosiasi standar, di mana setiap-
satu lebih suka standar untuk standar tidak, kemungkinan untuk menghasilkan yang terbaik
hasil dalam suatu industri, dan keberadaan badan yang efektif, dirasakan
menjadi netral, yang hanya agenda adalah rekayasa satu, adalah penting
aspek pemerintahan Web.
Dalam kasus dari Web, standar diperlukan untuk memastikan preserva the-
tion sifat esensialnya arsitektur, dikombinasikan dengan desentralisasi
sebagai realisasi, fleksibilitas dan kegunaan, dalam lingkup di mana aspek sosial
gunakan belum tetap. Berbagi informasi secara tradisional telah lim-
ited, dan tertanam dalam konteks dipahami dengan baik. Jadi, misalnya,
berbagi foto secara tradisional melibatkan menyerahkan fisik
objek. Lintasan suatu objek relatif mudah dilacak.
Penyalahgunaan objek relatif terdeteksi. Dan bahkan jika actual6.1. Standar dan kebijakan 99
misuser tidak dapat ditemukan, individu yang bersalah (yaitu orang yang dipinjamkan
foto tanpa izin) dapat. teknologi digital telah
mengubah semua itu. Berbagi foto digital memfasilitasi copy besar-
ing dan diseminasi dengan recourse sedikit pengguna, bahkan jika dis-
tertutup.
Standar dan kebijakan yang dirancang untuk membuat perilaku yang baik lebih mudah dan Oleh karena itu lebih mungkin diperlukan. kebijakan tersebut, biasanya, akan menentukan
yang dapat menggunakan atau memodifikasi sumber daya, dan di bawah kondisi apa. Pol-
kesadaran es melibatkan pengguna memastikan telah diakses dan mengerti-
dapat dilihat kebijakan yang terkait dengan sumber daya Web tertentu, yang
tidak hanya akan mendukung perilaku yang baik namun memungkinkan untuk mengidentifikasi
pelanggaran dan dengan demikian akar dari perilaku buruk. Ruang untuk kebijakan
infrastruktur akan sadar dalam penyebaran lapisan atas
Semantic Web, seperti yang ditunjukkan pada Gambar 3.2. Aturan harus deployable
yang akan memungkinkan produksi scalable dan pertukaran bukti
hak akses [287].
Kebijakan kesadaran, karena konteks tertentu dari Web,
harus sangat berbeda dari pendekatan saat ini untuk informasi
tion keamanan dan kontrol akses, yang memanfaatkan mekanisme yang memerlukan
koordinasi dan pemeliharaan mahal (misalnya sistem PKI), dan yang
Oleh karena itu lebih dari-preskriptif untuk penggunaan umum di Web. Bahkan Rou-
password akses dikendalikan tine bisa menjengkelkan. Weitzner et al menjelaskan
dilema seseorang ingin akses sementara untuk kawin restricted-
Material. Meningkatkan risiko keamanan yang memungkinkan seseorang kelas dia untuk melihat
Pembatasan bahan lain, sementara declassifying risiko material memungkinkan
orang lain akses ke sana [287].
Web memerlukan deskripsi kreatif langkah-langkah keamanan, bukan
dari resep dan mekanisme, dan sejumlah pendekatan telah
telah dikembangkan untuk menyusun kebijakan. Renungkan adalah pol ekspresif-
es deskripsi bahasa untuk sistem terdistribusi, tetapi menjadi terutama
sintaktis berbasis mungkin tidak bekerja dengan baik dalam lebih semantis-diaktifkan
masa depan [68]. KAOS, representasi kebijakan bahasa berdasarkan OWL
[275], dan Rei, yang memungkinkan agen untuk mengontrol akses dengan kebijakan
dijelaskan dengan menggunakan ontologi OWL [161], juga membuat sugges menarik-
berbagai pertanyaan serius tentang kontrol akses dan berbagi informasi dalam sistem terdistribusi- sistem pendokumentasian dari agen atau layanan Web. Bekerja pada Kebijakan Aware Web goes100 Web Pemerintahan, Keamanan dan Standar
agen ini di luar paradigma / layanan berbasis; awal telah dibuat
pada infrastruktur sesuai dengan desentralisasi dan demokratis
Web, tapi masih banyak yang harus dilakukan (misalnya, pada pengguna sesuai
interface) untuk memastikan bahwa transparansi dan akuntabilitas informasi
menggunakan tion benar di tempat.
6.2 Masalah hak cipta
Sebagai theWeb adalah ruang informasi, area penting adalah bahwa hak cipta dan
kekayaan intelektual. Hak cipta melindungi ekspresi ide, dan
jadi sempit - mereka tidak mencegah orang lain melepaskan, mengatakan, novel dengan
mirip alur cerita untuk sebuah novel sedang dalam hak cipta - dan ditujukan
untuk melindungi penulis, musisi atau orang kreatif lain khas
kontribusi. sempitnya membuatnya sulit untuk menggunakan hukum hak cipta di
arena komersial perangkat lunak, sehingga misalnya Mahkamah Agung AS
Borland ditegakkan banding terhadap Lotus setelah kedua menggugat mantan
'Pinjaman' untuk fasilitas dari penampilan Lotus 1-2-3's. Sekarang ada exten-
hak komprehensif di Amerika Serikat dan Eropa memungkinkan reverse engineering dan
menyalin untuk menghasilkan kompatibilitas, dalam kepentingan publik [247].
Database, diperlakukan sebagai kompilasi, telah di tanda terima yang sama
perlindungan sebagai karya sastra (yaitu dilindungi selama 50 tahun setelah CRE the-
asi atau 70 tahun setelah kematian pencipta di Inggris), tetapi fol-
melenguh dalam instruksi Uni Eropa di akhir 1990-an, database dilindungi untuk
15 tahun berikutnya perubahan terakhir utama. Pemilihan informasi
dan pengaturan yang harus berjumlah upaya intelektual untuk mendapatkan,
memverifikasi atau mempresentasikannya. Ada yang belum sedikit sekali kasus dibawa ke
menetapkan preseden, tetapi mengingat kuantitas Web mendalam yang
terdapat dalam database, dan tujuan dari komunitas Semantic Web- nity untuk membawa informasi yang didistribusikan bersama-sama dari berbagai dengan membangun database internasional, sangat mungkin bahwa hak-hak basis data akan menjadi
subjek yang semakin mencari perdebatan dalam [132] di masa depan. Lebih
umumnya merupakan direktif Eropa yang baru (2003/98/EC, http://www.ec-
gis.org / document.cfm? id = 486 & db = dokumen) di Sektor Publik Infor-
mation telah mulai berlaku. Salah satu tujuannya adalah untuk mempercepat
publikasi dan akses ke sejumlah besar data-col lected oleh pemerintah dalam berbagai fungsi mereka. Di Inggris ini has6.3. Transgresif perilaku 101 menyebabkan penciptaan baru-baru ini sebuah Kantor Informasi Sektor Publik (Www.opsi.gov.uk) - mereka mengambil melihat dari dekat apakah SW kendaraan yang tepat untuk memenuhi kewajibannya.
Hak cipta saat ini fokus untuk sebuah argumen utama di lapangan
hukum kekayaan intelektual. Beberapa pemangku kepentingan menunjukkan bahwa digital
teknologi, dan konektivitas dari Web, memiliki antara mereka membuat
pembajakan sangat mudah - penyalinan dan distribusi adalah sederhana
hal di dunia ini, dan sehingga mereka mendukung pengembangan technolo-
gies dan instrumen hukum untuk mencegah atau membatasi tidak sah reproduksi-
tion. Lain menunjukkan bahwa kekuatan web justru berasal dari
kebetulan penggunaan kembali konten, dan yang menggunakan sebagian besar informasi,
terutama dalam konteks theWeb, tidak berbahaya dan diinginkan, yang paling
dari semua di perguruan tinggi [131]. Argumen menyala apakah kreativitas
lebih mungkin dihambat oleh hilangnya insentif untuk penulis yang
hak cipta menjadi tidak berguna, atau menyusutnya bersama dan
domain publik [93]. Lawrence Lessig berpendapat untuk gagasan CRE sebuah '-
ative commons '(http://creativecommons.org/), yang dimaksudkan untuk
menawarkan berbagai fleksibel perlindungan untuk karya yang tidak melumpuhkan terbuka
ness. Metadata terpasang bekerja secara efektif waiving beberapa atau semua
hak bahwa hukum hak cipta memberikan penulis [187].
Ada argumen memecah belah serupa tentang hak paten, yang memberikan
penemu dua puluh tahun monopoli penggunaan yang baru, berguna dan non-
Penemuan jelas, tapi argumen ini membutuhkan diskusi sebanyak
lembaga dan prosedur pemerintah, dan ekonomi yang lebih luas
kekayaan intelektual. Paten (dan rahasia dagang) yang ditinjau dalam [93].
6.3 transgresif perilaku
Dalam banyak kasus, memahami bagaimana pelanggaran dapat berlangsung akan saran-
gest metode untuk merusak pelanggaran, tapi kita harus selalu
bersiaplah untuk perlombaan senjata. Jadi, misalnya, apa yang disebut 'spamdexing',
atau menempatkan kata kunci tertentu dalam dokumen sehingga meningkatkan
probabilitas dari mesin pencari mendarat di atasnya apakah atau tidak
isi tidak relevan, menjadi kurang menarik sebagai suatu kebijakan untuk memastikan
visibilitas dari halaman web jika langkah-langkah kualitas berfokus pada struktur hyperlink
bukan isi dari halaman [76] 0,102 Web Pemerintahan, Keamanan dan Standar
Sebagai contoh yang paling menonjol dari subjek perlombaan senjata,
Algoritma Google PageRank [221] adalah kualitas / relevansi ukuran
besar terkenal. Jadi berpengaruh adalah Google pada pola penggunaan Web, Pager-
ank harus beroperasi di dunia di mana banyak agen yang aktif berusaha untuk
menumbangkan itu.
Studi dari algoritma PageRank, atau algoritma gaya bahasa yang,
sering memilih keluar kemungkinan bebas naik kerja untuk
mempromosikan spam [37], [178], dan ada banyak 'bagaimana untuk' kertas untuk calon-
menjadi spammer. Mantan direktur riset di Google Monika Henzinger
mengidentifikasikan ini sebagai tantangan penting bagi Google [137]. Selama
ada keuntungan yang bisa diperoleh dari muncul tinggi di daftar
halaman diambil, perlombaan senjata akan terus, dan sulit membayangkan bagaimana
teknik untuk mesin pencari spamming bisa dibuat ilegal - setelah
semua banyak dari mereka hanya memanfaatkan mekanisme menghubungkan atau kata kunci
yang membuat Web sangat kuat.
6.4 Privasi dan identitas
Masalah lainnya, seperti spam, bahwa kekhawatiran orang yang sangat banyak adalah bahwa dari pri- Vacy. Web memungkinkan pengumpulan data belum pernah terjadi sebelumnya dalam jumlah yang adalah menciptakan reaksi pengguna yang baik sangat khawatir tentang
hilangnya privasi, atau sebagai alternatif menemukan upaya putaran bekerja seperti
membosankan [85], [234] isu. Informasi sering digunakan untuk tujuan berbeda-
ent dari yang mungkin telah diberikan sebagai alasan untuk koleksi.
Dan keamanan data adalah semua terlalu sering diperlakukan sebagai masalah-sisi oleh perusahaan, fakta disorot pada tahun 2005 ketika ditemukan bahwa kebocoran dari berbagai busi- nesses telah terpapar informasi pribadi lebih dari 50.000.000
orang. perlawanan Amerika untuk undang-undang privasi berarti bahwa seperti
paparan sering tidak terdeteksi, walaupun hukum perintis dalam Negara
perusahaan California berkewajiban untuk menginformasikan data mereka yang telah bocor, dan
skandal itu terungkap. Pada saat penulisan, undang-undang privasi yang
memperoleh dukungan di semua tingkat masyarakat Amerika dan pemerintah, dan
Microsoft telah membalikkan posisi dan didukung undang-undang federal privasi
[265]. Namun demikian, survei terbaru melaporkan bahwa 59% dari komputasi
ahli yang merespon kuesioner diharapkan surveilans online
meningkat selama beberapa tahun mendatang [103] .6.4. Privasi dan identitas 103
W3C mempromosikan Platform for Privacy Preferences (P3P) untuk
meningkatkan kontrol pengguna dengan memungkinkan presentasi yang lebih baik kebijakan privasi, dan sehingga memungkinkan pengguna untuk menyesuaikan mereka lebih mudah [67]. P3P adalah standar yang memungkinkan pandangan umum yang akan diambil oleh berbagai privasi aktor berbeda. Peraturan privasi jelas dalam agenda politik,
dan bisa dibilang perlu. Namun, juga kasus yang sensitivitas
untuk kebutuhan pribadi dan preferensi membutuhkan antarmuka pintar dan
berguna alat dan teknik untuk berpengalaman atau relatif tidak tertarik
pengguna untuk melindungi diri mereka sendiri [286]. Selanjutnya, P3P dan pendekatan serupa
tidak membawa mekanisme penegakan ketika dilanggar.
Mungkin saja bahwa gagasan tentang privasi seperti yang telah secara tradisional
understod dalam politik pasca-Pencerahan akan terlalu sulit untuk melindungi
di era ketika Web digunakan untuk transaksi begitu banyak, berisi
begitu banyak informasi, dan memungkinkan begitu banyak informasi yang berguna untuk
dikumpulkan dari pengguna Web tanpa pengetahuan mereka. Beberapa alasan mengapa
di cyberworld digital tampaknya begitu bertentangan dengan privasi meliputi:
umur panjang potensi informasi yang tersimpan, kemudahan menyalin dan trans-
fer, keakuratan penyalinan dan transfer; mekanisme pencarian yang efektif;
kekuatan database dilebur; kesulitan menekan
informasi; fluiditas identitas dan anonimitas bahwa Web pro-
vides; kurangnya sentralisasi, kelangkaan arena untuk dipublikasikan dengan baik
koreksi kesalahan, kesulitan dalam mengidentifikasi pelanggaran privasi, sedangkan
kesulitan melacak pelakunya, kelengkapan cov Web's-
nya cakupan kehidupan kita; pervasiveness dalam hidup kita; digital informasi's
independensi menengah; arsitektur kompak yang informasi
tion disimpan; kedekatan yang aneh antara Web dan bawah tanah
perilaku. Tidak diragukan lagi ada alasan lebih banyak, membandingkannya dengan
media penyimpan informasi lain, seperti kertas, dan dapat dilihat
berapa besar ancaman terhadap privasi Web. Ini digunakan untuk menjadi
hal ini bahkan ketika disimpan, informasi dalam praktek hampir impos-
jawab untuk menemukan (misalnya, dalam sistem pengarsipan berbasis kertas yang besar yang memiliki berevolusi sedikit demi sedikit selama bertahun-tahun). Dalam era digital kami, fenomena ini, yang David Brin telah memanggil [46] 'ketidakjelasan praktis', adalah hal yang dari masa lalu.
Tapi itu tidak perlu menjadi akhir masalah. Mungkin harus fokus
berada di definisi yang merupakan penyalahgunaan informasi, and104 Web Pemerintahan, Keamanan dan Standar
mungkin kita harus bergerak menuju standar yang mempromosikan akuntabilitas
ity pengguna informasi, dan transparansi dalam informasi cara adalah
digunakan. Kita perlu memahami bagaimana peraturan dan platform yang memungkinkan
kontrol pengguna interleave dengan kerja biasa atau kehidupan pribadi. Setelah semua,
ada saat ini banyak platform di tempat untuk membantu secu informasi
ritas dan perlindungan kekayaan intelektual, tetapi orang cenderung tidak
menggunakannya. Seperti yang kami sebutkan di atas, kami belum melanda keseimbangan ideal
antara mengganggu orang dengan pertanyaan di satu pihak, dan memungkinkan
informasi untuk menjadi berbahaya tidak aman di sisi lain.
Sebuah isu yang terkait dengan privasi adalah bahwa identitas dan otentikasi.
Sebagai sistem otomatis lebih tergantung pada satu mampu membuktikan iDEN-
Tity (dalam urutan, misalnya, untuk mendapatkan akses ke sumber daya), kebutuhan
otentikasi meningkat. Fluiditas identitas telah sering dikutip
sebagai salah satu yang paling penting attractor Internet ("tidak ada yang tahu
Anda anjing "- cf. [186, 215]), tetapi sistem jaminan identitas tidak perlu
tentu kompromi itu. Secara khusus, dalam ketiadaan biometrik
standar kita mungkin menganggap bahwa 'identifikasi' dan 'authentication'
kurang lebih sama-aperson diidentifikasi melalui sesuatu yang dia
atau dia memiliki (misalnya kartu pintar, kunci pintu, tagihan rumah tangga), sesuatu
dikenal (misalnya password, jawaban atas pertanyaan tertentu, nomor PIN), atau
beberapa karakteristik pribadi. Banyak sistem tidak termasuk pribadi
karakteristik dalam loop, dan karena itu menyamakan individu dengan
Metode otentikasi, mereka mengasumsikan bahwa awal, akurat Authen-
tication berlangsung, dan kemudian mengandalkan pada asumsi induktif [230].
Apapun kekurangan dari asumsi tersebut adalah - dan dari
sudut pandang keamanan mereka banyak - mereka lakukan minimal menghasilkan
standar relatif identitas daripada satu mutlak, dan
Oleh karena itu kurang intrusif.
Titik jelas untuk membuat tentang mekanisme identifikasi adalah bahwa
mereka lebih mudah digunakan, dan karenanya lebih cocok untuk het the-
basis pengguna erogeneous dari Web, yang sederhana mereka harus berkompromi.
password tetap akrab dan mudah dijalankan, tetapi rentan
untuk serangan sederhana, di sisi lain kunci identifikasi berbasis masyarakat
protokol cryptographically kuat (dan memang komputasi
murah dan masih relatif sederhana), tetapi mereka umumnya membutuhkan sesuatu
seperti token perangkat keras serta infrastruktur pendukung [230] .6.5. Ekonomi informasi dan komunikasi 105
6.5 ekonomi informasi dan komunikasi
Web tidak hanya merupakan ruang politik, melainkan juga sebuah ruang ekonomi,
karena pengetahuan memiliki nilai [209], meskipun sebagai dengan politik yang baru
lingkungan online tidak berarti bahwa buku ekonomi akan robek.
Sebagai contoh, struktur umum dari industri informasi - dengan
relatif besar biaya tetap (untuk menemukan atau memperoleh informasi) dan
diabaikan biaya marjinal (setiap salinan informasi yang sepele untuk CRE-
makan) - menunjukkan bahwa mereka adalah monopoli alami, satu kali biaya tetap
telah dilakukan oleh perusahaan, maka mereka selalu dapat harga perusahaan baru
keluar dari pasar selama mereka dapat menghambat yang lain perusahaan 'acquisi-
tion dari informasi yang disyaratkan. Pekerjaan yang harus dilakukan untuk menentukan
sejauh mana sketsa situasi ekonomi adalah benar, misalnya, itu
tampak bahwa perusahaan online memiliki bersaing untuk pangsa pasar, yang telah memimpin
untuk harga online sangat rendah. Sejauh bahwa sketsa itu benar,
Namun, pertanyaan regulasi dari monopoli alam harus
mengangkat kepalanya (cf. [281]).
Pencarian dapat menjadi masalah. Dimana ada kemacetan, ada
peluang monopoli. Pencarian dapat dianggap sebagai penting bot-
tleneck di Web (cf. [25]). Perusahaan-perusahaan pencari utama wajah semakin meningkat-
ing pengawasan (yang sama dengan perusahaan lain dalam bidang komputasi) sebagai
mereka harus berhadapan dengan masalah internasionalisasi dan con-
flicting politik persyaratan, mungkin paling terkenal di Cina [16].
6.6 Sebuah hegemoni liberal?
Sebuah sebentar titik akhir layak membuat adalah bahwa Web adalah ruang dirancang
membiarkan arus informasi, dan menciptakan peluang kerjasama
dan kolaborasi. Perlu bertanya mengapa arus informasi bebas adalah
hal yang baik, dan jawaban yang cukup sederhana. Adalah baik untuk
memiliki kebebasan untuk mengekspresikan diri agar seseorang dapat mengejar seseorang
otonom sendiri dan otentik proyek. Tanpa hambatan kritik terhadap pemerintah-
Pemerintah daerah dan pusat-pusat kekuasaan lainnya cenderung mengarah pada pemerintahan yang lebih baik; informasi drive demokrasi. Kedua alasan ini memiliki akar
dalam pandangan, liberal individualistis dunia, dalam tradisi Locke,
Mill dan Rawls. Mungkin Web adalah artefak liberal 106 Web? Pemerintahan, Keamanan dan Standar Tentu saja ada oposisi terhadap theWeb dari berbagai sumber (sebagian besar
sumber-sumber ini, adalah adil untuk mengatakan, lebih dari senang untuk mempekerjakan Web
sebagai alat untuk organisasi, komunikasi dan diseminasi). Banyak
liberal pemerintah membatasi penggunaan warga mereka dari Web, sering menggunakan
adaptasi teknologi firewall untuk menciptakan apa yang berlaku raksasa
intranet di dalam perbatasan mereka. Bahkan demokrasi non-liberal memiliki beberapa-
sesuatu dari masalah dengan Web. Sebagai contoh, pemerintah Sin-
gapore memiliki sentuhan yang relatif ringan dalam pengaturannya Internet, tapi
masih blok 100 atau lebih situs porno, membutuhkan politik dan agama
website untuk didaftarkan dan berlisensi dengan Broadcasting Singapura
Otoritas, dan larangan aktivitas pemilu di Web selama pemilu-cam
paigns [197], walaupun ia memiliki visi yang kuat dari berbasis pengetahuan
ekonomi dan merupakan salah satu pemerintah paling antusias di dunia
berkaitan dengan IT [273].
Dalam dunia aktivitas non-pemerintah, Web juga telah
dilihat dilihat sebagai agen globalisasi, sehingga dari Web telah
dikondisikan oleh pandangan politik penulis tentang tren itu. Banyak melihat
Internet sebagai surga anarkis indah sedangkan Web, dengan nya
website licin dan daya tarik massa, telah menghancurkan semua itu dan normalisasi
dunia online. Online sama suram dan tidak adil, bagi para penulis tersebut,
sebagai offline [241]. Pemasaran telah menggantikan demokrasi. Dalam wacana,
neologisme seperti 'cyberhegemony' dan 'cyberdependency' berlimpah
[226].
Untuk Web untuk menjadi kontributor ke global pengembangnya kesejahteraan
harus memilih jalan melalui sejumlah perdebatan rumit seperti ini;
adalah penting bahwa theWeb tidak menjadi monokultur global, sedangkan
juga menghindari alternatif dekomposisi dalam beberapa cultish-mini
web dengan konektivitas sedikit atau tidak ada di antara keduanya. Saldo hormat
untuk titik-titik orang lain pandang dan pertahanan yang tepat dari seseorang sendiri selalu
menjadi satu sulit untuk menyerang dalam setiap bidang kegiatan manusia. Pada
saat, kejutan Web kita dengan kesuburan konektivitas nya.
Adalah penting bahwa ini adalah ditahan [30]. Ini mungkin bahwa fraktal
struktur Web, jika bisa dipupuk, akan menjadi bagian dari solusi
[29]. Kita juga perlu memahami cara yang Web digunakan dalam
negara berkembang, daripada fokus pada demokrasi Barat, 6,6. Sebuah hegemoni liberal? 107
untuk memastikan bahwa ia dapat berfungsi sebagai luas seperangkat konstituen sebagai
mungkin [83].
Mengingat semua kekhawatiran, mungkin mengherankan bahwa pemerintah AS-
pemerintah baru-baru ini datang di bawah tekanan tentang keunggulan
yang berperan dalam pemerintahan Web, meskipun jelas keberhasilan Internet
dan Web sejauh ini. PBB Kelompok Kerja di Internet
2005 Laporan Tata's membuat sejumlah rekomendasi yang
semua stakeholder harus dilibatkan dalam tata kelola Internet [288]. Ini
mungkin mengubah liberalisme dari Web. Tersebut kemungkinan efek ini pada
Web sendiri tidak diketahui (cf. [274]) .7
Diskusi dan Kesimpulan
Teks ini telah disebutkan serangkaian pendekatan baik memahami dan
insinyur Web. Kami berpendapat bahwa pendekatan-pendekatan ini dapat diatur
menjadi kerangka kerja dan kerangka kerja yang seperti merupakan ilmu untuk
kami disiplin. Dalam ilmu ini kita perlu menyelidiki arsitektur dan
kita perlu memahami dan merumuskan arsitektur kami di tepat
tingkat abstraksi. Sebuah Ilmu Web akan berisi perdebatan sendiri tentang
metodologi yang tepat. Ini tidak terlepas dari kombinasi dari sintesis,
analisis dan pemerintahan - sejak Web ada dalam satu set kompleks
sosial dan hukum konvensi.
Kami berpendapat pada panjang yang bergerak dari centricWeb-dokumen
ke data yang lebih menyeluruh Web cenderung memerlukan lebih banyak dengan cara
teknologi semantik. Tidak sedikit karena kenyataan bahwa trans-
orangtua dan integrasi tidak ambigu tuntutan data heterogen
jelas deskripsi semantik. Sejauh mana ontologi akan pro-
vide mekanisme luas untuk mencapai mediasi ini dibahas.
Apakah ontologi atau folksonomi, jika kita untuk mengkoordinasikan web kami
data kemudian kosakata stabil dari berbagai skala merupakan elemen penting-
pemerintah. Dalam web data masalah akrab identitas referensial timbul.
Kapan dua konsep yang sama? Bagaimana kita untuk membangun yang kuat dan
108Discussion dan Kesimpulan 109
skema penamaan yang fleksibel? Bagaimana kita ke account untuk drift alam
dan evolusi dalam penafsiran kita tentang arti konsep?
Saat ini trend dalam penelitian Web akan mengubah sifat
Web itu sendiri. Apakah ini adalah munculnya layanan Web, mod baru
els berbagi konten seperti P2P, permintaan untuk personalisasi,
luas otomatis Natural Language Processing atau munculnya
komputasi mobile, masing-masing topik akan komponen yang sah
Sains Web kami.
Kami juga telah meninjau berbagai pendekatan yang berusaha untuk menganalisis
Web seperti itu dan mungkin menjadi. Berikut kebutuhan untuk peneliti
dalam matematika dan fisika, biologi dan ekonomi untuk membuat umum
menyebabkan dengan insinyur dan ilmuwan komputer untuk membantu memperkaya kami di bawah berdiri dari sistem informasi besar desentralisasi. Kami belum
mengatakan banyak tentang bagaimana memahami dan menganalisa Web dapat menyebabkan
untuk wawasan penting untuk disiplin ilmu lainnya. Tapi ini hampir pasti
akan terjadi. Serius kolaborasi ilmiah tidak pernah merupakan salah satu cara
jalanan.
Kami telah menghabiskan waktu mengartikulasikan tantangan yang Web Science
menimbulkan dari sudut pandang moral dan sosial. Kami percaya bahwa ini
sangat diperlukan. Web mungkin lebih dari yang lainnya baru-baru ini manusia
membangun disertai dengan sejumlah masalah termasuk privasi dan
perlindungan, akses dan keragaman, kontrol dan kebebasan. Struktur yang
kami merancang, insinyur dan penelitian, dan temuan yang muncul melalui
analisis, sering akan memiliki implikasi sosial yang kuat. Kami ingin bahwa
komunitas Web Ilmu sadar secara sosial, informasi dan di mana nec-
beda-beda, proaktif.
Akhirnya, kami percaya bahwa argumen tentang apakah ilmu
harus dasarnya analitik yang steril [34]. Kami membutuhkan ilmu
menganalisis dan mensintesis. Kami juga menduga ada seni lebih untuk ilmu pengetahuan dan
ilmu pengetahuan untuk seni daripada sering diakui. Kami lebih dari senang untuk
mengakui bahwa Web Ilmu pengetahuan adalah disiplin eklektik. Kami juga percaya
bahwa ia memiliki beberapa pertanyaan yang paling menantang dan menarik
dari century.Acknowledgements 21 Terima kasih kepada para peserta dalam workshop di Web Ilmu diselenggarakan di British Computer Society di London, 12-13 Septem-
ber 2005, selama dua hari diskusi menarik yang dapat membantu membentuk kita
ide-ide tentang apa ilmu dari Web terdiri masuk Seperti halnya sekarang
penulis, para peserta termasuk Hal Abelson, Mark Ackerman, David
de Roure, Dutton William, Feigenbaum Joan, Fensel Dieter, Carole
Goble, Craig Knoblock, Lassila Ora, Robin Milner, Guus Schreiber,
Henry Thompson Yorick Wilks, dan Jonathan Zittrain. Tertentu dan memberikan ini
ipants tentu saja tidak bertanggung jawab atas ide-ide yang diajukan dalam
teks, tetapi kami telah mencoba untuk memasukkan sebanyak mungkin dari ide-ide mereka
isu utama untuk Web Science. juga untuk James Finlay Banyak terima kasih,
Susan Davies dan Timotius Miles-Board.
Selama penulisan teks ini beberapa penulis yang dukungan-
porting oleh Inggris Teknik dan Ilmu Pengetahuan Alam Penelitian Coun-
CIL Advanced Pengetahuan Technologies col interdisipliner penelitian
laboration (nomor hibah GR/N15764/01), dan beberapa pekerjaan
dilaporkan dilakukan di bawah Inggris dan Sosial Ekonomi Penelitian
Dewan proyek 'Keadilan On-Line: Mendistribusikan Cyberspace Cukup'
(RES penghargaan nomor-000-22-0563). Kami juga mengucapkan terima kasih kepada US National Sci-
ence Yayasan dukungan mereka kerja di Kebijakan Sadar Web
dan Transparan Akuntabel Datamining Initiative.

Referensi
[1] M. Abadi dan C. Fournet, "nilai Mobile, nama baru dan aman-com
munication, "dalam Proceedings of Simposium ACM 28 pada Prinsip
Bahasa Pemrograman (POPL '01), 2001. http://research.microsoft.
com/users/fournet/papers/mobile-values-new-names-and-secure-
communication.pdf.
[2] K. Aberer, e P. Cudr '-Mauroux, dan M. Hauswirth, "Mulai membuat akal:
The Chatty Web pendekatan untuk perjanjian semantik global, "Journal of Web
Semantik, vol. 1, no. 1, http://www. websemanticsjournal.org/volume1 /
issue1/Abereretal2003/index.html, 2003.
[3] LA Adamic dan N. Sekilas, "The blogosphere politik dan
2004 US pemilu: Terbagi mereka blog, "2 Tahunan Lokakarya
Weblogging Ekosistem: Agregasi, Analisis dan Dinamika, WWW05,
http://www.hpl.hp.com/research/idl/papers/politicalblogs/AdamicGlance
BlogWWW.pdf, 2005.
[4] LA Adamic dan AB Huberman, "Perintah tersembunyi The Web,"
Komunikasi ACM, vol. 44, no. 9, http://www.hpl.hp.com/
Penelitian / makalah / weborder.pdf, 2001.
[5] E. Adar dan LA Adamic, "epidemi informasi Pelacakan di
blogspace, "Web Intelligence 2005, http://www.hpl.hp.com/research/idl/
papers/blogs2/trackingblogepidemics.pdf, 2005.
[6] G. Adomavicius dan A. Tuzhilin, "Menuju generasi berikutnya rekomendasi
sistem: Sebuah survei dari negara-ekstensi-the-art dan kemungkinan, "IEEE
Transaksi pada Pengetahuan dan Teknik Data, vol. 17, no. 6, hal 734 -
749, 2005.
Referensi 111112
[7] K. Ahmad, M. Tariq, B. Vrusias, dan C. Handy, "thesaurus Corpus berbasis
konstruksi untuk pengambilan gambar dalam domain spesialis, "Uang Muka dalam Infor-
mation Retrieval: Prosiding Konferensi Eropa 25 pada IR Penelitian
(ECIR 2004), (F. Sebastiani, ed.), Hal 502-510, Berlin: Springer, 2003.
[8] K. Ahmad, B. Vrusias, dan M. Zhu, "Visualising koleksi gambar?,"
9 Prosiding Konferensi Internasional tentang Visualisasi Informasi
(IV '05), hlm 268-274, 2005.
[9] J. Aizen, D. Huttenlocher, J. Kleinberg, dan A. Novak, "Traffic feed berbasis
kembali di Web, "PNAS, vol. 101, (6 April 2004), http://www.pnas.
org/cgi/reprint/101/suppl 1 / 5254, 2004.
[10] H. Alani, "Ontologi konstruksi dari ontologi online," Proceedings of
WWW 2006, http://www2006.org/programme/files/pdf/4013.pdf, 2006.
[11] H. Alani, S. Dasmahapatra, N. Gibbins, H. Glaser, S. Harris, Y. Kalfoglou,
K. O'Hara, dan N. Shadbolt, "Mengelola referensi: Memastikan referensial
integritas ontologi untuk Web Semantic, "dalam Pengetahuan Teknik dan
Manajemen Pengetahuan: ontologi dan Web Semantic, (A. G 'omez-P' Erez
dan VR Benjamins, eds), pp 317-334, Berlin:. Springer, 2002.
[12] H. Alani, S. Dasmahapatra, K. O'Hara, dan N. Shadbolt, "komunikasi Mengidentifikasi-
nities praktek melalui analisis ontologi jaringan, "IEEE Intelligent Sys-
U raian, hal 18-25, http://eprints.ecs.soton.ac.uk/7397/, Maret / April 2003.
[13] R. Albert, H. Jeong, dan A.-L. Barab 'ASI, "Diameter dari World Wide Web,"
Nature, vol. 401, hal 130-131, 1999.
[14] B. Aleman-Meza, M. Nagarajan, C. Ramakrishnan, L. Ding, P. Kolari,
Sheth AP, IB Arpinar, A. Joshi, dan T. Finin, "analisis Semantic pada
jaringan sosial: Pengalaman dalam menangani masalah konflik antar-
est deteksi, "Proceedings of WWW 2006, http://www2006.org/programme/
files/pdf/4068.pdf, 2006.
[15] AR Anderson dan Belnap ND, entailment: The Logika Relevansi dan
Kebutuhan vol.1, Princeton: Princeton University Press, 1975.
[16] Anonymous, "Fuzzy matematika," The Economist, 11 Mei 2006.
[17] G. Antoniou dan Harmelen van F., A Semantic Web Primer, Cambridge MA:
MIT Press, 2004.
[18] A. Arasu, J. Novak, A. Tomkins, dan J. Tomlin, "PageRank perhitungan dan
struktur dari Web: Percobaan dan algoritma, "Proceedings of the
World Wide Web Conference ke-11, 2002.
[19] K. Baclawski dan T. Niu, ontologi untuk Bioinformatics, Cambridge MA: MIT
Tekan, 2005.
[20] S. Baluja, "Browsing di layar kecil: membentuk kembali segmentasi web-page
menjadi sebuah mesin yang efisien kerangka belajar, "Proceedings of WWW 2006,
http://www2006.org/programme/files/pdf/2502.pdf, 2006.
[21] A.-L. Barab 'ASI, "The fisika dari Web," Fisika Dunia, http://physics
web.org/articles/world/14/7/09, Juli 2001.
[22] A.-L. ASI Barab ', R. Albert, dan H. Jeong, "karakteristik Skala-bebas berlari-
Jaringan dom: Topologi dari World Wide Web, "Physica A, vol. 281,
hal 69-77, 2000.References 113
[23] J. Basney, W. Nejdl, D. Olmedilla, V. Welch, dan Winslett M., "Negotiat-
ing percaya pada Grid, "Prosiding Seminar Dagstuhl Semantic Grid:
The Konvergensi Teknologi, http://drops.dagstuhl.de/opus/volltexte/
2005/387/pdf/05271.OlmedillaDaniel.Paper.387.pdf, 2005.
[24] T. Basten, Dalam Ketentuan Nets: Desain Sistem Dengan Nets Petri dan Proses
Aljabar, Ph.D. tesis, Eindhoven University of Technology, 1998.
[25] J. Battelle, The Search: Bagaimana Google dan Rivals yang menulis ulang Aturan
Bisnis dan Transformasi Budaya kami, Boston: Nicholas Brealey Publish-
ing, 2005.
[26] T. Berners-Lee, "Mitos Nama dan Alamat," http://www.w3.org/
DesignIssues / NameMyth.html, 1996.
[27] T. Berners-Lee, "Cool URI Jangan Perubahan," http://www.w3.org/Provider/
Gaya / URI, 1998.
[28] T. Berners-Lee, "Database Relational di Web Semantic," http://www.
w3.org/Design Masalah / RDB-RDF.html, 1998.
[29] T. Berners-Lee, "The Nature Fractal dari Web," http://www.w3.org/Design
Isu / Fractal.html, 1998/2005.
[30] T. Berners-Lee, Tenun Web: Masa Lalu, Sekarang dan Masa Depan Dunia
Wide Web oleh Inventor nya, London: Publishing Texere, 1999.
[31] T. Berners-Lee, "Apa HTTP URI Mengidentifikasi,?" Http://www.w3.org/
DesignIssues / HTTP-URI.html, 2002 / 3.
[32] T. Berners-Lee, "Pengantar," dalam Spinning Semantic Web: Membawa
World Wide Web untuk Potensi Purna nya, (D. Fensel, J. Hendler, H. Lieberman,
dan Wahlster W., eds), Cambridge MA:. MIT Press, 2003.
[33] T. Berners-Lee, Fielding RT, dan Masinter L., "Uniform Resource
Identifier (URI): Generic Syntax, "http://www.gbiv.com/protocols/uri/rfc/
rfc3986.html, 2005.
[34] T. Berners-Lee, W. Hall, J. Hendler, N. Shadbolt, dan Weitzner D., "Web
Science, "Science, vol. 313, 11 Agustus 2006.
[35] T. Berners-Lee, J. Hendler, dan O. Lassila, "The Semantic Web,"
Scientific American, http://www.sciam.com/article.cfm?articleID=00048144-
10D2-1C70-84A9809EC588EF21, Mei 2001.
[36] S. Besen dan J. Farrell, "Memilih bagaimana bersaing: Strategi dan taktik
standarisasi, "Jurnal Ekonomi Perspectives, vol. 8, hal 117-131, 1994.
[37] M. Bianchini, M. Gori, dan F. Scarselli, "Di dalam PageRank," ACM transaksi-
tions di Internet Technology, vol. 5, no. 1, hal 92-128, 2005.
[38] P. E. Black, ed., Ch. Kamus Algoritma dan Struktur Data, Leven-
shtein jarak. 2005. http://www.nist.gov/dads/HTML/Levenshtein.html.
[39] DC Blair, "Wittgenstein, bahasa dan informasi:" Kembali ke kasar
tanah ', "dalam Konteks: Alam, Dampak dan Peran - 5th International Con-
konferensi di Konsepsi Perpustakaan dan Informasi Ilmu (CoLIS 2005),
(F. Crestani dan eds I. Ruthven,.), Hal 1-4, Berlin: Springer, 2005.
[40] RA Botafogo, E. Rivlin, dan B. Shneiderman, "analisis Struktural hiper-
teks: Mengidentifikasi hierarki dan metrik berguna, "ACM Transaksi di Infor-
mation Systems, vol. 10, no. 2, hal 142-180, 1992,114 Referensi
[41] P. Bouquet, F. Giunchiglia, F. Harmelen van, L. Serafini, dan H. Stuck -
enschmidt, "mengontekstualisasikan ontologi," Journal of Web Semantik, vol. 1,
no. 4, hal 325-343, 2004.
[42] RJ Brachman dan JG Schmolze, "Suatu ikhtisar-KL SATU
representasi pengetahuan sistem, "Cognitive Science, vol. 9, hal 171-216,
http://www.cogsci.rpi.edu/CSJarchive/1985v09/i02/p0171p0216/MAIN.PDF,
1985.
[43] B. Brewington dan G. Cybenko, "Bagaimana dinamis Web,?" Proceedings
dari World Wide Web 9 Konferensi, http://www9.org/w9cdrom/264/
264.html, 2000.
[44] D. Brickley dan Guha RV, eds, RDF Keterangan Kosakata Bahasa 1.0.:
RDF Schema. 2004. http://www.w3.org/TR/rdf-schema/.
[45] D. Brickley dan L. Miller, "FOAF Kosakata Spesifikasi," http://xmlns.
com/foaf/0.1 /, 2005.
[46] D. Brin, Masyarakat Transparan: Apakah Teknologi Angkatan Kami untuk Pilih
Antara Privasi dan Kebebasan, New York: Basic Books, 1998.
[47] S. Brin dan L. Page, "Anatomi pencarian besar-besaran Web hypertextual
mesin, "Proceedings of the World Wide Web Conference ke-7, 1998.
[48] A. Broder, S. Glassman, M. Manasse, dan G. Zweig, "Syntactic pengelompokan
Web, "Proceedings Konferensi Web World Wide 6, 1997.
[49] Broder A., R. Kumar, F. Maghoul, P. Raghavan, S. Rajagopalan, S. Stata,
A. Tomkins, dan J. Wiener, "Grafik struktur di Web," Komputer Net-
bekerja, vol. 33, no. 107, 2000.
[50] FP Brooks, The Mythical Man-Bulan: Esai dalam 2 Rekayasa Perangkat Lunak
Edition, Boston: Addison Wesley Longman, 1995.
[51] RA Brooks, "Bagaimana membangun makhluk lengkap daripada terisolasi kognitif
simulator, "dalam Arsitektur untuk Intelijen, (K. VanLehn, ed.), hal 225-239,
N.J. Hillsdale: Lawrence Erlbaum, 1991.
[52] A. Caldas, David PA, dan O. Ormanidhi, "Bersih-Informasi Digital
bekerja Technologies, Organisasi Kinerja dan Produktivitas, "Stan-
ford Lembaga Penelitian Ekonomi makalah diskusi, Kebijakan 05-11 http://
siepr.stanford.edu/papers/pdf/05-11 summary.pdf, 2005..
[53] F. Carmagnola, F. Cena, C. Gena, dan I. Torre, "Pendekatan multidimensi
untuk representasi semantik taksonomi dan aturan dalam adaptif hiper-
media sistem, "Proceedings of the Workshop Personalisasi pada
Semantic Web: PerSWeb '05, hal 5-14, http://www.win.tue.nl/persweb/full-
proceedings.pdf, 2005.
[54] L. Carr, S. Bechhofer, C. Goble, dan W. Hall, "Conceptual menghubungkan: Ontologi-
berbasis open hypermedia, "Proceedings of 10 World Wide Web Conference,
http://www10.org/cdrom/papers/frame.html, 2001.
[55] E. Castronova, Sintetis Worlds: Bisnis dan Budaya Games Online,
Chicago: University of Chicago Press, 2005.
[56] J. Gua, "Ekonomi kepercayaan antara mitra cyber cyber," dalam Trust dan
Kejahatan dalam Masyarakat Informasi, (R. Mansell dan Collins BS, eds.), Hal 380 -
427, Cheltenham: Edward Elgar, 2005.References 115
[57] CCSDS, "Reference Model untuk Sistem Informasi Pengarsipan Terbuka
(OAIS), "Komite Konsultatif untuk Space Data Systems, http://ssdoo.
gsfc.nasa.gov/nost/wwwclassic/documents/pdf/CCSDS-650.0-B-1.pdf, 2002.
[58] Cedars, "Cedars Panduan untuk Pelestarian artikel," http://www.leeds.ac.uk/
pohon aras / guideto / metadata / guidetometadata.pdf, 2002.
[59] T. Chen, H. Chang, R. Govindan, S. Yamin, SJ Shenker, dan Willinger W.,
"Asal hukum kekuasaan di topologies Internet ditinjau kembali," IEEE Telematika,
2002.
[60] P. C.-H. Cheng, "diagramatik pengetahuan akuisisi: elisitasi, analisis
dan isu-isu, "Uang Muka dalam Pengetahuan Perolehan: Proceedings of the 9
Akuisisi Pengetahuan Eropa Workshop, (N. Shadbolt, K. O'Hara, dan
G. Schreiber, eds), pp 179-194, Berlin:. Springer, 1996.
[61] T. Coates, M. Biddulph, P. Hammond, dan M. Webb, "radio Reinventing:
Memperkaya siaran dengan perangkat lunak sosial, "O'Reilly Emerging Technology Con-
konferensi, http://conferences.oreillynet.com/cs/et2005/view/e sess/5981, 2005.
[62] EF Codd, "Sebuah model relasional data untuk besar bank data bersama," Com-
munications dari vol ACM,. 13, no. 6, hal 377-387, 1970.
[63] R. Cohen, K. Erez, D. ben-Avraham, dan S. Havlin, "Ketahanan Inter-
kerusakan acak bersih, "Phys Rev Lett, vol. 85, http://www.wisdom.
weizmann.ac.il / ~ recohen / publikasi / prl.pdf internet, 2000.
[64] R. Cohen, K. Erez, D. ben-Avraham, dan S. Havlin, "Breakdown dari
Internet diserang disengaja, "Phys Rev Lett, vol. 86, http://www.
wisdom.weizmann.ac.il / ~ recohen / publikasi / prl.pdf serangan, 2001.
[65] D. Connolly, F. van Harmelen, Horrocks Ian, McGuiness DL, PF
Patel-Schneider, dan LA Stein, "DAML + MINYAK Referensi Deskripsi,"
http://www.w3.org/TR/daml+oil-reference, 2001.
[66] L. Coyle, D. Doyle, dan P. Cunningham, "kesamaan Mewakili untuk CBR
dalam XML, "Uang Muka dalam Penalaran Berbasis Kasus: Proceedings of the 7
Konferensi Eropa Penalaran Berbasis Kasus, (P. Funk dan PAG
Calero, eds), Berlin:. Springer, 2004. https: / / www.cs.tcd.ie/publications/tech-
reports/reports.04/TCD-CS-2004-25.pdf.
[67] L. Cranor, M. Langheinrich, M. Marchiori, M. Presler-Marshall, dan J. Rea -
gle, "Platform for Privacy Preferences 1.0 (P3P1.0) Spesifikasi,"
http://www.w3.org/TR/P3P/, 2002.
[68] NC Damianou, Sebuah Kerangka Kebijakan Pengelolaan Sistem Terdistribusi-
U raian, Ph.D. tesis, Imperial College, London, 2002. http://www-dse.doc
.ic.ac.uk / Riset / kebijakan / merenungkan / tesis-ncd.pdf.
[69] HT Dang, "Sekilas DUC 2005," Proceedings of DUC 2005, http://www-
nlpir.nist.gov/projects/duc/pubs/2005papers/OVERVIEW05.pdf, 2005.
[70] M. d'Aquin, J. Lieber, dan A. Napoli, "rea Decentralized berbasis kasus
soning untuk Web Semantic, "Proceedings of the Seman Internasional
tic Web Konferensi (ISWC 2005), http://www.loria.fr/equipes/orpailleur/
Documents/daquin05b.pdf, 2005.
[71] W. Davies, "You Don't Know Me, Tapi ...: Modal Sosial dan Sosial
Software, "Yayasan Kerja, http://www.theworkfoundation.com/pdf/
1843730103.pdf, 2003,116 Referensi
[72] NR Jennings DC De Roure,, dan Shadbolt NR, "The Grid Semantic:
Masa lalu, sekarang dan masa depan, "Proceedings of the IEEE, vol. 93, no. 3, hal 669-681,
2005.
[73] RA DeMillo, RJ Lipton, dan AJ Perlis, "proses Sosial dan bukti
teorema dan program, "Proceedings of the ACM Simposium 4 pada prinsip-
prinsip keuangan dari Pemrograman Bahasa, hlm 206-214, 1977.
[74] R. Denaux, L. Aroyo, dan V. Dimitrova, "OWL-Olm: ontologi Interaktif-
elisitasi berdasarkan model pengguna, "Proceedings of the Workshop Per-
sonalisation di Web Semantic: PerSWeb '05,, hal 34-46 http://www.
win.tue.nl / persweb / full-proceedings.pdf, 2005.
[75] A. Deutsch, L. Sui, dan V. Vianu, "Spesifikasi dan verifikasi data-driven
layanan Web, "Proceedings of PODS '04, 2004.
[76] D. Dhyani, WK Ng, dan SS Bhowmick, "Sebuah survei metrik Web," ACM
Computing Survey, vol. 34, no. 4, hal 469-503, 2002.
[77] E. Dijkstra, "Go To pernyataan dianggap berbahaya," Komunikasi dari
ACM, vol. 11, no. 3, hal 147-148, http://www.acm.org/classics/oct95/, 1968.
[78] S. Dill, R. Kumar, K. McCurley, S. Rajagopalan, D. Sivakumar, dan
A. Tomkins, "Self-kesamaan dalam Web," Proceedings of the Interna-
Konferensi internasional Basis Data Sangat Besar, http://citeseer.ist.psu.edu/
dill01selfsimilarity.html, 2001.
[79] A. Dix, Jumat A., B. Koleva, T. Rodden, H. Muller, C. Randell, dan
A. Steed, "Mengelola spasi ganda," dalam Ruang, spasialitas dan Technol-
ogy, (P. Turner dan E. Davenport, eds.), Dordrecht: Kluwer, 2005. http://
www.equator.ac.uk/index.php/articles/c94/.
[80] D. Donato, L. Laura, S. Leonardi, dan S. Millozzi, "sifat skala besar
webgraph itu, "Eropa Fisik Jurnal B, vol. 38, hlm 239-243, 2004.
[81] L. Downes dan C. Mui, Unleashing Aplikasi Killer: Strategi digital untuk Mar-
ket Dominasi, Cambridge MA: Harvard Business School Press, 2000.
[82] HL Dreyfus dan SE Dreyfus, "Membuat pikiran versus pemodelan otak:
Kecerdasan buatan kembali pada titik-cabang, "Artificial Intelligence, vol. 117,
no. 1, 1988.
[83] B. Du, M. Demmer, dan E. Brewer, "Analisis lalu lintas di WWW
Kamboja dan Ghana, "Proceedings of WWW 2006, http://www2006.org/
programme/files/pdf/5510.pdf, 2006.
[84] M. Dubinko, R. Kumar, J. Magnani, Novak J., P. Raghavan, dan
A. Tomkins, "Visualisasi tag dari waktu ke waktu," Proceedings of WWW 2006,
http://www2006.org/programme/files/pdf/25.pdf, 2006.
[85] WH Dutton dan A. Shepherd, "Keyakinan dan resiko di Internet," dalam
Kepercayaan dan Kejahatan dalam Masyarakat Informasi, (R. Mansell dan Collins BS,
eds), hal 207-244, Cheltenham:. Elgar Edward, 2005.
[86] eBay, "Mengevaluasi Reputasi Anggota's," http://pages.ebay.com/help/
umpan balik / evaluasi-feedback.html, 2005.
[87] SA Edwards, "Ini hidup," Wired, Apr.97 1997.
[88] J. Ellman, "ontologi Perusahaan sebagai antarmuka informasi," IEEE Intelligent
Sistem, hal 79-80, Jan 2004.References Februari / 117
[89] P. Erd ¨ os dan enyi A. R ', "Pada grafik evolusi acak," Publikasi
Institut Matematika Akademi Hungaria of Science, vol. 5,
hal 17-61, 1960.
[90] P. Evans dan Wurster TS, Blown untuk Bits: Bagaimana Ekonomi Baru Infor-
mation Transformasi Strategi, Cambridge MA: Harvard Business School Press,
2000.
[91] R. Fagin, R. Kumar, KS McCurley, J. Novak, D. Sivakumar, JA
Tomlin, dan DP Williamson, "Mencari tempat kerja Web," Proceedings
dari World Wide Web Internasional ke-12 Konferensi, http://www2003.org
/ Cdrom/papers/refereed/p641/xhtml/p641-mccurley.html, 2003.
[92] M. Faloutsos, P. Faloutsos, dan C. Faloutsos, "Pada power-law hubungan
topologi internet, "ACM SIGCOMM 99, vol. 29, 1999.
[93] J. Farrell dan C. Shapiro, "Intelektual properti, kompetisi dan informasi
tion teknologi, "dalam The Ekonomi Teknologi Informasi: Sebuah introduksi-
tion, (HR Varian, J. Farrell, dan C. Shapiro, ed.), hlm 49-86, Cambridge:
Cambridge University Press, 2004.
[94] M. Fayed, P. Krapivsky, J. Byers, M. Crovella, D. Finkel, dan S. Redner,
"Pada munculnya distribusi sangat bervariasi dalam sistem otonom
topologi, "ACM Computer Communication Review, Juli 2003.
[95] M. Fayzullin, M. Nanni, D. Pedraschi, dan VS Subrahmanian, "Yayasan
reaksi yang diharapkan dari interaksi sistem terdistribusi, "Annals Matematika dan Artifi-
finansial Intelijen, vol. 28, hlm 127-168, http://citeseer.ist.psu.edu/478943.html,
2000.
[96] D. Fensel, ontologi: A Silver Bullet untuk Manajemen Pengetahuan dan Elec-
Tronic Commerce, 2nd edition, Berlin: Springer, 2004.
[97] D. Fensel, J. Hendler, H. Lieberman, dan Wahlster W., "Pengantar,"
di Spinning Semantic Web: Bringing Web World Wide ke Penuh nya
Potensi, (D. Fensel, J. Hendler, H. Lieberman, andW.Wahlster, eds.), Hal 1 -
25, Cambridge MA: MIT Press, 2003.
[98] A. Ferrara, "layanan Web: Sebuah pendekatan aljabar proses," dalam Proceedings of the
2nd International Conference on Computing Service-Oriented (ICSOC 2004),
(M. Aiello, M. Aoyama, F. Curbera, dan Papazoglou MP, eds.), Hal 242-251,
New York: ACM Press, 2004.
[99] D. Fetterly, M. Manasse, M. Najork, dan J. Wiener, "Sebuah penelitian besar-besaran
evolusi halaman Web, "Software: Praktek dan Pengalaman, vol. 34,
no. 2, hal 213-237, http://research.microsoft.com/research/sv/sv-pubs/p97-
fetterly/p97-fetterly.html, 2004.
[100] JH Fetzer, "Program verifikasi: Gagasan sangat," Komunikasi dari
ACM, vol. 31, hlm 1048-1063, 1988.
[101] GW Flake, Pennock DM, dan DC paksaan, "The self-organized Web: The
yin untuk Yang Semantic Web itu, "IEEE Intelligent Systems, vol. 18, no. 4,
http://research.yahoo.com/publication/OR-2003-003.pdf, 2003.
[102] I. Kesselman Foster dan C., eds, The Grid 2: Cetak Biru untuk Komputasi Baru.
Infrastruktur, San Francisco: Morgan Kaufmann, 2003.
[103] S. Fox, Anderson JQ, dan L. Rainie, "Masa Depan Internet: Dalam
Survei, Ahli Teknologi dan Ulama Mengevaluasi Dimana Jaringan is118 Referensi
Menuju ke Sepuluh Tahun Berikutnya, "Pew Internet & American Life Project,
http://www.pewinternet.org/pdfs/PIP Masa Depan Internet.pdf, 2005.
[104] C. Fry, M. Plusch, dan H. Lieberman, "statis dan semantik dinamis dari
Web, "dalam Spinning Semantic Web: Bringing World Wide Web untuk perusahaan
Potensi Penuh, (D. Fensel, J. Hendler, H. Lieberman, dan Wahlster W., eds.),
hal 377-401, Cambridge MA: MIT Press, 2003.
[105] X. Fu, T. Bultan, dan J. Su, "Analisis Web berinteraksi layanan BPEL,"
Prosiding Konferensi Web Dunia, Wide 2004 2004.
[106] A. Gangemi, N. Guarino, C. Masolo, A. Oltramari, dan Schneider L., "Sweet-
Ening ontologi dengan Dolce, "dalam Pengetahuan Rekayasa dan Pengetahuan
Manajemen: ontologi dan Web Semantic, (Erez A. G 'omez-P' dan VR
Benjamins, eds), pp 166-181, Berlin:. Springer, 2002.
[107] J. Garrett dan D. Waters, "Melestarikan Informasi Digital: Laporan Tugas
Berlaku pada Informasi Pengarsipan Digital, "Komisi tersebut pada Pengawetan
dan Access, dan Penelitian Perpustakaan Group, http://www.rlg.org/ArchTF/,
1996.
[108] W. Gaver, A. Boucher, S. Pennington, dan B. Walker, "Mengevaluasi teknologi
nologies untuk keterlibatan ludis, "CHI '05 Lokakarya tentang Evaluasi terkendali,
http://www.equator.ac.uk/index.php/articles/c94/, 2005.
[109] D. Gentner, "Struktur-pemetaan: Kerangka teoritis untuk analogi," Cog-
Ilmu kognitif, vol. 7, no. 2, hal 155-170, 1983.
[110] Y. Gil, "Pengetahuan mobilitas: Semantik untuk Web sebagai ksatria putih untuk
sistem berbasis pengetahuan, "dalam Spinning Semantic Web: Membawa Dunia
Wide Web untuk Potensi Purna nya, (D. Fensel, J. Hendler, H. Lieberman, dan
W. Wahlster, eds), pp 253-278, Cambridge MA:. MIT Press, 2003.
[111] Y. Gil dan V. Ratnakar, "sumber informasi Mempercayai satu warga pada satu waktu,"
Prosiding Konferensi Internasional Semantic Web 1 (ISWC), 2002.
[112] A. Ginsberg dan Hirtle D., eds., Kasus Gunakan RIF dan Persyaratan, 2006.
http://www.w3.org/TR/rif-ucr/.
[113] JA Goguen, "Ontologi, ontotheology dan masyarakat," Konferensi Internasional
pada formal Ontologi dalam Sistem Informasi (FOIS 2004, http://charlotte
.ucsd.edu/users/goguen/pps/fois04.pdf, 2004.
[114] J. Golbeck dan B. Parsia, "jaringan Trust filtering berdasarkan klaim agregat,"
International Journal of artikel, Semantik dan ontologi, vol. 1, no. 1,
http://trust.mindswap.org/papers/ijmso.pdf, 2005.
[115] J. Golbeck, B. Parsia, dan J. Hendler, "jaringan Trust di Seman-
tic Web, "dalam Proceedings of the 7th International Workshop Koperasi
Intelligent Agen, (M. Klusch, S. Ossowski, Omicini A., dan H. Laamenen,
eds), hal 238-249, Berlin:. Springer-Verlag, 2003. http://www.mindswap.org/
papers/CIA03.pdf.
[116] S. Grabner-Kr ¨ auter dan EA Kaluscha, "empirik di kepercayaan on-line:
Suatu penilaian meninjau dan kritis, "International Journal of Manusia Komputer
Studies, vol. 58, hlm 783-812, 2003.
[117] P. Graham, "Sebuah Rencana Spam," http://www.paulgraham.com/spam.html,
2002.References 119
[118] TL Griffiths dan JB Tenenbaum, "predikat.Juga optimal di setiap-
hari kognisi, "Psychological Science, http://web.mit.edu/cocosci/Papers/
prediction10.pdf, 2006.
[119] G. Grimmett, keberlanjutan, Berlin: Springer, edisi 2 ed, 1989..
[120] G. Grimnes, P. Edwards, dan A. Preece, "Belajar dari flora semantik dan
fauna, "Proceedings of the Workshop on Semantic Web AAAI Personalisasi,
http://maya.cs.depaul.edu/ ~ mobasher/swp04/accepted/grimnes.pdf, 2004.
[121] WI Grosky, DV Sreenath, dan F. Fotouhi, "Emergent dan semantik
multimedia Semantic Web, "ACM Sigmod, vol. 31, no. 4, hal 54-58,
http://lsdis. cs.uga.edu/SemNSF/SIGMOD-Record-Dec02/Gorsky.pdf (sic),
2002.
[122] P. Groth, S. Miles, V. Tan, dan Moreau L., eds, Arsitektur untuk PROVENANSI.
Sistem Versi 0.4. 2005. http://eprints.ecs.soton.ac.uk/11310/.
[123] T. Gruber, "Sebuah pendekatan terjemahan ke ontologi formal," Pengetahuan
Akuisisi, vol. 5, no. 25, hlm 199-200, http://ksl-web.stanford.edu/
KSL Abstracts/KSL-92-71.html, 1993.
[124] N. Guarino, "formal ontologi, analisis konseptual dan perwakilan pengetahuan
resentation, "dalam Formal Ontologi dalam Analisis dan Pengetahuan konseptual
Representasi: Edisi Khusus Jurnal Internasional Manusia Komputer
Studi, (N. Guarino dan eds R. Poli,.), 1995. http://citeseer.ist.psu.edu/
guarino95formal.html.
[125] N. Guarino dan CA Welty, "Sebuah gambaran dari OntoClean," dalam The Handbook
pada ontologi, (S. Staab dan R. Studer, eds.), hal 151-172, Berlin: Springer-
Verlag, 2004.
[126] P. Haase, M. Ehrig, A. Hotho, dan B. Schnizler, "Personalized informasi
tion akses dalam sistem peer-to-peer bibliografi, "Proceedings of the
AAAI Lokakarya Semantic Web Personalisasi, http://maya.cs.depaul.
edu / ~ mobasher/swp04/accepted/haase.pdf, 2004.
[127] W. Hall, "Tombol pemogokan kembali," New Review Hypermedia dan Multi-
media, vol. 6, hal 5-17, 2000.
[128] T. Hammond, T. Hamay, B. Lund, dan J. Scott, "Social bookmarking tools
(I): Sebuah tinjauan umum, "D-Lib, vol. 11, no. 4, http://www.dlib.org/dlib/
april05/hammond/04hammond.html, 2005.
[129] S. Harnad, "Masalah simbol grounding," Physica D, vol. 42, hal 335-346,
http://cogprints.org/3106/01/sgproblem1.html, 1990.
[130] S. Harnad, Masalah simbol grounding, Nature Publishing Group /
Macmillan, 2003. http://cogprints.org/3018/01/symgro.htm.
[131] S. Harnad, "Publish atau binasa - diri-arsip untuk berkembang: Jalur hijau
akses terbuka, "ERCIM Berita, http://eprints.ecs.soton.ac.uk/11715/, 2006.
[132] T. Hart dan L. Fazzani, Hukum Kekayaan Intelektual 3rd Edition, Basingstoke:
Palgrave Macmillan, 2004.
[133] J. Haugeland, "Memahami bahasa alami," Jurnal Filsafat,
vol. 76, hlm 619-632, 1979.
[134] Hendler JA, "Pertanyaan yang Sering Diajukan pada Lan Ontologi W3C Web
gauge (OWL), "http://www.w3.org/2003/08/owlfaq, 2004,120 Referensi
[135] JA Hendler, "Dari Atom ke Owls: The Ekologi Baru dari
WWW, "Keynote Kuliah, XML2005, http://www.cs.umd.edu/ ~ hendler /
presentations/XML2005Keynote.pdf, 2005.
[136] N. Henze dan M. Kriesell, "Personalisasi fungsionalitas untuk
Semantic Web: garis Arsitektur dan implementasi sampel pertama
tions, "Proceedings of 1st International Workshop Teknik yang
Adaptif Web, http://rewerse.net/publications/download/REWERSE-RP-
2004-31.pdf, 2004.
[137] M. Henzinger dan S. Lawrence, "pengetahuan Ekstrak dari World Wide
Web, "PNAS, vol. 101, http://www.pnas.org/cgi/reprint/101/suppl 1 / 5186,
6 April 2004.
[138] MR Henzinger, "tantangan algorithmic di search engine Web," Internet
Matematika, vol. 1, no. 1, hal 115-126, 2004.
[139] MR Henzinger, R. Motwani, dan C. Silverstein, "Tantangan dalam pencarian Web
mesin, "SIGIR Forum, http://www.sigir.org/forum/F2002/henzinger.pdf,
Fall 2002.
[140] C. Hewitt, PERENCANA: Bahasa untuk Memanipulasi Model dan Membuktikan
Teorema dalam Robot, AI Memo AIM-168, MIT, 1970. http://hdl.handle.
net/1721.1/6171.
[141] CAR Hoare, Berkomunikasi Proses Sequential, New York: Prentice-
Hall, 1984.
[142] DL Hoffman, TP Novak, dan A. Venkatesh, "Apakah internet menjadi
sangat diperlukan?, "Komunikasi dari vol ACM,. 47, no. 7, hal 37-42, 2004.
[143] Hoffman DL, Novak TP, dan Venkatesh A., "Apakah Internet
Menjadi Indispensable? Temuan empiris dan Pengembangan Model, "Work-
ing Kertas, Pusat Sloan untuk Ritel Internet, Universitas Vanderbilt,
http://elab.vanderbilt.edu/research papers.htm, 2004.
[144] M. Hollis, Trust Dalam Reason, Cambridge: Cambridge University Press,
1998.
[145] JB Horrigan, "Komunitas Online: Jaringan yang Nurture Long-Jarak Jauh
Hubungan dan Ties Sosial, "Pew Internet dan American Life Project,
Masyarakat http://www.pewinternet.org/pdfs/PIP Report.pdf, 2001.
[146] I. Horrocks, PF Patel-Schneider, dan Harmelen F. van, "Dari SHIQ
dan RDF ke OWL: Pembuatan bahasa ontologi Web, "Jurnal
Web Semantik, vol. 1, no. 1, http://www.websemanticsjournal.org/volume1/
issue1/Horrocksetal2003/index.html, 2003.
[147] M. Horstmann, M. Lorenz, A. Watkowski, G. Ioannidis, O. Herzog, Raja A.,
D. G. Evans, C. Hagen, C. Schlieder, A.-M. Burn, N. King, H. Petrie, S. Dijk -
stra, dan D. Crombie, "Automated interpretasi dan presentasi dapat diakses
diagram teknis untuk orang buta, "New Review Hypermedia dan Mul-
timedia, vol. 10, no. 2, hal 141-163, 2004.
[148] J. Huang dan MS Fox, "Ketidakpastian dalam asalnya pengetahuan,"
Prosiding 1 Eropa Semantic Web Simposium, http://www.eil.
utoronto.ca/km/papers/EuroSemWeb04-online.pdf, 2004.References 121
[149] Z. Huang dan H. Stuckenschmidt, "Penalaran dengan ontologi multi-version:
Pendekatan temporal logika, "Proceedings of the Semantic Internasional ke-4
Lokakarya web, http://www.cs.vu.nl/ ~ heiner/public/ISWC05a.pdf, 2005.
[150] BA Huberman dan LA Adamic, "Pertumbuhan dinamika dari World-Wide
Web, "Nature, vol. 401, p. 131, 1999.
[151] BA Huberman dan LA Adamic, "dinamika Informasi dalam net-
bekerja dunia, "dalam Jaringan Complex, (E. Ben-Naim, H. Frauenfelder, dan
Z. Toroczkai, eds), pp 371-398, Berlin:. Springer, 2003. http://www.hpl.
hp.com / penelitian / IDL / makalah / infodynamics / infodynamics.pdf.
[152] D. Huynh, NR Jennings, dan NR Shadbolt, "Membangun inte-
parut kepercayaan dan reputasi model untuk sistem multi-agent terbuka, "Lanjutkan-
petunjuk untuk keselamatan dari 7 Workshop Internasional Trust di Agen Societies, http://
eprints.ecs.soton.ac.uk/9557/01/aamas-trust04.pdf, 2004.
[153] J. Iria dan F. Ciravegna, "Hubungan ekstraksi untuk pertambangan Seman-
tic Web, "Seminar Dagstuhl pada Machine Learning untuk Web Semantic,
http://tyne.shef.ac.uk/t-rex/pdocs/dagstuhl.pdf, 2005.
[154] I. Jacobs, ed., Kelompok Arsitektur Teknis (TAG) Piagam. 2004. http://
www.w3.org/2004/10/27-tag-charter.
[155] I. Jacobs dan N. Walsh, eds., Arsitektur Volume World Wide Web
Satu. 2004. http://www.w3.org/TR/webarch/.
[156] A. Jaimes, "faktor manusia dalam desain pengambilan gambar otomatis dan
evaluasi, "SPIE Konferensi: Electronic Imaging 2006, http://www.ee.
columbia.edu / ~ ajaimes / Pub / ajaimes spie06.pdf, 2006.
[157] X. Jin, Y. Zhou, dan B. Mobasher, "Suatu pendekatan seragam dalam personaliza-
tion berdasarkan model-model probabilistik semantik laten penggunaan Web dan con-
tenda, "Proceedings of the Workshop on Semantic Web AAAI Personalisasi,
http://maya.cs.depaul.edu/ ~ mobasher/swp04/accepted/jin.pdf, 2004.
[158] KS Jones, "Apa yang baru tentang Semantic Web? beberapa pertanyaan, "
SIGIR Forum, vol. 38, no. 2, http://www.acm.org/sigir/forum/2004D/sparck
jones sigirforum 2004d.pdf, 2004.
[159] A. Jøsang, "Sebuah logika untuk probabilitas yang tidak pasti," International Journal of
Ketidakpastian, ketidakjelasan dan Sistem Berbasis Pengetahuan, vol. 9, no. 3, hal 279 -
311, http://security.dstc.edu.au/papers/logunprob.pdf, 2001.
[160] A. Jøsang dan D. McAnally, "Perkalian dan comultiplication keyakinan,"
International Journal of reasoning Perkiraan, vol. 38, no. 1, hal 19-51,
http://security.dstc.edu.au/papers/JM2004-IJAR.pdf, 2004.
[161] L. Kagal, T. Finin, M. Paolucci, N. Srinivasan, K. Sycara, dan Denker G.,
"Otorisasi dan privasi untuk layanan Web Semantic," IEEE Intelligent Sys-
U raian, hal 52-58, Juli / Agustus 2004.
[162] D. Kahneman, P. Slovic, dan Tversky A., eds, Putusan bawah Ketidakpastian.:
Heuristik dan Bias, Cambridge: Cambridge University Press, 1982.
[163] DR Karger dan D. Quan, "Apa artinya ke blog di
Semantic web, "Journal of Semantik Web, vol. 3, no. 2, http://www.
websemanticsjournal.org/ps/pub/2005-18, 2005,122 Referensi
[164] N. Kavantzas, D. Burdett, G. Ritzinger, T. Fletcher, Y. Lafon, dan Bar C. -
Reto, "Web Services Choreography Description Language Version 1.0," http://
www.w3.org/TR/2005/CR-ws-cdl-10-20051109/, 2005.
[165] J. Kay dan A. Lum, "Ontologi berbasis pengguna pemodelan untuk Web Semantic,"
Prosiding Lokakarya Personalisasi di Web Semantic: Per-
SWeb '05, hal 15-23, http://www.win.tue.nl/persweb/full-proceedings.pdf,
2005.
[166] O. kharif, "Kurang dampak dari" efek Slashdot "," BusinessWeek Online,
http://www.businessweek.com/technology/content/mar2005/tc2005032 0932
tc119.htm id kampanye = pencarian,? 2 Maret 2005.
[167] A. Kilgarrif dan G. Grefenstette, "Pengantar masalah khusus pada
Web sebagai corpus, "Komputasi Linguistik, vol. 29, no. 3, hal 333 -
348, http://www.kilgarriff.co.uk/Publications/2003-KilgGrefenstette-WAC
Intro.pdf, 2003.
[168] J. Kim, "supervenience dan incommensurables nomological," American Philo-
sophical Quarterly, vol. 15, hlm 149-156, 1978.
[169] J. Kim, "supervenience Psikologis," Philosophical Studies, vol. 41, hlm 51 -
70, 1982.
[170] Kiryakov A., B. Popov, I. Terziev, D. Manov, dan Ognyanoff D., "Semantic
anotasi, pengindeksan dan pengambilan, "Journal of Web Semantik, vol. 2, no. 1,
http://www.websemanticsjournal.org/ps/pub/2005-10, 2005.
[171] J. Kleinberg, "sumber otoritatif dalam lingkungan hyperlink,"
ACM-SIAM Simposium Algoritma Diskrit (SODA), hal 668-677,
http://www.cs.cornell.edu/home/kleinber/auth.pdf, 1998.
[172] Carroll G. Klyne dan JJ, eds, Resource Description Framework (RDF).:
Konsep dan Sintaks Abstrak, 2004. http://www.w3.org/TR/rdf-concepts/.
[173] GF Knolmayer dan Myrach T., "Konsep-konsep Database Bitemporal The-
ORY dan Evolusi Dokumen Web, "Institut Sistem Informasi-
U raian, University of Bern, Kertas Kerja 127, http://www.ie.iwi.unibe.ch/
publikationen/berichte/resource/WP-127.pdf, 2000.
[174] KR Koedinger dan JR Anderson, "Abstrak perencanaan dan persepsi-
tual potongan: Unsur-unsur keahlian dalam geometri, "Cognitive Science, vol. 14,
hlm 511-550, 1990.
[175] R. Kumar, P. Raghavan, S. Rajagopalan, dan Tomkins A., "Trawl yang
Web untuk muncul cyber-komunitas, "Proceedings of the World Wide 8
Konferensi web, http://www8.org/w8-papers/4a-search-mining/trawling/
trawling.html, 1999.
[176] AM Lai, J. Nieh, B. Bohra, V. Nandikonda, Surana AP, dan
S. Varshneya, "Meningkatkan Web browsing pada PDA nirkabel menggunakan tipis-
komputasi klien, "Proceedings of World Wide Web, Konferensi 2004 http://
www2004.org/proceedings/docs/1p143.pdf, 2004.
[177] C. Lam, "penyaringan Kolaborasi menggunakan memori saraf asosiatif," Lanjutkan-
petunjuk untuk keselamatan dari Lokakarya AAAI di Semantic Web Personalisasi, http://maya
cs.depaul.edu /. ~ mobasher/swp04/accepted/lam.pdf, 2004.References 123
[178] AN Meyer Langville dan CD, "Deeper dalam PageRank," Internet
Matematika, vol. 1, no. 3, http://www.internetmathematics.org/volumes/1/
3/Langville.pdf, 2004.
[179] O. Lassila dan M. Adler, "gadget Semantic: komputasi Ubiquitous memenuhi
SemanticWeb, "dalam Spinning Semantic Web: Bringing World Wide Web
untuk Potensi Full nya, (D. Fensel, J. Hendler, H. Lieberman, dan Wahlster W.,
eds), hal 363-376, Cambridge MA:. MIT Press, 2003.
[180] D. Lee, H. Chuang, dan K. Seamons, "Efektivitas peringkat dokumen dan
teknik umpan balik relevansi, "IEEE Software, vol. 14, no. 2, hal 67-75, 1997.
[181] R. Lempel dan S. Moran, "Pendekatan stokastik untuk dubur struktur-link
ysis (SALSA) dan efek TKC, "Proceedings of the World Wide Web 9
Konferensi, 2000.
[182] R. Lempel dan A. Soffer, "PicASHOW: Pictorial otoritas pencarian dengan hiper-
link pada theWeb, "Proceedings of the World Wide Web Conference ke-10, 2001.
[183] DB Lenat, "Cyc: Sebuah investasi besar-besaran dalam infrastruktur pengetahuan,"
Komunikasi ACM, vol. 38, no. 11, 1995.
[184] A. Lenhart, "Sekitar 25 Juta Orang Memiliki Digunakan Internet untuk Jual Beberapa-
hal, "Pew Internet dan American Life Project, http://www.pewinternet.
org / PDF / PIP SellingOnline Nov05.pdf, 2005.
[185] EL Lesser, MA Fontaine, dan Slusher JA, eds., Pengetahuan dan Com-
komunitas perikanan, Boston: Butterworth-Heinemann, 2000.
[186] L. Lessig, Kode dan Hukum Lain Cyberspace, New York: Buku Dasar, 1999.
[187] L. Lessig, The Future of Ideas: Nasib Commons dalam Terhubung
Dunia, New York: Random House, 2001.
[188] S.-T. A. Leung, SE Perl, Stata R., dan Wiener JL, "Menuju Web-Skala
Web Arkeologi, "Compaq Pusat Penelitian Sistem laporan # 174, 2001.
[189] J. Liang, R. Kumar, dan Ross KW, "Kazaa Memahami," Bekerja
kertas, http://cis.poly.edu/ ~ ross / makalah / UnderstandingKaZaA.pdf, 2004.
[190] J. Lohse, K. Biolsi, N. Walker, dan H. Rueter, "Sebuah klasifikasi visual
representasi, "Komunikasi dari vol ACM,. 37, no. 12, hlm 36-49,
1994.
[191] A. L 'opez-Ortiz, "algorithmic yayasan Internet," ACM SIGACT
News, vol. 36, no. 2, 2005.
[192] D. MacKenzie, mekanisasi Bukti: Komputasi, Risiko dan Trust, Cambridge
MA: MIT Press, 2001.
[193] T. Maekawa, T. Hara, dan S. Nishio, "Gambar klasifikasi untuk Web mobile
browsing, "Proceedings of WWW 2006, http://www2006.org/programme/
files/pdf/2506.pdf, 2006.
[194] T. Maneewatthana, G. Wills, dan W. Hall, "Adaptive pribadi informasi
tion lingkungan berdasarkan Semantic Web, "Prosiding Internasional
Lokakarya Hypertext Adaptive dan Personalized Semantic Web, 2005,
http://www.ru5.cti.gr/HT05/files/Maneewatthana.pdf, 2005.
[195] F. Manola dan Miller E., eds., RDF Primer, 2004. http://www.w3.org/
TR/rdf-primer/.124 Referensi
[196] Marshall CC dan Shipman FL, "Yang Semantic Web,?" Dalam Proceedings
Konferensi ACM 14 pada Hypertext dan Hypermedia,, hal 57-66 ACM
Tekan, 2003. http://www.csdl.tamu.edu/ ~ marshall/ht03-sw-4.pdf.
[197] DK Mauzy dan RS Milne, Politik Singapura Dalam Aksi Rakyat
Partai, London: Routledge, 2002.
[198] McGuiness DL dan Harmelen F. van, eds., OWL Web Bahasa Ontologi
Tinjauan, 2004. http://www.w3.org/TR/owl-features/.
[199] S. Mendes dan RP Chaves, "Memperkaya WordNet dengan qualia informasi
tion, "Proceedings of NAACL 2001 Workshop WordNet dan leksikal Lainnya
Sumber daya, http://errepe.no.sapo.pt/ewqf.pdf, 2001.
[200] P. Mika, "Flink: teknologi Web Semantik untuk ekstraksi dan analisis
jaringan sosial, "Journal of Web Semantik, vol. 3, no. 2, http://www.
websemanticsjournal.org/ps/pub/2005-20, 2005.
[201] P. Mika, "ontologi adalah kita: Sebuah model terpadu jaringan sosial dan
Semantik, "Proceedings Konferensi Internasional 4 Semantic Web
(ISWC2005), 2005.
[202] T. Miles-Board, L. Carr, dan W. Hall, "Mencari menghubungkan: link asosiatif
di Web, "Proceedings of Conference ACM 13 di Hypertext dan Hyper-
media (HT '02), http://eprints.ecs.soton.ac.uk/6977/, 2002.
[203] R. Milner, Komunikasi dan Concurrency, New York: Prentice Hall, 1989.
[204] R. Milner, Berkomunikasi dan Sistem Mobile: The Pi-Calculus, Cambridge:
Cambridge University Press, 1999.
[205] BA Misztal, Kepercayaan dalam Masyarakat Modern, Cambridge: Polity Press, 1996.
[206] H. M ¨ uller, P. Clough, W. Hersh, T. Deselaers, TM Lehmann, B. Jan -
Vier, dan A. Geissbuhler, "Menggunakan anotasi heterogen dan informasi visual-
mation untuk pembandingan sistem temu kembali citra, "SPIE Konferensi
Photonics Barat: Electronic Imaging, http://medir.ohsu.edu/ ~ hersh/spie-06-
imageclef.pdf, 2006.
[207] J. Myers, "Apa yang bisa Grid Semantic lakukan untuk sains dan teknik?,"
Prosiding Seminar Dagstuhl pada Kotak Semantic: The Konvergensi
Technologies, http://drops.dagstuhl.de/opus/volltexte/2005/395/pdf/05271.
MyersJames.ExtAbstract.395.pdf, 2005.
[208] S. Narayanan dan S. McIlraith, "Analisis dan simulasi layanan Web,"
Jaringan Komputer, vol. 42, no. 5, hal 675-693, 2003.
[209] D. Neef, Siesfeld GA, dan J. eds Cefola,., Dampak Ekonomi pengetahuan-
tepi, Boston: Butterworth-Heinemann, 1998.
[210] F. Neuhaus, P. Grenon, dan B. Smith, "Sebuah teori formal zat, qual-
ities dan universal, "dalam Formal Ontologi dalam Sistem Informasi, (A. Varzi
dan Vieu L., eds), hlm 49-59, Turin:. IOS Press, 2004.
[211] Noy NF dan DL McGuiness, "Ontology Development 101: Panduan A
http://protege.stanford.edu untuk Membuat Anda Pertama Ontologi, "/ publikasi-
tions / ontologi development/ontology101-noy-mcguinness.html, 2001.
[212] Noy NF dan MA Musen, "Paket PROMPT: alat Interaktif untuk
ontologi penggabungan dan pemetaan, "International Journal of Manusia Komputer
Studies, vol. 59, no. 6, hlm 983-1024, 2003.References 125
[213] NF Noy, W. Grosso, dan MA Musen, "Pengetahuan-akuisisi antar-
wajah untuk pakar domain: Sebuah evaluasi empiris 'misalnya' Prot e-2000, "12
Konferensi Internasional Engi Rekayasa Perangkat Lunak dan Pengetahuan-
neering (SEKE2000), http://smi-web.stanford.edu/auslese/smi-web/reports/
SMI-2000-0825.pdf, 2000.
[214] C. Nugent, D. Doyle, dan P. Cunningham, "Insight Mendapatkan Melalui Case-
Berdasarkan Penjelasan, "Laporan Teknis TCD-CS-2004-49, Trinity College
Dublin, https: / / www.cs.tcd.ie/publications/tech-reports/reports.04/TCD-
CS-2004-49.pdf, 2004.
[215] K. O'Hara, Trust: Dari Socrates Spin, Cambridge: Icon Books, 2004.
[216] K. O'Hara, H. Alani, dan N. Shadbolt, "komunitas Mengidentifikasi praktek:
Menganalisis ontologi sebagai jaringan untuk mendukung pengakuan masyarakat, "dalam Pro-
ceedings dari Kongres Dunia 2002 Komputer, Sistem Informasi: The
E-Business Challenge, (R. Traunm ¨ uller, ed.), Hal 89-102, Dordrecht: Kluwer,
2002. http://eprints.ecs.soton.ac.uk/6522/.
[217] K. O'Hara dan D. Stevens, inequality.com: Kekuasaan, Kemiskinan dan Digital
Membagi, Oxford: Oneworld, 2006.
[218] ET O'Neill, BF Lavoie, dan R. Bennett, "Tren dalam evolusi
Web masyarakat 1998-2002, "D-Lib Magazine, vol. 9, no. 4, http://www.dlib.
org/dlib/april03/lavoie/04lavoie.html, 2003.
[219] ET O'Neill, PD McClain, dan Lavoie BF, "Sebuah Metodologi untuk Sam-
pling World Wide Web, "Online Perpustakaan Pusat Komputer, http://
digitalarchive.oclc.org / da / ViewObject.jsp objid = 0000003447, 1998?.
[220] Oram A., Peer-to-Peer: Memanfaatkan Kekuatan Disruptive Technologies,
Sebastopol, CA: 2001 O'Reilly & Associates,.
[221] L. Page, S. Brin, R. Motwani, dan T. Winograd, "The PageRank Citation
Peringkat: Membawa Order ke Web, "Departemen Ilmu Komputer, Stanford
Universitas, laporan teknis 1999-66, 1999.
[222] TS Parikh dan ED Lazowska, "Merancang sebuah arsitektur untuk memberikan
mobile informasi layanan ke dunia berkembang pedesaan, "Proceedings of
WWW 2006, http://www2006.org/programme/files/pdf/5507.pdf, 2006.
[223] J. Parsons, P. Ralph, dan K. Gallagher, "Menggunakan waktu melihat untuk menyimpulkan
preferensi pengguna dalam sistem rekomendasi, "Proceedings of the AAAI
Lokakarya Semantic Web Personalisasi, http://maya.cs.depaul.edu/
~ Mobasher/swp04/accepted/parsons.pdf, 2004.
[224] K. Pastra dan Y. Wilks, "integrasi Visi-bahasa di AI: Sebuah cek realitas,"
Prosiding ECAI 2004, http://www.dcs.shef.ac.uk/ ~ yorick / makalah /
ecai04.pdf, 2004.
[225] J. Pathak, D. Caragea, dan VG Honovar, "komponen Ontologi-extended-
berdasarkan alur kerja: Sebuah kerangka untuk membangun workflow kompleks
dari semantik komponen perangkat lunak heterogen, "Proceedings of the
Lokakarya Internasional di Web Semantik dan Database (SWDB-04),
http://www.cs.iastate.edu/ ~ honavar/Papers/SWDB04.pdf, 2004.
[226] WD Perdue, "The totalitarianisme baru: Cyber-hegemoni dan global
sistem, "International Roundtable on Tantangan Globalisasi, http://
-p-o.org/perdue.htm, 1999.126 Referensi
[227] M. Perkowitz dan O. Etzioni, "situs adaptiveWeb Menuju: kerangka Konseptual-
kerja dan studi kasus, "Proceedings of the World Wide Web Conference ke-8,
1999.
[228] EL Peterson, "penemuan sumber daya Customized: Menghubungkan Web diformalkan
taksonomi dengan hub ontologi Web, "Proceedings of the Workshop AAAI
pada Semantic Web Personalisasi, http://maya.cs.depaul.edu/ ~ mobasher /
swp04/accepted/peterson.pdf, 2004.
[229] K. Petridis, F. Precioso, Athanasiadis T., Y. Avrithis, dan Kompatsiaris Y.,
"Gabungan domain spesifik dan multimedia ontologi untuk gambar mengerti-
pelatihan, "Risalah Lokakarya di Mixed-Realita sebagai Tantangan ke Image
Memahami dan Kecerdasan Buatan, Jerman Konferensi Artifi-28 pada
finansial Intelijen, http://www.image.ntua.gr/papers/384.pdf, 2005.
[230] F. Piper, Robshaw MJB, dan S. Schwiderski-Grosche, "Identitas dan
otentikasi, "dalam Trust dan Kejahatan dalam Masyarakat Informasi, (R. Mansell
dan BS Collins, eds), hal 91-112, Cheltenham:. Elgar Edward, 2005.
[231] G. Imam, "Paraconsistent logika," dalam Handbook of Philosophical Logic 2nd Edi-
tion vol.6, (DF Gabbay dan F. Guenthner, eds.), hal 287-393, Dordrecht:
Kluwer Akademik Publishers, 2002.
hommeaux [232] E. Prud 'dan A. Seaborne, eds., SPARQL Query Language untuk
RDF, 2005. http://www.w3.org/TR/rdf-sparql-query/.
[233] H. Putnam, "Yang dimaksud dengan" yang berarti "," dalam Pikiran, Bahasa dan Realitas:
Philosophical Papers Volume 2, hal 215-271, Cambridge: Cambridge-universitas
sity Press, 1975.
[234] CD Raab, "Masa depan perlindungan privasi," dalam Trust dan Kejahatan di
Masyarakat Informasi, (R. Mansell dan Collins BS, eds.), Hal 282-318,
Cheltenham: Edward Elgar, 2005.
[235] D. Rafiei dan A. Mendelzon, "Apakah halaman ini dikenal? komputasi web
reputasi halaman, "Proceedings of the World Wide Web Konferensi 9, 2000.
[236] L. Rainie, "Langsung Besar di Gunakan Search Engine," Pew Internet dan American Life
Proyek, http://www.pewinternet.org/pdfs/PIP SearchData 1105.pdf, 2005.
[237] L. Rainie, "Penggunaan Web Cams," Pew Internet dan American Life Project,
webcam http://www.pewinternet.org/pdfs/PIP use.pdf, 2005.
[238] L. Rainie dan M. Madden, "Podcasting Catches pada," Pew Internet & American
Life Project, http://www.pewinternet.org/pdfs/PIP podcasting.pdf, 2005.
[239] SD Ramchurn dan NR Jennings, "Percayalah kepada perangkat lunak berbasis agen," dalam Trust
dan Kejahatan dalam Masyarakat Informasi, (R. Mansell dan Collins BS, eds.),
hal 165-204, Cheltenham: Edward Elgar, 2005.
[240] R. Reiter, "Kesetaraan dan domain penutupan di database orde pertama," Jurnal
ACM, vol. 27, no. 2, hal 235-249, 1980.
[241] D. Resnick, "Politik di internet: The normalisasi dunia maya," dalam
Politik Cyberspace, (C. Toulouse dan Lukas TW, eds.), Hal 48-68,
New York: Routledge, 1998.
[242] Resnick P. dan R. Zeckhauser, "Percayalah di antara orang-orang asing di Internet transaksi-
tions: analisis empiris sistem reputasi e-Bay, "dalam The Ekonomi
Internet dan E-Commerce: Kemajuan dalam Microeconomics Terapan vol.11,
(Baye MR, ed.), Hal 127-157, Amsterdam: Elsevier Science, 2002.References 127
[243] M. Richardson, R. Agrawal, dan P. Domingos, "Trust manajemen
untuk Web Semantic, "Proceedings of the 2nd International Seman-
tic Web Konferensi, http://www.cs.washington.edu/homes/pedrod/papers/
iswc03.pdf, 2003.
[244] P. Rodriguez, S. Mukherjee, dan S. Rangarajan, "Sesi teknik tingkat
untuk meningkatkan kinerja browsing Web pada link nirkabel, "Proceedings of
World Wide Web Conference 2005, http://www2004.org/proceedings/
docs/1p121.pdf, 2004.
[245] O. Roy, global Islam: The Search for a New Ummah, New York: Columbia
University Press, 2004.
[246] J. Sabater dan C. Sierra, "MENYESAL: Sebuah model reputasi untuk SOCI bersahabat-
eties, "dalam Proceedings of 1 Bersama Konferensi Internasional Otonom
Agen dan Sistem Multi-Agen, (C. Castelfranchi dan L. Johnson, eds.),
hal 475-482, New York: ACM Press, 2002.
[247] P. Samuelson dan S. Scotchmer, "Hukum dan ekonomi reverse
teknik, "Yale Law Journal, vol. 111, hal 1575-1663, http://socrates.
berkeley.edu / ~ scotch / re.pdf, 2002.
[248] E. Sanchez, ed, Logika Fuzzy dan Web Semantic, Amsterdam:. Elsevier,
2006.
[249] S. Saroiu, KP Gummadi, R. Dunn, SD Gribble, dan HM Levy, "An anal-
ysis sistem pengiriman konten internet, "Proceedings Simposium 5
pada Sistem Operasi Desain dan Implementasi, 2002.
[250] C. Schindler, P. Arya, A. Rath, andW. Slany, "htmlButler - kegunaan wrapper
peningkatan melalui berbagi ontologi dan kerja sama skala besar, "Lanjutkan-
petunjuk untuk keselamatan dari Workshop Internasional tentang Adaptasi dan Dipersonalisasi Semantik
Web, Hypertext 2005, http://www.ru5.cti.gr/HT05/files/rath.pdf, 2005.
[251] Schraefel MMC, Shadbolt NR, N. Gibbins, H. Glaser, dan
S. Harris, "CS AKTive Space: Mewakili ilmu komputer di
Semantic Web, "Proceedings of WWW 2004, http://www.www2004.org/
proceedings/docs/1p384.pdf, 2004.
[252] R. Schroeder, Caldas A., G. Mesch, dan Dutton W., "Dunia Wide
Web of Science: Mengkonfigurasi akses terhadap informasi, "Proceedings of the
Konferensi Tahunan Pusat Nasional untuk e-Ilmu Sosial, http://
www.oii.ox.ac.uk/research/files/W3Sc ncess2005 kertas Schroeder.pdf, 2005.
[253] N. Schwartz, R. Cohen, D. ben-Avraham, A.-L. Barab 'ASI, dan S. Havlin, "Per-
colation dalam jaringan skala bebas diarahkan, "Fisika Review E, vol. 66, http://
www.wisdom.weizmann.ac.il/ ~ recohen / publikasi / directed.pdf, 2002.
[254] P. Seabright, perusahaan orang asing: Sebuah sejarah alam kehidupan ekonomi,
Princeton: Princeton University Press, 2004.
[255] J. Searle, "Pikiran, otak dan program," The Behavioral and Brain Sciences,
vol. 3, hlm 417-424, 1980.
[256] J. Seidenberg dan A. Rektor, "Web ontologi segmentasi: Analisis,
klasifikasi dan digunakan, "Proceedings of WWW 2006, http://www2006.org/
programme/files/pdf/4026.pdf, 2006.
[257] N. Shadbolt, W. Hall, dan T. Berners-Lee, "mengunjungi kembali Semantic Web,"
IEEE Intelligent Systems, hal 96-101, Mei / Juni 2.006,128 Referensi
[258] G. Shafer, "logika kausal," Proceedings of IJCAI-98, http://www.glennshafer.
com/assets/downloads/article62.pdf, 1998.
[259] C. Shirky, "adalah Ontologi dibesar-besarkan: Kategori, Link dan Tag," http://www.
shirky.com / tulisan / ontologi overrated.html, 2005.
[260] N. Simou, C. Saathoff, S. Dasiopoulou, E. Spyrou, N. Voisine, V. Tzouvaras,
I. Kompatsiaris, Y. Avrithis, dan S. Staab, "Sebuah infrastruktur ontologi untuk
multimedia penalaran, "International Workshop Sangat Rendah Bit-Rate Video
Coding, http://www.image.ntua.gr/papers/381.pdf, 2005.
[261] B. Skyrms, Evolusi Kontrak Sosial, Cambridge: Cambridge-universitas
sity Press, 1996.
[262] J. Slaney, "logika yang relevan dan paraconsistency," dalam Inkonsistensi Toleransi,
(L. Bertossi, Hunter A., dan Schaub T., eds.), Hal 270-293, Berlin: Springer,
2004.
[263] A. Sloman, "Diagram dalam pikiran,?" Dalam diagram Representasi
dan Penalaran, (M. Anderson, B. Meyer, dan Olivier P., eds.), London:
Springer-Verlag, 2001. http://www.cs.bham.ac.uk/research/cogaff/sloman.
diagbook.pdf.
[264] A. Smeaton, "link informasi Membuat dalam video digital sebagai sarana untuk dukungan-
navigasi video port efektif, "keynoteMultimedia Information Retrieval
Workshop, SIGIR 2003, http://km.doc.ic.ac.uk/mmir2003/1alansmeaton
wsmm03.pdf, 2003.
[265] B. Smith, "Melindungi konsumen dan pasar: Kebutuhan untuk makan-
eral privasi undang-undang, "pidatonya di Kongres Kaukus Internet,
http://www.netcaucus.org/speakers/2005/smith/privacyspeech.pdf, 2005.
[266] JF Sowa dan AK Majumdar, "penalaran analogis," dalam Konseptual Susunan-
membangun struktur untuk Pengetahuan Penciptaan dan Komunikasi, (A. de Moor, W. Lex,
dan Ganter B., eds), Berlin:. Springer, 2003. http://www.jfsowa.com/pubs/
analog.htm.
[267] J. Stanley dan Williamson T., "Mengetahui bagaimana," Journal of Philosophy, vol. 98,
hlm 411-444, 2001.
[268] L. Baja, "dinamika Semiotika untuk agen diwujudkan," IEEE Intelligent Systems,
hal 32-38, Mei / Juni 2006.
[269] H. St ¨ orrle, Model Perangkat Lunak Arsitektur: Desain dan Analisis Dengan UML
dan Petri Nets, Ph.D. Tesis, Universitas M ¨ unchen, 2000.
[270] K. Su, A. Sattar, G. Governatori, dan Q. Chen, "Sebuah komputasi beralasan
logika pengetahuan, kepercayaan dan kepastian, "Prosiding Internasional ke-4
Bersama Konferensi Agen Otonom dan Sistem Multi-Agen (AAMAS
2005), http://eprint.uq.edu.au/archive/00002328/01/p409-su.pdf, 2005.
[271] VS Subrahmanian, "Amalgamating basis pengetahuan," Transaksi ACM
pada Sistem Database, vol. 19, no. 2, hal 291-331, 1994.
[272] C. Sunstein, republic.com, Princeton: Princeton University Press, 2001.
[273] JBH Tan dan JSL Yong, "Banyak lembaga, satu pemerintahan - Singapura
visi pemberian pelayanan publik, "dalam E-Government di Asia: Mengaktifkan Publik
Inovasi layanan di Abad 21, (Yong JSL, ed.), Hal 267-308,
Singapore: Marshall Cavendish Bisnis, 2003.References 129
[274] P. Twomey, "Hei pemerintah, tangan dari internet," New Scientist, 12
Nov 2005.
[275] Uszok A., Bradshaw JM, M. Johnson, R. Jeffers, A. Tate, J. Dal -
ton, dan S. Aitken, "Kaos kebijakan manajemen untuk ser-Semantic Web
kejahatan, "IEEE Intelligent Systems, hal 32-41, http://www.aiai.ed.ac.uk/
project/ix/documents/2004/2004-ieee-is-uszok-kaos.pdf, Juli / Agustus 2004.
[276] WMP van der Aalst, "Pi kalkulus versus jala petri: Mari kita makan" kue rendah hati "
bukannya lebih lanjut penggelembungan "hype pi", "BPTrends, vol. 3, no. 5, hal 1-11,
http://is.tm.tue.nl/staff/wvdaalst/pi-hype.pdf, 2005.
[277] PC van Fenema dan F. Go, "masyarakat tersebar: col-Tenun
lective dan individu hidup, fakta dan fiksi, dimediasi dan langsung spasial
pengalaman, "Masyarakat dan Teknologi Konferensi, http://www.fbk.
eur.nl / ORANG / pfenema / pribadi /, 2003.
[278] J. Ossenbruggen van, L. Hardman, dan Rutledge L., "Hypermedia dan
Semantic Web: A agenda penelitian, "Jurnal Digital Informasi, vol. 3,
no. 1, http://jodi.ecs.soton.ac.uk/Articles/v03/i01/VanOssenbruggen/, 2002.
[279] J. van Ossenbruggen, G. Stamou, dan JZ Pan, "Multimedia annota-
tions dan Semantic Web, "Workshop Semantic Web Studi Kasus
dan Praktik Terbaik untuk eBusiness, International Semantic Web Conference,
http://homepages.cwi.nl/ ~ media/publications/SWCASE05.pdf, 2005.
[280] Rijsbergen van CJ, "Evaluasi," dalam Informasi 2nd Edition Retrieval,
1979. online buku, http://www.dcs.gla.ac.uk/Keith/Chapter.7/Ch.7.html.
[281] HR Varian, "Persaingan dan kekuatan pasar," dalam The Ekonomi Infor-
mation Teknologi: Sebuah Pengantar, (HR Varian, J. Farrell, dan C. Shapiro,
eds), hlm 1-47, Cambridge:. Cambridge University Press, 2004.
[282] JM Vidal, P. Buhler, dan C. Stahl, "sistem multiagen dengan pekerjaan-
mengalir, "IEEE Internet Computing, hal 76-82, http://jmvidal.cse.sc.edu/
papers/vidal04a.pdf, Januari / Februari 2004.
[283] R. Volz, S. Handschuh, S. Staab, L. Stojanovic, dan N. Stojanovic, "selubung-
ing pengantin idden: Deep anotasi untuk pemetaan dan migrasi warisan
data ke Semantic Web, "Journal of Web Semantik, vol. 1, no. 2,
http://www.websemanticsjournal.org/ps/pub/2004-15, 2004.
[284] DJ Watts dan SH Strogatz, "dinamika Kolektif" kecil dunia "net-
bekerja, "Nature, vol. 393, hal 440-442, 1998.
[285] G. Weimann, Teror di Internet: Arena Baru, Tantangan Baru,
Washington: United States Institute of Peace, 2006.
[286] Weitzner DJ, "Kesaksian Sebelum Komite Senat Amerika Serikat
di Commerce, Sains dan Transportasi, "http://www.w3.org/2000/05/25-
Senat-Privasi-Testimony.html, 2000.
[287] Weitzner DJ, J. Hendler, T. Berners-Lee, dan D. Connolly, "Membuat
Kebijakan-Aware Web: Discretionary, akses berbasis aturan untuk World Wide
Web, "dalam Keamanan Web dan Informasi, (E. Ferrari dan B. Thuraising -
ham, eds), Hershey PA:. Group Ide Inc, 2005. http://www.mindswap.org/
users/hendler/2004/PAW.html.130 Referensi
[288] WGIG, "Laporan Kelompok Kerja tentang Pemerintahan Internet,"
http://www.wgig.org/docs/WGIGREPORT.pdf (tersedia dalam beberapa
bahasa dan format dari http://www.wgig.org/, 2005.
[289] Y. Wilks, "Ontotherapy, atau cara berhenti mencemaskan apa yang ada," dalam
Representasi Pengetahuan Dengan ontologi: Tantangan Present, Future-Pos
jawabnya, (C. Brewster dan K. O'Hara, eds.), International Journal of Human-
Ilmu Komputer, 2006.
[290] Y. Wilks, "The Semantic Web sebagai pendewaan dari anotasi, tapi apa
adalah semantik nya?, "di tekan. http://www.dcs.shef.ac.uk/ ~ yorick / makalah /
AAAI Paper.pdf.
[291] L. Wittgenstein, Philosophical Investigations, Oxford: Blackwell Basil, 1953.
[292] L. Wittgenstein, Keterangan tentang Yayasan Matematika 3rd Edition,
Oxford: Blackwell Basil, 1978.
[293] K. Yanai dan K. Barnard, "Probabilistik Web mengumpulkan gambar," Lanjutkan-
petunjuk untuk keselamatan dari SIGMM ACM 7th International Workshop Multimedia Infor-
mation Retrieval (MIR 2005), http://kobus.ca/research/publications/ACM-
MM-MIR-05/Yanai-Barnard-ACM-MM-MIR-05.pdf, 2005.
[294] B. Yuwono dan D. Lee, "algoritma Cari dan peringkat untuk menempatkan sumber daya
di World Wide Web, "Prosiding Konferensi Internasional ke-12
pada Data Teknik, 1996.
[295] L. Zadeh, "Dari search engine untuk sistem pertanyaan-menjawab - prob the-
memiliki kualifikasi pengetahuan dunia, relevansi, deduksi dan precisiation, "Keynote2005
IEEE Konferensi Internasional tentang Reuse Informasi dan Integrasi,
http://www.cs.fiu.edu/IRI05/, 2005.
[296] J. Zhang, J.-Y. Chung, CK Chang, dan Kim SW, "WS-Net: A Petri-net
spesifikasi model berbasis layanan Web, "Proceedings of IEEE Interna-
Konferensi internasional Web Services (ICWS '04), 2004.
[297] D. Zhou, E. Manavoglu, J. Li, CL Giles, dan H. Zha, "Probabilis-
model tic untuk menemukan e-komunitas, "Proceedings of WWW 2006,
http://www2006.org/programme/files/pdf/1016.pdf, 2006.
[298] M. Zhou dan Venkatesh K., Pemodelan, Simulasi dan Pengendalian Fleksibel
Sistem Manufaktur: Pendekatan Bersih Petri, Singapore: World Scientific
Publishing, 1999.
[299] H. Zhuge, L. Zheng, N. Zhang, dan X. Li, "Sebuah otomatis Semantic hubungan-
kapal pendekatan penemuan, "presentationWorld poster Wide Web Konferensi

Baru! Klik kata di atas untuk melihat terjemahan alternatif. Singkirkan
Google Terjemahan untuk:PenelusuranVideoEmailPonselObro

uTha

Senin, 06 Juni 2011

Ilmu Kerangka Jaringan

Arsip Blog

Mengenai Saya