Sa{a Madacki Mogu}nosti lociranja Bosniacae na online dostupnim katalozima (Online Public Access Catalogues) na World Wide Webu : eksperiment |
Napomena korisnicima: Nakon uèitavanja ovog dokumenta izaberite opciju na meniju Options / Document encoding / Central European (ISO 8859-2) da bi dokument bio ~itljiv sa dijakriti~kim znacima.
Predgovor | Go top |
* |
Cilj ovog rada je istra`iti mogu}nosti lociranja Bosniacae na online dostupnim katalozima na World Wide Webu. Kako je Nacionalna i univerzitetska biblioteka BiH izgorila, a samim tim i njen katalog, javila se potreba za novim na~inom identificiranja izvora koji sadr`e podatke od neophodne za rekonstruisanje fonda gra|e objedinjene pod zajedni~kim nazivom Bosniaca. Ovaj rad nema ambicija da pru`i sve odgovore vezane za tu problematiku, nego da prezentira rezultate eksperimentalnih pretra`ivanja online kataloga {irom svijeta - sa svih pet kontinenata, sa ciljem otkrivanja mogu}nosti za potpuno rekonstruiranje u budu}nosti. Kako su ovakva istra`ivanja , za {iru populaciju bila nemogu}a prije nekoliko godina, danas je svim korisnicima Mre`e omogu}eno online pretra`ivanje ne samo kataloga nego i informacionih resursa najrazli~itijih tipova i oblika. Stoga smo smatrali za shodno dati pregled razvoja informacionih sistema sa bazama podataka od prvih za~etih u {ezdesetim godinama, do globalne mre`e zvane Internet danas u 1997. godini. Obratili smo pa`nju i na na~in funkcionisanja te globalne mre`e, kao i protokole na kojima se zasniva njen rad. Pored ovog prezentirali smo osnovne naznake fenomena zvanog World Wide Web, kao i jezik kojim se pi{u Web dokumenti - HTML. Nakon ovog uvodnog dijela dati su kako ciljevi ovog eksperimenta, tako i njegova metodolo{ka postavka, te rezultati i dnevnik rada. |
Historija online baza podataka ili ideja referalnosti od Teophrasta Renaudota do LCESS LCESS Library of Congres Experimental Search System | Go top |
1 |
U informati~kom smislu na{e je doba, doba online pretra`ivanja sa novim generacijama ra~unarskih sistema i korisnika. Danas (1) imamo oko 6 miliona korisnika consumer online servisa, kao {to su America Online, CompuServe i Prodigy, te desetine miliona korisnika globalne mre`e zvane Internet. Online informacije i sistemi koji ih nude su postali mjesta koja nam daju vi{e ¹ansi za uspjeh u pronala`enju informacije nego klasi~ni nosioci informacija u pro{losti. Danas se nalazimo usred onoga {to mo`emo nazvati tre}a generacija online-a. Prva generacija online-a je vezana za po~etak osamdesetih kada su korisnici koristili "nijeme" terminale, brzina transmisije podataka je bila izuzetno mala, baze podataka su bile mahom bibliografskog karaktera, intermedijarni korisnici su koristili komercijalne baze podataka, kao npr. DIALOG. Druga generacija, od 1982 do 1991, po~ela je sa PC-jima, brzina transmisije podataka je pove}ana, pored bibliografskih pojavile su se i ASCII full-text baze podataka. Specijalizirani krajnji korisnici (sepecialized end users) su se pridru`ili intermedijarnim, ali su krajnji korisnici uop{te (general end users) bili rijetki. Komercijalni online servisi koegzistiraju sa CD ROM bazama. Sada, tre}u generaciju karakterizira multimedija (multimedia PCs), izuzetna brzina transmisije podataka, a pored ASCII pojavile su se i slikovne baze podataka (ASCII and image full-text databases). Broj komercijalnih online servisa je svakim danom u porastu, a zastupljeni su skoro svi tipovi korisnika (consumer end users, intermediaries, specialized end users). Èetvtra generacija dolazi uskoro. |
2 |
Ovaj mali uvod tretira historiju toka informacije zadnjih dvadesetak godina, no bitka za pravovremeno dostavljanje informacije po~ela je davno. "Koliko ~esto i koliko brzo dolaze va`ni dokumenti do pojedinih korisnika u nekom dru{tvu, toliko je realnija mogu}nost da ti korisnici adekvatnije i pripremljenije utje~u na razvoj svog dru{tvenog sistema" (2). Otuda je vrlo jasno za{to su prvi izvori tj. nosioci informacije u vidu glinenih plo~ica slu`ili vrlo uskom krugu korisnika - bile su nepodesne za transport. Nekada je i njihova lokacija bila "nepodesna". Drevni korisnici su od biblioteke do biblioteke putovali danima, pa i mjesecima po nesigurnim krajevima da bi do{li do npr. Nippurske biblioteke. I gabarit kataloga je bio nepodesan, nije se mogao evakuisati pred najezdom ratobornih susjeda. Tako je na protok informacije u Mezopotamiji stavljena ta~ka prilikom prodiranja Aka|ana. Mezopotamska kultura u vremenu u kojem je pro`ivljavala jedan od svojih najve{ih procvata najezdom semitskih Amorejaca do`ivljava propast. Kasnije, diseminacija papirusa vr{ena je - brodovima. Prili~no nesigurno zar ne? Online je ~ini se najsigurniji metod no na njega }e se pri~ekati koji milenij. Tada se na tra`enu informaciju ~ekalo jako dugo, no ona nije morala biti sasvim pouzdana. |
3Danko Plevnik, op.cit., str. 47 |
Bilo je dakle potrebno na jednom mjestu sakupiti podatke o izvorima informacija, o osobama, institucijama i publikacijama koje mogu pru`iti zadovoljavaju{i odgovor korisnicima. Bilo je vrijeme da se rodi ideja referalnosti. Ovu ideju }e u vidu prvog referalnog centra (ili bar njegove prete~e) realizirati Teophrast Renaudot 1612. godine. On je kreirao svojevrsni referalni centar u vidu posredovnog zavoda namijenjenog trgovcima, a prvi pravi referalni centar nasta}e 1963. godine u Kongresnoj biblioteci.(3) |
Baze podataka - pogled u pro{lost | |
4 5 6 |
Sedamdesetih godina na{eg stolje}a postojalo je oko 300 baza podataka, a danas rukovode}i se podacima koje pru`a Gale Directory of Databases postoji oko 9000 baza na oko 1700 sistema.(4) Tome svakako treba pridodati desetine hiljada izvora dostupnih na nekoliko hiljada Internet site-ova. No zapitajmo se kada je sve to po~elo? Put ka kontroli informacijske entropije po~eo se graditi {ezdesetih godina. Prve korake vezane za formiranje baza podataka u~inili su veliki ameri~ki sistemi koji su poslje prerasli u svjetske gigante na polju baza podataka. Te temelje su postavili NLM (National Library of Medicine), Lockheed i SDC (System Development Corporation) (5). National Library of Medicine 1960. godine po~inje sa dzajniranjem MEDLARS-a (Medical Literature Analysis and Retrieval Systems), a ~etiri godine kasnije zapo~inje sa pretra`ivanje na serijski ili grupni na~in. Prvi veliki servis dostupan javnosti je otvoren. No kada su pretra`ivanja baze u pitanju, javljao se problem tehni~ke prirode: moralo se ~ekati da se akumulira dovoljan broj pitanja (grupno pretra`ivanje) jer je bilo skupo (samim tim i nezamislivo) ulaziti u bazu zbog jednog pitanja .(6) Kongresna biblioteka u Va{ingtonu 1969 godine ~ini dostupnom svoju MARC (Machine Readable Cataloguing) bazu knjiga. dizajniranje ove baze, odnosno ovakve strukture zapisa omogu}ilo je stvaranje bibliografskog opisa u ma{inski ~itljivoj formi. Ovo je ponukalo i druge velike biblioteke da se uklju~e u rad sa kompjuterima. MARC format se modificira {to rezultira dizajniranjem UNIMARC-a (Universal MARC) koji olak{ava internacionalnu razmjenu podataka. Osam godina kasnije, 1977 otvoren je najve}i servis u SAD-u, OCLC (prvobitno Ohio College Library Center, potom Online Library Computer Center). Prvobitno kreiran iz dva razloga: podjela fondova i smanjenje bibliote~kih tro{kova u 50 akademskih biblioteka dr`ave Ohio, danas 20 godina kasnije predstavlja}e jedan od najmo}nijih online servisa dostupan na Internetu (http://www.oclc.org). |
7 8 |
Ve}ina prvih baza podataka bile su finansirane od strane vlade i vladinih organizacija u SAD.U po~etku kreirane zbog jednog zadatka, a u na{e vrijeme dobi}e naj{riru primjenu. Prve baze o kojima smmo govorili (DIALOG kompanije Lockheed i ORBIT SDC-a) realizirane su kroz ugovore sa Nacionalnom agencijom za svemirska istra`ivanja NASA-om i Ministarstvom odbrane SAD (US Department of Defense). Ovaj rani uspjeh vladinih eksperimenata i prihvatanje baza podataka u informacijskom dru{tvu utemeljilo je legitimnost medija (7). Sada se po~inju razvijati i baze iz dru{tvenih nauka. Online baze podataka su se izborile za svoje mjesto u dru{tvu startaju}i kao numeri~ke baze podataka, da bi preko bibliografskih i baza punog teksta "prerasle u gigantske resurse iz kojih je svakodnevno mogu}e crpsti znanja"(8) |
Internet | Go top |
* |
Stolje}ima su korisnici posje}ivali biblioteke i athive da bi do{li do gra|e potrebne za njihova istra`ivanja. njihov prvi korak bio je tra`enje pomo}i bibliotekara i arhivista koji su ih upu}ivali na kataloge i druge {tampane vodi~e. Nekada je istra`ivanje bilo ograni~eno na gra|u dostupnu samo u okviru neke institucije. Bilo je potrebno mnogo putovati da bi se do{lo do `eljene informacije. Pojavom off line sistema baza podataka, stvar je donekle ubla`ena, ali se moralo ~ekati na grupna pretra`ivanja i na slanje rezultata po{tom. | ||||||||||||||||||||||
9 |
Kako su posljednjih godina bud`eti smanjeni, a tro{kovi istovremeno pove}ani, biblioteke i arhivi su bili prisiljeni da sklope savez {to im je pru`ilo ve}e mogu}nosti pristupa institucijama sa velikim koli~inama gra|e. Ispostavilo se da je u datom momentu povezivanje postalo va`nije od davanja publiciteta vrijednim kolekcijama. Ovaj vid kooperacije je potpomognut online bazama podataka, koje su se pojavile u proteklih desetak godina, a koje su stavljene na raspolaganje putem Interneta. Danas istra`iva~i imaju "svijet na vrhovima prstiju", odnosno sa svog ra~unara (za koji se pretpostavlja da je u mre`i), ne gube}i vrijeme na putovanja zbog pretra`ivanja kataloga i drugih {tampanih vodi~a. Danas je ve}ina informacija dostupna online, a istra`iva~i uz pomo} sre|enih online kataloga postaju korisnici "virtualnih biblioteka"(9) . Me|utim, kao {to je slu~aj i sa prvim bazama podataka, nije sve oduvijek bilo komforno kao danas: Internet pubovi, barovi, Internet u hotelima, bibliotekama itd. Internet kao svjetska mre`a ra~unara, koja je povezana uzu pomo} TCP/IP protokola prdukt je na{eg vremena. Za~eci ovog, spravom mo`emo re}i fenomena, vezana je za {ezdesete godina na{eg stolje}a. | ||||||||||||||||||||||
10 Su{anj Dario, Dragan Petric: Velika knjiga o World Wide Webu, Znak, Zagreb, 1996, str.4. 11 Oleg Ma{truko, op.cit.; vidi i Wallace, Brian (et.al.): Museums and the Internet: A Guide for the Interpid Traveler, Museum News, Jul/Aug 1994, p.32-35. |
Godine 1969. (10) Ameri~ko ministarstvo odbrane (Department of Defense) je u "nedostatku bolje ideje" odlu~ilo ulo`iti novaz u razvoj svoje nove mre`e. Projekat je povjeren Agenciji za napredna istra`ivanja (Advanced Research Project Agency), ARPA, po kojoj ta nova mre`a i dobija ime ARPANET (11). Ova mre`a se smatra prete~om dana{njeg Interneta. | ||||||||||||||||||||||
12 host Ra~unar uklju~en u mre`u koja koristi TCP/IP. Pod hostom se podrazumijeva serverski ra~unar koji je na mre`i 24 sata dnevno, koji podacima poslu`uje ra~unare-klijente. Host ra~unari obi~no rade po UNIX-om. |
Prvi ~vor (host ) ove mre`e nastaje na Kalifornijskom univerzitetu u Los Angelesu (UCLA). (12) Sama mre`a bila je zasnovana na tada novoj tehnologiji paketnog prespajanja. Stvoren je protokol kojim se paketi prenose mre`om i nazvan je Internet Protocol (IP). Internet u tom momentu nije bilo ime mre`e, nego je taj pojam bio skra}enica od internetworking, tj. povezivanje mre`a, te je IP bio protokol za povezivanje mre`a. Ono {to je bilo najva`nije , time je omogu}eno da me|usobno mogu komunicirati razli~iti tipovi kompjutera. U po~etku ARPANET je povezivao ~etiri institucije. | ||||||||||||||||||||||
13 Podaci iz 1996. godine 14 Oleg Ma{truko: Internet za Windows 95, Znak, Zagreb, 1995. |
| ||||||||||||||||||||||
* |
| ||||||||||||||||||||||
15 Oleg Ma{truko, op.cit. str 12. |
Kod ovih brojeva hostova potrebno je obja{njenje. kako smo ve} ranije napomenuli pod hostom se podrazumijeva ra~unar koji je 24 sata priklju~en na Internet i koji opslu`uje ra~unare-klijente. Broj krajnjih korisnika, dakle ra~unara koji se povremeno spajaju na internet je oko 50.000.000 (15) |
Kako radi Internet | Go top |
TCP/IP |
TCP/IP protokoli su zbir prilagodljivih protokola za mre`nu komunikaciju, a na njima po~iva cijeli Internet, dakle TCP/IP je temelj Interneta. Ovaj zbir protokola je star nekih 30-tak godina - ve} je od samih po~etaka bio osnovni protokol ARPANET-a i NSF-neta. TCP/IP je ime izvedeno iz imena dvaju protokola: TCP (Transfer Control Protocol), odnosno protokol za nadziranje prijenosa podataka i IP (Internet Protocol). Oba se koriste u komunikaciji dvaju ra~unara na Internetu. Kako smo naveli da je TCP/IP zbir protokola nave{}emo nekoliko najva`nijih koji su uklju~eni u paket TCP/IP. Protokoli iz ove skupine rade na svim nivoima, osim na najni`em gdje se nalazi samo hardver i odabrano mre`no rje{enje povezivanja ra~unara. Navedimo neke protokole: |
IP |
Protokol IP je odgovoran za osnovno povezivenje kompjutera. Osnovni dio ovog protokola rukuje sa mre`nim adresama. IP prenosi UDP i TCP pakete preko mre`e. UDP (User Datagram Protocol) je TCP/IP protokol koji {alje podatke mre`om pomo}u IP protokola. Za razliku od TCP-a UDP nejam}i pouzdan prijenos paketa. Svaki ra~unar na Internetu ima svoju jedinstvenu numeri~ku adresu, a zadatak IP protokola je slanje paketa na tako adresirane kompjutere. IP adresa je slu`bena oznaka ra~unara na Internetu. TO je 32-bitni broj, podijeljen na ~etiri 8-bitna dijela odvojena ta~kom. Svaki od ~etiri 8-bitna dijela IP adrese mo`e biti broj od 0 do 255. |
TCP |
TCP je odgovoran za stizanje paketa na ispravno mjesto u mre`i i da sadr`ina paketa bude ispravno prenesena, a ako su podaci bili podijeljeni u vi{e paketa da budu ispravno rekonstruirani iz sastavnih dijelova nakon primanja. Dakle, provjera ispravnosti i numerisanje paketa su dva najva`nija svojstva TCP-a. On je na vi{em nivou od IP-a jer on koristi IP da bi podatke prenosio mre`om. Princip rada je sljede}i: TCP od neke aplikacije ili protokola vi{eg nivoa dobiva niz podataka, koje treba odaslati na neko drugo, udaljeno mjesto na mre`i. TCP zatim fragmentira taj niz u pakete veli~ine 64 Kb, {to je maksimalna dozvoljena veli~ina datagrama koje koristi protokol IP. Nakon toga IP opet mo`e fragmentirati pakete da bi ih prilagodio du`ini datagrama koja se koristi na mre`i (576 bytova ili vi{e), kao i mre`nim uslovima. Nakon dolaska paketa do destinacije, dakle drugog ra~unara, IP iz primljenih datagrama ponovo po~inje stvarati po~etni TCP-ov paket, a TCP potom iz njega izdvaja informacije koje proslje|uje protokolu vi{eg nivoa, s kojim se zapravo i komunicira. |
ICMP |
Kako IP nema ugra|ene mehanizme za otkrivanje gre{aka, razvijen je ICMP. Sastavni je dio IP protokola i mo`e otkriti probleme tipa nemogu}nosti pristupa ra~unaru, nemogu}nost isporuke paketa i sli~no. |
ARP |
Ovaj protokol je usko povezan sa IP-om. Kako IP "zna" adresu ra~unara kojem treba poslati poruku, ARP je du`an prona}i udaljeni ra~unar na mre`i. |
RARP |
Ukoliko je poznato koji nam ra~unar {alje poruke, a potrebno nam je saznati i njegovu IP adresu, du`nost RARP protokola je da je utvrdi. |
RIP |
RIP je protokol koji se koristi za preusmjeravanje paketa mre`om. Njemu je uvijek poznata odredi{na IP adresa , zbir potrebnih koraka mre`om za preno{enje paketa do nje, IP adresu odredi{nog ra~unara, kao i vrijeme koje je paket proveo na putu. |
FTP |
FTP protokol je protokol koji prenosi binarne ili tekstualne datoteke mre`om, a iza ovog akronima se krije i osnovna mre`na usluga. |
TFTP |
TFTP predstavlja skresanu verziju FTP-a, sli~no kao relacija UDP - TCP. |
SMTP |
SMTP prenosi elektronsku po{tu (E-mail) izme|u ra~unara zasnovanih na Unixu. Ovaj protokol je razvijen za preno{enje 7 - bitnih ASCII znakova. |
* |
Pored ovdje pobrojanih protokola jedan }emo psebno razmotriti, a rije~ je o Z39.50 Information Retrieval Protocol-u. To je protokol koji bi, bar kada je rije~ o bibliotekarstvu, trebao donijeti izuzetne promjene. To je protokol koji dozvoljava klijentovoj aplikaciji da propituje baze podataka na udaljenim ra~unarima, da dobije rezultate pretra`ivanja, kao i ostale funkcije vezane za pretra`ivanje informacija. |
Z39.50 Information Retrieval Protocol | Go top |
16 |
Rapidni rast razli~itih informacionih resursa u mre`nom okru`enju (Internet), zapo~et u ranim devedesetim, vrlo brzo se nastavlja. Internet sada predstavlja masivni agregat heterogenih, autonomno vo|enih informacionih resursa. Bez automatizirane podr{ke za otkrivanje, lociranje i upotrebu tih resursa, korisnik bi bio pretrpan njihovim enormnim brojem, kao i razli~ito{}u koja vodi entropiji. Prije nego pre|emo na opisivanje novog protokola, potrebno je naglasiti neke trenutne probleme na Mre`i, a koje su naprijed ovla{ pomenute. Naime problemi koji se sada javljaju direktno uti~u na kakvo}u, te brzinu pretra`ivanja (16):
Ovaj protokol (Z39.50), ~ini se ima mogu}nosti da rije{i ove probleme. Razvijanje ovog protokola po~elo je u ranim 80-im, a verzija koja je danas korisnicima na raspolaganju je ~etvrta po redu, ~iji je razvoj po~eo u jesen 1995. godine. Iako je do`ivio ~etiri modifikacije, i kao takav prilago|en korisnicima ~iji je posao informacija, nije u velikoj mjeri implementiran. |
17 |
U stvari, Z39.50 je ameri~ki nacionalni standard za pretra`ivanje informacija (information retrieval), koji je formalno poznat kao ANSI/NISO Z39.50 - Information Retrieval (Z39.50): Application Service Definition and Protocol Specification (17). Ovaj standard precizira set pravila i procedura za pona{anje dva ra~unara (sistema) koja komuniciraju u svrhu pretra`ivanja baza podataka (database searching) i informacija (information retrieval). Kao mre`ni standard (network application standard), Z39.50 je otvoreni standard koji omogu}ava me|usobnu komunikaciju dva udaljena ra~unara sa razli~itim hardwareom i softwareom. Kao {to je poznato, svaka baza podataka instalirana na nekom od sistema ima svoju sintaksu za ppostavljanje korisni~kog upita, te je neophodno poznavati komandni jezik (command language), te procedure za pretra`ivanje da bi se dobio `eljeni rezultat. Prednost ovog protokola je {to pojednostavljuje proces pretra`ivanja, omogu}avajuæi korisniku da koristi svoj korisni~ki interfejs na lokalnom sistemu u svrhu pretra`ivanja kako lokalnih baza, tako imonih na udaljenim (remote) sistemima. Ovoaj protokol se bazira na klijent/server modelu. U ovom modelu dva ra~unara stupaju u interakciju na istom nivou (peer-to-peer relation). Koriste}i se Z39.50 terminologijom, klijent se naziva origin a server target. Klijent i serve komuniciraju via Z39.50 protokola na sljede}i na~in: |
_____________________________________
User
interface (korisni~ki
interfejs)
_____________________________________
User application
(aplikacija)
_____________________________________
Client
(klijent)
_____________________________________
ō
_____________________________________
Server
_____________________________________
Database
application (Program
baze)
_____________________________________
Database
_____________________________________
Shema preuzeta iz: Dempsey, Lorcan (et.al.): Towards distributed library systems:Z39.50 in a European context, Program, Vol.30,No 1, January 1996., p.2
* |
Princip komunikacije je sljede}i: istra`iva~ unosi upit (querry) koriste}i set menija i komandni jezik svog sistema. Z39.50 origin modul lociran na lokalnom sistemu prevodi querry na standardizirani format definiran Z39.50 protokolom i {alje ga na sistem sa bazom podataka na Z39.50 target-u. Target prezentira komande i search querry bazi podataka, te vra}a rezultate pretra`ivanja u standardiziranom formatu origin sistemu koji je inicirao pretra`ivanje. Jedna od glavnih prednosti kori{tenja Z39.50 protokola je ta da istra`iva~ ne mora biti upoznat sa detaljima standarda. Origin modul unutar istra`iva~evog sistema je odgovoran za uspostavljanje veze sa target sistemom, formuliranje querry-a prema standardu, te interpretiranje rezultata u formatu bliskom istra`iva~u. Z39.50 metod za informaciona pretra`ivanja je radikalno druga~iji od tradicionalnih metoda obi~no primjenjenih u pretra`ivanju baza podataka, pri ~emu istra`iva~ koristi lokalni terminal ili kompjuter prijavljen na udaljeni sistem, podrazumijevaju}i da tada koristi jedinstvene menije i komandni jezik tog sistema. Ovo zahtijeva obuku i stru~no usavr{avanje u jedinstvenim odlikama svakog sistema na kojem se `eli imati izuzetno uspje{na pretra`ivanja. Implementacijom Z39.50 protokola (standarda) elimini{e se potreba za takvim vidom usavr{avanja za kori{tenje velikog broja razli~itih sistema. |
* |
Z39.50 ne postavlja samo standard za razmjenui "poruka" izme|u origin i target sistema, nego i za strukturu i semantiku querry-a, vr{i slaganje poruka (odnosno odre|uje slijed poruka) i za mehanizme za povrat zapisa (records). Pravila i procedure definirane sa Z39.50 standardom omogu}avaju podignutim na razli~itim hardware-ima koji koriste razli~ite software-ske pakete da stupe u sadejstvo radi izvr{enja brojnih zadataka koji se odnose na pretra`ivanje informacija. Z39.50 mo`e biti upotrijebljen u {irokom spektru bibliote~kih funkcija koje zahtijevaju pretra`ivanje baza podataka, od katalogizacije do me|ubibliote~ke pozajmice i referalne djelatnosti. Mo`e biti kori{ten kako za pretra`ivanje bibliografskih baza podataka, tako i za druge vrste baza poput full text i image databases. |
World Wide Web (WWW) | Go top |
* |
Kako je Internet razvijan uglavnom u akademskim i vojnim krugovima, nikada nije svojim korisnicima nudio udobno okru`enje. Rad na mre`i podrazumijevao je poznavanje obilja kompliciranih naredbi. One su se pisale u Unixu, a za svaki klijentski program koji je pristupao nekoj Internet usluzi bilo je potrebno pamtiti desetine naredaba. Usljed svih tih "nedostataka" sistema bilo je vrijeme da se napravi aplikacija koja }e prevazi}i te probleme i ponuditi korisniku friendly pristup. |
18 |
U jesen 1989. godine ro|ena je ideja iz koje se razvio World Wide Web. U to doba jo{ uvijek nije postojala "navala" ku}nih i malih korisnika na Mre`u - ali je nau~nicima i ostalim "privilegovanim" koji su imali pristup "dosadilo" pisati tekstualne naredbe, jer je takav na~in rada sam po sebi djelovao ograni~avaju}e. Tim Berners-Lee iz CERN-a (18) u ©vajcarskoj sa svojim timom predlo`io je stvaranje hipertekstualnog ssistema koji }e omogu}iti jednostavnu razmjenu informacija me|u stru~njacima iz cijelog svijeta. Oni su kreirali novi protokol HTTP (Hyper Text Transfer Protocol) koji je standardizirao komunikaciju izme|u servera i klijenta. Krajem 1990. godine, po~eo se razvijati i sam projekat World Wide Weba, dok je u prolje}e sljede}e 1991. godine zavr{enopisanje prvog pretra`iva~kog programa za WWW, (sa jednostavnim imenom www), koji je slu`beno pu{ten u promet 1992. godine. Krajem te iste 1992, postojalo je oko 50-ak servera za WWW u svijetu. Po~etkom 1993. godine nastao je prvi grafi~ki pretra`iva~ki program za X Windowsw MOSAIC. Napisao ga je Marc Andersen iz NCSA u Èikagu, koji je tako|er razvio i jedan od najkori{tenijih programskih alata za www browsere - Netscape Navigator. |
* |
WWW omogu}uje prijenos slika, teksta, animacija, zvukova, dakle prakti~no svega - ali po prvi puta u historiji svi ti elementi su mogli biti integrisani u jedinstven dokument. Upravo je ta inovacija u~inila WWW tako popularnim i izvan istra`iva~kih krugova. Dakle za izuzetnu popularnost www-a mo`emo "kriviti" dvije tehnologije: multimediju i hipertekstualnost. |
Pristupanje dokumentima na WWW | |
19 URL Jednozna~ni lokator resursa |
Da bi se moglo pristupiti nekom dokumentu na udaljenom ra~unaru potrebno je znati ime ra~unara na kojem se nalazi, direktorij u kojem je smje{ten, kao i naziv datoteke. Osim ovih parametara, ponekad je za kori{tenje nekih Internet usluga potrebno navesti i broj porta (ukoliko se usluga izvr{ava na nestandardnom portu). Da bi ovakvo lociranje bilo {to jednostavnije osmi{ljen je sistem URL-a (Uniform Resource Locator) (19) , {to bi zna~ilo adresu kojom je jedinstveno ukazano na neki resurs na mre`i. URL je {ema za preciziranje, odnosno specifikaciju Internet resursa izra`ena u jednoj liniji (single line) sastavljena od ASCII karaktera. Ova {ema sadr`avasve va`nije Internet protokole uklju~uju}i FTP, Gopher, HTTP i WAIS. Jedan je od osnovnih alata na Webu, a koristi se i unutar samog HTML dokumenta za odre|ivanje mete (target) hypertext linka. Ovdje je isto tako bitno naglasiti da URL {ema nije ograni~ena samo na WWW. URL sadr`i sljede}e informacije:
|
* |
Na primjer: http://www.nlc-bnc.ca/ifla/VI/5/op/udtop3.htm Protokol Ime hosta Direktorij... Ime datoteke ili ukoliko je potrebno ime porta onda {ema izgleda ovako: http: //www.address.edu :8080 /path/subdir/file.ext Protokol Ime hosta port Direktorij i ime datoteke |
* |
Ukoliko je rije~ o telnet protokolu onda {ema URL-a mo`e imati dva na~ina: telnet://flober.rodent.edu ili telnet://username:password@flober.rodent.edu Ovo su bili primjeri potpunog ili apsolutnog URL-a, pored kojeg postoji djelomi~ni ili relativni URL. Kao {to je gore navedeno apsolutni URL navodi sve parametre, me|utim pristup je osiguran ako se navede samo ime hosta. Tada obi~no dolazimo do Home Page-a. Me|utim relativni URL mo`e sadr`ati destinaciju unutar servera, pa ako navedemo URL /ifla/rode.htm onda }e Web browser tu adresu protuma~iti relativno u odnosu na trenutno prikazani dokument. Protokol, ime ra~unara i svi ostali parametri koji se navode u URL-u ostaju isti kao i za dokument koji je trenutno aktivan. Ako relativni URL kre}e sa kosom crtom, zna~i da direktoriji kre}u od korijenskog. |
HTML (Hyper Text Markup Language) | Go top |
* |
HTML je po definiciji jezik koji se koristi za grafi~ki opis stranice na World Wide Webu. Izvedenica je od op}enitijeg jezika SGML (Standard Generalized Markup Language), odnosno, HTML predstavlja prakti~nu primjenu SGML-a. Slobodno se mo`e re}i da je HTML "maternji" jezik Weba. S njim se odre|uje formacija, sadr`aj i funkcija nekog hipertekstualnog dokumenta. HTML-om se kombinira nekoliko va`nih elemenata:
U su{tini markup language je (samo) kolekcija kodova ugra|enih u dokument, koji definiraju format dokumenta, njegov izgled (ovdje termin izgled moramo shvatiti uslovno) i na~in prezentiranja sadr`aja dokumenta. HTML omogu}ava ubacivanje grafike, zvuka i drugih multimedijalnih zapisa u dokument. |
* |
Oblikovanje Web stranica HTML-om je za razliku od dosada{njih "programerskih" poduhvata prili~no jednostavno, i omogu}ava ~ak i laicima kreiranje efektnih dokumenata. Naravno, postoji i vi{i oblik rada. To je upotreba naprednih mogu}nosti HTML-a, kao na primjer obrada obrazaca (forms) i ugradnja Java aplikacija. Prilikom kreiranja Web strane u tekst koji }e se prikazati ubacuju se HTML naredbe kojima se opisuje kako }e izgledati svaki element u dokumentu. Kod kreiranja HTML-om postoje dva osnovna pristupa:
|
* |
Sa tehnikom fizi~kog markiranja, markup tagovi eksplicitno odre|uju kako bi dokument trebao izgledati. Tako mo`emo napisati naredbu sa kojom }emo odrediti kojim fontom }e biti napisan tekst, kojom veli~inom slova (font size) i koliki }e biti razmak. Kod drugog principa mo`emo definirati napr. koji dio teksta je naslov ili zaglavlje (heading) i sli~no, i time kodirati zna~enje dijela teksta u strukturi stranice ili dokument, a ne fizi~ki izgled. Ono {to razdvaja programe za stono izdava{tvo i tekst procesore od HTML-a je to da dokument nije ograni~en odre|enim formatom. Klijentov pretra`iva~ki program }e automatski prelomiti re~enice teksta u zasebne retke u zavisnosti od {irine prozora, te }e mu (korisniku) omogu}iti kretanje unutar dokumenta (npr. bo~nim kliza~ima). Dakle osnovna razlika izme|u klasi~nih word procesora i HTML-a je ta da se prvi pona{aju po principu WYSWYG (What You See Is What You Get), a dokumenti u HTML-u vi{e principu WYGIWYM (What You Get Is What You Meant). Jedna od prednosti HTML-a je ta da ne zahtijeva poseban editor (iako postoji), nego je dokument mogu}e napisati u najobi~nijem Notepadu ili Wordpadu u Windows Accessories i jednostavno ga prenijeti u HTML editor ili editor u nekom browseru. |
Dizajn HTML kolekcija dokumenata | Go top |
Nakon kreiranja HTML dokumenata, mo`e se pre}i na dizajniranje kolekcija HTML dokumenta i povezivanje sa ostalim resursima. Ukoliko bismo po analogiji kreiranje dokumenta poistovijetili sa stranicom u knjizi, onda bi kolekcija HTML dokumenata odgovarala dizajnu knjige ili ~asopisa. Me|utim razlike su vi{e nego o~ite: knjiga je "prostorna", fizi~ka, stati~ka kolekcija sa fiksiranom linearnom strukturom, dok je hypertext "besprostoran", nematerijalan (nonphysical), mogu}e dinami~an i ~esto nelinearan. Dakle knjige i ostali {tampani materijal su opisani kao linearni. Ovdje linearan podrazumijeva postojanje o~iglednog po~etka i kraja uslovljenih numeracijom strana. Indeksi, registri, sadr`aj i unakrsne reference su pridodati i od kriti~ke su va`nosti. Vidi linearnu organizaciju na sljede}oj shemi: |
|
|
Sljede}a ilustracija prikazuje nelinaernu organizaciju Web dokumenta. Linkovi me|u strama su ozna~eni strelicama. U ovoj nelinearnoj kolekciji veliki je broj "puteva" i na~ina na koji kolekcija mo`e biti pregledana. Na ovakvoj kolekciji se korisnik vrlo lako mo`e izgubiti. Slijedi shema: |
---|
Na sljede}im primjerima pokaza}emo linearnu kolekciju hipertekstalnih dokumenata. Deblje linije ozna~avaju glavne navigacione linkove, dok tanje ozna~avaju sekundarne.
Shematski dijagram hijerarhijski organiziranog dokumenta na webu. Dokumenti su organizirani po strukturi stabla (tree-like): |
|
|
Shematski prikaz velike Web kolekcije sa prikazom HTML kodiranih hipertekst relacija izme|u Home page-a i ostalih elemenata kolekcije. Deblje linije ozna~avaju glavne linkove unutar hijerarhijske strukture, dok ispresijecana linija ozna~ava veze izme|u "siblings" na istom hijerarhijskom nivou. Strelicama su ozna~ene mogu}i pravci linkova kodiranih kao HTML ankori u dokumentu. |
Mogu}a struktura Web site-a sa dva Home Page-a i dvije paralelne organizacione strukture, ozna~ene sa A i B. Oba dijela imaju pristup istoj kolekciji dokumenata pozicioniranih ispod ispresijecane linije. |
|
Eksperiment Bosniaca | Go top |
20 |
Devastacijom Nacionalne i univerzitetske biblioteke Bosne i Hercegovine u no}i 25/26 avgust 1992 uni{teno je oko 2,500,000 primjeraka razne bibliote~ke gra|e, kao i njen katalog (20). Iz ovog je proiza{la ~injenica da je veliki dio podataka, ako ne i najve}i, o Bosniaci uni{ten. Ostali katalozi koji su pre`ivjeli kataklizmu, kao i oni u inostranstvu sadr`e podatke koje treba istra`iti i prikupiti na jedno mjesto, te po~eti rad na izradi Bibliografije Bosniacae. Kako Muhamed Zlatan Hrenovica ka`e izvori nisu i{~ezli, " Treba ih samo pedantno istra`ivati, a zatim komunicirati sa njima radi prikupljanja barem onog elementarnog dakle bibliografskog minimuma o pojedinim bibliote~kim jedinicama. Prikupljanje primarnih, sekundarnih i inih dokumenata mo`e do}i kasnije. Sada je esencijalno otkriti i slijediti trag." (21). Dakle, traganje je imperativ i ovog rada. Cilj rada je ispitati mogu}nosti lociranja Bosniacae na online dostupnim katalozima (Online Public Access Catalogue) na World Wide Webu sa namjerom da rezultati ovog istra`ivanja budu upotrebljiv alat u procesu rekonstitucije kako kolekcija NUBBiH, tako i Bibliografije Bosniacae. Pored ovog cilj je bio kreirati takav istra`iva~ki metod koji bi bar u po~etku bio vezan za Sarajevo, da bi se izbjegli izuzetno veliki tro{kovi putovanja i boravka u inostranstvu. Naravno ovaj rad nema ambicije da pru`i sve odgovore vezane za ovu problematiku, nego da otkrije mogu}nosti ovog tipa istra`ivanja, koji bi eventualno kasnije mogao biti jedan od modaliteta potpunijih istra`ivanja u budu}nosti, zbog ~ega je u podnaslovu rada naznaka da je rije~ o eksperimentu. Pravilno je o~ekivati nekompletnu rekonstrukciju za {ta je potrebno vi{egodi{nje istra`ivanje. Ekspetiment ima zadatak da pru`i okvirna rje{enja. |
Metodologija | |
* |
Za potrebe izvo|enja ovog eksperimenta kori{ten je Internet browser Netscape Navigator Gold 3.0, te Web pretra`iva~ Fore Front Web Seeker. Za Netscape smo smo se odlu~ili zbog ve}e brzine u odnosu na Internet Explorer. Za globalno lociranje, tj. pretra`ivanje svih search engine-a na Interneut po zadatom kriteriju (library, library catalogue, OPAC) kori{ten je fore Front Web Seeker. Cijeli eksperiment je u potpunosti kompjuterski podr`an. Tabelarni prikazi i statisti~ki prora~uni su ra|eni u Microsoft Excelu. Sve pomenute aplikacije su kori{tene na personalnom ra~unaru (PC), CPU Pentium 90 MHz sa programskim paketom MS OFFICE. Prilikom pretra`ivanja putem telnet protokola kori{tena je VT100 emulacija terminala. Eksperiment je podijeljen u tri faze. |
FAZA I (Strategija pretra`ivanja) | |
* |
Prvi korak je bio odrediti (pribli`no) lokacije online kataloga na Mre`i. U ovoj fazi kori{tene su search engines Yahoo i Alta Vista. U subject search je dat termin library, library catalogue i OPAC. Po kriteriju library locirano je ukupno 1219 category, 8369 site matches, po kriteriju library catalogue 67 site matches, po kriteriju OPAC 30 site matches. Unutar opcije OPAC uo~ili smo site WebCATS - Online Catalogues on the World Wide Web na kojem su postavljeni linkovi sa OPAC katalozima velikog broja biblioteka. Za odabir ovog site-a smo se odlu~ili iz sljede}ih razloga:
Nakon ovog lociranja, Fore Front Web Seeker-u smo zadali iste kriterije za pretra`ivanje kao i na Yahoo-u. Kriterij OPAC je pored kataloga sadr`avao i linkove sa radovima na tu temu, te su linkovi snimljeni na disketi 2 priloga ovog rada. |
22 Recomendations for defining Bosniaca, UNESCO Expert Group, 25/26 Nov. 1994. U// Bosniaca (1) 1996, str. VII Dodatka |
Nakon odabira veza sa katalozima definirali smo kriterije pretra`ivanja po pitanju Bosniacae. Kako je gra|a koja spada u bosniacu definirana po dva kriterija , te zbog mogu}ih na~ina pretra`ivanja odlu~ili smo se za Subject/Keyword BOSNIA.(22) Sva pretra`ivanja su vr{ena po ovom kriteriju, izuzev BIBOS OPAC (Austria) i Library of Congress Experimental Search System, koji su dozvoljavali pretra`ivanje po kriteriju grada/izdava~a. |
FAZA II (Pretra`ivanje) | |
* |
U Geographical Index-u je sadr`ano 49 zemalja na svih 5 kontinenata. Pretra`ivanje je ograni~eno na nacionalne i univerzitetske biblioteke, osim par slu~ajeva kada odr|ena zemlja nije plasirala svoj OPAC nacionalne biblioteke na Web. |
FAZA III (Obrada podataka) | |
Rezultati | |
* |
Prilikom pretra`ivanja locirano je 1.114 kataloga, od ~ega je pretra`eno 114 ili 10,23 % svih dostupnih kataloga na WebCATS-u. od ovih 1.114 kataloga 798 otpada na SAD, a ostalih 316 na ostale. Pretra`eno je 8,4 % SAD kataloga, te 15 % ostalih, te je locirano 9.558 naslova:
Nakon izvr{enog pretra`ivanja pregledani su bibliografski popisi i do{lo se do zaklju~ka da bi pro{ireno istra`ivanje dalo sli~an rezultat (u kvalitativnom smislu) jer se veliki dio bibliografskih jedinica ponavlja, te bi ono dalo vrlo malo novih jedinica . Bibliografske jedinice registrirane u ovom pretra`ivanju mahom se odnose na noviju produkciju, dok su stariji materijali prisutni u malom broju. Naime u katalogu Kongresne biblioteke od 2895 zapisa 196 se odnosi na materijal {tampan u Sarajevu do 1945. godine. U prilogu ovog rada dali smo samo podatke o broju lociranih jedinica, dok detaljne bibliografske popise nismo zbog prostora. |
Bibliografija | Go top |
Go top |