World Wide Web - co to jest?

Jeszcze do niedawna większość spośród zgromadzonych w sieci Internet zasobów informacji dostępna była na jeden z dwóch sposobów: jako tzw. usługi on-line, czyli zainstalowane na określonych komputerach specjalne oprogramowanie, z którym można połączyć się i pracować zdalnie przez telnet (w ten sposób działają np. dostępne w Internecie katalogi biblioteczne), oraz anonimowe archiwa ftp - umożliwiające pobieranie za pomocą ftp plików zgromadzonych w takim archiwum (zawierających np. programy, teksty, grafikę itp.) każdemu użytkownikowi Internetu. Dostęp do obydwu tych rodzajów informacji odbywa się w sposób raczej "siermiężny". W przypadku serwisów on-line tzw. "interfejs użytkownika", ze względu na specyfikę pracy przez telnet, nie może być zbyt wyrafinowany - emulacja terminala stosowana najczęściej w programach telnetu (VT100) ogranicza możliwości wyświetlania na ekranie do znaków z podstawowego kodu ASCII, z zaledwie kilkoma rodzajami wyróżnień tekstu (rozjaśnienie, wyświetlenie w negatywie). Nie zawsze też obsługiwane są prawidłowo znaki sterujące na klawiaturze (np. klawisze kursora), stąd też praca z takim programem sprowadza się na ogół do czytania ekranów jednolicie zapisanych tekstem, odpowiadania na zadawane przez program pytania i dokonywania wyborów z bardzo prostych menu poprzez wciskanie odpowiednich liter czy cyfr na klawiaturze. Z kolei przy pobieraniu plików przez ftp "oblicze" programu jest jeszcze bardziej surowe: użytkownik wpisuje ciągi skomplikowanych komend podobnych do komend systemu operacyjnego Unix. Dobre to dla fachowca-informatyka, ale nie dla nienawykłego do takiego sposobu pracy (i do bezwzględnego rygoryzmu systemu w interpretacji komend...) biologa, lekarza czy prawnika, który akurat chce pobrać z Internetu potrzebną mu informację. Nie mówiąc już o tym, że trzeba wiedzieć, gdzie ta informacja jest - zarówno telnet, jak i ftp wymagają podania adresu sieciowego konkretnego komputera, z którym chcemy się łączyć, a w przypadku ftp trzeba jeszcze znać dokładną nazwę katalogu i pliku, który nas interesuje.

W roku 1991 zespół programistów z University of Minnesota opracował system o nazwie gopher, pozwalający przeglądać zasoby Internetu za pomocą bardzo prostego systemu wielopoziomowych menu. W stosunku do "klasycznego" telnetu i ftp był on znaczną innowacją i udogodnieniem. Praca z gopherem nie wymaga znajomości żadnych adresów sieciowych, sprowadza się do wybrania odpowiedniej pozycji w menu i naciśnięcia ENTER. Wybrana pozycja może być plikiem tekstowym, który można odczytać bezpośrednio na ekranie (z możliwością zapisania go od razu na dysk swojego komputera), bazą danych (typowo np. spisem adresowym), w której wyszukuje się informacje według podanego klucza, plikiem binarnym (czyli zawierającym informacje inne niż tekstowe), który przetransmitowany będzie do naszego komputera w sposób analogiczny jak przy "zwykłym" ftp, typową sesją telnetową nawiązującą połączenie z komputerem o określonym adresie (którego sami nie musimy znać), a wreszcie menu niższego poziomu, otwierającym kolejną listę możliwości do wyboru.

Od swego powstania w 1991 roku gopher bardzo szybko zyskiwał popularność, coraz więcej instytucji i organizacji udostępniających swoje zasoby w Internecie oferowało je także, a niejednokrotnie nawet przede wszystkim, w tej właśnie formie. Dzisiaj gopher jest już usługą równie "klasyczną" i równie często wykorzystywaną co tradycyjne telnet i ftp. I - niespodziewanie - coraz częściej wśród użytkowników sieci pojawia się zdanie o archaiczności gophera i tendencja do rezygnacji z niego na rzecz następcy - systemu World Wide Web (WWW). Liczba komputerów udostępniających informacje tym nowym sposobem rośnie obecnie szybciej niż rosła po 1991 r. liczba maszyn oferujących gophera.

Gopher i WWW mają wiele wspólnego: obydwa te systemy umożliwiają dostęp do informacji poprzez proste "wskazanie" żądanej pozycji, obydwa mogą udostępniać informacje różnych typów (tekst, grafika, dźwięk, bazy danych, pliki binarne, sesje telnetowe), obydwa są systemami rozproszonymi, co oznacza, że rzeczywiste dane odpowiadające wyświetlanym przez system tytułom w menu mogą znajdować się na zupełnie innych komputerach niż ten, który stanowił dla nas punkt wyjścia, i stamtąd będą pobierane w razie wyboru danej opcji. World Wide Web rezygnuje jednak ze sztywnej hierarchicznej struktury menu, jaką charakteryzował się gopher, organizując w zamian informacje na zasadzie hipertekstu.

Czym jest hipertekst? Pojęcie to najłatwiej objaśnić, biorąc jako przykład system podpowiedzi ("help") w jakimkolwiek nowoczesnym programie użytkowym, zwłaszcza pracującym w środowisku graficznym, takim jak Microsoft Windows. Otóż otrzymujemy na ekranie estetycznie sformatowany dokument (taki pojedynczy dokument nazywa się w systemie WWW "stroną", aczkolwiek może on, gdyby go wydrukować, zająć wiele stron w sensie dosłownym), wykorzystujący różne kroje czcionek, wstawione w tekst ilustracje i inne ozdobniki graficzne, w którym niektóre słowa lub frazy (albo rysunki...) są wyróżnione (np. innym kolorem) - stanowią one tzw. łączniki albo odnośniki hipertekstowe (w języku angielskim links; w niektórych programach WWW używane jest także określenie anchors) - coś jak tradycyjne odsyłacze w książce, np. encyklopedii. "Wskazanie" któregokolwiek z tych łączników za pomocą podświetlonej "belki" przesuwanej klawiszami kursora i wybór klawiszem ENTER (lub za pomocą "kliknięcia" myszy) powoduje przejście do innego fragmentu tekstu, będącego "rozwinięciem" danego łącznika (np. objaśnieniem danego słowa czy wyrażenia). Od prostych hipertekstów, takich jak wspomniane "helpy" programów użytkowych, system WWW różni się jednakże tym, że łączniki hipertekstowe mogą tu prowadzić do wielu różnych dokumentów, tekstowych, graficznych, a także innych rodzajów, w tym również znajdujących się na innych komputerach w Internecie - serwerach WWW. Dlatego mówimy o systemie rozproszonym.

Jak to widać z powyższego opisu, WWW jest pierwszą usługą Internetową nastawioną zasadniczo na pracę w trybie graficznym, z wykorzystaniem wszelkich możliwości środowisk graficznych takich jak Windows. Znakomicie wpasowuje się przez to w dominujący obecnie w użytkowaniu komputerów trend do pracy w takich właśnie środowiskach, jak również w panującą "modę" na multimedia - łączniki hipertekstowe w systemie WWW mogą przecież prowadzić do plików dźwiękowych czy nawet zawierających sekwencje filmowe i możliwe będzie odtworzenie ich na naszym komputerze, jeżeli ma on tylko zainstalowany odpowiedni sprzęt i oprogramowanie.

Do pracy z systemem WWW (jak zresztą z każdą inną usługą Internetową) potrzebne są dwa podstawowe programy: klient WWW, zainstalowany na komputerze, na którym bezpośrednio pracujemy (a więc na ogół PC stojącym na naszym biurku), oraz serwer WWW, który musi być zainstalowany na każdym komputerze w Internecie mającym udostępniać informacje poprzez WWW. Najczęściej stosowanym klientem WWW jest program o nazwie NCSA Mosaic - dostępny jest on w wersjach dla X Windows (środowisko graficzne w systemie operacyjnym Unix) oraz MS Windows. Jeżeli nie lubimy trybu graficznego, lub konfiguracja naszego komputera jest zbyt słaba do efektywnej pracy w tym trybie, możemy wybrać klienta tekstowego - tu w zasadzie istnieje tylko jeden liczący się program: Lynx, dostępny również w wersjach zarówno dla Unixa, jak i MS DOS-a. (O źródłach, z których można otrzymać te programy - patrz na końcu tekstu.) Oczywiście, wybierając pracę w trybie tekstowym automatycznie wybieramy niedostępność pewnych bardziej wyrafinowanych możliwości systemu WWW (ale obrazki zawarte w dokumentach WWW Lynx, przynajmniej w jego wersji DOS-owej, wyświetlać potrafi).

Przy instalacji klienta WWW musimy wybrać adres domyślnego serwera, z którym klient ma się łączyć, jeżeli w wywołaniu programu nie podamy inaczej - z reguły będzie to serwer geograficznie nam najbliższy. Po uruchomieniu klienta i nawiązaniu połączenia na ekranie ukaże się nam tzw. strona macierzysta (home page) danego serwera. Taka strona macierzysta zawiera cały szereg odnośników, po których bezpośrednio bądź pośrednio możliwe jest "dojście" do wszystkich dokumentów i usług oferowanych przez dany serwer. Często zawiera także łączniki do dokumentów znajdujących się na innych serwerach WWW.

Przyjęło się umieszczanie w stronach macierzystych serwerów WWW łączników prowadzących do informacji o instytucji, do której należy dany serwer i jej działalności. Często znaleźć tam można także informacje o mieście, w którym się dana instytucja znajduje (zwłaszcza jeżeli jest to jedyny lub w jakimś sensie "główny" serwer WWW w tym mieście). Nierzadko informacje te są ilustrowane: widokami miasta i okolic, zdjęciami członków kierownictwa danej instytucji, osób odpowiedzialnych za funkcjonowanie serwerów, planem np. kampusu uniwersyteckiego czy schematem lokalnej sieci komputerowej.

Idea strony macierzystej została też rozszerzona na organizacje, regiony, kraje, a nawet całą Ziemię. Stąd można spotkać w systemie WWW stronę macierzystą Polski, Europy, samego systemu WWW jako takiego, a wreszcie stronę macierzystą Ziemi. Z drugiej strony, swoje strony macierzyste tworzą pojedyncze osoby - administratorzy sieci lokalnych, autorzy poszczególnych stron WWW, co bardziej "aktywni sieciowo" pracownicy instytucji posiadających serwery WWW, a nawet - w przypadku uczelni - studenci. Takie prywatne strony macierzyste zawierają - oprócz niemal "obowiązkowego" zdjęcia - mniej lub więcej informacji o sylwetce danej osoby: charakterze, życiorysie, zainteresowaniach, pracy, rodzinie itp. Niejednokrotnie właściciele takich prywatnych stron umieszczają na nich odnośniki do szczególnie - ich zdaniem - interesujących "miejsc" w sieci, które udało im się wyszperać, co może być bardzo cennym źródłem informacji.

Rozpoczynając wędrówkę po WWW od strony macierzystej lokalnego serwera możemy, "wchodząc" w kolejne łączniki hipertekstowe, "skakać" po różnych komputerach na całym świecie, często nawet nie zdając sobie z tego sprawy. Jeżeli jesteśmy podłączeni do Internetu szybką linią, możemy wręcz nie zauważyć tego, że prezentowane informacje nie pochodzą z naszego komputera, a odczytywane są gdzieś z daleka. W ten sposób WWW umożliwia korzystanie z zasobów informacyjnych wszystkich serwerów jak z jednej, zintegrowanej całości - właśnie owej "ogólnoświatowej pajęczyny". Żeby ta integracja była jeszcze pełniejsza, programy klientów WWW potrafią odczytywać nie tylko "naturalne" dokumenty hipertekstowe udostępniane przez serwery WWW, ale także współpracować z innymi usługami sieciowymi - co najmniej z serwerami gophera oraz archiwami anonymous ftp (dodatkowe możliwości lepszych klientów WWW umożliwiają m.in. współpracę z bazami danych WAIS, Usenet news, uruchamianie sesji telnetowych, a nawet wysyłanie listów pocztą elektroniczną pod ustalone adresy), stwarzając tym samym ujednolicone narzędzie dostępu do wszystkich zasobów informacyjnych Internetu.

W takiej różnorodności dostępnych informacji konieczne było oczywiście wprowadzenie jakiegoś sposobu lokalizowania (adresowania) konkretnego dokumentu. W tym celu system WWW posługuje się tzw. URL'ami (Universal Resource Locator, albo, jak chcą inni, Uniform Resource Locator). URL, z grubsza rzecz biorąc, jest to rodzaj uogólnionej "ścieżki dostępu do pliku", występującej np. w systemach operacyjnych MS-DOS czy Unix, z tym, że podaje on nie tylko katalog i nazwę danego dokumentu, ale także jego rodzaj oraz adres komputera w Internecie, na którym się on znajduje.

Typowy URL dla dokumentów WWW wygląda tak:

http://adres.komputera.w.internecie/katalog/katalog/katalog/plik

np. http://www.uci.agh.edu.pl/pzs/pzs.html. Rozszerzenie ".html" (lub ".htm" w MS DOS-ie) jest charakterystyczne dla plików zawierających dokumenty WWW. Jeżeli chcemy odwołać się do strony macierzystej danego serwera, określenie katalogu i pliku można opuścić, a więc powyższy URL przybiera postać

http://adres.komputera.w.internecie/

np. http://www.uci.agh.edu.pl/.

W powyższych URL'ach część początkowa ("http:") identyfikuje, o jaki rodzaj dokumentu nam chodzi. Dla dokumentów hipertekstowych będzie to "http:", dla gophera - "gopher:", dla plików osiągalnych przez anonymous ftp - "ftp:", a dla plików na lokalnym komputerze (mogących również zawierać dokumenty hipertekstowe) - "file:". Istnieją także bardziej "egzotyczne" URL'e, dla współpracy z innymi usługami sieciowymi (np. "telnet:", "news:", "wais:", "mailto:" - zobacz powyżej) - nie każdy klient WWW potrafi obsługiwać te mniej typowe.

Jeżeli znamy URL interesującego nas dokumentu, możemy na ogół podać go od razu jako parametr w komendzie wywołującej program klienta WWW. Wówczas zamiast strony macierzystej domyślnego serwera po uruchomieniu klienta zostanie od razu załadowany wskazany dokument. Każdy klient WWW posiada też opcję umożliwiającą w trakcie pracy z programem załadowanie dokumentu wskazanego dowolnym URL'em, niezależnie od odnośników znajdujących się na aktualnie oglądanej stronie. Dokumenty, z których zamierzamy często korzystać, możemy, aby uniknąć każdorazowego wpisywania ich URL'i, umieścić sobie na tzw. gorącej stronie (hotlist) naszego klienta WWW, którą można zwykle przywołać określonym klawiszem w dowolnej chwili podczas pracy i wybrać z niej odnośnik do odpowiedniego dokumentu, jak z każdej innej strony WWW.

Wiemy już prawie wszystko, aby rozpocząć eksplorację "hiperprzestrzeni" WWW. Nie wiemy jeszcze tylko, skąd zacząć. Na zakończenie tego krótkiego przeglądu warto więc podać kilka wygodnych "punktów startu" do WWW i zasobów informacyjnych Internetu w ogóle.

Strona macierzysta systemu WWW znajduje się pod adresem http://www.w3.org/. Autorzy klientów WWW zalecają korzystanie z tego właśnie adresu jako domyślnej strony macierzystej w przypadku braku dostępu do jakiegokolwiek bliskiego serwera WWW. Strona ta zawiera m.in. ogólne informacje o projekcie WWW, w ramach którego system powstał i jest rozwijany, informacje o dostępnym oprogramowaniu klientów i serwerów, wykaz (długi!) wszystkich serwerów WWW na świecie, a wreszcie najbardziej chyba interesującą część pod nazwą WWW Virtual Library. WWW Virtual Library jest znakomitym narzędziem do wyszukiwania w systemie WWW informacji na konkretny temat, gdyż zawiera odnośniki do informacji z różnych dziedzin pogrupowane tematycznie, a więc astronomia, historia, sztuka, medycyna, sport... itp. Drugim podobnym katalogiem tematycznym jest The Whole Internet Catalog, będący częścią "hipertekstowego czasopisma" o nazwie Global Network Navigator (GNN), opracowywanego przez znane wydawnictwo literatury komputerowej O'Reilly & Associates. GNN zainstalowany jest na kilkunastu serwerach na całym świecie - dla użytkowników z Polski najwygodniejsze jest korzystanie z serwera EUnet Germany.The Whole Internet Catalog dostępny jest pod URL'em http://nearnet.gnn.com/gnn/wic/index.html, zaś główna strona GNN - http://nearnet.gnn.com/gnn/GNNhome.html. *

Trzecim tego typu "globalnym" zestawieniem informacji, do których można sięgnąć, jest strona macierzysta Ziemi (Planet Earth Home Page) - URL: http://white.nosc.mil/info.html (ciekawe, że jest to serwer wojskowy - proszę zwrócić uwagę na ".mil" w adresie!).

Przechodząc na nasze polskie podwórko, możemy zacząć "wędrówkę" od listy polskich serwerów WWW - http://info.fuw.edu.pl/pl/servers-list.html ** - lub znakomitej listy Polskich Zasobów Sieciowych, opracowywanej przez Rafała Maszkowskiego - http://www.uci.agh.edu.pl/pzs/pzs.html. Na tym samym serwerze, co ta ostatnia lista, znaleźć można też zestawioną przez tamtejszego administratora listę "ciekawych serwerów WWW" - http://www.uci.agh.edu.pl/www.html (na liście tej znajdują się niektóre pozycje omówione wcześniej, np. Global Network Navigator albo strona macierzysta Ziemi).

Jako że system WWW jest szczególnie wart polecenia początkującym użytkownikom jako bardzo przyjazne narzędzie do eksploracji zasobów Internetu, wśród licznych osiągalnych w nim dokumentów szczególną uwagę zwrócić należy na podręczniki i przewodniki umożliwiające lepsze poznanie tej sieci. Na wspomnianym już serwerze www.uci.agh.edu.pl znaleźć możemy dwa ciekawe hipertekstowe podręczniki: pierwszy z nich to niewątpliwie jeden z najlepszych i najpopularniejszych podręczników o Internecie, jego usługach i zasobach - EFF's Guide To The Internet (znany również pod tytułami Big Dummy's Guide To The Internet - wcześniejsze wersje - lub Everybody's Guide To The Internet). Jego URL to http://www.uci.agh.edu.pl/eegtti/eegtti.html. Natomiast ściśle na samym systemie WWW koncentruje się tekst Entering the World-Wide Web - A Guide To Cyberspace, dostępny poprzez http://www.uci.agh.edu.pl/guide.61.html.

A jeżeli lubimy podróże w nieznane, możemy dać się zanieść w przypadkowy punkt "pajęczyny" URL-ruletce (URouLette). Skorzystanie z niej przenosi nas do przypadkowo wybranego dokumentu na przypadkowo wybranym serwerze WWW w świecie. Dosyć to ciekawy sposób poznawania Internetu... Oto URL tej niezwykłej ruletki: http://www.uroulette.com:8000/. (Nie współpracuje ona poprawnie z niektórymi klientami WWW, stąd też warto przeczytać umieszczone na powyższej stronie uwagi i informacje).

I wreszcie, last but not least, niewątpliwie istotna informacja - skąd wziąć program - klienta WWW? Jak nietrudno się domyślić, programy te są dostępne w Internecie przez anonimowe ftp. NCSA Mosaic dostępny jest na komputerze ftp.ncsa.uiuc.edu - wersja dla X Windows w katalogu /Mosaic/Unix, dla MS-Windows w katalogu /Mosaic/Windows ~~(z tego ostatniego katalogu w Polsce lepiej korzystać za pośrednictwem "mirrora" w krakowskim Cyfronecie - ftp://ftp.cyf-kr.edu.pl/pub/mirror/ncsa/Mosaic)~~. *** Lynx - na komputerze ftp2.cc.ukans.edu, wersja Unixowa w katalogu /pub/WWW/lynx, DOS-owa - /pub/WWW/DosLynx.

* Po różnych "kolejach losu" (zmiana właściciela na America Online, duże reorganizacje serwisu) pod koniec 1996 r. serwis GNN wraz z Whole Internet Catalog ostatecznie przestał istnieć; prezentowane do tej pory w nim materiały włączono w inne serwisy prowadzone przez AOL, np. WebCrawler.
** Lista ta jest już niezbyt aktualna; znacznie lepszą listę znaleźć można obecnie pod adresem http://www.nask.pl/Resources/www.html.
*** Mirror NCSA Mosaic nie jest już dostępny w Cyfronecie.

Jarosław Rafa 1995. Tekst udostępniony na licencji Creative Commons (uznanie autorstwa - użycie niekomercyjne - bez utworów zależnych). Kliknij tutaj, aby dowiedzieć się, co to oznacza i co możesz z tym tekstem zrobić. W razie jakichkolwiek wątpliwości licencyjnych bądź w celu uzyskania zgody na rozpowszechnianie wykraczające poza warunki licencji proszę o kontakt e-mailem: raj@ap.krakow.pl.

Wersja HTML opracowana 15.03.96, ostatnia aktualizacja adresów 24.01.97.

Powrót do wykazu artykułów o Internecie

Statystyka