World Wide Web - myszą przez świat

Podobnie jak środowiska graficzne typu np. Microsoft Windows przeciętnego człowieka bez fachowego przygotowania "oswoiły" z komputerem jako takim, tak system World Wide Web (WWW) uprzystępnia mu sieć Internet.

"Klasyczny" sposób pracy w Internecie, wymagający wpisywania skomplikowanych komend, pamiętania długich i złożonych adresów sieciowych, pod którymi znajduje się potrzebna nam informacja - a wszystko to na ekranie monochromatycznego, wyłącznie tekstowego terminala - powoli odchodzi w przeszłość. Podręczniki traktujące o Internecie wciąż jeszcze w przeważającej większości pełne są instrukcji logowania się do systemu Unix, "siedmiu komend Unixa bez których nie możesz żyć" (rozdział o takim tytule znaleźć można w popularnej książce Everybody's Guide to the Internet), czy opisów posługiwania się klasycznymi Unixowymi wersjami programów takich jak telnet, ftp, mail czy gopher, stanowiącymi jeszcze do niedawna podstawowe wyposażenie Internetowych "weteranów". Jednak ogromna fala nowych użytkowników Internetu, która pojawiła się w sieci w ciągu ostatnich kilku lat, Unixowego "prompta" zazwyczaj już nie ogląda na oczy: rozpoczyna swoją sieciową przygodę od ozdobnych, kolorowych, multimedialnych stron WWW w znajomym sobie środowisku na ekranie własnego PC.

System ten, opracowany na początku lat dziewięćdziesiątych w CERN-ie (europejskie centrum badań w zakresie fizyki cząstek elementarnych), stał się prawdziwą rewolucją w sposobie korzystania z Internetu. Jest on najbardziej dynamicznie rozwijającą się usługą Internetową w ciągu ostatnich dwu lat, a zarazem czynnikiem, który w błyskawicznym tempie przekształca charakter sieci, będącej przez dwadzieścia kilka lat głównie naukową i akademicką, w kierunku powszechnego medium komunikacyjnego. Wspomniana fala nowych użytkowników, którzy właśnie od WWW rozpoczynają swoją sieciową edukację, to przede wszystkim osoby prywatne, korzystające z sieci ze swoich domowych komputerów za pośrednictwem modemów, oraz szeroko pojęty biznes - wszelkiego rodzaju firmy komercyjne, dla których Internet jest nie tylko szybkim i skutecznym środkiem łączności, ułatwiającym prowadzenie interesów, ale również nowym, o ogromnych potencjalnych możliwościach, sposobem dotarcia do klienta. "Witryna" firmy w WWW stanowi wszak reklamę docierającą do klienta 24 godziny na dobę, widoczną z całego świata i przez nieograniczenie długi czas, stąd też liczba takich witryn rośnie lawinowo - obliczono, że ich liczba podwaja się co niecałe dwa miesiące.

W pierwszym zetknięciu system WWW jawi się fascynująco: efektownie zaprojektowane plansze (pojedynczy dokument prezentowany w systemie WWW nazywa się "stroną", aczkolwiek może on, gdyby go wydrukować, zająć wiele stron w sensie dosłownym), przyciągające oko różnymi krojami czcionek, wstawionymi w tekst ilustracjami i innymi ozdobnikami graficznymi. W niektórych miejscach odezwie się nam jakiś głos, gdzie indziej w okienku pokaże się fragment filmu - a "klikając" na poszczególne fragmenty myszą możemy przechodzić dalej i dalej, swobodnie "skakać" po różnych komputerach na całym świecie przyglądając się informacjom z najdalszych zakątków globu.

Podstawą WWW jest idea hipertekstu. Hipertekst jest to tekst, w którym niektóre słowa lub fragmenty zdań są wyróżnione (np. innym kolorem) i pełnią rolę odnośników do innych dokumentów - podobnie jak tradycyjne odsyłacze w książce, np. encyklopedii (WWW rozszerza pojęcie hipertekstu - strony WWW mogą zawierać nie tylko tekst, ale i grafikę, i elementy graficzne również mogą być odsyłaczami). Istota hipertekstu sprowadza się do tego, że wskazanie na ekranie dowolnego z takich odnośników (typowo odbywa się to poprzez znane wszystkim użytkownikom środowisk graficznych "kliknięcie" myszą) powoduje automatyczne przejście do dokumentu skojarzonego z danym odsyłaczem i wyświetlenie go. Jest to idea powszechnie stosowana także w innych programach komputerowych - w ten sposób realizowane są np. tzw. "helpy" do większości programów użytkowych, zwłaszcza pracujących w środowisku Windows. Rewolucyjność zastosowania hipertekstu w systemie WWW polega jednakże na tym, że odsyłacze owe mogą tu prowadzić do dokumentów, znajdujących się na dowolnych innych komputerach w Internecie - serwerach WWW (mamy zatem do czynienia z tzw. systemem rozproszonym). Same zaś dokumenty dostępne "pod" odsyłaczami mogą być nie tylko kolejnymi hipertekstami (względnie zwykłymi tekstami bez żadnych odnośników), ale także plikami graficznymi, dźwiękowymi, czy też zawierającymi ruchome sekwencje filmowe - odpowiednio skonfigurowana przeglądarka WWW potrafi je odtworzyć. Odsyłacze mogą też prowadzić do baz danych, w których możemy wyszukiwać informacje według podanego klucza (np. spisy adresowe), plików binarnych (np. oprogramowania), które transmitowane są na nasz komputer w sposób podobny jak przy korzystaniu z usługi ftp; mogą powodować otwarcie sesji telnetowej do określonego komputera, wysłanie poczty elektronicznej pod określony adres bądź uruchomienie na komputerze - serwerze, z którego pochodzi dokument, jakiegoś programu i wyświetlenie wyników jego działania na naszym ekranie. Dzięki odpowiednim odnośnikom możliwe jest też korzystanie z zasobów informacji dostępnych na serwerach poprzednika WWW - systemu gopher, oraz na serwerach anonimowego ftp. Jest to zatem system nie tylko prawdziwie multimedialny, ale też integrujący w jednolitą całość, ową "pajęczynę oplatającą świat" (takie polskie tłumaczenie terminu World Wide Web jest ostatnio lansowane) wszelkie zasoby informacyjne dostępne w Internecie.

Do pracy z WWW (jak zresztą z każdą inną usługą Internetową) potrzebne są dwa podstawowe programy: klient WWW, zwany też przeglądarką (ang. browser), zainstalowany na komputerze, na którym bezpośrednio pracujemy (zatem w naszych warunkach najczęściej bywa to PC) oraz serwer WWW, instalowany na komputerach udostępniających w sieci informacje w tym systemie (zgodnie z zakorzenionym w terminologii sieciowej zwyczajem, komputery takie również nazywa się serwerami WWW). "Sercem" całego systemu jest przeglądarka: to przez nią właśnie realizowana jest większość możliwości decydujących o atrakcyjności systemu. Do przeglądarki należy zinterpretowanie ciągu bajtów wysyłanych przez serwer i utworzenie z nich wszystkich elementów składających się na wygląd sformatowanej strony (nagłówki, różne kroje i wielkości czcionek, tabele itp.). To przeglądarka musi "umieć" pobrać z serwera, zdekodować i wyświetlić zawarte na stronie obrazy graficzne (w WWW przyjęte są jako standard dwa formaty plików graficznych: GIF i JPEG), a także rozpoznać inne formaty danych spotykane na stronach WWW i uruchomić odpowiednie dla nich pomocnicze programy, odtwarzające np. nagranie dźwiękowe czy sekwencję filmową. To przeglądarka również inicjuje połączenia z innymi serwerami WWW (a także serwerami ftp i gophera) przy wybieraniu odsyłaczy na stronie - serwer, z którego pochodzi oglądana strona, nie bierze w tym procesie żadnego udziału. Tak więc to przede wszystkim od możliwości przeglądarki zależy atrakcyjność i wygoda korzystania z systemu, nic więc dziwnego, że na rynku przeglądarek, na którym do ubiegłego roku istniał praktycznie jeden liczący się program - NCSA Mosaic, opracowany przez National Center for Supercomputing Applications - trwa obecnie ostra konkurencja. Jak to wynika z powyżej przedstawionego opisu, WWW jest usługą wymagającą dla jej pełnej realizacji pracy w trybie graficznym, z wykorzystaniem możliwości dawanych przez okienkowe środowiska graficzne, takie jak Windows. W takich zatem środowiskach (konkretnie są to: X Window - graficzne środowisko opracowane dla systemu Unix, dostępne niemal we wszystkich jego odmianach; MS Windows i Windows 95 - dla komputerów typu PC; oraz własny system operacyjny komputerów Apple Macintosh) pracuje zatem większość dostępnych przeglądarek WWW. Wśród obecnych na rynku co najmniej kilkunastu programów tego typu, zarówno komercyjnych jak i darmowych, zdecydowanie na czoło, tak jeżeli chodzi o możliwości, jak i popularność, wysuwa się shareware'owa przeglądarka Netscape Navigator, produkt niezwykle dynamicznie rozwijającej się firmy Netscape Communications Corp. Jest to w chwili obecnej zdecydowanie najczęściej używana przeglądarka WWW na świecie; dodatkowo za jej stosowaniem przemawia fakt, że coraz więcej stron WWW dostępnych na serwerach opracowywanych jest specjalnie pod kątem możliwości Netscape i oglądając je przy pomocy tej właśnie przeglądarki uzyskuje się najlepsze efekty.

Dla zatwardziałych przeciwników graficznego trybu pracy, lub posiadaczy komputerów, których konfiguracja sprzętowa uniemożliwia efektywną pracę w tym trybie, istnieje także przeglądarka pracująca w trybie znakowym: Lynx, dostępna w wersjach dla Unixa i MS-DOS-u. Oczywiście praca w trybie znakowym pozbawia nas w znakomitej większości efektu estetycznego płynącego z oglądania stron WWW, i całej multimedialności tego systemu, ale "jak się nie ma co się lubi"... Dla posiadaczy słabszych komputerów stosunkowo atrakcyjnym wyjściem może być niedawno stworzona na University of Minnesota przeglądarka, pracująca w trybie graficznym pod kontrolą samego systemu DOS (bez konieczności korzystania z Windows) - jest ona częścią rozwijanego na tym uniwersytecie shareware'owego pakietu oprogramowania Internetowego o nazwie Minuet.

Wybór oprogramowania serwera WWW jest sprawą drugorzędną - właściwie wszystkie dostępne programy tego typu jednakowo dobrze spełniają swoją funkcję. Funkcja ta jest zresztą niezwykle prosta - w podstawowym zakresie sprowadza się po prostu do wysłania, w odpowiedzi na żądanie zgłoszone przez przeglądarkę, treści znajdującego się na serwerze pliku tekstowego zawierającego opis żądanej strony. Efektowne i kolorowe strony WWW w istocie są bowiem zwykłymi plikami tekstowymi ASCII, które można pisać za pomocą najprostszego edytora, choćby takiego jak zawarty w MS-DOS-ie EDIT. Pliki te oprócz (rzecz jasna) samego tekstu strony zawierają szereg specjalnych komend w języku HTML (HyperText Markup Language), opisujących sposób sformatowania tego tekstu. Język HTML przypomina nieco w swojej idei język stosowany do opisu strony w popularnym - zwłaszcza w środowiskach akademickich - systemie składu drukarskiego TeX, aczkolwiek jest niewątpliwie od niego znacznie prostszy (nieco więcej o języku HTML można przeczytać obok). Za pomocą komend HTML określa się miejsca, gdzie w dokumencie mają znaleźć się elementy graficzne, i wskazuje nazwy odpowiednich plików GIF, które należy tam wstawić (pliki te przeglądarka musi rzecz jasna osobno pobrać z serwera); inne polecenia służą do określenia fragmentów strony, które będą stanowiły odsyłacze hipertekstowe, i odpowiadających im konkretnych adresów sieciowych. Odpowiednie zinterpretowanie całego tego "bałaganu" należy już wyłącznie do przeglądarki. Wspomniany uprzednio program Netscape realizuje w stosunku do standardu HTML wiele rozszerzeń, pozwalających na tworzenie stron o znacznie bardziej efektownym wyglądzie (niestety kiepsko czytelnych w innych przeglądarkach) - to jedna z przyczyn jego tak wielkiej popularności.

Przy instalacji przeglądarki WWW musimy wybrać adres początkowej strony, która przy każdorazowym uruchomieniu programu pojawiać się będzie na naszym ekranie jako pierwsza. Z reguły strona ta znajduje się na serwerze, z którym użytkownik jest w jakiś sposób związany - użytkownicy komputerów znajdujących się w instytucjach posiadających własny serwer WWW z reguły łączą się na początek ze swoim macierzystym serwerem; użytkownicy korzystający z kont komercyjnych wykupionych u providera na ogół zaczynają wędrówkę po sieci od serwera swojego providera; itd. Każdy serwer posiada swoją tzw. stronę macierzystą (home page), która wyświetlana jest, jeżeli przy połączeniu z danym serwerem nie zażądano żadnej konkretnej strony (zob. informacje na temat URL). Taka strona macierzysta zawiera cały szereg odnośników, po których bezpośrednio bądź pośrednio możliwe jest "dojście" do wszystkich dokumentów i usług oferowanych przez dany serwer. Z reguły zawiera także odsyłacze do innych serwerów WWW, umożliwiając rozpoczęcie "wędrówki" po świecie.

Strony macierzyste serwerów WWW zawierają przede wszystkim informacje o instytucji, do której należy dany serwer i jej działalności. Często znaleźć tam można także informacje o mieście, w którym się dana instytucja znajduje (zwłaszcza jeżeli jest to jedyny lub w jakimś sensie "główny" serwer WWW w tym mieście). Nierzadko informacje te są ilustrowane: widokami miasta i okolic, zdjęciami członków kierownictwa danej instytucji, osób odpowiedzialnych za funkcjonowanie serwerów, planem np. kampusu uniwersyteckiego czy schematem lokalnej sieci komputerowej.

Idea strony macierzystej została też rozszerzona na organizacje, regiony, kraje, a nawet całą Ziemię. Mamy więc w systemie WWW strony macierzyste miast, krajów (np. Polski), partii politycznych, kościołów, samego systemu WWW jako takiego, a nawet stronę macierzystą Ziemi. Z drugiej strony, swoje strony macierzyste tworzą pojedynczy użytkownicy sieci: administratorzy sieci lokalnych, autorzy poszczególnych stron WWW, pracownicy (w przypadku uczelni - również studenci) instytucji posiadających serwery WWW, czy zwykli, prywatni użytkownicy kont komercyjnych. Takie strony osobiste zawierają - oprócz niemal "obowiązkowego" zdjęcia - mniej lub więcej wiadomości o sylwetce danej osoby: charakterze, życiorysie, zainteresowaniach, pracy, rodzinie itp. Niejednokrotnie właściciele takich prywatnych stron umieszczają na nich odnośniki do szczególnie - ich zdaniem - interesujących miejsc w sieci, które udało im się wyszperać, co może być bardzo cennym źródłem informacji.

Ogrom informacji, który znajduje się w zasięgu naszej ręki, gdy "podróżujemy" po WWW, fascynuje, ale zarazem i... przeraża. Przeraża swoim bezkresem, tym, że nigdy nie poznamy wszystkich "zakamarków" sieci, że być może "gdzieś tam" znajduje się interesująca nas, potrzebna nam informacja, ale możemy stracić lata na jej odszukanie; przeraża także tym, że w skomplikowanej pajęczynie powiązań między stronami, serwerami, nietrudno się pogubić: jakże często stajemy wobec znanego wszystkim użytkownikom WWW problemu: "tak, parę minut temu widziałem(am) interesującą stronę, ale gdzie to było? jak do niej wrócić?". Te niedogodności miał w założeniach usunąć projektowany na następcę WWW nowy system o nazwie Hyper-G, nie zyskał on jednak (i wydaje się, że chyba już nie zyska) większej popularności. Dostępne są jednakże różne przewodniki i katalogi, ułatwiające odnalezienie interesujących nas informacji w sieci. Osiągalne są one również w systemie WWW (niestety, pojawia się "problem jajka i kury" - trzeba wiedzieć skądinąd, gdzie one są), a zawierające je serwery należą do najbardziej "obleganych" miejsc w Internecie.

Narzędzia ułatwiające poszukiwanie informacji w WWW podzielić można na dwie główne grupy: pierwsza z nich, to tworzone ręcznie przez ludzi katalogi tematyczne, podobne do katalogów rzeczowych w bibliotece, w których wybierając interesującą nas dziedzinę wiedzy z kolejnych, coraz bardziej szczegółowych list, uzyskujemy w końcu wykaz odnośników do stron zawierających informacje z danej dziedziny. Druga grupa to automatyczne systemy wyszukiwawcze, tzw. roboty WWW, w których po podaniu interesującego nas słowa lub fragmentu zdania uzyskujemy wykaz (z reguły o wiele za długi w stosunku do naszych potrzeb...) wszystkich znalezionych stron WWW, na których podany przez nas tekst się znajduje. Największym i najpopularniejszym katalogiem pierwszego typu jest Yahoo, dostępny pod adresem (URL) http://www.yahoo.com/. Najpopularniejszy zaś z "robotów WWW" to Lycos - jego adres: http://lycos.cs.cmu.edu/. Czasami też poszukiwaną informację, np. o jakiejś instytucji, najprościej znaleźć można spoglądając po prostu na listę wszystkich serwerów WWW z danego obszaru (np. kraju). Wiele takich list gromadzonych jest i udostępnianych w sieci przez różnych autorów - w przypadku Polski najpełniejszą listę znaleźć można pod adresem http://www.nask.org.pl/Resources/www.html. Warto też przyjrzeć się stronie macierzystej Polski (http://info.fuw.edu.pl/pl/PolskaHome.html), zawierającej odsyłacze do wszystkiego, co ważne i ciekawe na polskich serwerach. Analogicznym zestawieniem, ale dotyczącym całego świata, jest strona macierzysta Ziemi (Planet Earth Home Page) - http://white.nosc.mil/info.html. Wiemy już prawie wszystko, co jest potrzebne, aby rozpocząć eksplorację "cyberprzestrzeni" WWW, a zatem zaopatrzmy się w odpowiednią przeglądarkę (informację o źródłach uzyskania przeglądarek można znaleźć tutaj) i w drogę! Warto jednak przypomnieć jakże adekwatne, choć sformułowane jeszcze przed powstaniem WWW, ostrzeżenie, zaczerpnięte z książki Brendana Kehoe Zen and the Art of the Internet: "Terytorium, na które teraz wstępujemy, może stać się fantastycznym pochłaniaczem czasu. Mogą przepływać godziny, ludzie będą przychodzić i odchodzić, a ty będziesz zamknięty w cyberprzestrzeni. Pamiętaj, aby wykonywać swoją pracę."


Jarosław Rafa 1995. Tekst udostępniony na licencji Creative Commons (uznanie autorstwa - użycie niekomercyjne - bez utworów zależnych). Kliknij tutaj, aby dowiedzieć się, co to oznacza i co możesz z tym tekstem zrobić. W razie jakichkolwiek wątpliwości licencyjnych bądź w celu uzyskania zgody na rozpowszechnianie wykraczające poza warunki licencji proszę o kontakt e-mailem: raj@ap.krakow.pl.

Wersja HTML opracowana 25.03.96.


Powrót do wykazu artykułów o Internecie Statystyka