Szukaj z głową

Wielokrotnie już na łamach MI podejmowany był temat wyszukiwarek i sposobu posługiwania się nimi. Nie wystarczy jednak wiedzieć, pod jakim adresem znajduje się wyszukiwarka i co trzeba do niej wpisać, aby skutecznie odnajdywać informację w Internecie. Potrzebny jest jeszcze jeden element: odrobina inteligencji w interpretowaniu znalezionych przez wyszukiwarkę adresów.

Wyników podawanych przez wyszukiwarki nie można bowiem prawie nigdy traktować jako ostatecznego rezultatu poszukiwań. Są one dosyć przypadkowe, niczym pierwszy strzał artylerzysty: rzadko zdarza się, aby trafił dokładnie w cel, choć zawsze lokuje się gdzieś blisko niego. Gdy podamy wyszukiwarce np. tytuł jakiegoś czasopisma, chcąc poszukać jego witryny, na początkowych pozycjach listy nie pojawi się prawie nigdy jej strona główna, lecz z reguły któreś z mniej reprezentatywnych stron serwisu: jakiś konkretny artykuł albo... stopka redakcyjna. Podając nazwisko jakiejś osoby, zanim dotrzemy na jej własną stronę, zwykle będziemy musieli "przerzucić" kilkanaście adresów stron jej znajomych, na których wymienione jest poszukiwane nazwisko. I tak dalej... Wyniki dostarczone przez wyszukiwarkę to nie koniec szukania - to dopiero początek. Dalej musimy użyć własnej głowy; dopiero ona pomoże nam znaleźć adres najbardziej adekwatny do tematu, o którym poszukujemy informacji.

Chciałem Państwu przedstawić wyniki pewnego eksperymentu, który zupełnie mimowolnie udało mi się przeprowadzić. Zadałem grupie studentów zadanie polegające na odnalezieniu w Internecie informacji na dowolnie wybrany temat. Studenci ci właśnie przeszli cały cykl ćwiczeń w posługiwaniu się Internetem, znali budowę adresu Internetowego i znaczenie poszczególnych jego fragmentów, byli poinformowani o najważniejszych wyszukiwarkach zarówno polskich, jak i zagranicznych. Rezultaty ich pracy były jednak dość mizerne. Choć każdy potrafił znaleźć jakieś informacje na wybrany przez siebie temat, to niemal nikt nie umiał dotrzeć do "wyjściowych", najbardziej reprezentatywnych źródeł informacji, choć czasami było to zupełnie łatwe. Zawiniło właśnie - w większości - mechaniczne przepisywanie adresów znalezionych przez wyszukiwarki, traktowanie ich jak świętości, w której nie wolno nic zmienić. A tymczasem tu właśnie potrzebna jest głowa.

Jeden ze studentów wybrał sobie jako zadanie odnalezienie w Internecie informacji na temat NASA. Swoją drogą, temat-rzeka: sama NASA ma kilkanaście własnych serwerów WWW, każdy należący do innej placówki tej agencji i poświęcony innym zagadnieniom, a oprócz tego są rzecz jasna strony na obcych (tzn. nie związanych z NASA) serwerach. Ale zarazem przez to zadanie staje się bardzo łatwe, możliwe do wykonania nawet bez użycia wyszukiwarki: wystarczy zacząć od głównej strony www.nasa.gov i wchodząc kolejno w odsyłacze do innych serwerów NASA pokrótce opisać, jakiej tematyce - ogólnie - są one poświęcone, a otrzymamy zwięzły, przejrzysty i uporządkowany przegląd. Tymczasem otrzymałem dość chaotyczny spis przypadkowych stron WWW znajdujących się zarówno na serwerach NASA (występujących w zupełnie nieuporządkowanej kolejności), jak i na "obcych". Jedne od drugich nie były przy tym w żaden sposób odróżnione, a chyba jasne jest, że nie można przykładać takiej samej wagi np. do oficjalnych informacji z serwera NASA i do pochodzącego nie wiadomo skąd artykułu na temat "NASA a UFO", zamieszczonego na czyjejś prywatnej stronie na Polboxie.

Podobną chaotyczną "mieszankę" adresów zaserwował mi student poszukujący informacji na temat wstąpienia Polski do NATO. Tym razem jednak, co gorsza, w ogóle nie znalazł się tam adres, od którego należałoby wręcz "na ślepo" zacząć poszukiwania takich informacji - adres głównego serwera NATO (www.nato.int)! Przedstawione adresy pochodziły w większości z serwera Internetu dla Szkół oraz (co już lepsze) Centrum Informacyjnego polskiego rządu. Koleżanka tego studenta, szukająca informacji o laureatach nagrody Nobla, wymieniła szereg adresów na serwerach różnych polskich uczelni, stronach prywatnych, a nawet... w archiwum Gazety Wyborczej (!), aby dopiero po ich obszernym omówieniu na końcu mimochodem wspomnieć o najbardziej podstawowym adresie z tej dziedziny - www.nobel.se, oficjalnym serwerze Fundacji Nobla, gdzie znajdują się najpełniejsze i najbardziej autorytatywne informacje o wszystkich noblistach. Dlaczego zawracać sobie głowę informacjami z drugiej, czy nawet trzeciej ręki, skoro można mieć je z pierwszej?

Brak umiejętności interpretowania adresów WWW w całej pełni wykazała inna studentka, której zadaniem było znalezienie informacji na temat imprez kulturalnych w Krakowie. Wśród całego szeregu podanych stron znajdowała się m.in. seria takich: http://www.krakow.pl/WK/PL/kultura/afisz/afisz.htm, http://www.krakow.pl/WK/PL/kultura/krakow2000/front.htm i tak dalej... Widząc takie adresy, aż się prosi, żeby "uciąć" tę ścieżkę dostępu trochę wyżej - zobaczyć, co jest pod adresem http://www.krakow.pl/WK/PL/kultura/, nieprawdaż? Albo wręcz pod http://www.krakow.pl/ - gdy szukamy informacji o kulturze w Krakowie, obejrzenie głównej strony serwisu poświęconego temu miastu na pewno nie będzie złym pomysłem; musi tam przecież być jakiś odsyłacz do właściwego miejsca...

Chyba rekordowy "kwiatek" tego typu zaserwowała mi osoba poszukująca informacji na temat projektu organizacji Igrzysk Olimpijskich w Zakopanem w 2006 roku. Wśród zaledwie dwu znalezionych stron (druga zawierała oświadczenie Instytutu Ochrony Przyrody PAN, sprzeciwiające się organizacji wspomnianych igrzysk) znalazł się adres następujący: http://zeus.polsl.gliwice.pl/agrest-cgi/plconv/isoHwin/www.zakopane.pl/referendum.html. Nie trzeba chyba być wielkim specjalistą od Internetu, żeby zauważyć, że adres ten jest co najmniej dziwny. Nie wiedząc nawet, co oznacza jego początek (w istocie jest to zainstalowany na komputerze zeus.polsl.gliwice.pl skrypt, pobierający strony WWW z innych serwerów i zmieniający w nich kodowanie polskich liter z ISO na Windows!) można wysnuć przypuszczenie, że chyba tak naprawdę ta strona znajduje się na serwerze www.zakopane.pl, którego adres jest wyraźnie widoczny w końcowej części powyższego "tasiemca". Po sprawdzeniu przypuszczenie okazuje się słuszne - właściwy adres wspomnianej strony to http://www.zakopane.pl/referendum.html, a dotyczy ona przeprowadzonego w Zakopanem referendum na temat "Czy chcesz organizacji Igrzysk Olimpijskich?". Skoro jednak wiemy, że mieszkańcy Zakopanego tak bardzo żyją tym pomysłem, trochę dziwne wydawałoby się, gdyby na serwerze www.zakopane.pl nie było na ten temat nic więcej. Zajrzyjmy zatem na jego stronę główną. W istocie - jest tam wyraźny odsyłacz podpisany "Olimpiada 2006", prowadzący wprost do specjalnego serwera poświęconego wyłącznie temu tematowi - www.zakopane2006.onet.pl. * To chyba jeden z najbardziej klasycznych przykładów zastosowania "głowy" w wyszukiwaniu: zamiast mechanicznie opierać się na adresie podanym przez wyszukiwarkę, trzeba najpierw go uprościć, potem przejść do głównej strony serwisu, a wreszcie z niej podążyć za odpowiednim odsyłaczem - i trafiamy dokładnie do celu!

W powyższym przykładzie dał znać o sobie jeszcze jeden problem: nieumiejętność samego korzystania z wyszukiwarek. Wspomniana studentka poszukiwała informacji o olimpiadzie w Zakopanem przy pomocy "światowej" AltaVisty. Błąd ten popełniała większość testowanych osób: informacji dotyczących Polski i znajdujących się na polskich serwerach szukano przy pomocy światowych wyszukiwarek, głównie właśnie AltaVisty lub Yahoo. Trudno powiedzieć, z czego to wynika; może z jakiegoś braku zaufania do rodzimych serwisów, przekonania, że to, co zagraniczne, to lepsze? Tymczasem właśnie one (szczególnie polski Infoseek) są najskuteczniejsze w odnajdywaniu stron na polskich serwerach.

Równie ważną rolę jak użycie właściwej wyszukiwarki odgrywa - o czym pisano już niejednokrotnie w MI - właściwy dobór hasła do szukania. Tymczasem w omawianym przypadku informacji o planowanej olimpiadzie w Zakopanem szukano wpisując w AltaViście hasło: igrzyska olimpijskie. Nawet bez cudzysłowów! (kto nie wie, jaka jest różnica między zapisem w cudzysłowach i bez, niech przeczyta "help" na serwerze AltaVisty) - nie wspominając już o tym, że przecież nie interesują nas dowolne igrzyska olimpijskie, tylko jedne konkretne. Rezultat takiego poszukiwania oczywiście był łatwy do przewidzenia: dziesiątki adresów zawierających różne informacje związane z olimpiadami, wśród których z trudnością można było wyłowić wspomniane wcześniej dwa faktycznie dotyczące interesującego nas tematu. Oczywiście właściwszymi kluczami, których należałoby użyć do poszukiwań, byłyby np. +"igrzyska olimpijskie" +Zakopane albo +olimpiada +Zakopane, czy też ewentualnie +olimpiada +2006. Każdy z nich od razu wyeliminowałby nie interesujące nas strony dotyczące innych igrzysk olimpijskich. Podobnej rady trzebaby udzielić innej studentce, która szukając informacji o liczbach Fibonacciego, wpisała w wyszukiwarce nazwisko "Fibonacci", po czym użalała się nad tym, jak trudno wśród kilku tysięcy stron zawierających to hasło znaleźć te, które dotyczą wspomnianych liczb. Tymczasem rzecz jasna należało użyć: +Fibonacci +numbers.

Zupełnie za to nie rozumiem osoby, która mając za zadanie odnalezienie informacji na temat astmy, wpisała w wyszukiwarce hasło: choroby. Zakrawa na cud, że przy tak sformułowanym zapytaniu faktycznie zdołała "wyłowić" wśród mnóstwa stron kilka rzeczywiście traktujących o astmie. I znowu dało znać o sobie "mechaniczne" traktowanie adresów; jakoś nie zwrócił jej uwagi fakt, że na początku koszmarnie długiej ścieżki dostępu do znalezionej przez wyszukiwarkę strony (dotyczącej jednego z leków stosowanych w leczeniu astmy) znajduje się serwer o wiele mówiącym adresie www.alergen.info.pl. Adres ten sugeruje informacje o alergii - a zatem niemal dokładnie to, czego szukaliśmy! Jakże można zatem nie zajrzeć na jego stronę główną? Okazuje się, że jest tam jeszcze dużo więcej informacji na interesujący nas temat prócz tej jednej, dość przypadkowo znalezionej strony.

Z tych wszystkich przykładów wynika jeden wniosek, który na zakończenie chciałem ponownie podkreślić: musimy zdawać sobie sprawę z tego, że adresów znalezionych przez wyszukiwarkę nie można traktować jako ostatecznego celu. To dopiero półprodukt, "punkt zaczepienia" do naszych własnych poszukiwań. Czasami trzeba będzie podążyć za odsyłaczami na którejś ze znalezionych stron, aby przejść do innej strony, traktującej temat bardziej kompetentnie i szeroko; czasami wręcz przeciwnie - trzeba "skrócić" adres, zajrzeć na wyższy poziom w strukturze katalogów serwera, albo nawet na stronę główną, aby znaleźć najodpowiedniejszy odsyłacz prowadzący do danego tematu. Czasami trzeba po prostu zgadnąć adres serwera, od którego powinniśmy rozpocząć poszukiwania; w przypadku tematów takich jak np. NASA czy NATO nie jest to zbyt trudne. Tak czy siak, w każdym przypadku trzeba użyć przede wszystkim własnej głowy. Przypomina się hasło, które już dawno temu wieszano na ścianach w siedzibie koncernu IBM: "Think!". Myśl! Komputer za ciebie nie pomyśli. Zdaje się, że obecnie coraz częściej o tym zapominamy...


* Omawiane strony na temat olimpiady w Zakopanem już nie istnieją.


Jarosław Rafa 1998. Tekst udostępniony na licencji Creative Commons (uznanie autorstwa - użycie niekomercyjne - bez utworów zależnych). Kliknij tutaj, aby dowiedzieć się, co to oznacza i co możesz z tym tekstem zrobić. W razie jakichkolwiek wątpliwości licencyjnych bądź w celu uzyskania zgody na rozpowszechnianie wykraczające poza warunki licencji proszę o kontakt e-mailem: raj@ap.krakow.pl.

Wersja HTML opracowana 15.09.98, ostatnia aktualizacja adresów 23.06.2000.


Powrót do wykazu artykułów o Internecie Statystyka