Wstęp
Proces wyszukiwania informacji naukowych w tak ogromnej strukturze, jaką są bazy internetowe, wymaga przygotowania użytkownika sieci (zarówno studenta, jak i pracownika naukowego uczelni wyższej) w zakresie strategii wyszukiwawczych. Winien on posiadać pewną wiedzę na temat specjalistycznych baz funkcjonujących w sieci jako wiarygodnego źródła informacji naukowej [1]. Powinien też zdobyć umiejętność sprawnego i efektywnego poruszania się wśród niezliczonej liczby rekordów bibliograficznych, by użyć terminologii bibliotekoznawczej. Przygotowanie użytkownika polega na nabyciu umiejętności formułowania odpowiednich wyrażeń wyszukiwawczych, prowadzących do znalezienia rekordów bibliograficznych zawierających poszukiwaną treść.
W praktyce uczelnianej rolę wprowadzających w arkana sztuki przeszukiwania zasobów Internetu pełnią pracownicy biblioteki, specjaliści informacji naukowej. W nowoczesnym zarządzaniu bibliotekami szkół wyższych są to tzw. bibliotekarze dziedzinowi [2, 3], wykonujący pracę infobrokera [4] na rzecz macierzystej uczelni.
Celem niniejszej publikacji jest wprowadzenie w strukturę baz naukowych dla nauk medycznych oraz wskazanie ich użytkownikom takich strategii wyszukiwania, które spełniają wymogi relewantności i wiarygodności przy optymalizacji wyników i efektywności pracy [5].
Strategie wyszukiwawcze
Wyróżnia się następujące dwie metody wyszukiwawcze: prostą (Basic Search) – stosowanie słów kluczowych oraz zaawansowaną (Advanced Search). Do tworzenia bardziej skomplikowanych wyrażeń wyszukiwawczych stosuje się przeszukiwanie zaawansowane, które umożliwia formułowanie pytań tak precyzyjnie, aby otrzymać możliwie tylko te dane, których poszukuje użytkownik [6, 7].
Kryteria wyszukiwawcze
Używanie tzw. operatorów logicznych Boole’a (Boolean Logic) – AND, OR, NOT.
Strength of materials AND titanium alloys oznacza, że rezultat poszukiwań ma obejmować tylko te rekordy, w których znajdują się jednocześnie słowa strength of materials oraz titanium alloys.
Strength of materials OR titanium alloys oznacza, że mają zostać znalezione te rekordy, w których występuje termin strength of materials albo titanium alloys.
Strength of materials NOT titanium alloys – ostatni operator spowoduje wyszukanie tych rekordów, w których pojawia się określenie strength of materials, a nie ma określenia titanium alloys.
Hasła przedmiotowe
MeSH lub Subject Terms (język informacyjno-wyszukiwawczy, Medical Subject Headings).
Ograniczniki (limits)
Languages, age groups, study groups.
Rodzaj publikacji (publication types) – prace przeglądowe (case reports), klasyczne artykuły (classical articles), kliniczne konferencje (clinical conferences), badania kliniczne (clinical trial), komentarze (comments), badania porównawcze.
W celu podniesienia efektywności wyszukiwania informacji naukowych w e-zasobach zostały stworzone specjalne systemy informacyjno-wyszukiwawcze [8].
Języki informacyjno-wyszukiwawcze (JIW)
Najważniejszym elementem systemu informacyjno-wyszukiwawczego, w dużej mierze decydującym o jego funkcjonalnej wartości dla użytkownika, jest język informacyjno-wyszukiwawczy.
Sadowska i Turowska definiują język informacyjno-wyszukiwawczy jako „język sztuczny o wyspecjalizowanych funkcjach: odtwarzania treści i formy dokumentów oraz wyszukiwania ich w zbiorze informacyjnym w odpowiedzi na zapytanie użytkownika” [8]. Od typu języka zależy zarówno wartość zbioru wyszukiwawczego, wyznaczona przez możliwości wyrażenia w JIW, informacji zawartej w dokumentach, jak i możliwości wyszukiwawcze systemu. Im lepiej opracowany JIW, tym większe prawdopodobieństwo uzyskania wysokiej efektywności wyszukiwania i uzyskania optymalnej odpowiedzi na zapytania użytkownika.
Języki informacyjno-wyszukiwawcze zostały stworzone na potrzeby wyszukiwania informacji w bazach danych. Używają określonych terminów, które stanowią w danym języku elementy ich słownika (tezaurusa). Mają własną gramatykę i słownictwo, służące do opisu formy i treści dokumentów oraz szybkiego odnalezienia w zbiorach wszystkich elementów, które zostały scharakteryzowane za pomocą tych samych określeń. Ich podstawowymi cechami są sztuczność i wyspecjalizowane funkcje, odpowiadające potrzebom dziedziny wiedzy, której mają służyć. Język sztuczny, w opozycji do języka naturalnego, charakteryzuje się tym, że nie powstaje samorzutnie, lecz jest opracowany w konkretnym celu. Cechuje go znaczne ubóstwo w porównaniu z językiem naturalnym, zarówno pod względem budowy, jak i słownictwa. Ubóstwo to jest jednak kompensowane precyzyjnością nazewnictwa, zmierzającą do jednoznaczności semantycznej, eliminującej wieloznaczność słów języka naturalnego.
Słownictwo JIW jest zarejestrowane w odpowiednich słownikach, przygotowywanych przez ekspertów w danej dziedzinie i używanych obligatoryjnie przez specjalistów (najczęściej bibliotekarzy) wprowadzających je do baz internetowych. Słownikami tymi mogą być powszechnie stosowane tablice klasyfikacyjne (Uniwersalna Klasyfikacja Dziesiętna, Klasyfikacja Biblioteczno-Bibliograficzna), tezaurusy, słowniki haseł przedmiotowych oraz wykazy słów kluczowych. Niektóre słowniki posługują się językiem deskryptorowym (deskryptor to – zgodnie z definicją Słownika Języka Polskiego PWN – słowo lub grupa słów, które razem z innymi opisują treść tekstu na potrzeby katalogów lub systemów wyszukiwania informacji).
Języki informacyjno-wyszukiwawcze pełnią następujące funkcje [9]:
główne:
- metainformacyjna – polega ona na odwzorowaniu cech informacji i/lub nośników informacji, na których są one utrwalane, przez tworzenie ich reprezentacji zwanej charakterystyką wyszukiwawczą dokumentu;
- wyszukiwawcza – polega na wyrażaniu zapytań informacyjnych i umożliwieniu odnalezienia w zbiorze informacyjnym tych informacji, które spełniają warunki wyrażone w zapytaniu;
wtórne:
- organizująca – zapewnia ona strukturalizację zbioru informacyjnego, która ułatwia selekcję określonych opisów dokumentów;
- funkcja opisu zbiorów dokumentów i/lub wyznaczania zakresów pól semantycznych JIW.
Słowa kluczowe
Użytkownicy baz wiedzy naukowej zazwyczaj korzystają z najprostszej metody wyszukiwania informacji – jedynie za pomocą tzw. słów kluczowych. Słowa te odzwierciedlają treść, są przejęte z tytułu lub tekstu dokumentu jako znaczące, reprezentatywne dla podejmowanej w dokumencie tematyki [10]. Stosowanie wyłącznie słów kluczowych w wyszukiwarkach sprawia, że wiele prób wyszukiwawczych kończy się fiaskiem. Użytkownik przeszukujący bazy metodą słów kluczowych stoi przed zagrożeniem szumu informacyjnego. Otrzymuje zbyt wiele rekordów, wśród których musi odnaleźć poszukiwaną informację, nie będąc pewnym jej adekwatności do własnych potrzeb. Musi przefiltrować wiele dokumentów, rekordów bibliograficznych, by dotrzeć do oczekiwanej informacji. Metoda przeszukiwania naukowych baz internetowych jedynie według słów kluczowych jest czasochłonna i mało (lub całkiem) nieefektywna (mała efektywność wynika z samej metody ich formułowania oraz z obszerności baz wiedzy).
Najpopularniejszym sposobem eksploracji sieci jest wpisanie w wyszukiwarkę wyrażenia z tekstu dokumentu, jedno- lub kilkuwyrazowego, charakteryzującego daną publikację, zaczerpniętego zazwyczaj z tytułu lub streszczenia dokumentu (rzadziej z całej jego treści). Słowa do przeszukiwania baz dobierane są indywidualnie przez osobę poszukującą informacji na konkretny, interesujący ją temat. Zakres słów ogranicza się do aktualnego zasobu językowego, słownika indywidualnego, konkretnego użytkownika. Ze względu na wieloznaczność terminów i związków frazeologicznych słowo nie zawsze jest precyzyjnie dopasowane do poszukiwanej treści. Toteż wpisując słowo kluczowe, użytkownik niekoniecznie otrzymuje rekordy bibliograficzne odpowiadające jego oczekiwaniom. Wyszukiwarki internetowe są tak skonstruowane, że szukane słowo pojawia się w każdym miejscu występowania w sieci bądź w wybranej bazie. Jest to oczywiście standard umożliwiający korzystanie z globalnych zasobów informacji. O tej zasadzie konstrukcyjnej należy pamiętać także w przypadku korzystania z bazy naukowej, ograniczonej do konkretnej dziedziny wiedzy, ponieważ wpisane w wyszukiwarce słowo może występować zarówno w abstrakcie, jak i w tekście dokumentu, pełnić rolę słowa-klucza do treści, ale też zostać użyte bez tej funkcji. Wyszukiwanie według słów kluczowych łączy bowiem wprowadzony termin wyszukiwawczy ze wszystkimi polami rekordu bibliograficznego obecnymi w danej bazie wiedzy. Stąd czasem wielość rekordów, które nie zawsze zawierają poszukiwaną informację, wywołują zjawisko tzw. szumu informacyjnego i utrudniają oddzielenie danych ważnych od bezużytecznych.
Tezaurus
Medical Subject Headings (MeSH)
Słownikiem posługującym się językiem deskryptorowym w zakresie nauk medycznych jest tezaurus MeSH – MeSH U.S. National Library of Medicine. W angielskiej terminologii językiem informacyjno-wyszukiwawczym, tezaurusem, nazywany jest zarówno słownik języka deskryptorowego, jak i język haseł przedmiotowych. Językiem informacyjno-wyszukiwawczym, opracowanym dla potrzeb nauk medycznych jest język haseł przedmiotowych MeSH. Ma on postać tezaurusa, zawiera precyzyjnie kontrolowane słownictwo, uporządkowane w hierarchicznej, wielostopniowej strukturze. Definiuje się go również jako zbiór semantycznie i hierarchicznie powiązanych terminów z jednej dziedziny, ułatwiający wyszukiwanie informacji oraz umożliwiający efektywne i spójne indeksowanie i katalogowanie. Jest to „słownik języka deskryptorowego, w którym słownictwo jest równorzędne z wyrażeniami języka naturalnego, a gramatyką są reguły indeksowania współrzędnego” [11]. Zawiera hasła (deskryptory), bogaty zasób ich synonimów oraz określniki, pozwalające na zawężenie znaczenia haseł do konkretnego aspektu.
Tezaurus MeSH został opracowany przez Narodową Bibliotekę Medyczną w Bethesdzie (USA). Jego pierwsza edycja pochodzi z 1960 r. Zawiera blisko 20 000 terminów, które są używane do bardzo szczegółowego opisania zawartości medycznych dokumentów oraz do zapytań wyszukiwawczych. Wykorzystywany jest on obecnie do indeksowania artykułów z 4600 światowych czasopism biomedycznych w bazie danych Medline. Kartoteka MeSH jest aktualizowana corocznie.
Prace nad polską wersją MeSH zostały podjęte w 1997 r. w Bibliotece Głównej ówczesnej Akademii Medycznej w Poznaniu oraz w Bibliotece Medycznej UJ CM. Konsolidacja wysiłków nastąpiła w 2001 r. przez scalenie prac nad tezaurusem MeSH i włączenie wszystkich bibliotek medycznych w Polsce [8]. Prace nad przystosowaniem polskiej terminologii medycznej i tłumaczeniami terminologii angielskiej trwają nadal. Aktualna „Kartoteka haseł przedmiotowych MeSH 2015 – wersja polska” jest uzupełniona o polskie odpowiedniki haseł angielskich.
MeSH jest powszechnie znany w środowisku medycznym, ponieważ stanowi integralną część drukowanego serwisu Index Medicus. Jest to system gałęziowy, który z jednej strony umożliwia precyzyjne sformułowanie zapytania wyszukiwawczego, a z drugiej pozwala – za pomocą hasła nadrzędnego – odszukać w bazie wszystkie prace związane z poszukiwanym tematem. Słownictwo MeSH składa się z różnego rodzaju terminów charakterystycznych dla języka deskryptorowego: deskryptorów (main headings) charakteryzujących przedmiot i treść danego dokumentu (rekordu) oraz kwalifikatorów (subheadings), które bezpośrednio odnoszą się do deskryptorów i pozwalają na grupowanie dokumentów dotyczących szczegółowych aspektów tematycznych. Służą one do zawężania treści deskryptora, do sprecyzowania aspektu opisywanego zagadnienia.
Przykład: main headings CHILDREN, subheading DENTAL CARE
Pojęcie jest uzupełnione o terminy hasłowe (entry terms) oraz references: synonimy i wyrażenia bliskie synonimom, które są odsyłaczami do deskryptorów. Generalnie słownictwo haseł może być używane zamiennie z proponowanymi deskryptorami do wyszukiwania w Medline.
Deskryptory są ułożone zarówno w alfabetycznej, jak i w hierarchicznej (systematycznej) strukturze, która pozwala na przeszukiwanie na różnych poziomach szczegółowości. Trzystopniowa struktura haseł umożliwia sprawne posługiwanie się słownikiem. Na najbardziej ogólnym poziomie struktury są hasła nadrzędne, takie jak anatomia czy choroba. Bardziej szczegółowe można znaleźć na węższych poziomach hierarchii, np. korona zęba, miazga albo próchnica – są to hasła podrzędne.
Podstawą struktury MeSH jest struktura drzewa (tree structure). Wszystkie deskryptory MeSH są podzielone na 16 różnych kategorii tematycznych, a każda z nich na szereg podkategorii. Kategorie oznaczone są symbolami literowymi. Jeden deskryptor może występować w kilku różnych kategoriach, które są podzielone na podkategorie.
Kategorie MeSH:
A – anatomia,
B – zwierzęta, organizmy żywe, rośliny,
C – choroby,
D – substancje chemiczne i endogenne,
E – metody diagnostyczne, terapeutyczne i inne, wyposażenie techniczne,
F – psychiatria i psychologia,
G – biologia, biochemia, genetyka i fizjologia,
H – fizyka,
I – socjologia, edukacja,
J – technologia, przemysł,
K – nauki humanistyczne,
L – informacja i dokumentacja,
M – grupy zawodowe, grupy etniczne, grupy wiekowe,
N – opieka zdrowotna,
V – charakterystyka publikacji,
Z – nazwy geograficzne.
Struktura drzewa jest wykazem pokrewnych terminów z tą samą kategorią tematyczną. Każdy termin w strukturze jest zaopatrzony w alfanumeryczny kod i terminy, które ułożone są w 11 poziomach – od najbardziej ogólnych do najbardziej precyzyjnych. Zapewnia to większą efektywność wyszukiwania.
Struktura słownika MeSH w postaci drzewa ma bardzo istotny wpływ na proces wyszukiwania artykułów o tematyce medycznej. Dzięki ścisłej hierarchizacji pojęć możliwe jest nie tylko wyszukanie artykułów związanych ze słowem wpisanym przez użytkownika, lecz również z pojęciami powiązanymi z danym określeniem (np. bardziej szczegółowymi pojęciami z danej dziedziny medycyny). I tak wpisanie w okno wyszukiwarki pojęcia korzeń zęba spowoduje nie tylko wyszukanie artykułów indeksowanych pod tym pojęciem, ale również z pojęciami z nim powiązanymi, np. zębina, kość itp. Wewnątrz każdej podkategorii deskryptory są ułożone hierarchicznie, od najbardziej ogólnych, do najbardziej precyzyjnych terminów. Np. deskryptor rehabilitacja występuje w trzech różnych kategoriach:
- kategoria E – wyraża postępowanie lecznicze,
- kategoria G – określa specjalność medycyny,
- kategoria N – określa dział lecznictwa.
Przykładowy schemat wyszukiwania
W celu zilustrowania części teoretycznej przeanalizowano poniżej proces wyszukiwania informacji w bazach medycznych dla pojęcia z zakresu stomatologii. Za przykład niech posłuży wyszukanie piśmiennictwa na temat błony śluzowej (mucosa). Powinno to przebiegać w następujący sposób. Na początku do wyszukiwarki MeSH należy wprowadzić słowo kluczowe (key word) mucosa. Rycina 1 przedstawia obraz dotyczący wyszukiwanej informacji, jaki otrzymujemy na ekranie monitora.
Wyrażenie mucosa zostało znalezione pod hasłem przedmiotowym (MeSH heading) mucous membrane. Poniżej podany jest numer w strukturze drzewa oraz wyjaśnienie znaczenia pojęcia (scope note). Następnie podane są synonimy szukanego wyrażenia (entry terms): mussel tissue, mucous membranes, muscularis mucosae (ryc. 2).
Po znalezieniu hasła przedmiotowego w wyszukiwarce MeSH Browser przechodzimy do wyszukiwania w bazach Medline oraz Dentistry & Oral Sciences. Jeśli zaczynamy nasze wyszukiwanie według słowa kluczowego mucosa, to otrzymujemy mnogość rekordów zawierających to słowo. Przeszukiwanie zasobów baz za okres 2010–2015 przyniosło wynik 28 096 rekordów z dostępem do pełnego tekstu (ryc. 3).
Kontynuując poszukiwanie interesującej nas, relewantnej informacji możemy posłużyć się wyrażeniami synonimicznymi, podpowiedzianymi przez tezaurus MeSH, które są już hasłami przedmiotowymi. Hasłami, o czym warto pamiętać, wystandaryzowanymi i wprowadzonymi do zasobów słownikowych MeSH po akceptacji przez specjalistów z zakresu nauk medycznych. Przeszukujemy bazy według hasła przedmiotowego (Subject Terms) muscularis mucosae – wyszukiwanie za okres 2010–2015 przyniosło wynik 2307 rekordów z dostępem do pełnego tekstu (ryc. 4).
Dla użytkownika poszukującego wiadomości np. na temat błony śluzowej szczególnie przydatne są informacje w polu scope note. Pozwalają one na rozszerzenie pola poszukiwań o następne hasła przedmiotowe, wprowadzone już do baz Medline i Dentistry & Oral Science, wyróżnione podświetleniem i ułatwiające nawigację.