Warszawa, 15 marca 2002
Autorzy:
Karol Bieńkowski
Bartłomiej Bóbski
Tomasz Zieliński

Wyszukiwarka - analiza wymagań

Wstęp

O czym mowa

Ten dokument określa wymagania stawiane systemowi Wyszukiwarka. Wyszukiwarka to program indeksujący strony WWW napisane w HTMLu oraz umożliwiający wyszukiwanie stron na podstawie kryteriów określonych przez użytkownika. Wyszukiwanie obejmuje wyłącznie strony wcześniej zindeksowane.

Wyszukiwarka będzie indeksować strony dostępne przez mechanizmy systemu plików.

Wymagania Wyszukiwarki

Do poprawnego działania Wyszukiwarka będzie wymagać maszyny wirtualnej Javy w wersj 1.4 lub nowszej oraz możliwości uruchomienia kontenera serwletów/JSP Tomcat w wersji 4.0 lub nowszej.

Interfejs użytkownika

Interfejs Wyszukiwarki musi być zrealizowany przez WWW. Jest to wymaganie niezależne od rodzaju użytkownika systemu. Takie rozwiązanie zapewni prostotę obsługi oraz pielęgnacji systemu.

Zatem kominikacja z użytkownikiem musi odbywać się przez protokół HTTP.

Słowniczek

indeksowanie - proces, przeglądania stron i zbierania informacji o nich. strukturę danych w której Wyszukiwarka przechowuje informacje o zindeksowanych stronach nazywamy indeksem. Indeks zawiera dla każdej strony wagi słów występujących na niej.

waga słowa - Waga określa ważność słowa na danej stronie, jest tym większa im słowo jest ważniejsze dla strony.

rodzaj strony - rodzaje stron są predefiniowane przez twórców Wyszukiwarki i określają ogólną charakterystykę strony. Muszą być dostępne następujące rodzaje stron:

kategoria strony - związek dwóch (lub więcej) wyrazów określający zawartość strony. Strona może mieć jedną lub więcej kategorii. Przykład: kategorią strony o aparatach fotograficznych może być aparaty fotograficzne.

Szczegółowe wymagania

Użytkownik Poszukiwacz

Interfejs

Interfejs użytkownika (dostępny przez WWW) musi być tak prosty, żeby umożliwić podstawowe wyszukiwanie bez konieczności czytania pomocy. Użytkownik musi mieć, tak jak w konkurencyjnych wyszukiwarkach, okienko do wpisania szukanych słów. Zaawansowane opcje mają być dostępne przez standardowe elementy strony WWW: pola wyboru i lisy rozwijane, albo przez dodatkowe konstrukcje w okienku do wpisywania słów.

Dostępne funkcje

Poszukiwacz stawia Wyszukiwarce zapytanie, wpisując szukane słowa (lub wyrażenia) w okienko i wybierając dodatkowe opcje. W odpowiedzi Wyszukiwarka prezentuje strony najlepiej pasujące do zapytania.

Język zapytań

Jeżeli użytkownik wpisze kilka słów w okienku wyszukiwania to Wyszukiwarka zwróci tylko te strony, na których występują wszystkie słowa.

Dodatkowo będzie możliwość podania operatora OR, który spowoduje wyświetlenie stron zawierających przynajmniej jedno ze słów połączonych operatorem. OR ma mniejszy priorytet niż domyślny AND, więc zapytanie praca programista OR projektant zwróci strony zawierające dotyczące pracy dla zarówno programistów jak i dla projektantów.

Kolejna możliwość to wzięcie słów w ciapki. Słowa w ciapkach muszą wystąpić na znalezionej stronie obok siebie, np. "rower górski".

Dodatkowe opcje

Użytkownik może okerślić rodzaj strony jaki go interesuje.

Użytkownik może określić ile wyników będzie prezentowanych na pojedynczej stronie.

Prezentacja wyników

Jako wynik zapytania użytkownik zobaczy listę (być może pustą) stron odpowiadających jego zapytaniu. Będą na niej wyłącznie strony spełniające zapytanie wpisane w okienku, najwyżej zostaną umieszone strony najlepiej pasujące. Strona dobrze pasuje do zapytania, jeżeli słowa z zapytania mają na niej dużą wagę, gdy jej rodzaj odpowiada rodzajowi określonemu przez użytkownika oraz gdy jej kategoria zgadza się z kategorią otrzymaną z zapytania.

Przy każdej znalezionej stronie pojawią się jej fragmenty zawierające szukane słowa oraz kategoria, która została przyporządkowana stronie.

Użytkownik Właściciel stron

Właściciel stron musi mieć możliwość (za pomocą przeglądarki internetowej):

Właściciel stron będzie miał dostęp do powyższych opcji po podaniu swojego identyfikatora i hasła.

Użytkownik Administrator

Za pomocą przglądarki internetowej administrator będzie mógł:

Interfejs WWW Wyszukiwarki musi być zaimplementowany z rozdzieleniem warstwy logiki i warstwy prezentacji, tak by Administrator mógł łatwo modyfikować jej wygląd wprowadzając zmiany w HTMLu.

Opcjonalne rozszerzenia i zmiany