|
INSTRUKCJA OBSŁUGI PROGRAMU 'KLASYFIKACJA I GRUPOWANIE' |
Instalacja
Instalacja programu polega na skopiowaniu zawartości biblioteki KiG (funkcji i skryptów) do wspólnego katalogu, w którym znajdują się funkcje z bibliotek: KLAS 1.0, MC PDM, MC PP2 oraz ustawieniu ścieżki dostępu do tego katalogu z poziomu MATLABa. Wykaz wszystkich funkcji wykorzystywanych przez program 'Klasyfikacja i Grupowanie' znajduje się w zakładce pakiet KiG.
Uruchomienie
Uruchomienie programu odbywa się poprzez wpisanie nazwy kig w edytorze poleceń (Command Window) MATLABa. Pojawia się okno dialogowe, w którym należy wybrać plik z danymi a następnie potwierdzić wybór przyciskiem Otwórz. Po tej czynności pojawia się okno główne programu. Podzielić je można na cztery części:
Pasek tytułowy
Menu rozwijalne
Wizualizacja danych
Modyfikacje wizualizacji danych
Pasek tytułowy
Można na nim znaleźć informacje na temat wielkości analizowanej przestrzeni oraz komunikat o zajętości komputera obliczeniami.
Menu rozwijalne
Menu rozwijalne zostało podzielone na następujące grupy:
Grupowanie
Klasyfikator
Klasyfikacja
Usługi
W części 'Grupowanie' można znaleźć szereg funkcji służących do przeprowadzenia operacji grupowania na wczytanym wcześniej zbiorze danych, ocenie jakości tej operacji oraz zmiany parametrów. Do dyspozycji są następujące metody grupowania:
- Iteracyjna, parametry wejściowe: ilość grup oraz macierz S środków grup;
- Hierarchiczna, parametry wejściowe: ilość grup oraz sposób porównywania zbiorów;
- Najbliższych sąsiadów (1), brak parametrów wejściowych;
- Najbliższych sąsiadów (2), parametry wejściowe: kwantyl zależny od przyjętego poziomu ufności oraz wartość progowa powiązań;
- K - najbliższych sąsiadów, parametry wejściowe: ilość najbliższych sąsiadów;
- MMD, parametry wejściowe: mnożnik wartości progowej;
- Drzewa minimalnego, parametry wejściowe: liczba klas;
- Macierzy powiązań, parametry wejściowe: wartość progowa powiązań;
- Wykorzystujące logikę rozmytą w algorytmach hierarchicznym i najbliższych sąsiadów, parametry wejściowe: ilość grup;
- Wykorzystujące zbiory przybliżone w algorytmach hierarchicznym i najbliższych sąsiadów, parametry wejściowe: ilość grup, wielkość zbioru elementarnego i liczebność grup dla algorytmu hierarchicznego oraz stopień przybliżenia i liczebność grup dla metody najbliższych sąsiadów.
Jakość grupowania jest oceniana na podstawie momentu i rozproszenia. Mniejsza wartość oznacza lepszą jakość podziału.
Opcje pozwalają na dokonanie wyboru typu funkcji odległości i podobieństwa.
Plik z danymi można otworzyć w trakcie działania programu wywołując funkcję Nowe dane. Procedura otwierania przebiega w identyczny sposób jak przy uruchamianiu programu.
'Klasyfikator' pozwala wyznaczyć klasyfikator na cztery różne sposoby:
- sposób 1 - zbiór uczący oraz zbiór testujący są równe pełnemu zbiorowi źródłowemu,
- sposób 2 - dane dotyczące połowy elementów zbioru źródłowego są stosowane do wyznaczenia klasyfikatora, a dane dotyczące pozostałych elementów tego zbioru są stosowane do weryfikacji wyznaczonego klasyfikatora,
- sposób 3 - postępownie opisane w sposobie 2 jest wykonywane przemiennie w dwóch krokach,
- sposób 4 - dla każdego obiektu będącego elementem zbioru źródłowego konstruowany jest klasyfikator na podstawie danych dotyczących pozostałych obiektów, a następnie klasyfikator ten weryfikowany jest na podstawie danych dotyczacych obiektu.
W każdym z tych sposobów po zakończeniu obliczeń wyświetlane zostają wyniki dotyczące jakości klasyfikatora:
- Względna liczba poprawnych klasyfikacji
- Względna liczba błędnych klasyfikacji
- Względna liczba sklasyfikowanych obiektów
- Względna liczba obiektów, które nie zostały sklasyfikowane
Polecenia Otwórz/Zapisz klasyfikator uruchamiają okna dialogowe pozwalające na wczytanie do pamięci komputera, bądź na zapis do pliku macierzy klasyfikatora K i macierzy R zawierającej parametry, dla których był wyznaczony klasyfikator. Pliki z macierzami klasyfikatora i parametrów są plikami binarnymi z rozszerzeniem *.kls . W przypadku, gdy program nie będzie mógł zastosować klasyfikatora K, znajdującego się we wczytywanym pliku, do klasyfikacji danych zawartych w macierzy V zostanie wyświetlony komunikat Nieprawidłowa macierz klasyfikatora K zaraz po próbie otwarcia pliku.
Dodatkowo zdublowana została funkcja zmiany opcji programu.
Możliwe są tylko dwa sposoby klasyfikacji zbioru na podstawie wyznaczonego klasyfikatora: dokładnie lub przybliżenie. Po zakończeniu klasyfikacji zostaje wyświetlona ocena jakości z przedziału od 0 do 1, gdzie 1 jest oceną najlepszą.
Funkcja przetwarzanie pozwala na zmianę wartości cech w analizowanym zbiorze według wzoru V=a*V+b.
Funkcja konwersja dokonuje zamiany macierzy przynależności dokładnej na macierz przynależności przybliżonej lub odwrotnie.
Wizualizacja danych
Obszar ten graficznie prezentuje wyniki obliczeń uzyskane podczas pracy programu. Możliwe jest wyświetlanie tylko wstępnie przetworzonej przestrzeni wielowymiarowej na jej reprezentację powierzchniową. Wszystkie potrzebne transformacje są udostępniane przez program. W zależności od postaci macierzy G odwzorowanie jest prezentowane w postaci punktów/figur (dla przynależności dokładnej), bądź w postaci okręgów (dla przynależności rozmytej).
Po obliczeniach każdorazowo należy odświeżyć obszar graficznej prezentacji. Można to zrobić przyciskami zmiany cech < , > i Rzutowanie prostokątne, a także Główne składowe, Główne współrzędne i Współrzędne dyskryminacyjne (dla przestrzeni powyżej trzech wymiarów).
Program prezentuje co najwyżej sto grup.
Modyfikacje wizualizacji danych
Umieszczone w tym obszarze przyciski spełniają następujące funkcje:
Tryb wizualizacji: figury/kolory - pozwala na zmianę rodzaju prezentowania wyników obliczeń w postaci figur geometrycznych lub kolorowych punktów,
Zmień osie - otwierane tym przyciskiem okno pozwala na zmianę skali x i y,
< , > (Cecha x/cecha y) - pozwalają na zmianę przydzielenia wartości kolejnej cechy do osi x lub y,
Rzutowanie prostokątne - realizuje rzutowanie prostokątne punktów przestrzeni wielowymiarowej na płaszczyznę. Gdy zbiór ma trzy i więcej wymiarów dodatkowo obliczane są oceny odwzorowania na płaszczyźnie,
Główne składowe - wykorzystuje metodę głównych składowych do odwzorowania przestrzeni wielowymiarowej na płaszczyźnie. Przycisk ten zostaje uaktywniony w czasie analizowania zbioru przynajmniej o trzech wymiarach, dodatkowo obliczane są oceny odwzorowania na płaszczyźnie,
Główne współrzędne - wykorzystuje metodę głównych współrzędnych do odwzorowania przestrzeni wielowymiarowej na płaszczyźnie. Przycisk ten zostaje uaktywniony w czasie analizowania zbioru przynajmniej o trzech wymiarach, dodatkowo obliczane są oceny odwzorowania na płaszczyźnie,
Współrzędne dyskryminacyjne - realizuje transformację sklasyfikowanego zbioru punktów z przestrzeni wielowymiarowej na płaszczyznę wykorzystując metodę współrzędnych dyskryminacyjnych. Przycisk ten zostaje uaktywniony w czasie analizowania zbioru przynajmniej o trzech wymiarach oraz trzech klasach uzyskanych w procesie grupowania, dodatkowo obliczane są oceny odwzorowania na płaszczyźnie,
Rysuj klasyfikator - obrazuje macierz klasyfikatora K, po wyznaczeniu lub otwarciu z pliku, w postaci okręgów wraz z danymi. Rysowanie jest realizowane tylko we współrzędnych prostokątnych w zależności od przydzielonych cech do osi x i y.
Koniec - kończy pracę z programem.
Okna edycyjne Oceny odwzorowania na płaszczyźnie informują o dobrym odwzorowaniu, gdy:
K1 (kryterium 1) jest bliskie jedności co świadczy o dobrym zachowaniu odległości pomiędzy środkami klas,
K2 (kryterium 2) jest większe lub równe zeru,
K3 (kryterium 3) przyjmuje jak największe wartości.
Uwaga
Zaleca się, aby po wykonaniu określonej operacji zamknąć wywołujące je okno. Zbyt duża liczba otwartych okien może doprowadzić do nieprawidłowych zachowań programu.
Początek