GRUPOWANIE

KLASYFIKACJA

SELEKCJA

Założenia

Strona główna
-
Projekty
-
Założenia
-
Co nowego
-
Artykuły
-
Literatura i odsyłacze
-
Oprogramowanie
-
Współpraca
-
Autorzy

Zadania grupowania, klasyfikacji i selekcji rozpatrywane są w przestrzeniach wielowymiarowych. Przyjęto następujące założenia dotyczące postaci zapisywanych danych:

  1. Dane wejściowe (wartości cech elementów rozpatrywanych zapisywane są w postaci macierzy, której wiersze opisują kolejne elementy, kolumny natomiast wartości kolejnych cech będące liczbami rzeczywistymi, np.
    (1kB)
  2. Rozpatrywane elementy numerowane są kolejnymi liczbami naturalnymi począwszy od jedynki (1, 2, 3, ...).
  3. Wyniki grupowania / klasyfikacji dokładnej zapisywane są w postaci dwóch macierzy, gdzie pierwsza macierz jest macierzą danych wejściowych, a druga macierz jest macierzą jednokolumnową, w której wierszach zapisywane są oznaczenia (numery porządkowe) klas, np. zapis
    (1kB)(1kB)
    oznacza, że elementy 1. i 2. należą do klasy 1., elementy 3. i 4. do klasy 2., element 5. do klasy 3. Elementy macierzy zawierającej oznaczenia klas nie muszą być uporządkowane.
  4. Klasy oznaczane są kolejnymi liczbami naturalnymi począwszy od jedynki (1, 2, 3, ...). Brak znajomości klasy, do której należy element, czyli nieznana przynależność elementu do klasy oznaczana jest cyfrą 0 (pojawia się jeżeli w czasie grupowania / klasyfikacji nie została okereślona przynależność do żadnej z klas lub przy konwersji macierzy przynależności rozmytej do macierzy przynależności ostrej żaden ze stopni przynależności elementu nie jest większy od ustalonej wartości progowej).
  5. Dla potrzeb grupowania / klasyfikacji rozmytej wprowadzono stopień przynależności elementu do klasy, który jest liczbą rzeczywistą z przedziału [0,1], np. 0.1, 0.6.
  6. Wyniki grupowania / klasyfikacji rozmytej zapisywane są w postaci dwóch macierzy, gdzie pierwsza macierz jest macierzą danych wejściowych, a druga macierz zawiera kolumny odpowiadające kolejnym klasom (począwszy od klasy 1). W wierszach tej macierzy zapisywane są stopnie przynależności do klas, np.
    (1kB)(1kB)
    oznacza, że np. element 3 w stopniu 0.1 należy do klasy 1., w stopniu 0.8 do 2. i w stopniu 0.2 do 3.
    Uwaga: Jeżeli rozpatrywane klasy nie są w pełni rozłączne, to suma stopni przynależności elementu do kolejnych klas może być różna od 1.
  7. Wzorzec klas dla potrzeb klasyfikatora dokładnego zapisywany jest w postaci trzech macierzy, w pierwszej zapisane są współrzędne elementów występujących jako reprezentanci klas, w drugiej oznaczenia klas, w trzeciej - prawdopodobieństwo 'a priori' wystąpienia elementu należącego do danej klasy (i związanego z danym reprezentantem).
    (1kB)(1kB)(1kB)
    Uwaga: Jeżeli kilka klas ma tylko jednego reprezentanta to suma tych prawdopodobieństw jest równa 1. Jeżeli klasy mają większą liczbę reprezentantów to suma powinna być >=1.
    Sposób zapisu wzorców klas dla klasyfikatorów przyjęto uwzględniając założenia, iż ma być on wspólny dla licznej rodziny rozpatrywanych klasyfikatorów. Zdecydowano się na zapisywanie klasyfikatora w postaci odpowiedniego zbioru reprezentantów klas. Dla umożliwienia reprezentowania w ten sposób klas o różnej postaci, przyjęto że w zapisie tym dla jednej klasy można wskazywać więcej niż jednego reprezentanta.
    Trzecia macierz (zawierająca wartości prawdopodobieństw) może być pominięta. Jest ona wtedy przyjmowana w postaci domyślnej, jako posiadająca wszystkie elementy równe 1/n, gdzie n jest liczbą wierszy tej macierzy.