GRUPOWANIE

KLASYFIKACJA

SELEKCJA

PROGRAM 'KLASYFIKACJA I GRUPOWANIE'

Strona główna
-
Instrukcja obsługi programu KiG

+ pakiet KiG
+ zbiory testowe
+ funkcje biblioteki KiG

FUNKCJE BIBLIOTEKI KiG

G=mpowiazan(V,a)

Algorytm macierzy powiązań grupowania elementów zbioru V. Przynależność elementów do grup zostanie zapisana w macierzy G.
Parametr 'a' przyjmuje wartości od 0 do ilości cech (kolumn macierzy V). Określa ile razy powinno się pojawić powiązanie dwóch obiektów w macierzach powiązań (liczba macierzy powiązań jest równa liczbie cech), aby ostatecznie zakwalifikować ich przynależność do jednej grupy.

Algorytm macierzy powiązań jest algorytmem grupowania do zastosowań dla przestrzeni wielowymiarowych. Bazuje on na następujących krokach:

  1. Podział przestrzeni o n wymiarach na n przestrzeni jednowymiarowych.
  2. Obliczenie średniej odległości dsr pomiędzy obiektami w wyodrębnionej przestrzeni jednowymiarowej.
  3. Zastosowanie kryterium przynależności dwóch elementów do jednej grupy w postaci:

    min(xi,xj) + dsr >= max(xi,xj)

  4. Powrót do punktu 2. i dokonanie identycznych obliczeń dla kolejnych przestrzeni jednowymiarowych.
  5. Sumowanie otrzymanych n macierzy powiązań.
  6. Określenie wartości progowej powiązań, tzn. krotności powtórzenia się powiązania dwóch obiektów, w celu ostatecznego zakwalifikowania ich do wspólnej grupy.


Macierz powiązań
Pojedyncza macierz powiązań jest to macierz kwadratowa, której wymiarem jest liczba obiektów. W celach praktycznych wykorzystuje się tylko macierz trójkątną leżącą nad (pod) główną przekątną. Na głównej przekątnej znajdują się zera.


    Przegrupuj

G=przegrupuj(G)

Funkcja służy do przenumerowania macierzy przynależności G. Zastosowanie tej funkcji likwiduje nieciągłości w numeracji grup. Macierz G musi być macierzą przynależności dokładnej.

Przykład
G=[0 1 2 5 5 3 8]
po przegrupowaniu
G=[0 1 2 4 4 3 5]


    Sasiad2

G=sasiad2(V,p,w,r,o,a,b)

Zmodyfikowany algorytm najbliższego sąsiada grupowania elementów zbioru V. Modyfikacja polega na wprowadzeniu elementów algorytmu macierzy powiązań. Przynależność elementu do grup zostanie zapisana w macierzy G.

Parametr 'p' przyjmuje wartości od 0 do ilości cech (kolumn macierzy V). Określa ile razy powinno się pojawić powiązanie dwóch obiektów w macierzach powiązań (liczba macierzy powiązań jest równa liczbie cech), aby ostatecznie zakwalifikować ich przynależność do jednej grupy.

Parametr 'w' jest kwantylem zależnym od przyjętego poziomu ufności, wartość domyślna tego współczynnika wynosi 1.

Parametry r, o, a, b są opcjonalne.

Parametr r - miara odległości lub podobieństwa (domyślnie r=1)
r=1 - odległość euklidesowa
r=2 - odległość Hamminga
r=3 - odległość Canbera
r=4 - odległość Mahalanobisa
r=5 - podobieństwo "cosinus kąta między wektorami x, y"
r=6 - podobieństwo na podstawie funkcja odległości h=1/(1+a*d^b)
r=7 - podobieństwo na podstawie funkcja odległości h=exp(-a*d)
(d - odległość elementów x, y)

Parametr o - funkcja odległości użyta w mierze podobieństwa (domyślnie o=1)
o=1 - odległość euklidesowa
o=2 - odległość Hamminga
o=3 - odległość Canbera
o=4 - odległość Mahalanobisa

Parametry a,b - stałe warunkujące własności funkcji podobieństwa (domyślnie a=b=1)

Algorytm został napisany na podstwaie algorytmu zamieszczonego w funkcji 'sasiad.m'.


Początek