Změny

Skočit na navigaci Skočit na vyhledávání

Implementace - Diplomka

Přidáno 332 bajtů, před 8 lety
Vyhledávání shluků
Samotné vyhledávání shluků používá výše vybranou metodu DBSCAN, která je vhodná pro svou rychlost a dobré vyrovnání se s odlehlými hodnotami (v tomto případě samostatně stojícími portály).
Nejprve s pomocí třídy ''PortalList '' získám seznam portálů, které jsou relevantní pro daný časový úsek, tedy veškeré portály s definovanou minilální úrovní, které byly aktivní v intervalu začínajícím 5 minut před zadaným časem a končícím 5 minut po něm. Každý z těchto portálů má nastavené číslo clusteru na hodnotu 0, která znamená že zatím nepatří do žádného shluku.
Následně, pokud portál nepatří do žádného existujícího shluku, se portálu přiřadí nejbližší volné číslo clusteru a najdou se veškeré zbývající portály se seznamu, které splňují podmínku maximální vzdálenosti a patří stejné frakci. Tyto portály jsou následně zařazeny do zpracovávaného shluku. V případě, že některý z okolních portálů již patří do existujícího clusteru, dojde k jejich sloučení pod číslem existujícího shluku. Zde by bylo možno dosáhnout minoritního zrychlení porovnámím velikosti shluků a následným použitím čísla většího z nich, avšak při průměrné velikosti shluku okolo pěti portálů by tato optimalizace mohla být naopak kontraproduktivní,. Tento krok je opakován pro veškeré portály ze seznamu. Posledním krokem shlukování je vyřazení příliš malých shluků (v současné době je experimentálně stanovena nejmenší velikost shluku na 5 portálů). Výsledné shluky jsou následně vypsány aby mohly být použity pro jejich grafické znázornění.

Navigační menu