Změny

Skočit na navigaci Skočit na vyhledávání

Implementace - Diplomka

Přidáno 1 378 bajtů, před 8 lety
Vyhledávání shluků
=== Vyhledávání shluků ===
Samotné vyhledávání shluků používá výše vybranou metodu DBSCAN, která je vhodná pro svou rychlost a dobré vyrovnání se s odlehlými hodnotami (v tomto případě samostatně stojícími portály).
 
Nejprve s pomocí třídy PortalList získám seznam portálů, které jsou relevantní pro daný časový úsek, tedy veškeré portály s definovanou minilální úrovní, které byly aktivní v intervalu začínajícím 5 minut před zadaným časem a končícím 5 minut po něm. Každý z těchto portálů má nastavené číslo clusteru na hodnotu 0, která znamená že zatím nepatří do žádného shluku.
 
Následně, pokud portál nepatří do žádného existujícího shluku, se portálu přiřadí nejbližší volné číslo clusteru a najdou se veškeré zbývající portály se seznamu, které splňují podmínku maximální vzdálenosti a patří stejné frakci. Tyto portály jsou následně zařazeny do zpracovávaného shluku. V případě, že některý z okolních portálů již patří do existujícího clusteru, dojde k jejich sloučení pod číslem existujícího shluku. Zde by bylo možno dosáhnout minoritního zrychlení porovnámím velikosti shluků a následným použitím čísla většího z nich, avšak při průměrné velikosti shluku okolo pěti portálů by tato optimalizace mohla být naopak kontraproduktivní,

Navigační menu