摘要:圖聚集技術(shù)是將一個大規(guī)模圖用簡潔的小規(guī)模圖來表示,同時保留原始圖的結(jié)構(gòu)和屬性信息的技術(shù)?,F(xiàn)有算法未同時考慮節(jié)點的屬性信息與邊的權(quán)重信息,導致圖聚集后與原始圖存在較大差異。因此,提出一種同時考慮節(jié)點屬性信息與邊權(quán)重信息的圖聚集算法,使得聚集圖既保留了節(jié)點屬性相似度又保留了邊權(quán)重信息。該算法首先定義了閉鄰域結(jié)構(gòu)相似度,通過一種剪枝策略來計算節(jié)點之間的結(jié)構(gòu)相似度;其次使用最小哈希(MinHash)技術(shù)計算節(jié)點之間的屬性相似度,并調(diào)節(jié)結(jié)構(gòu)相似與屬性相似所占的比例;最后,根據(jù)2方面相似度的大小對加權(quán)圖進行聚集。實驗表明了該算法可行且有效。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社