8. 最短経路最短経路
Planting Trees for scalable and efficient Canonical Hub Labeling (K. Lakhotia
et al.)
2頂点間の最短経路クエリ処理のためのインデックス構築 (事前計算) を並列分散処
理で高速化.
具体的には,最短経路クエリ処理の SOTA である Pruned Landmark Labeling
[Akiba+, SIGMOD'13] のインデックス構築処理部分を改良した.
8
13. 頂点の関連度 (続き)頂点の関連度 (続き)
以下の全ての論文では,品質に理論的保証がある近似解を求める.
SimTab: Accuracy-Guaranteed SimRank Queries through Tighter
Confidence Bounds and Multi-Armed Bandits (Y. Liu et al.)
Top-k,または閾値付きの近似 SimRank クエリ処理.
Realtime Index-Free Single Source SimRank Processing on Web-Scale
Graphs (J. Shi et al.)
与えられたクエリ頂点に対する全頂点の SimRank を 100 ms 以内に求める.
Realtime Top-k Personalized PageRank over Large Graphs on GPUs (J. Shi
et al.)
与えられたクエリ頂点に対する PPR 上位 頂点の値を 100 ms 以内に求める.k
13
30. k-cliquek-clique
-clique: 完全グラフを成す 頂点のサブ
グラフ.
-clique densest subgraph:
(含まれる -clique の数) / (頂点数)
が最大になるようなサブグラフ.
KClist++: A Simple Algorithm for
Finding k-Clique Densest Subgraphs
in Large Graphs (B. Sun et al.)
-clique densest subgraph の検出
(近似).
[Y. Che+, PVLDB 13(10) '20]
4-truss の部分は 4-clique でもある.
k k
k
k
k
30
45. グラフ処理基盤グラフ処理基盤
Pangolin: An Efficient and Flexible
Graph Mining System on CPU and
GPU (X. Chen et al.)
グラフパターンマイニングアルゴリ
ズムの効率的な記述と GPU 実行が可
能なフレームワーク.
グラフパターンマイニング︓Motif
counting や頻出サブグラフマイニン
グの総称.
[X. Chen+, PVLDB 13(8) '20]
45
46. グラフ処理基盤 (続き)グラフ処理基盤 (続き)
Graphite: A NUMA-aware HPC System for Graph Analytics Based on a new
MPI*X Parallelism Model (M. H. Mofrad et al.)
新しい 'MPI*X' というモデルによって効率的に並列分散グラフ処理をする.
MPI+X (既存)︓
マシン単位で処理を分割.
さらに各マシンで OpenMP 等によりコア数分並列化.
MPI*X (提案)︓
最初から マシン数×コア数 に処理を分割.
コア間の通信が減り NUMA-aware になる.
(Flat MPI と同じことを言っているように聞こえるが……︖)
46
47. 資料作成時点で未公開だった論文資料作成時点で未公開だった論文
Distributed Subgraph Counting: A General Approach
Many-Core Clique Enumeration with Fast Set Intersections
Ordering Heuristics for k-clique Listing
Maximizing the Reduction Ability for Near-maximum Independent Set
Computation
47