Lowest Common Ancestor (LCA) - টারজানের অফ-লাইন অ্যালগরিদম#

আমাদের কাছে $n$ নোড বিশিষ্ট একটি ট্রি $G$ আছে এবং $(u, v)$ আকারের $m$ টি কুয়েরি আছে। প্রতিটি কুয়েরি $(u, v)$-র জন্য আমরা $u$ ও $v$ ভার্টেক্সের LCA বের করতে চাই, অর্থাৎ সেই নোড যেটি $u$ এবং $v$ উভয়ের অ্যানসেস্টর এবং ট্রি-তে সবচেয়ে বেশি গভীরতায় অবস্থিত। নোড $v$ নিজেও $v$-এর অ্যানসেস্টর, তাই LCA দুটি নোডের একটিও হতে পারে।

এই আর্টিকেলে আমরা সমস্যাটি অফ-লাইনে সমাধান করব, অর্থাৎ আমরা ধরে নিচ্ছি যে সব কুয়েরি আগে থেকে জানা, এবং তাই আমরা যেকোনো ক্রমে কুয়েরিগুলোর উত্তর দিতে পারি। নিচের অ্যালগরিদম সব $m$ টি কুয়েরির উত্তর মোট $O(n + m)$ সময়ে দিতে পারে, অর্থাৎ যথেষ্ট বড় $m$-এর জন্য প্রতিটি কুয়েরিতে $O(1)$।

অ্যালগরিদম#

অ্যালগরিদমটির নাম রবার্ট টারজানের নামানুসারে, যিনি ১৯৭৯ সালে এটি আবিষ্কার করেছিলেন এবং ডিসজয়েন্ট সেট ইউনিয়ন ডেটা স্ট্রাকচারেও অনেক অবদান রেখেছিলেন, যেটি এই অ্যালগরিদমে ব্যাপকভাবে ব্যবহৃত হবে।

অ্যালগরিদমটি ট্রি-র একটি DFS ট্রাভার্সাল দিয়ে সব কুয়েরির উত্তর দেয়। একটি কুয়েরি $(u, v)$-র উত্তর দেওয়া হয় $u$ নোডে, যদি $v$ নোড ইতোমধ্যে আগে ভিজিট করা হয়ে থাকে, অথবা উল্টো।

তাহলে ধরি আমরা বর্তমানে $v$ নোডে আছি, আমরা ইতোমধ্যে রিকার্সিভ DFS কল করেছি, এবং কুয়েরি $(u, v)$-র দ্বিতীয় নোড $u$-ও ইতোমধ্যে ভিজিট করেছি। চলো শিখি কীভাবে এই দুটি নোডের LCA বের করা যায়।

লক্ষ্য কর যে $\text{LCA}(u, v)$ হয় $v$ নোড নিজে অথবা তার কোনো অ্যানসেস্টর। তাই আমাদের $v$-এর অ্যানসেস্টরদের মধ্যে ($v$ সহ) সবচেয়ে নিচের নোড খুঁজতে হবে যার জন্য $u$ নোড একটি ডিসেন্ডেন্ট। এছাড়াও লক্ষ্য কর যে একটি নির্দিষ্ট $v$-এর জন্য ট্রি-র ভিজিট করা নোডগুলো একাধিক ডিসজয়েন্ট সেটে বিভক্ত হয়। $v$ নোডের প্রতিটি অ্যানসেস্টর $p$-এর নিজস্ব সেট আছে যেটিতে এই নোড এবং তার চিলড্রেনদের মধ্যে যারা $v$ থেকে ট্রি-র রুট পর্যন্ত পাথের অংশ নয় তাদের রুটযুক্ত সাবট্রিগুলো থাকে। $u$ নোড যে সেটে থাকে সেটি $\text{LCA}(u, v)$ ডিটারমিন করে: LCA হলো সেটের প্রতিনিধি, অর্থাৎ $v$ এবং ট্রি-র রুটের মধ্যকার পাথে অবস্থিত নোড।

আমাদের শুধু দক্ষতার সাথে এই সব সেট বজায় রাখতে শিখতে হবে। এজন্য আমরা DSU ডেটা স্ট্রাকচার প্রয়োগ করি। ইউনিয়ন বাই র‍্যাংক প্রয়োগ করতে, আমরা প্রতিটি সেটের প্রকৃত প্রতিনিধি ($v$ এবং ট্রি-র রুটের মধ্যকার পাথের মান) ancestor অ্যারেতে সংরক্ষণ করি।

চলো DFS-এর ইমপ্লিমেন্টেশন আলোচনা করি। ধরি আমরা বর্তমানে $v$ নোড ভিজিট করছি। আমরা DSU-তে নোডটিকে একটি নতুন সেটে রাখি, ancestor[v] = v। যথারীতি আমরা $v$-এর সব চিলড্রেন প্রসেস করি। এজন্য আমাদের প্রথমে সেই নোড থেকে রিকার্সিভলি DFS কল করতে হবে, এবং তারপর এই নোডটিকে তার সব সাবট্রিসহ $v$-এর সেটে যোগ করতে হবে। এটি union_sets ফাংশন এবং পরবর্তী অ্যাসাইনমেন্ট ancestor[find_set(v)] = v দিয়ে করা যায় (এটি প্রয়োজনীয়, কারণ union_sets সেটের প্রতিনিধি পরিবর্তন করতে পারে)।

সবশেষে সব চিলড্রেন প্রসেস করার পর আমরা $(u, v)$ আকারের সব কুয়েরির উত্তর দিতে পারি যেখানে $u$ ইতোমধ্যে ভিজিট করা হয়েছে। কুয়েরির উত্তর, অর্থাৎ $u$ এবং $v$-এর LCA, হবে ancestor[find_set(u)] নোড। সহজেই দেখা যায় যে একটি কুয়েরির উত্তর শুধু একবারই দেওয়া হবে।

চলো এই অ্যালগরিদমের টাইম কমপ্লেক্সিটি ডিটারমিন করি। প্রথমত, DFS-এর জন্য $O(n)$। দ্বিতীয়ত, union_sets ফাংশন কল যা $n$ বার হয়, ফলে সেটিও $O(n)$। এবং তৃতীয়ত, প্রতিটি কুয়েরির জন্য find_set কল, যা $O(m)$ দেয়। সুতরাং মোট টাইম কমপ্লেক্সিটি $O(n + m)$, অর্থাৎ যথেষ্ট বড় $m$-এর জন্য এটি প্রতিটি কুয়েরিতে $O(1)$-এর সমতুল্য।

ইমপ্লিমেন্টেশন#

এখানে এই অ্যালগরিদমের একটি ইমপ্লিমেন্টেশন দেওয়া হলো। DSU-এর ইমপ্লিমেন্টেশন অন্তর্ভুক্ত করা হয়নি, কারণ এটি কোনো পরিবর্তন ছাড়াই ব্যবহার করা যায়।

vector<vector<int>> adj;
vector<vector<int>> queries;
vector<int> ancestor;
vector<bool> visited;

void dfs(int v)
{
    visited[v] = true;
    ancestor[v] = v;
    for (int u : adj[v]) {
        if (!visited[u]) {
            dfs(u);
            union_sets(v, u);
            ancestor[find_set(v)] = v;
        }
    }
    for (int other_node : queries[v]) {
        if (visited[other_node])
            cout << "LCA of " << v << " and " << other_node
                 << " is " << ancestor[find_set(other_node)] << ".\n";
    }
}

void compute_LCAs() {
    // initialize n, adj and DSU
    // for (each query (u, v)) {
    //    queries[u].push_back(v);
    //    queries[v].push_back(u);
    // }

    ancestor.resize(n);
    visited.assign(n, false);
    dfs(0);
}