একটি সিকোয়েন্সের মেক্স (MEX - ন্যূনতম বাদ পড়া)#

$N$ আকারের একটি অ্যারে $A$ দেওয়া আছে। আপনাকে এমন ক্ষুদ্রতম অঋণাত্মক উপাদান খুঁজে বের করতে হবে যেটি অ্যারেতে নেই। এই সংখ্যাটিকে সাধারণত মেক্স (MEX - ন্যূনতম বাদ পড়া) বলা হয়।

$$ \begin{align} \text{mex}(\{0, 1, 2, 4, 5\}) &= 3 \\ \text{mex}(\{0, 1, 2, 3, 4\}) &= 5 \\ \text{mex}(\{1, 2, 3, 4, 5\}) &= 0 \\ \end{align} $$

লক্ষ্য করুন, $N$ আকারের একটি অ্যারের মেক্স কখনোই $N$-এর চেয়ে বড় হতে পারে না।

সবচেয়ে সহজ পদ্ধতি হলো অ্যারে $A$-এর সকল উপাদানের একটি সেট তৈরি করা, যাতে আমরা দ্রুত পরীক্ষা করতে পারি কোনো সংখ্যা অ্যারেতে আছে কিনা। এরপর আমরা $0$ থেকে $N$ পর্যন্ত সকল সংখ্যা পরীক্ষা করতে পারি, যদি বর্তমান সংখ্যাটি সেটে না থাকে, তাহলে সেটি রিটার্ন করব।

ইমপ্লিমেন্টেশন#

নিচের অ্যালগরিদমটি $O(N \log N)$ সময়ে চলে।

int mex(vector<int> const& A) {
    set<int> b(A.begin(), A.end());

    int result = 0;
    while (b.count(result))
        ++result;
    return result;
}

যদি কোনো অ্যালগরিদমে $O(N)$ সময়ে মেক্স গণনা করা প্রয়োজন হয়, তাহলে সেট-এর পরিবর্তে একটি বুলিয়ান ভেক্টর ব্যবহার করে এটি সম্ভব। লক্ষ্য করুন, অ্যারেটির আকার সম্ভাব্য সর্বোচ্চ অ্যারে আকারের সমান হতে হবে।

int mex(vector<int> const& A) {
    static bool used[MAX_N+1] = { 0 };

    // mark the given numbers
    for (int x : A) {
        if (x <= MAX_N)
            used[x] = true;
    }

    // find the mex
    int result = 0;
    while (used[result])
        ++result;

    // clear the array again
    for (int x : A) {
        if (x <= MAX_N)
            used[x] = false;
    }

    return result;
}

এই পদ্ধতিটি দ্রুত, কিন্তু শুধুমাত্র তখনই ভালো কাজ করে যখন আপনাকে একবার মেক্স গণনা করতে হয়। যদি আপনাকে বারবার মেক্স গণনা করতে হয়, যেমন আপনার অ্যারে ক্রমাগত পরিবর্তন হচ্ছে, তাহলে এটি কার্যকর নয়। এর জন্য আমাদের আরও ভালো কিছু দরকার।

অ্যারে আপডেটসহ মেক্স#

এই সমস্যায় আপনাকে অ্যারের পৃথক সংখ্যা পরিবর্তন করতে হবে এবং প্রতিটি আপডেটের পরে অ্যারের নতুন মেক্স গণনা করতে হবে।

এমন কুয়েরিগুলো দক্ষতার সাথে পরিচালনা করার জন্য একটি উন্নত ডেটা স্ট্রাকচার প্রয়োজন।

একটি পদ্ধতি হলো $0$ থেকে $N$ পর্যন্ত প্রতিটি সংখ্যার ফ্রিকোয়েন্সি নেওয়া এবং এর উপর একটি ট্রি-সদৃশ ডেটা স্ট্রাকচার তৈরি করা। যেমন একটি সেগমেন্ট ট্রি বা একটি ট্রিপ। প্রতিটি নোড একটি সংখ্যার রেঞ্জ প্রতিনিধিত্ব করে, এবং রেঞ্জের মোট ফ্রিকোয়েন্সির পাশাপাশি আপনি সেই রেঞ্জে ভিন্ন ভিন্ন সংখ্যার পরিমাণও সংরক্ষণ করবেন। এই ডেটা স্ট্রাকচারটি $O(\log N)$ সময়ে আপডেট করা সম্ভব, এবং $O(\log N)$ সময়ে মেক্সও খুঁজে পাওয়া সম্ভব, মেক্সের জন্য বাইনারি সার্চ করে। যদি $[0, \lfloor N/2 \rfloor)$ রেঞ্জ প্রতিনিধিত্বকারী নোডে $\lfloor N/2 \rfloor$ সংখ্যক ভিন্ন সংখ্যা না থাকে, তাহলে একটি অনুপস্থিত এবং মেক্স $\lfloor N/2 \rfloor$-এর চেয়ে ছোট, এবং আপনি ট্রির বাম শাখায় রিকার্সন করতে পারেন। অন্যথায় এটি কমপক্ষে $\lfloor N/2 \rfloor$, এবং আপনি ট্রির ডান শাখায় রিকার্সন করতে পারেন।

স্ট্যান্ডার্ড লাইব্রেরি ডেটা স্ট্রাকচার map এবং set ব্যবহার করেও এটি সম্ভব (এখানে ব্যাখ্যা করা একটি পদ্ধতির উপর ভিত্তি করে)। একটি map দিয়ে আমরা প্রতিটি সংখ্যার ফ্রিকোয়েন্সি মনে রাখব, এবং set দিয়ে আমরা অ্যারেতে বর্তমানে অনুপস্থিত সংখ্যাগুলো প্রতিনিধিত্ব করব। যেহেতু একটি set সাজানো থাকে, *set.begin() হবে মেক্স। মোট $O(N \log N)$ প্রিপ্রসেসিং প্রয়োজন, এবং এরপর মেক্স $O(1)$-এ গণনা করা যায় এবং একটি আপডেট $O(\log N)$-এ সম্পন্ন করা যায়।

class Mex {
private:
    map<int, int> frequency;
    set<int> missing_numbers;
    vector<int> A;

public:
    Mex(vector<int> const& A) : A(A) {
        for (int i = 0; i <= A.size(); i++)
            missing_numbers.insert(i);

        for (int x : A) {
            ++frequency[x];
            missing_numbers.erase(x);
        }
    }

    int mex() {
        return *missing_numbers.begin();
    }

    void update(int idx, int new_value) {
        if (--frequency[A[idx]] == 0)
            missing_numbers.insert(A[idx]);
        A[idx] = new_value;
        ++frequency[new_value];
        missing_numbers.erase(new_value);
    }
};

অনুশীলন সমস্যা#