ফাস্ট ফুরিয়ে ট্রান্সফর্ম#

এই আর্টিকেলে আমরা এমন একটি অ্যালগরিদম আলোচনা করব যা দৈর্ঘ্য $n$-এর দুটি পলিনোমিয়ালকে $O(n \log n)$ সময়ে গুণ করতে দেয়, যা $O(n^2)$ সময়ের ট্রিভিয়াল গুণের চেয়ে ভালো। স্পষ্টতই দুটি বড় সংখ্যার গুণও পলিনোমিয়ালের গুণে রিডিউস করা যায়, তাই দুটি বড় সংখ্যাও $O(n \log n)$ সময়ে গুণ করা যায় (যেখানে $n$ সংখ্যাগুলোর ডিজিটের সংখ্যা)।

ফাস্ট ফুরিয়ে ট্রান্সফর্মেশন (FFT) আবিষ্কারের কৃতিত্ব কুলি এবং টুকিকে দেওয়া হয়, যারা ১৯৬৫ সালে একটি অ্যালগরিদম প্রকাশ করেন। কিন্তু আসলে FFT এর আগেও বারবার আবিষ্কৃত হয়েছিল, তবে আধুনিক কম্পিউটারের আবিষ্কারের আগে এর গুরুত্ব বোঝা যায়নি। কিছু গবেষক FFT-এর আবিষ্কার ১৯২৪ সালে রুঙ্গে এবং কনিগকে দেন। কিন্তু আসলে গাউস ১৮০৫ সালেই এই পদ্ধতি তৈরি করেছিলেন, তবে কখনো প্রকাশ করেননি।

লক্ষ্য করুন, এখানে উপস্থাপিত FFT অ্যালগরিদমটি $O(n \log n)$ সময়ে চলে, কিন্তু এটি ইচ্ছামতো বড় পলিনোমিয়ালের ইচ্ছামতো বড় সহগ সহ অথবা ইচ্ছামতো বড় পূর্ণসংখ্যার গুণের জন্য কাজ করে না। এটি সহজেই $10^5$ আকারের ছোট সহগসহ পলিনোমিয়াল, অথবা $10^6$ আকারের দুটি সংখ্যার গুণ সামলাতে পারে, যা সাধারণত প্রতিযোগিতামূলক প্রোগ্রামিং সমস্যা সমাধানের জন্য যথেষ্ট। $10^6$ বিটের সংখ্যার গুণের স্কেলের বাইরে, গণনায় ব্যবহৃত ফ্লোটিং পয়েন্ট সংখ্যার রেঞ্জ এবং প্রিসিশন সঠিক চূড়ান্ত ফলাফল দিতে যথেষ্ট হবে না, যদিও আরও জটিল ভেরিয়েশন আছে যা ইচ্ছামতো বড় পলিনোমিয়াল/পূর্ণসংখ্যার গুণ সম্পাদন করতে পারে। যেমন ১৯৭১ সালে শোনহেগে এবং স্ট্রাসার ইচ্ছামতো বড় সংখ্যার গুণের জন্য একটি ভেরিয়েশন তৈরি করেন যা রিং স্ট্রাকচারে FFT রিকার্সিভভাবে প্রয়োগ করে $O(n \log n \log \log n)$-এ চলে। এবং সম্প্রতি (২০১৯-এ) হার্ভি এবং ভান ডের হুভেন সত্যিকারের $O(n \log n)$-এ চলমান একটি অ্যালগরিদম প্রকাশ করেন।

ডিসক্রিট ফুরিয়ে ট্রান্সফর্ম#

ধরি ডিগ্রি $n - 1$-এর একটি পলিনোমিয়াল আছে:

$$A(x) = a_0 x^0 + a_1 x^1 + \dots + a_{n-1} x^{n-1}$$

সাধারণতা না হারিয়ে আমরা ধরে নিই $n$ - সহগের সংখ্যা - ২-এর ঘাত। $n$ ২-এর ঘাত না হলে, আমরা কেবল অনুপস্থিত পদ $a_i x^i$ যোগ করি এবং সহগ $a_i$ কে $0$ সেট করি।

জটিল সংখ্যার তত্ত্ব আমাদের বলে যে $x^n = 1$ সমীকরণের $n$ টি জটিল সমাধান আছে ($n$-তম একক মূল বলা হয়), এবং সমাধানগুলো $w_{n, k} = e^{\frac{2 k \pi i}{n}}$ আকারের, $k = 0 \dots n-1$-এর জন্য। এছাড়াও এই জটিল সংখ্যাগুলোর কিছু অত্যন্ত আকর্ষণীয় বৈশিষ্ট্য আছে: যেমন মুখ্য $n$-তম মূল $w_n = w_{n, 1} = e^{\frac{2 \pi i}{n}}$ অন্য সকল $n$-তম মূল বর্ণনা করতে ব্যবহার করা যায়: $w_{n, k} = (w_n)^k$।

পলিনোমিয়াল $A(x)$-এর (বা সমতুল্যভাবে সহগের ভেক্টর $(a_0, a_1, \dots, a_{n-1})$-এর) ডিসক্রিট ফুরিয়ে ট্রান্সফর্ম (DFT) সংজ্ঞায়িত হয় $x = w_{n, k}$ বিন্দুগুলোতে পলিনোমিয়ালের মান হিসেবে, অর্থাৎ এটি ভেক্টর:

$$\begin{align} \text{DFT}(a_0, a_1, \dots, a_{n-1}) &= (y_0, y_1, \dots, y_{n-1}) \\ &= (A(w_{n, 0}), A(w_{n, 1}), \dots, A(w_{n, n-1})) \\ &= (A(w_n^0), A(w_n^1), \dots, A(w_n^{n-1})) \end{align}$$

একইভাবে ইনভার্স ডিসক্রিট ফুরিয়ে ট্রান্সফর্ম সংজ্ঞায়িত হয়: পলিনোমিয়ালের মান $(y_0, y_1, \dots, y_{n-1})$-এর ইনভার্স DFT হলো পলিনোমিয়ালের সহগ $(a_0, a_1, \dots, a_{n-1})$।

$$\text{InverseDFT}(y_0, y_1, \dots, y_{n-1}) = (a_0, a_1, \dots, a_{n-1})$$

সুতরাং, যদি একটি ডাইরেক্ট DFT $n$-তম মূলগুলোর বিন্দুতে পলিনোমিয়ালের মান গণনা করে, ইনভার্স DFT সেই মানগুলো ব্যবহার করে পলিনোমিয়ালের সহগ পুনরুদ্ধার করতে পারে।

DFT-এর অ্যাপ্লিকেশন: পলিনোমিয়ালের দ্রুত গুণ#

ধরি দুটি পলিনোমিয়াল $A$ ও $B$ আছে। আমরা প্রতিটির জন্য DFT গণনা করি: $\text{DFT}(A)$ এবং $\text{DFT}(B)$।

এই পলিনোমিয়ালগুলো গুণ করলে কী হয়? স্পষ্টতই প্রতিটি বিন্দুতে মানগুলো কেবল গুণিত হয়, অর্থাৎ

$$(A \cdot B)(x) = A(x) \cdot B(x).$$

এর মানে হলো আমরা ভেক্টর $\text{DFT}(A)$ ও $\text{DFT}(B)$ গুণ করলে - একটি ভেক্টরের প্রতিটি এলিমেন্টকে অন্য ভেক্টরের সংশ্লিষ্ট এলিমেন্ট দিয়ে গুণ করলে - পলিনোমিয়াল $\text{DFT}(A \cdot B)$-এর DFT ছাড়া আর কিছুই পাই না:

$$\text{DFT}(A \cdot B) = \text{DFT}(A) \cdot \text{DFT}(B)$$

অবশেষে, ইনভার্স DFT প্রয়োগ করে পাই:

$$A \cdot B = \text{InverseDFT}(\text{DFT}(A) \cdot \text{DFT}(B))$$

ডানপক্ষে দুই DFT-এর গুণফল দ্বারা আমরা ভেক্টর এলিমেন্টগুলোর জোড়ায় জোড়ায় গুণফল বুঝাচ্ছি। এটি $O(n)$ সময়ে গণনা করা যায়। যদি আমরা DFT এবং ইনভার্স DFT $O(n \log n)$-এ গণনা করতে পারি, তাহলে আমরা একই টাইম কমপ্লেক্সিটিতে দুটি পলিনোমিয়ালের (এবং ফলস্বরূপ দুটি বড় সংখ্যার) গুণফল গণনা করতে পারি।

এটি লক্ষ্য করা উচিত যে দুটি পলিনোমিয়ালের একই ডিগ্রি হওয়া উচিত। অন্যথায় DFT-এর দুটি ফলাফল ভেক্টরের ভিন্ন দৈর্ঘ্য হবে। আমরা $0$ মানের সহগ যোগ করে এটি সম্পন্ন করতে পারি।

এবং এছাড়াও, দুটি পলিনোমিয়ালের গুণফল $2 (n - 1)$ ডিগ্রির একটি পলিনোমিয়াল হওয়ায়, আমাদের প্রতিটি পলিনোমিয়ালের ডিগ্রি দ্বিগুণ করতে হবে (আবার $0$ দিয়ে প্যাডিং করে)। $n$ টি মান সহ একটি ভেক্টর থেকে আমরা $2n - 1$ সহগসহ কাঙ্ক্ষিত পলিনোমিয়াল পুনর্গঠন করতে পারি না।

ফাস্ট ফুরিয়ে ট্রান্সফর্ম#

ফাস্ট ফুরিয়ে ট্রান্সফর্ম হলো $O(n \log n)$ সময়ে DFT গণনা করার একটি পদ্ধতি। FFT-এর মূল ধারণা হলো ডিভাইড অ্যান্ড কনকার প্রয়োগ করা। আমরা পলিনোমিয়ালের সহগ ভেক্টরকে দুটি ভেক্টরে ভাগ করি, প্রতিটির জন্য রিকার্সিভভাবে DFT গণনা করি, এবং সম্পূর্ণ পলিনোমিয়ালের DFT গণনা করতে ফলাফলগুলো একত্রিত করি।

তাহলে ধরি ডিগ্রি $n - 1$-এর একটি পলিনোমিয়াল $A(x)$ আছে, যেখানে $n$ ২-এর ঘাত, এবং $n > 1$:

$$A(x) = a_0 x^0 + a_1 x^1 + \dots + a_{n-1} x^{n-1}$$

আমরা এটিকে দুটি ছোট পলিনোমিয়ালে ভাগ করি, একটিতে জোড় পজিশনের সহগ এবং অন্যটিতে বিজোড় পজিশনের সহগ:

$$\begin{align} A_0(x) &= a_0 x^0 + a_2 x^1 + \dots + a_{n-2} x^{\frac{n}{2}-1} \\ A_1(x) &= a_1 x^0 + a_3 x^1 + \dots + a_{n-1} x^{\frac{n}{2}-1} \end{align}$$

দেখা সহজ যে

$$A(x) = A_0(x^2) + x A_1(x^2).$$

পলিনোমিয়াল $A_0$ ও $A_1$-এ $A$-এর সহগের অর্ধেক আছে। যদি আমরা $\text{DFT}(A_0)$ ও $\text{DFT}(A_1)$ ব্যবহার করে রৈখিক সময়ে $\text{DFT}(A)$ গণনা করতে পারি, তাহলে আমরা টাইম কমপ্লেক্সিটির জন্য রিকারেন্স $T_{\text{DFT}}(n) = 2 T_{\text{DFT}}\left(\frac{n}{2}\right) + O(n)$ পাই, যার ফলাফল মাস্টার থিওরেম দ্বারা $T_{\text{DFT}}(n) = O(n \log n)$।

আসুন দেখি কীভাবে আমরা এটি সম্পন্ন করতে পারি।

ধরুন আমরা ভেক্টর $\left(y_k^0\right)_{k=0}^{n/2-1} = \text{DFT}(A_0)$ এবং $\left(y_k^1\right)_{k=0}^{n/2-1} = \text{DFT}(A_1)$ গণনা করেছি। আসুন $\left(y_k\right)_{k=0}^{n-1} = \text{DFT}(A)$-এর জন্য একটি রাশি খুঁজি।

প্রথম $\frac{n}{2}$ মানের জন্য আমরা কেবল আগে উল্লেখিত সমীকরণ $A(x) = A_0(x^2) + x A_1(x^2)$ ব্যবহার করতে পারি:

$$y_k = y_k^0 + w_n^k y_k^1, \quad k = 0 \dots \frac{n}{2} - 1.$$

তবে দ্বিতীয় $\frac{n}{2}$ মানের জন্য আমাদের একটু ভিন্ন রাশি খুঁজতে হবে:

$$\begin{align} y_{k+n/2} &= A\left(w_n^{k+n/2}\right) \\ &= A_0\left(w_n^{2k+n}\right) + w_n^{k + n/2} A_1\left(w_n^{2k+n}\right) \\ &= A_0\left(w_n^{2k} w_n^n\right) + w_n^k w_n^{n/2} A_1\left(w_n^{2k} w_n^n\right) \\ &= A_0\left(w_n^{2k}\right) - w_n^k A_1\left(w_n^{2k}\right) \\ &= y_k^0 - w_n^k y_k^1 \end{align}$$

এখানে আমরা আবার $A(x) = A_0(x^2) + x A_1(x^2)$ এবং দুটি আইডেন্টিটি $w_n^n = 1$ ও $w_n^{n/2} = -1$ ব্যবহার করেছি।

তাই আমরা সম্পূর্ণ ভেক্টর $(y_k)$ গণনার কাঙ্ক্ষিত সূত্রগুলো পাই:

$$\begin{align} y_k &= y_k^0 + w_n^k y_k^1, &\quad k = 0 \dots \frac{n}{2} - 1, \\ y_{k+n/2} &= y_k^0 - w_n^k y_k^1, &\quad k = 0 \dots \frac{n}{2} - 1. \end{align}$$

($a + b$ ও $a - b$-এর এই প্যাটার্নকে কখনো কখনো বাটারফ্লাই বলা হয়।)

এভাবে আমরা $O(n \log n)$ সময়ে DFT গণনা করতে শিখলাম।

ইনভার্স FFT#

ধরি ভেক্টর $(y_0, y_1, \dots y_{n-1})$ - ডিগ্রি $n - 1$-এর পলিনোমিয়াল $A$-এর $x = w_n^k$ বিন্দুগুলোতে মান - দেওয়া আছে। আমরা পলিনোমিয়ালের সহগ $(a_0, a_1, \dots, a_{n-1})$ পুনরুদ্ধার করতে চাই। এই পরিচিত সমস্যাটিকে ইন্টারপোলেশন বলা হয়, এবং এটি সমাধানের জন্য সাধারণ অ্যালগরিদম আছে। তবে এই বিশেষ ক্ষেত্রে (যেহেতু আমরা একক মূলগুলোর বিন্দুতে মান জানি), আমরা অনেক সরল একটি অ্যালগরিদম পাই (যা ব্যবহারিকভাবে ডাইরেক্ট FFT-এর মতোই)।

আমরা DFT কে, এর সংজ্ঞা অনুসারে, ম্যাট্রিক্স আকারে লিখতে পারি:

$$ \begin{pmatrix} w_n^0 & w_n^0 & w_n^0 & w_n^0 & \cdots & w_n^0 \\ w_n^0 & w_n^1 & w_n^2 & w_n^3 & \cdots & w_n^{n-1} \\ w_n^0 & w_n^2 & w_n^4 & w_n^6 & \cdots & w_n^{2(n-1)} \\ w_n^0 & w_n^3 & w_n^6 & w_n^9 & \cdots & w_n^{3(n-1)} \\ \vdots & \vdots & \vdots & \vdots & \ddots & \vdots \\ w_n^0 & w_n^{n-1} & w_n^{2(n-1)} & w_n^{3(n-1)} & \cdots & w_n^{(n-1)(n-1)} \end{pmatrix} \begin{pmatrix} a_0 \\ a_1 \\ a_2 \\ a_3 \\ \vdots \\ a_{n-1} \end{pmatrix} = \begin{pmatrix} y_0 \\ y_1 \\ y_2 \\ y_3 \\ \vdots \\ y_{n-1} \end{pmatrix} $$

এই ম্যাট্রিক্সকে ভান্ডেরমন্ড ম্যাট্রিক্স বলা হয়।

সুতরাং আমরা ম্যাট্রিক্সের ইনভার্স দ্বারা বাঁ থেকে ভেক্টর $(y_0, y_1, \dots y_{n-1})$ কে গুণ করে ভেক্টর $(a_0, a_1, \dots, a_{n-1})$ গণনা করতে পারি:

$$ \begin{pmatrix} a_0 \\ a_1 \\ a_2 \\ a_3 \\ \vdots \\ a_{n-1} \end{pmatrix} = \begin{pmatrix} w_n^0 & w_n^0 & w_n^0 & w_n^0 & \cdots & w_n^0 \\ w_n^0 & w_n^1 & w_n^2 & w_n^3 & \cdots & w_n^{n-1} \\ w_n^0 & w_n^2 & w_n^4 & w_n^6 & \cdots & w_n^{2(n-1)} \\ w_n^0 & w_n^3 & w_n^6 & w_n^9 & \cdots & w_n^{3(n-1)} \\ \vdots & \vdots & \vdots & \vdots & \ddots & \vdots \\ w_n^0 & w_n^{n-1} & w_n^{2(n-1)} & w_n^{3(n-1)} & \cdots & w_n^{(n-1)(n-1)} \end{pmatrix}^{-1} \begin{pmatrix} y_0 \\ y_1 \\ y_2 \\ y_3 \\ \vdots \\ y_{n-1} \end{pmatrix} $$

দ্রুত যাচাই করে দেখা যায় ম্যাট্রিক্সের ইনভার্স নিম্নলিখিত আকারের:

$$ \frac{1}{n} \begin{pmatrix} w_n^0 & w_n^0 & w_n^0 & w_n^0 & \cdots & w_n^0 \\ w_n^0 & w_n^{-1} & w_n^{-2} & w_n^{-3} & \cdots & w_n^{-(n-1)} \\ w_n^0 & w_n^{-2} & w_n^{-4} & w_n^{-6} & \cdots & w_n^{-2(n-1)} \\ w_n^0 & w_n^{-3} & w_n^{-6} & w_n^{-9} & \cdots & w_n^{-3(n-1)} \\ \vdots & \vdots & \vdots & \vdots & \ddots & \vdots \\ w_n^0 & w_n^{-(n-1)} & w_n^{-2(n-1)} & w_n^{-3(n-1)} & \cdots & w_n^{-(n-1)(n-1)} \end{pmatrix} $$

সুতরাং আমরা সূত্র পাই:

$$a_k = \frac{1}{n} \sum_{j=0}^{n-1} y_j w_n^{-k j}$$

$y_k$-এর সূত্রের সাথে তুলনা করলে

$$y_k = \sum_{j=0}^{n-1} a_j w_n^{k j},$$

আমরা লক্ষ্য করি যে এই সমস্যাগুলো প্রায় একই, তাই সহগ $a_k$ একই ডিভাইড অ্যান্ড কনকার অ্যালগরিদম দ্বারা, সেইসাথে ডাইরেক্ট FFT দ্বারা পাওয়া যায়, শুধু $w_n^k$-এর পরিবর্তে $w_n^{-k}$ ব্যবহার করতে হবে, এবং শেষে ফলাফলের সহগগুলোকে $n$ দ্বারা ভাগ করতে হবে।

সুতরাং ইনভার্স DFT-এর গণনা ডাইরেক্ট DFT-এর গণনার প্রায় একই, এবং এটিও $O(n \log n)$ সময়ে সম্পাদন করা যায়।

ইমপ্লিমেন্টেশন#

এখানে আমরা FFT এবং ইনভার্স FFT-এর একটি সরল রিকার্সিভ ইমপ্লিমেন্টেশন উপস্থাপন করি, উভয় একটি ফাংশনে, কারণ ফরওয়ার্ড ও ইনভার্স FFT-এর পার্থক্য এতটাই সামান্য। জটিল সংখ্যা সংরক্ষণের জন্য আমরা C++ STL-এর complex টাইপ ব্যবহার করি।

using cd = complex<double>;
const double PI = acos(-1);

void fft(vector<cd> & a, bool invert) {
    int n = a.size();
    if (n == 1)
        return;

    vector<cd> a0(n / 2), a1(n / 2);
    for (int i = 0; 2 * i < n; i++) {
        a0[i] = a[2*i];
        a1[i] = a[2*i+1];
    }
    fft(a0, invert);
    fft(a1, invert);

    double ang = 2 * PI / n * (invert ? -1 : 1);
    cd w(1), wn(cos(ang), sin(ang));
    for (int i = 0; 2 * i < n; i++) {
        a[i] = a0[i] + w * a1[i];
        a[i + n/2] = a0[i] - w * a1[i];
        if (invert) {
            a[i] /= 2;
            a[i + n/2] /= 2;
        }
        w *= wn;
    }
}

ফাংশনটি সহগের একটি ভেক্টর পাস করে, এবং ফাংশন DFT অথবা ইনভার্স DFT গণনা করে ফলাফল আবার এই ভেক্টরে সংরক্ষণ করে। $\text{invert}$ আর্গুমেন্ট দেখায় ডাইরেক্ট না ইনভার্স DFT গণনা করা উচিত। ফাংশনের ভেতরে আমরা প্রথমে পরীক্ষা করি ভেক্টরের দৈর্ঘ্য এক কিনা, তাহলে কিছু করার দরকার নেই। অন্যথায় আমরা ভেক্টর $a$ কে দুটি ভেক্টর $a0$ ও $a1$-এ ভাগ করি এবং উভয়ের জন্য রিকার্সিভভাবে DFT গণনা করি। তারপর আমরা $wn$ মান এবং একটি ভেরিয়েবল $w$ ইনিশিয়ালাইজ করি, যেটিতে $wn$-এর বর্তমান ঘাত থাকবে। তারপর উপরের সূত্র ব্যবহার করে ফলাফল DFT-এর মান গণনা করা হয়।

$\text{invert}$ ফ্ল্যাগ সেট থাকলে, আমরা $wn$ কে $wn^{-1}$ দিয়ে প্রতিস্থাপন করি, এবং ফলাফলের প্রতিটি মান $2$ দ্বারা ভাগ করি (যেহেতু এটি রিকার্সনের প্রতিটি স্তরে করা হবে, এটি শেষ পর্যন্ত চূড়ান্ত মানগুলোকে $n$ দ্বারা ভাগ করবে)।

এই ফাংশন ব্যবহার করে আমরা দুটি পলিনোমিয়াল গুণ করার একটি ফাংশন তৈরি করতে পারি:

vector<int> multiply(vector<int> const& a, vector<int> const& b) {
    vector<cd> fa(a.begin(), a.end()), fb(b.begin(), b.end());
    int n = 1;
    while (n < a.size() + b.size())
        n <<= 1;
    fa.resize(n);
    fb.resize(n);

    fft(fa, false);
    fft(fb, false);
    for (int i = 0; i < n; i++)
        fa[i] *= fb[i];
    fft(fa, true);

    vector<int> result(n);
    for (int i = 0; i < n; i++)
        result[i] = round(fa[i].real());
    return result;
}

এই ফাংশন ইন্টিজার সহগসহ পলিনোমিয়ালের সাথে কাজ করে, তবে আপনি এটি অন্য টাইপের সাথে কাজ করতেও সামঞ্জস্য করতে পারেন। যেহেতু জটিল সংখ্যার সাথে কাজ করলে কিছু ত্রুটি হয়, শেষে ফলাফলের সহগগুলো রাউন্ড করতে হবে।

অবশেষে দুটি বড় সংখ্যা গুণ করার ফাংশন ব্যবহারিকভাবে পলিনোমিয়াল গুণের ফাংশন থেকে আলাদা নয়। শুধু পরে সংখ্যাটি নরমালাইজ করতে হবে:

    int carry = 0;
    for (int i = 0; i < n; i++)
        result[i] += carry;
        carry = result[i] / 10;
        result[i] %= 10;
    }

দুটি সংখ্যার গুণফলের দৈর্ঘ্য কখনো উভয় সংখ্যার মোট দৈর্ঘ্য অতিক্রম না করায়, ভেক্টরের আকার সকল ক্যারি অপারেশন সম্পাদনের জন্য যথেষ্ট।

উন্নত ইমপ্লিমেন্টেশন: ইন-প্লেস গণনা#

দক্ষতা বাড়াতে আমরা রিকার্সিভ ইমপ্লিমেন্টেশন থেকে ইটারেটিভে স্যুইচ করব। উপরের রিকার্সিভ ইমপ্লিমেন্টেশনে আমরা সুস্পষ্টভাবে ভেক্টর $a$ কে দুটি ভেক্টরে আলাদা করেছি - জোড় পজিশনের এলিমেন্ট একটি অস্থায়ী ভেক্টরে, এবং বিজোড় পজিশনের এলিমেন্ট আরেকটিতে। তবে আমরা যদি এলিমেন্টগুলোকে একটি নির্দিষ্ট উপায়ে পুনর্বিন্যাস করি, আমাদের এই অস্থায়ী ভেক্টর তৈরি করার দরকার নেই (অর্থাৎ সকল গণনা “ইন-প্লেস”, ভেক্টর $A$-তেই করা যায়)।

লক্ষ্য করুন প্রথম রিকার্সন লেভেলে, পজিশনের সর্বনিম্ন বিট শূন্য হলে এলিমেন্ট $a_0$ ভেক্টরে এবং সর্বনিম্ন বিট এক হলে $a_1$ ভেক্টরে বরাদ্দ হয়। দ্বিতীয় রিকার্সন লেভেলে একই ঘটনা ঘটে, তবে দ্বিতীয় সর্বনিম্ন বিট দিয়ে, ইত্যাদি। তাই আমরা যদি প্রতিটি সহগের পজিশনের বিটগুলো উল্টে দিই, এবং এই উল্টানো মান দ্বারা সর্ট করি, আমরা কাঙ্ক্ষিত ক্রম পাই (এটিকে বিট-রিভার্সাল পারমুটেশন বলা হয়)।

উদাহরণস্বরূপ $n = 8$-এর জন্য কাঙ্ক্ষিত ক্রম হলো:

$$a = \bigg\{ \Big[ (a_0, a_4), (a_2, a_6) \Big], \Big[ (a_1, a_5), (a_3, a_7) \Big] \bigg\}$$

প্রকৃতপক্ষে প্রথম রিকার্সন লেভেলে (কার্লি ব্রেসের মধ্যে), ভেক্টরটি দুই ভাগে বিভক্ত হয় $[a_0, a_2, a_4, a_6]$ এবং $[a_1, a_3, a_5, a_7]$। দেখা যায়, বিট-রিভার্সাল পারমুটেশনে এটি কেবল ভেক্টরকে দুই ভাগে ভাগ করার সমতুল্য: প্রথম $\frac{n}{2}$ এলিমেন্ট এবং শেষ $\frac{n}{2}$ এলিমেন্ট। তারপর প্রতিটি অর্ধেকের জন্য একটি রিকার্সিভ কল হয়। ধরি তাদের প্রতিটির জন্য ফলাফল DFT এলিমেন্টগুলোর স্থানেই রিটার্ন করা হয় (অর্থাৎ ভেক্টর $a$-এর প্রথম অর্ধেক এবং দ্বিতীয় অর্ধেক যথাক্রমে)।

$$a = \bigg\{ \Big[y_0^0, y_1^0, y_2^0, y_3^0\Big], \Big[y_0^1, y_1^1, y_2^1, y_3^1 \Big] \bigg\}$$

এখন আমরা দুটি DFT কে সম্পূর্ণ ভেক্টরের জন্য একটিতে একত্রিত করতে চাই। এলিমেন্টগুলোর ক্রম আদর্শ, এবং আমরা সরাসরি এই ভেক্টরেই ইউনিয়ন সম্পাদন করতে পারি। আমরা $y_0^0$ ও $y_0^1$ এলিমেন্ট নিয়ে বাটারফ্লাই ট্রান্সফর্ম সম্পাদন করতে পারি। ফলাফলের দুটি মানের স্থান দুটি প্রাথমিক মানের স্থানের মতোই, তাই আমরা পাই:

$$a = \bigg\{ \Big[y_0^0 + w_n^0 y_0^1, y_1^0, y_2^0, y_3^0\Big], \Big[y_0^0 - w_n^0 y_0^1, y_1^1, y_2^1, y_3^1\Big] \bigg\}$$

একইভাবে আমরা $y_1^0$ ও $y_1^1$-এর বাটারফ্লাই ট্রান্সফর্ম গণনা করতে পারি এবং ফলাফল তাদের স্থানে রাখতে পারি, ইত্যাদি। ফলস্বরূপ আমরা পাই:

$$a = \bigg\{ \Big[y_0^0 + w_n^0 y_0^1, y_1^0 + w_n^1 y_1^1, y_2^0 + w_n^2 y_2^1, y_3^0 + w_n^3 y_3^1\Big], \Big[y_0^0 - w_n^0 y_0^1, y_1^0 - w_n^1 y_1^1, y_2^0 - w_n^2 y_2^1, y_3^0 - w_n^3 y_3^1\Big] \bigg\}$$

এভাবে আমরা ভেক্টর $a$ থেকে প্রয়োজনীয় DFT গণনা করলাম।

এখানে আমরা শুধু প্রথম রিকার্সন লেভেলে DFT গণনার প্রক্রিয়া বর্ণনা করেছি, তবে একই পদ্ধতি স্পষ্টতই অন্য সকল লেভেলেও কাজ করে। সুতরাং, বিট-রিভার্সাল পারমুটেশন প্রয়োগের পর, আমরা কোনো অতিরিক্ত মেমোরি ছাড়াই ইন-প্লেসে DFT গণনা করতে পারি।

এটি অতিরিক্তভাবে রিকার্সন থেকে মুক্তি পেতে দেয়। আমরা সর্বনিম্ন স্তর থেকে শুরু করি, অর্থাৎ ভেক্টরকে জোড়ায় ভাগ করি এবং তাদের উপর বাটারফ্লাই ট্রান্সফর্ম প্রয়োগ করি। এতে শেষ স্তরের কাজ প্রয়োগ করা ভেক্টর $a$ পাওয়া যায়। পরবর্তী ধাপে আমরা ভেক্টরকে ৪ আকারের ভেক্টরে ভাগ করি, এবং আবার বাটারফ্লাই ট্রান্সফর্ম প্রয়োগ করি, যা ৪ আকারের প্রতিটি ব্লকের জন্য DFT দেয়। এবং এভাবে চলতে থাকে। অবশেষে শেষ ধাপে আমরা $a$-এর উভয় অর্ধেকের DFT-এর ফলাফল পাই, এবং বাটারফ্লাই ট্রান্সফর্ম প্রয়োগ করে সম্পূর্ণ ভেক্টর $a$-এর DFT পাই।

using cd = complex<double>;
const double PI = acos(-1);

int reverse(int num, int lg_n) {
    int res = 0;
    for (int i = 0; i < lg_n; i++) {
        if (num & (1 << i))
            res |= 1 << (lg_n - 1 - i);
    }
    return res;
}

void fft(vector<cd> & a, bool invert) {
    int n = a.size();
    int lg_n = 0;
    while ((1 << lg_n) < n)
        lg_n++;

    for (int i = 0; i < n; i++) {
        if (i < reverse(i, lg_n))
            swap(a[i], a[reverse(i, lg_n)]);
    }

    for (int len = 2; len <= n; len <<= 1) {
        double ang = 2 * PI / len * (invert ? -1 : 1);
        cd wlen(cos(ang), sin(ang));
        for (int i = 0; i < n; i += len) {
            cd w(1);
            for (int j = 0; j < len / 2; j++) {
                cd u = a[i+j], v = a[i+j+len/2] * w;
                a[i+j] = u + v;
                a[i+j+len/2] = u - v;
                w *= wlen;
            }
        }
    }

    if (invert) {
        for (cd & x : a)
            x /= n;
    }
}

প্রথমে আমরা প্রতিটি এলিমেন্টকে উল্টানো পজিশনের এলিমেন্টের সাথে অদলবদল করে বিট-রিভার্সাল পারমুটেশন প্রয়োগ করি। তারপর $\log n - 1$ ধাপে আমরা সংশ্লিষ্ট $\text{len}$ আকারের প্রতিটি ব্লকের জন্য DFT গণনা করি। সেই সকল ব্লকের জন্য আমাদের একই একক মূল $\text{wlen}$ আছে। আমরা সকল ব্লকের মধ্য দিয়ে ইটারেট করি এবং তাদের প্রতিটিতে বাটারফ্লাই ট্রান্সফর্ম সম্পাদন করি।

আমরা বিটের রিভার্সালটি আরও অপটিমাইজ করতে পারি। আগের ইমপ্লিমেন্টেশনে আমরা ইনডেক্সের সকল বিট ইটারেট করে বিটওয়াইজ উল্টানো ইনডেক্স তৈরি করেছি। তবে আমরা ভিন্নভাবে বিট উল্টাতে পারি।

ধরুন $j$-তে ইতিমধ্যে $i$-এর রিভার্স আছে। তাহলে $i + 1$-এ যেতে, আমাদের $i$ ইনক্রিমেন্ট করতে হবে, এবং $j$ ও ইনক্রিমেন্ট করতে হবে, তবে “উল্টানো” সংখ্যা পদ্ধতিতে। প্রচলিত বাইনারি পদ্ধতিতে এক যোগ করার অর্থ হলো সকল ট্রেইলিং ওয়ান শূন্যে ফ্লিপ করা এবং তার ঠিক আগের শূন্যকে একে ফ্লিপ করা। সমতুল্যভাবে “উল্টানো” সংখ্যা পদ্ধতিতে, আমরা সকল লিডিং ওয়ান ফ্লিপ করি, এবং পরবর্তী শূন্যও ফ্লিপ করি।

সুতরাং আমরা নিম্নলিখিত ইমপ্লিমেন্টেশন পাই:

using cd = complex<double>;
const double PI = acos(-1);

void fft(vector<cd> & a, bool invert) {
    int n = a.size();

    for (int i = 1, j = 0; i < n; i++) {
        int bit = n >> 1;
        for (; j & bit; bit >>= 1)
            j ^= bit;
        j ^= bit;

        if (i < j)
            swap(a[i], a[j]);
    }

    for (int len = 2; len <= n; len <<= 1) {
        double ang = 2 * PI / len * (invert ? -1 : 1);
        cd wlen(cos(ang), sin(ang));
        for (int i = 0; i < n; i += len) {
            cd w(1);
            for (int j = 0; j < len / 2; j++) {
                cd u = a[i+j], v = a[i+j+len/2] * w;
                a[i+j] = u + v;
                a[i+j+len/2] = u - v;
                w *= wlen;
            }
        }
    }

    if (invert) {
        for (cd & x : a)
            x /= n;
    }
}

এছাড়াও আমরা বিট-রিভার্সাল পারমুটেশন আগে থেকে প্রিকম্পিউট করতে পারি। এটি বিশেষভাবে উপকারী যখন আকার $n$ সকল কলের জন্য একই। তবে যখন আমাদের শুধু তিনটি কল আছে (যেগুলো দুটি পলিনোমিয়াল গুণ করতে প্রয়োজন), প্রভাবটি লক্ষণীয়। এছাড়াও আমরা সকল একক মূল এবং তাদের ঘাত প্রিকম্পিউট করতে পারি।

নাম্বার থিওরেটিক ট্রান্সফর্ম#

এখন আমরা উদ্দেশ্যটি একটু পরিবর্তন করি। আমরা এখনো দুটি পলিনোমিয়াল $O(n \log n)$ সময়ে গুণ করতে চাই, তবে এবার আমরা কোনো মৌলিক সংখ্যা $p$ মডুলোতে সহগ গণনা করতে চাই। অবশ্যই এই কাজের জন্য আমরা স্বাভাবিক DFT ব্যবহার করে ফলাফলে মডুলো অপারেটর প্রয়োগ করতে পারি। তবে, এটি করলে রাউন্ডিং ত্রুটি হতে পারে, বিশেষ করে বড় সংখ্যার ক্ষেত্রে। নাম্বার থিওরেটিক ট্রান্সফর্ম (NTT)-এর সুবিধা হলো, এটি শুধুমাত্র পূর্ণসংখ্যার সাথে কাজ করে, এবং তাই ফলাফল সঠিক হওয়ার গ্যারান্টি দেওয়া হয়।

ডিসক্রিট ফুরিয়ে ট্রান্সফর্ম জটিল সংখ্যার উপর ভিত্তি করে, এবং $n$-তম একক মূলের উপর। এটি দক্ষভাবে গণনা করতে, আমরা মূলগুলোর বৈশিষ্ট্যগুলো ব্যাপকভাবে ব্যবহার করি (যেমন একটি মূল আছে যা সূচকীকরণের মাধ্যমে অন্য সকল মূল তৈরি করে)।

তবে মডুলার অ্যারিথমেটিকে $n$-তম একক মূলের জন্যও একই বৈশিষ্ট্যগুলো ধরে রাখে। একটি প্রিমিটিভ ফিল্ডে $n$-তম একক মূল হলো এমন একটি সংখ্যা $w_n$ যা পূরণ করে:

$$\begin{align} (w_n)^n &= 1 \pmod{p}, \\ (w_n)^k &\ne 1 \pmod{p}, \quad 1 \le k < n. \end{align}$$

অন্য $n-1$ টি মূল $w_n$-এর ঘাত হিসেবে পাওয়া যায়।

ফাস্ট ফুরিয়ে ট্রান্সফর্ম অ্যালগরিদমে এটি প্রয়োগ করতে, আমাদের কোনো $n$-এর জন্য একটি মূল থাকা দরকার, যেটি ২-এর ঘাত, এবং সকল ছোট ঘাতের জন্যও। আমরা নিম্নলিখিত আকর্ষণীয় বৈশিষ্ট্যটি লক্ষ্য করতে পারি:

$$\begin{align} (w_n^2)^m = w_n^n &= 1 \pmod{p}, \quad \text{with } m = \frac{n}{2}\\ (w_n^2)^k = w_n^{2k} &\ne 1 \pmod{p}, \quad 1 \le k < m. \end{align}$$

সুতরাং $w_n$ যদি $n$-তম একক মূল হয়, তাহলে $w_n^2$ হলো $\frac{n}{2}$-তম একক মূল। এবং ফলস্বরূপ ২-এর সকল ছোট ঘাতের জন্য প্রয়োজনীয় ডিগ্রির মূল আছে, এবং $w_n$ ব্যবহার করে সেগুলো গণনা করা যায়।

ইনভার্স DFT গণনার জন্য, আমাদের $w_n$-এর ইনভার্স $w_n^{-1}$ দরকার। তবে একটি মৌলিক মডুলাসের জন্য ইনভার্স সর্বদা বিদ্যমান।

সুতরাং জটিল মূলগুলো থেকে আমাদের যেসব বৈশিষ্ট্য দরকার সেগুলো মডুলার অ্যারিথমেটিকেও পাওয়া যায়, যদি আমাদের কাছে যথেষ্ট বড় মডুল $p$ থাকে যার জন্য $n$-তম একক মূল বিদ্যমান।

উদাহরণস্বরূপ আমরা নিম্নলিখিত মান নিতে পারি: মডুল $p = 7340033$, $w_{2^{20}} = 5$। এই মডুল যথেষ্ট না হলে, আমাদের ভিন্ন জোড়া খুঁজতে হবে। আমরা এই তথ্য ব্যবহার করতে পারি যে $p = c 2^k + 1$ আকারের মডুলগুলোর জন্য (এবং $p$ মৌলিক হলে), সর্বদা $2^k$-তম একক মূল বিদ্যমান। দেখানো যায় যে $g^c$ একটি $2^k$-তম একক মূল, যেখানে $g$ হলো $p$-এর একটি প্রিমিটিভ রুট।

const int mod = 7340033;
const int root = 5;
const int root_1 = 4404020;
const int root_pw = 1 << 20;

void fft(vector<int> & a, bool invert) {
    int n = a.size();

    for (int i = 1, j = 0; i < n; i++) {
        int bit = n >> 1;
        for (; j & bit; bit >>= 1)
            j ^= bit;
        j ^= bit;

        if (i < j)
            swap(a[i], a[j]);
    }

    for (int len = 2; len <= n; len <<= 1) {
        int wlen = invert ? root_1 : root;
        for (int i = len; i < root_pw; i <<= 1)
            wlen = (int)(1LL * wlen * wlen % mod);

        for (int i = 0; i < n; i += len) {
            int w = 1;
            for (int j = 0; j < len / 2; j++) {
                int u = a[i+j], v = (int)(1LL * a[i+j+len/2] * w % mod);
                a[i+j] = u + v < mod ? u + v : u + v - mod;
                a[i+j+len/2] = u - v >= 0 ? u - v : u - v + mod;
                w = (int)(1LL * w * wlen % mod);
            }
        }
    }

    if (invert) {
        int n_1 = inverse(n, mod);
        for (int & x : a)
            x = (int)(1LL * x * n_1 % mod);
    }
}

এখানে inverse ফাংশনটি মডুলার ইনভার্স গণনা করে (মডুলার মাল্টিপ্লিকেটিভ ইনভার্স দেখুন)। ধ্রুবকগুলো mod, root, root_pw মডুল এবং মূল নির্ধারণ করে, এবং root_1 হলো mod মডুলোতে root-এর ইনভার্স।

প্র্যাকটিসে এই ইমপ্লিমেন্টেশন জটিল সংখ্যা ব্যবহার করা ইমপ্লিমেন্টেশনের চেয়ে ধীর (বিশাল সংখ্যক মডুলো অপারেশনের কারণে), তবে কম মেমোরি ব্যবহার এবং কোনো রাউন্ডিং ত্রুটি না থাকার মতো কিছু সুবিধা আছে।

ইচ্ছামতো মডুলাস সহ গুণ#

এখানে আমরা আগের অনুচ্ছেদের মতোই লক্ষ্য অর্জন করতে চাই। দুটি পলিনোমিয়াল $A(x)$ ও $B(x)$ গুণ করা, এবং সহগ কোনো সংখ্যা $M$ মডুলোতে গণনা করা। নাম্বার থিওরেটিক ট্রান্সফর্ম শুধুমাত্র নির্দিষ্ট মৌলিক সংখ্যার জন্য কাজ করে। মডুলাস কাঙ্ক্ষিত আকারের না হলে কী হবে?

একটি বিকল্প হলো $c 2^k + 1$ আকারের ভিন্ন মৌলিক সংখ্যা দিয়ে একাধিক নাম্বার থিওরেটিক ট্রান্সফর্ম সম্পাদন করা, তারপর চূড়ান্ত সহগ গণনা করতে চায়নিজ রিমেইন্ডার থিওরেম প্রয়োগ করা।

আরেকটি বিকল্প হলো পলিনোমিয়াল $A(x)$ ও $B(x)$ কে প্রতিটি দুটি ছোট পলিনোমিয়ালে বিতরণ করা

$$\begin{align} A(x) &= A_1(x) + A_2(x) \cdot C \\ B(x) &= B_1(x) + B_2(x) \cdot C \end{align}$$

$C \approx \sqrt{M}$ সহ।

তারপর $A(x)$ ও $B(x)$-এর গুণফল এভাবে উপস্থাপন করা যায়:

$$A(x) \cdot B(x) = A_1(x) \cdot B_1(x) + \left(A_1(x) \cdot B_2(x) + A_2(x) \cdot B_1(x)\right)\cdot C + \left(A_2(x) \cdot B_2(x)\right)\cdot C^2$$

পলিনোমিয়াল $A_1(x)$, $A_2(x)$, $B_1(x)$ ও $B_2(x)$-এ $\sqrt{M}$-এর চেয়ে ছোট সহগ আছে, তাই সকল প্রদর্শিত গুণফলের সহগ $M \cdot n$-এর চেয়ে ছোট, যা সাধারণত প্রচলিত ফ্লোটিং পয়েন্ট টাইপ দিয়ে সামলানোর মতো যথেষ্ট ছোট।

এই পদ্ধতিতে তাই ছোট সহগসহ পলিনোমিয়ালের গুণফল গণনা করা প্রয়োজন (স্বাভাবিক FFT ও ইনভার্স FFT ব্যবহার করে), এবং তারপর মডুলার যোগ ও গুণ ব্যবহার করে $O(n)$ সময়ে মূল গুণফল পুনরুদ্ধার করা যায়।

অ্যাপ্লিকেশন#

DFT বিভিন্ন ধরনের সমস্যায় ব্যবহার করা যায়, যেগুলো প্রথম দৃষ্টিতে পলিনোমিয়াল গুণের সাথে কোনো সম্পর্ক নেই।

সকল সম্ভাব্য যোগফল#

দুটি অ্যারে $a[]$ ও $b[]$ দেওয়া আছে। আমাদের সকল সম্ভাব্য যোগফল $a[i] + b[j]$ খুঁজতে হবে, এবং প্রতিটি যোগফল কতবার আসে তা গণনা করতে হবে।

উদাহরণস্বরূপ $a = [1,~ 2,~ 3]$ এবং $b = [2,~ 4]$-এর জন্য: যোগফল $3$ ১ ভাবে পাওয়া যায়, যোগফল $4$ও ১ ভাবে, $5$ ২ ভাবে, $6$ ১ ভাবে, $7$ ১ ভাবে।

আমরা অ্যারে $a$ ও $b$-এর জন্য দুটি পলিনোমিয়াল $A$ ও $B$ তৈরি করি। অ্যারের সংখ্যাগুলো পলিনোমিয়ালে সূচক হিসেবে কাজ করবে ($a[i] \Rightarrow x^{a[i]}$); এবং এই পদের সহগ হবে সংখ্যাটি অ্যারেতে কতবার আসে।

তারপর, $O(n \log n)$ সময়ে এই দুটি পলিনোমিয়াল গুণ করে, আমরা একটি পলিনোমিয়াল $C$ পাই, যেখানে সূচকগুলো বলবে কোন যোগফলগুলো পাওয়া সম্ভব, এবং সহগগুলো বলবে কতবার। উদাহরণটিতে দেখানো হলো:

$$(1 x^1 + 1 x^2 + 1 x^3) (1 x^2 + 1 x^4) = 1 x^3 + 1 x^4 + 2 x^5 + 1 x^6 + 1 x^7$$

সকল সম্ভাব্য স্কেলার গুণফল#

দৈর্ঘ্য $n$-এর দুটি অ্যারে $a[]$ ও $b[]$ দেওয়া আছে। আমাদের $b$-এর প্রতিটি সাইক্লিক শিফটের সাথে $a$-এর গুণফল গণনা করতে হবে।

আমরা $2n$ আকারের দুটি নতুন অ্যারে তৈরি করি: আমরা $a$ উল্টে দিই এবং $n$ টি শূন্য যোগ করি। এবং আমরা কেবল $b$ কে নিজের সাথে যোগ করি। যখন আমরা এই দুটি অ্যারে পলিনোমিয়াল হিসেবে গুণ করি, এবং গুণফল $c$-এর $c[n-1],~ c[n],~ \dots,~ c[2n-2]$ সহগগুলো দেখি, আমরা পাই:

$$c[k] = \sum_{i+j=k} a[i] b[j]$$

এবং যেহেতু $i \ge n$-এর জন্য সকল $a[i] = 0$:

$$c[k] = \sum_{i=0}^{n-1} a[i] b[k-i]$$

দেখা সহজ যে এই যোগফলটি কেবল ভেক্টর $a$-এর সাথে $b$-এর $(k - (n - 1))$-তম সাইক্লিক লেফট শিফটের স্কেলার গুণফল। সুতরাং এই সহগগুলোই সমস্যার উত্তর, এবং আমরা এখনও $O(n \log n)$ সময়ে এটি পেতে সক্ষম হয়েছি। এখানে লক্ষ্য করুন $c[2n-1]$ও আমাদের $n$-তম সাইক্লিক শিফট দেয় কিন্তু সেটি $0$-তম সাইক্লিক শিফটের মতোই তাই আমাদের এটি আলাদাভাবে উত্তরে বিবেচনা করার দরকার নেই।

দুটি স্ট্রিপ#

দুটি বুলিয়ান স্ট্রিপ (মান $0$ ও $1$-এর সাইক্লিক অ্যারে) $a$ ও $b$ দেওয়া আছে। আমরা প্রথম স্ট্রিপটি দ্বিতীয়টির সাথে সংযুক্ত করার সকল উপায় খুঁজতে চাই, যেন কোনো পজিশনে প্রথম স্ট্রিপের $1$ দ্বিতীয় স্ট্রিপের $1$-এর পাশে না থাকে।

সমস্যাটি আগের সমস্যা থেকে খুব বেশি আলাদা নয়। দুটি স্ট্রিপ সংযুক্ত করার মানে হলো আমরা দ্বিতীয় অ্যারেতে সাইক্লিক শিফট করি, এবং দুটি অ্যারের স্কেলার গুণফল $0$ হলে আমরা দুটি স্ট্রিপ সংযুক্ত করতে পারি।

স্ট্রিং ম্যাচিং#

দুটি স্ট্রিং দেওয়া আছে, একটি টেক্সট $T$ এবং একটি প্যাটার্ন $P$, ছোট হাতের অক্ষর দিয়ে গঠিত। আমাদের টেক্সটে প্যাটার্নের সকল অবস্থান গণনা করতে হবে।

আমরা প্রতিটি স্ট্রিংয়ের জন্য একটি পলিনোমিয়াল তৈরি করি ($T[i]$ ও $P[I]$ হলো বর্ণমালার ২৬টি অক্ষরের সাথে সংশ্লিষ্ট $0$ থেকে $25$-এর মধ্যে সংখ্যা):

$$A(x) = a_0 x^0 + a_1 x^1 + \dots + a_{n-1} x^{n-1}, \quad n = |T|$$

যেখানে

$$a_i = \cos(\alpha_i) + i \sin(\alpha_i), \quad \alpha_i = \frac{2 \pi T[i]}{26}.$$

এবং

$$B(x) = b_0 x^0 + b_1 x^1 + \dots + b_{m-1} x^{m-1}, \quad m = |P|$$

যেখানে

$$b_i = \cos(\beta_i) - i \sin(\beta_i), \quad \beta_i = \frac{2 \pi P[m-i-1]}{26}.$$

লক্ষ্য করুন $P[m-i-1]$ রাশি দিয়ে প্যাটার্নটি সুস্পষ্টভাবে উল্টানো হয়েছে।

দুটি পলিনোমিয়ালের গুণফল $C(x) = A(x) \cdot B(x)$-এর $(m-1+i)$-তম সহগ আমাদের বলবে, প্যাটার্ন টেক্সটে $i$ পজিশনে আছে কিনা।

$$c_{m-1+i} = \sum_{j = 0}^{m-1} a_{i+j} \cdot b_{m-1-j} = \sum_{j=0}^{m-1} \left(\cos(\alpha_{i+j}) + i \sin(\alpha_{i+j})\right) \cdot \left(\cos(\beta_j) - i \sin(\beta_j)\right)$$

$\alpha_{i+j} = \frac{2 \pi T[i+j]}{26}$ এবং $\beta_j = \frac{2 \pi P[j]}{26}$ সহ

ম্যাচ থাকলে, $T[i+j] = P[j]$, এবং তাই $\alpha_{i+j} = \beta_j$। এটি দেয় (পিথাগোরীয় ত্রিকোণমিতিক আইডেন্টিটি ব্যবহার করে):

$$\begin{align} c_{m-1+i} &= \sum_{j = 0}^{m-1} \left(\cos(\alpha_{i+j}) + i \sin(\alpha_{i+j})\right) \cdot \left(\cos(\alpha_{i+j}) - i \sin(\alpha_{i+j})\right) \\ &= \sum_{j = 0}^{m-1} \cos(\alpha_{i+j})^2 + \sin(\alpha_{i+j})^2 = \sum_{j = 0}^{m-1} 1 = m \end{align}$$

ম্যাচ না থাকলে, অন্তত একটি অক্ষর ভিন্ন, যা বলে যে একটি গুণফল $a_{i+1} \cdot b_{m-1-j}$ $1$-এর সমান নয়, যা সহগ $c_{m-1+i} \ne m$ তে নিয়ে যায়।

ওয়াইল্ডকার্ড সহ স্ট্রিং ম্যাচিং#

এটি আগের সমস্যার একটি সম্প্রসারণ। এবার আমরা অনুমতি দিই যে প্যাটার্নে ওয়াইল্ডকার্ড ক্যারেক্টার $\*$ থাকতে পারে, যা যেকোনো সম্ভাব্য অক্ষরের সাথে ম্যাচ করতে পারে। যেমন প্যাটার্ন $a*c$ টেক্সট $abccaacc$-এ ঠিক তিনটি পজিশনে আছে, ইনডেক্স $0$, ইনডেক্স $4$ এবং ইনডেক্স $5$-এ।

আমরা হুবহু একই পলিনোমিয়াল তৈরি করি, শুধু $P[m-i-1] = *$ হলে $b_i = 0$ সেট করি। $P$-তে ওয়াইল্ডকার্ডের সংখ্যা $x$ হলে, $c_{m-1+i} = m - x$ হলে $T$-তে ইনডেক্স $i$-এ $P$-এর ম্যাচ পাওয়া যাবে।

ফাস্ট ফুরিয়ে ট্রান্সফর্ম#

ডিসক্রিট ফুরিয়ে ট্রান্সফর্ম#

DFT-এর অ্যাপ্লিকেশন: পলিনোমিয়ালের দ্রুত গুণ#

ফাস্ট ফুরিয়ে ট্রান্সফর্ম#

ইনভার্স FFT#

ইমপ্লিমেন্টেশন#

উন্নত ইমপ্লিমেন্টেশন: ইন-প্লেস গণনা#

নাম্বার থিওরেটিক ট্রান্সফর্ম#

ইচ্ছামতো মডুলাস সহ গুণ#

অ্যাপ্লিকেশন#

সকল সম্ভাব্য যোগফল#

সকল সম্ভাব্য স্কেলার গুণফল#

দুটি স্ট্রিপ#

স্ট্রিং ম্যাচিং#

ওয়াইল্ডকার্ড সহ স্ট্রিং ম্যাচিং#

অনুশীলন সমস্যা#