বিগ ডেটার অফুরন্ত বিকাশের সম্ভাবনা রয়েছে। আসুন জেনে নেওয়া যাক বিগ ডেটা কী এবং তিনটি কারণ কেন এটি শুধুমাত্র 2010 সালে জনপ্রিয় হয়েছিল।


এক পর্যায়ে, আমরা বিভিন্ন মিডিয়ার মাধ্যমে অপরিচিত শব্দ বিগ ডেটার মুখোমুখি হতে শুরু করি। এই শব্দগুলো জনপ্রিয় হয়ে উঠেছে মাত্র কয়েক বছর হয়েছে। যাইহোক, এটি সম্প্রতি মিডিয়া দ্বারা এত বেশি ব্যবহার করা হয়েছে যে "বিগ ডেটা ব্যবহার করে বিপণন" এর মত অভিব্যক্তিগুলি এখন আমাদের কাছে বিরক্তিকর মনে হচ্ছে। তাহলে বড় ডেটা এবং ডেটা মাইনিং সম্পর্কে এটি কী যা তাদের এত জনপ্রিয় করে তোলে?

বিগ ডেটা আক্ষরিক অর্থে একটি বিশাল ডেটা সেট। সাধারণ সংখ্যা থেকে জটিল সিসিটিভি ছবি পর্যন্ত স্টোরেজ মিডিয়ামে সংরক্ষিত যেকোন ডেটা, বিন্যাস নির্বিশেষে সেগুলিকে একত্রিত করে একটি সেট তৈরি করে বড় ডেটা হয়ে উঠতে পারে। অন্য কথায়, ডেটার আনুষ্ঠানিক দিক থেকে, আগের ডেটা এবং বড় ডেটার মধ্যে কোনও পার্থক্য নেই। যাইহোক, যদি বড় ডেটা কেবলমাত্র বড় আকারের ডেটা হয়, তবে এটি 1990-এর দশকের শেষের দিকে এবং 2000-এর দশকের শুরুতে, যখন কম্পিউটার প্রযুক্তির দ্রুত বিকাশ ঘটেছিল ততটাই জনপ্রিয় হওয়া উচিত ছিল। যাইহোক, 2010 এর দশকে বিগ ডেটা জনপ্রিয় হওয়ার তিনটি কারণ রয়েছে:

প্রথমত, সবচেয়ে বড় কারণ হল CPU ডেভেলপমেন্টে প্যারাডাইম শিফট। CPU (সেন্ট্রাল প্রসেসিং ইউনিট) হল কম্পিউটারের মস্তিষ্ক যা গণনামূলক কাজ করে। অতীতে, বিকাশের গতি এত দ্রুত ছিল যে মুরের আইন, যা বলে যে CPU কর্মক্ষমতা প্রতি 18 মাসে দ্বিগুণ হয়, ব্যাপকভাবে গৃহীত হয়েছিল। যাইহোক, 2004 সালে, সিপিইউগুলির বিকাশ '4GHz প্রাচীর' নামে একটি সীমাতে পৌঁছেছিল। পূর্বে, সিপিইউ বিকাশের দিকটি ছিল একটি কোরে (কম্পিউটিং ইউনিট) ঢোকানো ট্রানজিস্টরের (কম্পিউটিং উপাদান) সংখ্যা বাড়িয়ে একটি প্রক্রিয়াকরণ ইউনিটের গতি বাড়ানো। যাইহোক, এই পদ্ধতিতে একটি গুরুতর তাপ সমস্যা ছিল কারণ ট্রানজিস্টরের একীকরণ বৃদ্ধির সাথে সাথে প্রতিটি ট্রানজিস্টরের তাপ অপচয় ক্ষেত্র হ্রাস পেয়েছে। CPU নির্মাতারা শেষ পর্যন্ত এই গরম করার সমস্যা সমাধান করতে ব্যর্থ হয়েছে। ফলস্বরূপ, ট্রানজিস্টর ইন্টিগ্রেশন একটি নির্দিষ্ট স্তর অতিক্রম করেনি, এবং একটি কোরের অপারেটিং গতি প্রায় 4GHz এ রয়ে গেছে। যাইহোক, কোরে ট্রানজিস্টরের সংখ্যা বাড়ানোর পরিবর্তে, সিপিইউ নির্মাতারা তাপ সমস্যা মোকাবেলা করার অন্যান্য উপায় খুঁজে পেয়েছে। একটি মাল্টি-কোর সিপিইউ তৈরি করে একটি নতুন অগ্রগতি পাওয়া গেছে যা সিপিইউ-এর মধ্যে একাধিক কোর অন্তর্ভুক্ত করে। বিদ্যমান সিঙ্গেল-কোর সিপিইউগুলি একটি কোর অনুসারে একাধিক টাস্ক প্রক্রিয়া করার সময়, মাল্টি-কোর সিপিইউগুলি একাধিক কোর জুড়ে একাধিক টাস্ককে বিভক্ত এবং সমান্তরাল করে এবং একই সাথে প্রক্রিয়াকরণের মাধ্যমে প্রক্রিয়াকরণের গতি বাড়ায়। এই মাল্টি-কোর সিপিইউগুলি ক্রমশ জনপ্রিয় হয়ে উঠেছে, এবং সমান্তরাল কম্পিউটিং প্রযুক্তি যা একই সাথে ডেটা প্রক্রিয়া করে। ফলস্বরূপ, কম্পিউটিং গতির সীমাবদ্ধতার কারণে আগে পরিচালনা করা যেত না এমন বিপুল পরিমাণ ডেটা এখন আরও দ্রুত এবং সহজে পরিচালনা করা সম্ভব।

শুধুমাত্র মাল্টি-কোর সিপিইউ-এর জনপ্রিয়করণই নয়, স্টোরেজ মিডিয়ার বিকাশও বিগ ডেটার যুগের সূচনায় একটি বড় ভূমিকা পালন করেছে। হার্ড ডিস্কের ক্ষেত্রে, একটি প্রতিনিধি সঞ্চয় মাধ্যম, ডেটা ধাতুর প্লেটে সংরক্ষণ করা হয় যাকে প্ল্যাটার বলা হয়। একটি হার্ড ডিস্কে একাধিক প্ল্যাটার সন্নিবেশ করার জন্য উন্নত চৌম্বকীয় রেকর্ড ইন্টিগ্রেশন এবং মাল্টি-কোর সিপিইউ-এর মতো প্রযুক্তিগুলি তৈরি করা হয়েছে। এর জন্য ধন্যবাদ, স্টোরেজ ক্ষমতা বিস্ফোরকভাবে বৃদ্ধি পেয়েছে, যে পরিমাণে 8TB স্টোরেজ স্পেস সহ পণ্যগুলি 2023-এর দশকে জনপ্রিয় হয়ে উঠেছে, যা 1990-এর দশকে ছিল মাত্র 1GB। এছাড়াও, তুলনামূলকভাবে ধীরগতির হার্ডডিস্কের বিপরীতে, SSD (সলিড স্টেট ড্রাইভ) এর মতো উচ্চ গতির নতুন স্টোরেজ মিডিয়া আবির্ভূত হয়েছে। প্রচুর পরিমাণে ডেটা ব্যবহার করা সহজ হয়ে উঠেছে যা আগে অপর্যাপ্ত স্টোরেজ স্পেসের কারণে সংরক্ষণ করা যেত না বা সংরক্ষণ করা হলেও ধীর পড়া এবং লেখার গতির কারণে প্রক্রিয়া করা কঠিন ছিল।

সিপিইউ এবং স্টোরেজ মিডিয়ার অগ্রগতির ফলে প্রচুর পরিমাণে ডেটা ব্যবহার করা সম্ভব হয়েছে যা আগে গণনা করা বা সংরক্ষণ করা যেত না। যাইহোক, আজকের বড় ডেটা এবং অতীতের বড় ডেটার মধ্যে মৌলিক পার্থক্যটি ডেটা সংগ্রহ করার পদ্ধতিতে রয়েছে। স্মার্ট ডিভাইস এবং এসএনএস, যা 2010 এর দশকে দ্রুত জনপ্রিয় হয়ে ওঠে, তথ্য সংগ্রহের দৃষ্টান্ত পরিবর্তন করে। নেটওয়ার্কের সাথে প্রত্যক্ষ বা পরোক্ষভাবে সংযুক্ত স্মার্ট ডিভাইসগুলি বিভিন্ন সেন্সর যেমন ক্যামেরা, জিপিএস (গ্লোবাল পজিশনিং সিস্টেম), এবং এনএফসি (নিয়ার ফিল্ড কমিউনিকেশন) এর মাধ্যমে ব্যবহারকারীর ডেটা সংগ্রহ করে। এবং এই ডেটা প্রতিনিয়ত নেটওয়ার্কে আপলোড করা হচ্ছে। এছাড়াও, ফেসবুক এবং টুইটারের মতো এসএনএস ব্যবহারকারীরা ক্রমাগত তাদের বিভিন্ন ব্যক্তিগত তথ্য নেটওয়ার্কে আপলোড করছেন। অতীতে, ডেটা সংগ্রহ করা হয়েছিল শুধুমাত্র নির্দিষ্ট টার্গেট ডেটা প্রাপ্ত করার জন্য যা ডেটা সংগ্রহের বিষয়কে গুরুত্বপূর্ণ বলে মনে করা হত। যাইহোক, বর্তমান ডেটা সংগ্রহ নির্বিচারে স্মার্ট ডিভাইস এবং SNS এর মাধ্যমে নেটওয়ার্কের মাধ্যমে প্রবাহিত বিপুল পরিমাণ ডেটা সংগ্রহ করে। উপরন্তু, নেটওয়ার্ক প্রযুক্তি ধীরে ধীরে বিকাশের সাথে সাথে নেটওয়ার্কের সাথে সংযুক্ত বস্তুর ধরন বৃদ্ধি পাচ্ছে। অন্য কথায়, ইন্টারনেট অফ থিংস (আইওটি) এর আবির্ভাবের সাথে সাথে ডেটা সংগ্রহের ক্ষেত্র আরও প্রসারিত হচ্ছে।

এইভাবে, মাল্টি-কোর সিপিইউগুলির বিকাশ, স্টোরেজ মিডিয়ার বিকাশ এবং ডেটা সংগ্রহের সুযোগের সম্প্রসারণের সুরেলা সমন্বয়ের মাধ্যমে বড় ডেটার ধারণাটি উদ্ভূত হয়েছিল। বর্তমানে, অসংখ্য কোম্পানী, সরকার এবং অন্যান্য গোষ্ঠী গুপ্তধন খোঁজার জন্য তাদের সংগ্রহ করা বিগ ডাটা খনন করছে এবং বিভিন্ন মিডিয়া বিগ ডাটার গুরুত্বের উপর জোর দিচ্ছে। কিন্তু যেকোন কিছুর চেয়েও বড় তথ্যের বিষয়ে আমাদের যা বিবেচনা করতে হবে তা হল বর্তমান বিগ ডেটা শুধুমাত্র শুরু। ভবিষ্যতে, মাল্টি-কোর সিপিইউগুলি একই সাথে দ্রুত গণনা করতে সক্ষম হওয়ার জন্য বিকাশ করবে, এবং স্টোরেজ মিডিয়া আরও দ্রুত আরও ডেটা সংরক্ষণ করতে সক্ষম হওয়ার জন্য বিকাশ করবে। এবং আরও অনেক জিনিস নেটওয়ার্কের সাথে সংযুক্ত হবে এবং নেটওয়ার্কে তাদের সংগ্রহ করা ডেটা পাঠাবে। বর্তমান বিগ ডেটা যা আমরা বর্তমানে বড় হিসাবে উপলব্ধি করি তা বিগ ডেটার আসন্ন যুগে মোটেও বড় নাও হতে পারে।