ডিপ লার্নিং হচ্ছে মেসিন লার্নিং এর একটি শাখা যেটি আবার আর্টিফিশিয়াল ইন্টিলিজেন্সের(AI) একটি শাখা। আর্টিফিশিয়াল ইন্টেলিজেন্স সম্পর্কে আশা করি সবার আইডিয়া রয়েছে। AI বা আর্টিফিশিয়াল ইন্টেলিজেন্স হলো মূলত যন্ত্রকে মানুষের মতো বুদ্ধিমত্তা দিয়ে সেই যন্ত্র দিয়ে কাজ করানোর উপায়। এসব যন্ত্র কিছু কিছু ক্ষেত্রে মানুষ থেকেও বেশি বুদ্ধিমত্তা নিয়ে কাজ করতে পারে। মানে দাড়ালো যন্ত্রকে শিখিয়ে সেই যন্ত্রদিয়েই কাজ করানো। যেমন - একটি কারকে(Car) যদি ঢাকা - চট্টগ্রাম রাস্তা ও রাস্তায় থাকা মানুষ, অন্যান্য গাড়ি, মোড়, ফ্লাইওভার, রোড ডিভাইডার ইত্যাদি ভালো করে চিনিয়ে দিয়ে তারপর সেই রাস্তায় ঐ কারকে ড্রাইভার ছাড়া যাতায়াত করতে দেওয়া হয় তাহলে সে যদি অনায়াসে কাজটি করতে পারে তাহলে ধরা হয় যন্ত্রটিতে(কার) কৃত্তিম বুদ্ধিমত্তা বা আর্টিফিশিয়াল ইন্টেলিজেন্স রয়েছে। এখন প্রশ্ন হলো কিভাবে কারটিকে ঢাকা চট্টগ্রাম এর রাস্তা ও রাস্তায় থাকা বস্তু ও প্রাণীগুলো চিনিয়ে দেওয়া যায়? একাজ করতে হলে যতপ্রকারের গাড়ি এই রাস্তায় চলাচল করে তাদের বিভিন্ন রকম ছবি নিয়ে যন্ত্রকে আগে শিখিয়ে দিতে হবে যে এটা বাস, এটা মিনিবাস, এটা কার, এটা ট্রাক, এটা কাভার্ড ভ্যান, এটা মোটরসাইকেল, এটা রিকশা ইত্যাদি। এসব গাড়ি চিনিয়ে দিলে সে তাদের সাথে সংঘর্ষ ঘটাবে না। আবার প্রাণীগুলোকেও চিনিয়ে দেওয়া লাগবে যাতে কোন প্রাণীকে সে চাকার নিচে পিষ্ট না করে। এজন্যে তাকে চিনিয়ে দিতে হবে এটা মানুষ, এটা গরু, এটা ছাগল, এটা মহিষ ইত্যাদি। তাহলে এসব প্রাণীর বিভিন্ন অবস্থার ছবি নিয়ে তাকে চিনিয়ে দিতে হবে। একপ্রাণীর একটি ছবি চিনিয়ে দিলেই হবে না, কারণ একই প্রাণী রাতে একরকম দেখায় দিনে অন্যরকম। আবার মানুষ কখনো পাঞ্জাবি-পায়জামা, কখনো শার্ট-প্যান্ট, কখনো গেঞ্জি-প্যান্ট পরিধান করে রাস্তায় বের হয়। সুতরাং কারটিকে সব রকম সম্ভাব্য ছবি চিনিয়ে দিতে হবে। যাতে সে ঠিক মানুষের মতো যেকোন বস্তু ও প্রাণীর ছবি দেখলে চিনতে পারে। এই পদ্ধতিকে বলে অবজেক্ট ডিটেকশন।তাহলে প্রতিটি বস্তু ও প্রাণীর 100 টি করে ছবি নিয়ে 500টি বস্তু ও প্রাণী কারটিকে চিনিয়ে দিতে হলে 50000টি ছবি হয়। এই 50000 ছবির প্রতিটি যদি 1MB করে সাইজ হয় তাহলে দাড়ায় 50000MB = 50000000KB = 50000000000Byte = 400000000000 Bit। আর পিক্সেলে হিসাব করলে লাখ লাখ পিক্সেল। আর যদি ছবির সাইজ ও সংখ্যা আরো বাড়ে তাহলে কোটি কোটি বিট হবে। এরকম ডেটাকে বলা হয় বিগ ডেটা। এই বিশাল পরিমাণের ডেটাকে প্রসেসিং করে ঐ কারটিকে শিখানো লাগবে ঢাকা-চট্রগ্রাম মহাসড়কে কিভাবে চলা লাগবে। এজন্যে দরকার যথাযথ প্লাটফর্ম ও যথাযথ অ্যালগরিদম। অ্যালগরিদম হলো কোন সিদ্ধান্ত নেওয়ার বা ফলাফল বের করার কতগুলো নিদিষ্ট ধাপ, যেমন - এক থেকে দশ পর্যন্ত যোগ করার উপায়। আর প্লাটফর্ম হলো কাজটি করার ওয়ার্কশপ ও তার টুলস গুলো। প্লাটফর্মটি নিদিষ্ট প্রোগ্রাম দ্বারা তৈরি করা হয়। বিগ ডেটাগুলোকে অ্যানালাইসিস করতে মেসিন লার্নিং ও ডিপ লার্নিং ব্যবহার করা যায়। কিন্তু ডিপ লার্নিং বিগ ডেটা প্রসেসিং এর সময় সঠিক পারদর্শীতা দেখাতে যেমনি সক্ষম তেমনি অপ্রোয়জনীয় ডেটাকে ফিল্টারিং করতেও সক্ষম। সেদিকে আমরা পরে যাবো। আগে জেনে নেই মেসিন লার্নিং ও ডিপ লার্নিং কি জিনিষ। মেসিন লার্নিং হলো কতোগুলো নির্ধারিত ডাটা থেকে শিখে সিদ্ধান্ত নেওয়ার উপায়। যেমন - কোন ব্যক্তির বংশে ডায়াবেটিস আছে কিনা সেটা দেখে ও ঐ ব্যক্তির জীবনধারণ কিরকম সেটার তথ্য নিয়ে প্রিডিকশন করা সম্ভব তার ডায়াবেটিস আছে কিনা। এক্ষেত্রে ডাটাকে প্রসেস করার কোন প্রয়োজন নেই। শুধু ডাটা থেকে শিখে তারপর মেশিন কাজ করবে বা সিদ্ধান্ত নিবে। মেসিন লার্নিং দিয়ে কাজটি করার জন্যে এর সুনিদিষ্ট কতোগুলো অ্যালগরিদম রয়েছে । ডিপ লার্নিং মেসিন লার্নিং এর মতোই সিদ্ধান্ত নেয় কিন্তু ডেটাকে প্রসেসিং করার ক্ষমতা রয়েছে ডিপ লার্নিং এর। যেমন অপ্রয়োজনীয় ডাটা ফিল্টার করা, একই রকম ডেটাকে গ্রুপিং করা এসব এ পারদর্শী ডিপ লার্নিং। ডিপ লার্নিং এরও কতোগুলো সুনির্দিষ্ট অ্যালগরিদম রয়েছে। কারটিকে ছবিগুলো চিনিয়ে দিতে কিভাবে ডিপ লার্নিং কাজ করে তা আমরা ধাপে ধাপে শিখবো। আজকের আলোচনা এতটুকুই। শেয়ার করে অন্যকে জানার সুযোগ দিবেন।
-মো বাহার উল্যাহ, ইইই বিভাগ, চবি।