ChatGPT হলো জেনারেটিভ প্রি-ট্রেনড ট্রান্সফরমার (GPT) ভাষার মডেলের পরিবারের সদস্য । ওপেনএআই-এর GPT-3- এর একটি উন্নত সংস্করণ যা " GPT-3.5 " নামে পরিচিত ছিল তার উপর এটি সূক্ষ্মভাবে তৈরি করা হয়েছে।
ফাইন-টিউনিং প্রক্রিয়া মানব প্রতিক্রিয়া থেকে রিইনফোর্সমেন্ট লার্নিং (RLHF) নামক একটি প্রক্রিয়ায় তত্ত্বাবধানে শিক্ষার পাশাপাশি রিইনফোর্সমেন্ট লার্নিং উভয়কেই ব্যবহার করে। উভয় পদ্ধতিই মডেলের কর্মক্ষমতা উন্নত করতে মানব প্রশিক্ষকদের ব্যবহার করে। তত্ত্বাবধানে শেখার ক্ষেত্রে, এই মডেলটি কথোপকথনের সাথে সরবরাহ করা হয়েছিল যেখানে প্রশিক্ষকরা উভয় পক্ষই খেলেছেন: ব্যবহারকারী এবং এআই সহকারী । শক্তিবৃদ্ধি শেখার ধাপে, মানব প্রশিক্ষকরা প্রথম প্রতিক্রিয়াগুলিকে র্যাঙ্ক করেছেন যা মডেলটি পূর্ববর্তী কথোপকথনে তৈরি করেছিল। এই র্যাঙ্কিংগুলি "পুরস্কার মডেল" তৈরি করতে ব্যবহার করা হয়েছিল যা মডেলটিকে আরও সূক্ষ্ম সুর করতে ব্যবহৃত হয়েছিল প্রক্সিমাল পলিসি অপ্টিমাইজেশান (পিপিও)।
ChatGPT প্রাথমিকভাবে এনভিডিয়া জিপিইউ দ্বারা চালিত একটি মাইক্রোসফ্ট Azure সুপারকম্পিউটিং অবকাঠামো ব্যবহার করেছিল , যা মাইক্রোসফ্ট বিশেষভাবে OpenAI-এর জন্য তৈরি করেছিল এবং এটির জন্য "শত মিলিয়ন ডলার" খরচ হয়েছে বলে জানা গেছে। ChatGPT-এর সাফল্যের পর, Microsoft নাটকীয়ভাবে 2023 সালে OpenAI পরিকাঠামোকে আপগ্রেড করে।
ওপেনএআই ChatGPT ব্যবহারকারীদের কাছ থেকে ডেটা সংগ্রহ করে এবং পরিষেবাটিকে আরও উন্নত করতে প্রশিক্ষণ দেয়। ব্যবহারকারীরা ChatGPT থেকে প্রাপ্ত প্রতিক্রিয়াগুলিকে আপভোট বা ডাউনভোট করতে পারেন এবং অতিরিক্ত প্রতিক্রিয়া সহ একটি পাঠ্য ক্ষেত্র পূরণ করতে পারেন।
যদিও একটি চ্যাটবটের মূল কাজ হল একজন মানুষের কথোপকথনের অনুকরণ করা, তবুও চ্যাটজিপিটি বহুমুখী। এটি কম্পিউটার প্রোগ্রামগুলি লিখতে এবং ডিবাগ করতে পারে, সেলিব্রিটি সিইওদের শৈলী অনুকরণ করতে পারে এবং ব্যবসায়িক পিচগুলি লিখতে পারে, সঙ্গীত, টেলিপ্লে, রূপকথা এবং ছাত্রদের রচনা, পরীক্ষার প্রশ্নের উত্তর দিতে পারে (কখনও কখনও, পরীক্ষার উপর নির্ভর করে, একটি স্তরে গড় মানব পরীক্ষাকারীর উপরে), কবিতা এবং গানের কথা লিখতে পারে, টেক্সট অনুবাদ এবং সংক্ষিপ্ত করে, একটি লিনাক্স সিস্টেম অনুকরণ করে; পুরো চ্যাট রুম অনুকরণ করে, টিক-ট্যাক-টোর মতো গেম খেলে এবং এটিএম অনুকরণ করতে পারে । ChatGPT-এর প্রশিক্ষণের তথ্যে ম্যান পেজ অন্তর্ভুক্ত রয়েছেএবং এতে রয়েছে ইন্টারনেট ঘটনা এবং প্রোগ্রামিং ভাষা যেমন বুলেটিন বোর্ড সিস্টেম এবং পাইথন প্রোগ্রামিং ভাষা সম্পর্কে তথ্য । এমনকি এটি বিভিন্ন ডিগ্রিসহ বিসিএস পরীক্ষা পর্যন্ত দিতে পারে।
বেশিরভাগ চ্যাটবট থেকে ভিন্ন, কেননা ChatGPT একই কথোপকথনে দেওয়া সীমিত সংখ্যক পূর্ববর্তী প্রম্পট মনে রাখে। চ্যাটজিপিটি থেকে আপত্তিকর আউটপুটগুলিকে উপস্থাপিত করা এবং উত্পাদিত হওয়া রোধ করার জন্য, প্রশ্নগুলি OpenAI "মডারেশন এন্ডপয়েন্ট" API (একটি পৃথক GPT-ভিত্তিক AI) এর মাধ্যমে ফিল্টার করা হয়, এবং সম্ভাব্য বর্ণবাদী বা যৌনতাবাদী প্রম্পটগুলি খারিজ করা হয়।
তথ্যসূত্রঃ
১. https://en.m.wikipedia.org/wiki/ChatGPT
২. https://www.atriainnovation.com/en/how-does-chat-gpt-work/