বিজ্ঞান ও প্রযুক্তি যতই উন্নত হচ্ছে ততই নানা পেশা ও নানা কাজ যন্ত্র নির্ভর করে তোলার দৌঁড় বাড়ছে। এর মধ্যে জনপ্রিয় আর সফল হয়ে উঠেছে কণ্ঠস্বর হুবহু নকল করার প্রযুক্তি, যাতে আকৃষ্ট হচ্ছেন ভয়েস আর্টিস্টরা। কিন্তু কেন এই প্রযুক্তির উদ্ভাবন, অভিনেতা বা ভয়েস আর্টিস্টদের জন্য এটা কী সুসংবাদ না দুঃসংবাদ আর সাইবার অপরাধীদের জন্যই বা এটা কত বড় সুযোগ!!
কারো কণ্ঠ ক্লোন বা হুবহু নকল করা হয় কম্পিউটারে কৃত্রিম বুদ্ধিমত্তার একটি সফটওয়্যার প্রোগ্রাম ব্যবহার করে, যার মাধ্যমে একজন ব্যক্তির কণ্ঠস্বর হুবহু নকল করে একটা কৃত্রিম কণ্ঠস্বর তৈরি করা হয়।
এর জন্য কাউকে মাত্র কয়েক মিনিট তার কণ্ঠের রেকর্ডিং করে দিতে হয়। এর থেকেই সফটওয়্যার জেনে যায় তার কণ্ঠের আওয়াজ, তার বাচনভঙ্গি- কীভাবে ওই ব্যক্তি কথা বলেন।
শুধু আপনার কণ্ঠের আওয়াজই নয়, এই প্রযুক্তি সাম্প্রতিক সময়ে এতটাই এগিয়েছে যে আপনি শুনলে টের পাবেন না যে আপনার কণ্ঠের যান্ত্রিক অনুকরণ আপনি শুনছেন।
আপনার কথা বলার ঢং, আপনার অ্যাকসেন্ট বা কথার উচ্চারণভঙ্গি, আপনি কত দ্রুত বা ধীরে কথা বলেন, কথা বলার সময় আপনার কণ্ঠ কতটা ওঠে বা নামে, শব্দের মাঝে আপনি যেভাবে শ্বাস নেন এবং গলার স্বর আপনার কতটা হালকা বা গম্ভীর সবই এই সফটওয়্যার হুবহু নকল করে ফেলে।
ভয়েস ক্লোনিং-এর বিপদ কোথায়?
এত উচ্চ প্রযুক্তির ভয়েস ক্লোনিং-এর বাণিজ্যিক সুবিধার দিক যেমন আছে, তেমনি এর গুরুতর ঝুঁকির দিকও রয়েছে।
কেন এই প্রযুক্তির উদ্ভাবন?
ভোকালআইডি প্রতিষ্ঠানটি তৈরি করেছেন রুপাল প্যাটেল। তিনি সংস্থাটির প্রধান নির্বাহী। তিনি নর্থইস্টার্ন ইউনিভার্সিটির যোগাযোগ বিজ্ঞান ও এ সংক্রান্ত সমস্যা বিষয়ে অধ্যাপক।
রুপাল প্যাটেল এই ব্যবসা গড়ে তোলেন ২০১৪ সালে তার চিকিৎসা কাজকে আরও এগিয়ে নেবার লক্ষ্যে। যেসব রোগী অসুস্থতার কারণে বা অস্ত্রোপচারের পর কথা বলার ক্ষমতা হারিয়েছে তাদের কণ্ঠস্বর যন্ত্রের সাহায্যে কৃত্রিমভাবে তৈরি করার তাগিদ থেকে এই প্রযুক্তির ওপর ভিত্তি করে তিনি তার সংস্থাটি প্রতিষ্ঠা করেন।
তিনি বলছেন এই প্রযুক্তি কাজ করে কৃত্রিম বুদ্ধিমত্তা বা আর্টিফিশিয়াল ইন্টালিজেন্স (এআই) সফটওয়্যার ব্যবহার করে। কী প্রয়োজন সেটা "বুঝতে পারার" ক্ষমতা এআই-এর আছে, এবং সেটা বুঝে এআই নিজেই ঠিক করে নেয় তার কাছে কী চাওয়া হচ্ছে।
অধ্যাপক প্যাটেল বলছেন, গত কয়েক বছরে এই প্রযুক্তি অনেক উন্নত হয়েছে এবং মানুষের কণ্ঠস্বর হুবহু নকল করতে পারছে।
তিনি বলছেন এখন শুধু কণ্ঠস্বর হারানো রোগী নয়, তার খদ্দেরদের মধ্যে রয়েছেন ভয়েসওভার শিল্পীরা।
বিশেষজ্ঞরা খুবই উদ্বিগ্ন যে এই প্রযুক্তি সাইবার অপরাধের জন্য খুবই ঊর্বর একটা ক্ষেত্র। কারণ ধরুন যে আপনার সাথে কথা বলছে সে আসল মানুষ নাকি নকল মানুষ তা বোঝা এর ফলে অসম্ভব হয়ে দাঁড়াবে, এবং আপনাকে ফাঁদে ফেলা অপরাধীদের জন্য খুবই সহজ হবে।
ডিজিটাল প্রযুক্তি ব্যবহার করে যেসব ভুয়া ভিডিও তৈরি করা হয়, সেগুলোর মত এভাবে হুবহু নকল করা কণ্ঠকেও "ডিপফেক" বলা হয়।
অপরাধীদের মোকাবেলার পথ কি?
এধরনের নতুন অপরাধ মোকাবেলার জন্যও বিশ্বের বিভিন্ন দেশে প্রযুক্তি কোম্পানিগুলো কাজ শুরু করে দিয়েছে বলে জানাচ্ছে কৃত্রিম বুদ্ধিমত্তা বিষয়ে বিশেষজ্ঞ ওয়েবসাইট ভেনচার বিট।
এই কোম্পানিগুলো এমন প্রযুক্তি তৈরি করছে যা দিয়ে কোন অডিও ভুয়া কিনা তা পরীক্ষা করা যাবে। কোন কথা অস্বাভাবিকভাবে একাধিকবার ব্যবহার করা হয়েছে কিনা, কিংবা কণ্ঠের পেছনে এমনকি হালকা ডিজিটার শব্দ আছে কিনা, এছাড়াও কিছু শব্দ বা বাক্যের গঠন এসব পরীক্ষা করার ব্যবস্থা দিয়ে এই পাল্টা প্রযুক্তি গড়ে তোলা হচ্ছে।
সরকার এবং আইনশৃঙ্খলা রক্ষাকারী সংস্থাগুলোও নতুন এই অপরাধ জগত সম্পর্কে সজাগ হয়ে উঠছে।
গত বছর ইউরোপিয় ইউনিয়নের আইন রক্ষাকারী সংস্থা ইউরোপোল ইইউর সদস্য দেশগুলোকে 'ডিপফেক' প্রযুক্তি ধরার জন্য প্রযুক্তি খাতে "বড়ধরনের বিনিয়োগের" আহ্বান জানিয়েছে।
লেখকঃ Promity
#science #bee #facts #clone #voice #deepfake