কিছুদিন পূর্বে ডিপফেইক ভিডিও এর বিষয়টা অনেক আলোচনায় ছিল, তাই এই সম্পর্কে সবারই কমবেশি কিছু ধারণা রয়েছে। কিন্তু এই ডিপফেইক গোত্রের আরেকটি নতুন ফিচার, ভয়েস ক্লোনিং নিয়ে হয়তো আমাদের ধারণা অনেক কম বা নেই বললেই চলে। কিন্তু এই প্রযুক্তির যুগে নিজেকে এবং নিজের পরিবারকে নিরাপদে রাখতে এই সম্পর্কে কিছু ধারণা থাকা বাঞ্ছনীয়।
তো আসুন জেনে নিই এই ভয়েস ক্লোনিং এর আদ্যোপান্ত।
মূলত ভয়েস ক্লোনিং হচ্ছে একজনের ভয়েসের কৃত্রিম সিমুলেশন তৈরি। বর্তমানে AI ব্যাবহার করে এই কাজটি এত নিপুণভাবে করা হচ্ছে যে অরিজিনাল ভয়েস আর সিমুলেশন এর মধ্যে পার্থক্য করা কঠিন হয়ে দাঁড়িয়েছে।
জানতে ইচ্ছে হচ্ছে কিভাবে তৈরি হয় এই ভয়েস ক্লোনিং? চলুন জেনে নেয়া যাক।
কম্পিউটার ব্যবহার করে ভয়েস বিশ্লেষণ দ্বারা AI ভয়েস ক্লোনিং এর প্রাথমিক কাজ শুরু হয়। এই কাজটি করা হয় দশক পুরাতন পদ্ধতি টেক্সট টু স্পীচ (TTS) দ্বারা। এটি মূলত একটি লেখাকে বক্তৃতায় রূপান্তর করে দেয়।
অতীতে এই (TTS) কেবল দুটি কাজেই ব্যবহার হতো, ভয়েস রেকর্ড করে একটি শব্দ ভাণ্ডার তৈরি এবং সেই শব্দ থেকে কণ্ঠস্বর তৈরিতে। আরেকটি হচ্ছে বক্তৃতার মডেল ব্যবহার করে সেখান থেকে ভয়েস বা কণ্ঠস্বর তৈরি করে। বর্তমানে আর্টিফিশিয়াল ইন্টিলিজেন্স (AI) এই দুটিকে সম্মিলিত করে এই ভয়েস ক্লোনিং এর কাজটি করে থাকে। তাই এটা আসল কি নকল ধরা মুশকিল হয়ে যায়।
বিষয়টা এমন যে, প্রোগ্রামার আপনার কয়েক মিনিটের ভয়েস রেকর্ড বা ভিডিও রেকর্ড পেলে সে AI দ্বারা এমনভাবে একটি সিমুলেশন তৈরি করতে সক্ষম হবে যে সে চাইলে যেকোনো কিছু আপনার ভয়েসে তথা ওই AI মডেলটি দ্বারা বলাতে পারবে। এমনকি কেউ শুনে বুঝতেও পারবে না যে সেটা আপনি ছিলেন না।
Google এর Tacotron, Wavenet বা Lyrebird এর ফলে এই কাজটি অনেক সহজ হয়ে উঠেছে। এমনকি এর মান দিন দিন উন্নততর হচ্ছে।
[নিম্নে বর্ণিত কোন অপরাধমূলক কাজে ব্যবহারের জন্য এদের তৈরি করা হয়নি]
আসুন এবার এদের কিছু ব্যবহার জেনে নেয়া যাক!
প্রথমে অপরাধমূলক কাজে এদের ব্যবহারযোগ্যতা সম্পর্কে জেনে নেয়া শ্রেয়।
- বর্তমানে অনেকে নিজের বাসা, অফিস বা সংগ্রহশালা এর নিরাপত্তার জন্য ভয়েস রিকগনিজেশন সিস্টেম ব্যবহার করে থাকেন। কিন্তু এটি বেশ ভঙ্গুর ব্যবস্থা ও ভয়েস ক্লোনিং ব্যবহার করে সহজেই এই নিরাপত্তা বেষ্টনী ভেঙ্গে কারো ক্ষতি করা যায়।
- এর জনপ্রিয় একটি ব্যবহার হচ্ছে ভুল তথ্য ছড়ানো। অনেকসময় কাউকে ফাঁসিয়ে দেয়ার জন্য ষড়যন্ত্রমূলকভাবে তার ভয়েস ব্যবহার করে ভুল তথ্য ছড়িয়ে দেয়া হয়।
- অনেক সময় একজনের বক্তব্যকে আংশিক পরিবর্তন করে কাউকে উত্যক্ত করা হয় বা টাকা হাতিয়ে নেয়া হয়।
এছাড়াও এর রয়েছে চমৎকার কিছু ভালো ব্যবহারও, যেমনঃ
- শিক্ষার ক্ষেত্রে এর বহুমুখী ব্যবহার করা যেতে পারে। পাঠ্যবইয়ে থাকা গুরুত্বপূর্ণ ব্যক্তিদের গল্প তাদের কণ্ঠেই শোনা গেলে নিঃসন্দেহে এর প্রতি সবার জানার আগ্রহ বাড়বে। আর এটা সম্ভব হবে এই পদ্ধতিতে।
- তাছাড়া অডিও বুক পড়াশোনাকে করে দিবে আরও মধুর ও সহজ।
- বাকপ্রতিবন্ধী মানুষকে নিজের কণ্ঠে নিজের মনের ভাব প্রকাশ করার সুযোগ করে দিতে পারে এই পদ্ধতি।
যেহেতু এর কিছু বাজে ব্যবহার হতে পারে ভয়াবহ, তাই এ থেকে মানুষকে রক্ষা করতে অনেক কোম্পানি যেকোনো রেকর্ডিং ভয়েস ক্লোনিং নাকি অরিজিনাল তা যাচাই করার টুলও তৈরির চেষ্টায় মগ্ন আছেন। ID R&D DARPA এমনই একটি সংস্থা যা এরূপ প্রোগ্রাম তৈরি করছে এবং এর উন্নততর সংস্করণ তৈরিতে গবেষণা করছে।
জোবায়ের হোসেন সামস/ নিজস্ব প্রতিবেদক
তথ্যসূত্রঃ ID R&D DARPA