পক্ষাঘাতগ্রস্ত নারী ‘কথা’ বললেন ডিজিটাল অ্যাভাটার দিয়ে

প্যারালাইসিসের আগের তার প্রাকৃতিক কণ্ঠের রেকর্ড ব্যবহার করে ট্রেইনিং দেওয়া হয়েছে প্রযুক্তিটিকে, যার ফলে একটি কৃত্রিম কণ্ঠস্বর ব্যবহার করতে পারছেন তিনি।

প্রযুক্তি ডেস্কবিডিনিউজ টোয়েন্টিফোর ডটকম
Published : 25 August 2023, 04:35 AM
Updated : 25 August 2023, 04:35 AM

মস্তিষ্কের সঙ্গে কম্পিউটারের সংযোগ স্থাপনের পর ডিজিটাল অ্যাভাটারের মাধ্যমে সাবলীলভাবে কথা বললেন স্ট্রোকের শিকার পক্ষাঘাতগ্রস্ত এক নারী। মানুষের মাস্তিষ্কের গ্রে মেটারে তৈরি হওয়া সিগনালকে কম্পিউটারের পক্ষে বোঝা সম্ভব এমন ডিজিটাল সিগনালে রূপান্তর করে এই ব্রেইন-কম্পিউটার ইন্টারফেইস (বিসিআই) প্রযুক্তি।

ইউনিভার্সিটি অফ ক্যালিফোর্নিয়া স্যান ফ্রান্সিসকো এবং ইউনিভার্সিটি অফ ক্যালিফোর্নিয়া, বার্কলির সঙ্গে এডিনব্রাভিত্তিক স্পিচ গ্রাফিক্স যৌথভাবে এই যুগান্তকারী যোগাযোগ প্রযুক্তিটি তৈরি করেছে।

ইউসি স্যান ফ্রান্সিসকোর নিউরোলজিকাল সার্জারির প্রধান ড. এডওয়ার্ড চ্যাঙয়ের নেতৃত্বে গবেষকদলটি প্রথমে এই রোগীর মস্তিস্কের স্পিচ সেন্টার বা কথা বলার বিষয়টি যেখান থেকে নিয়ন্ত্রিত হয়, সেখানে একটি ২৫৩ পিনের ইলেকট্রোড স্থাপন করেন।

এগুলো মস্তিষ্ক থেকে মাড়ি, ঠোঁট, এবং জিহবার পেশিতে পাঠানো সিগনালকে পর্যবেক্ষণ এবং ধারণ করে মাথার মধ্যে থাকা একটি তারের পোর্টের মাধ্যমে বাইরের প্রসেসরে পাঠায়।

প্রযুক্তিটির মধ্যে রয়েছে একটি মেশিন লার্নিং এআই, যা কয়েক সপ্তাহের ট্রেইনিংয়েই রোগীর এক হাজারেরও বেশি শব্দের ইলেকট্রিক সিগনালের প্যাটার্ন শনাক্ত করতে সক্ষম হয়।

পুরো গল্পের অর্ধেক কেবল এটি। একটি এআই ইন্টারফেইসের মাধ্যমে সেই রোগী তার কথা প্রকাশ করতে পারছেন। একই রকম প্রযুক্তি ব্যবহার করে লকড-ইন সিস্টেমে আক্রান্তদের কথা বলার সুযোগ করে দিয়েছে প্রথম ব্রেইন ইমপ্ল্যান্ট করা কোম্পানি ‘সিনক্রোনে’র একটি সিস্টেম।

এক অর্থে তিনি কথাই বলছেন বলে প্রতিবেদনে লিখেছে প্রযুক্তি সাইট এনগ্যাজেট। প্যারালাইসিসের আগের তার পুরোনো স্বাভাবিক কণ্ঠস্বরের রেকর্ড ব্যবহার করে ট্রেইনিং দেওয়া হয়েছে প্রযুক্তিটিকে, যার ফলে প্রায় অবিকল একটি কৃত্রিম কণ্ঠস্বর ব্যবহার করতে পারছেন তিনি।

গবেষক দলটির সঙ্গে যুক্ত হওয়া কোম্পানি স্পিচ গ্রাফিক্স, বাস্তব চেহারার সঙ্গে মিল রেখে অ্যানিমেশন প্রযুক্তি তৈরি করেছে। যা ব্যবহার হয়েছে হালো ইনফিনিট এবং দ্যা লাস্ট অফ আস পার্ট ২ এর মতো গেইমে।

কোনো শব্দ উচ্চারণের সময় মুখমণ্ডলের পেশি ও হাড়ের নড়াচড়া যেমন হবে,  শব্দটি বিশ্লেষণ করে সেই নড়াচড়ার ধরন ঠিক করে স্পিচ গ্রাফিক্সের প্রযুক্তিটি। তারপর রিয়েল-টাইমে একটি গেইম ইঞ্জিনে ব্যবহার করে করে সাবলীল অ্যাভাটার দিয়ে শব্দটি বলানো বলানো হয়।

যেহেতু রোগীর মানসিক সিগনাল সরাসরি অ্যাভাটারে পাঠানো হচ্ছে, তাই এ পদ্ধতিতে তিনি আবেগ প্রকাশ বা কথা না বলেও যোগাযোগ করতে পারবেন।

“সরাসরি মস্তিষ্কের সঙ্গে যুক্ত থেকে রিয়েল-টাইমে কথা বলা, মুখভঙ্গি এবং আবেগ প্রকাশ করতে সক্ষম একটি ডিজিটাল অ্যাভাটার তৈরি, এআই-সৃষ্ট চেহারার সম্ভবনা প্রমাণ করছে এর সম্ভাবনা ভিডিও গেইম ছাড়িয়ে অনেক দূর পর্যন্ত হওয়া সম্ভব।” – বলেছেন স্পিচ গ্রাফিক্সের সহ-প্রতিষ্ঠাতা এবং সিটিও মাইকেল বার্জার।

কণ্ঠস্বর ফিরিয়ে আনা চমৎকার, কিন্তু তার সঙ্গে মুখভঙ্গী জুড়ে দেওয়ার মাধ্যমে একজন রোগীর মধ্যে হারানো সক্ষমতা ফিরে পাওয়ার অনুভূতি হবে।”

১৯৭০ এর দশকে বিসিআই প্রযুক্তিগুলো যাত্রা শুরু করলেও পরবর্তী কয়েক দশকে তাদের অগ্রগতি হয়েছে ধীর গতিতে। প্রসেসিং এবং কম্পিউটিং সিস্টেমে অভূতপূর্ব উন্নতির ফলে এই ক্ষেত্রটিতে নতুন জোয়ার সৃষ্টি হয়েছে। বেশ বড় বিনিয়োগসহ একাধিক স্টার্টআপ তাদের তৈরি করা ডিভাইস নিয়ে এফডিএ অনুমোদনের জন্য অপেক্ষা করছে।

প্রথমবারের মতো মস্তিষ্কে সফলভাবে বিসিআই ইমপ্লান্ট স্থাপনের মাধ্যমে গতবছর শিরোনামে আসে ব্রুকলিনভিত্তিক সিনক্রোন। অন্যদিকে এফডিএ’র যাচাই পরীক্ষায় অংশ নিয়ে পরীক্ষায় ব্যবহৃত অসংখ্য শুকরের মৃত্যু ঘটিয়েছে ইলন মাস্কের নিউরালিংক।