বিশেষজ্ঞদের চেয়ে 'সঠিক' এআই লিপরিডার

নতুন এক লিপরিডিং কম্পিউটার বানিয়েছেন বিজ্ঞানীরা, এটি সর্বোচ্চ প্রশিক্ষণ প্রাপ্ত একজন বিশেষজ্ঞের চেয়েও সঠিকভাবে কাজ করবে বলে দাবি করা হচ্ছে।

নাফিস ইমতিয়াজ রহমানবিডিনিউজ টোয়েন্টিফোর ডটকম
Published : 9 Nov 2016, 02:42 PM
Updated : 9 Nov 2016, 02:43 PM

গুগলের কৃত্রিম বুদ্ধিমত্তা বিভাগ ডিপমাইন্ড-এর অর্থায়নে অক্সফোর্ড বিশ্ববিদ্যালয়ের দল লিপনেট তৈরি করে। এই সফটওয়্যারের সাফল্য ৯৩.৪ শতাংশ, জানিয়েছে ব্রিটিশ ট্যাবলয়েড মিরর।

এ উদ্ভাবন নিয়ে নির্মাতারা বলেন, "মেশিন লিপরিডারটির প্রচুর ব্যবহারিক সম্ভাব্যতা রয়েছে।" এর ব্যবহারের মধ্যে "উন্নত হিয়ারিং এইড অ্যাপ্লিকেশন, সর্বসাধারণের জায়গায় নিরব শ্রুতলিপি, গুপ্ত আলোচনা, কোলাহলপূর্ণ পরিস্থিতিতে উক্তির স্বীকৃতি, বায়োমেট্রিক পরিচয় এবং নিঃশব্দ সিনেমা প্রসেসিং"-এর কাজও থাকবে বলে তারা জানিয়েছেন।

তিন সেকেন্ড সময়ের প্রায় ৩০ হাজারের বেশি মানুষের কথা বলার ভিডিও ব্যবহার করে কম্পিউটারটিকে প্রশিক্ষণ দেওয়া হয়েছে, যা বিভিন্ন শব্দ উচ্চারণের সঙ্গে ঠোঁটের অঙ্গভঙ্গি মেলাতে দক্ষ হয়ে ওঠে।

অক্সফোর্ড-এর স্টুডেন্টস ডিজঅ্যাবিলিটি কমিইউনিটি-এর তিনজন বিশেষজ্ঞের বিরুদ্ধে যখন গবেষকরা লিপনেট পরীক্ষা করেন, তখন তার ফলাফল ছিল বিস্ময়কর। এ ক্ষেত্রে বিশেষজ্ঞদের ভুলের হার ছিল ৪৭.৭ শতাংশ, সেখানে লিপনেট ৬.৬ শতাংশ ভুল করে।

এখন পর্যন্ত সফটওয়্যারটি বিশ্বের সামনে তুলে ধরার জন্য সম্পূর্ণভাবে তৈরি না। যে ভিডিওগুলো ব্যবহার করে লিপরিড করা শেখানো হয়েছিল সেগুলো সব সিনট্যাক্সের কিছু নির্দিষ্ট ধরনকে অনুসরণ করে। দৈনিক ব্যবহৃত সংলাপ বুঝতে আরও প্রচুর অনুশীলন করতে হবে।

এ নিয়ে কাজ করা এক গবেষক ইয়ান্নিস আসসায়েল বলেছেন, "নজরদারির বিশ্বে লিপনেটের কোনো ব্যবহার নেই, কারণ ঠোঁট পড়তে বস্তুর জিহ্বা দেখার প্রয়োজন হয়- অর্থাৎ ভিডিওটিতে অবশ্যই সরাসরি সোজা এবং ভালো আলো থাকতে হবে, যদি ভালো ফলাফল পেতে হয়।"