টিউরিং পরীক্ষায় পাস করার পরও গবেষকরা বলেছেন, এর মানে এই নয় যে বিভিন্ন এআই চ্যাটবটের মানুষের পর্যায়ের বুদ্ধিমত্তা রয়েছে।
Published : 08 Apr 2025, 06:38 PM
টিউরিং পরীক্ষায় পাশ করেছে শীর্ষস্থানীয় এক কৃত্রিম বৃদ্ধিমত্তা বা এআই চ্যাটবট। এটি ‘মানুষের চেয়ে বেশি বিশ্বাসযোগ্যভাবে’ কাজ করতে পারে বলে উঠে এসেছে নতুন এক গবেষণায়।
এক ‘ব্লাইন্ড’ পরীক্ষায় ওপেনএআইয়ের এআই মডেল চ্যাটজিপিটির সর্বশেষ সংস্করণ ‘জিপিটি ৪.৫’ মডেলকে বিচার করেছেন অংশগ্রহণকারীরা। তারা বলছেন, একজন মানুষ হওয়ার জন্য ‘মানুষের চেয়েও বেশি ভাল’ এআই মডেলটি।
১৯৫০ সালে প্রথম ‘টিউরিং টেস্ট’-এর প্রস্তাব করেন ব্রিটিশ কম্পিউটার বিজ্ঞানী অ্যালান টিউরিং। যার উদ্দেশ্য, কৃত্রিম বুদ্ধিমত্তা বা এআইয়ের বুদ্ধিমত্তা মানুষের সঙ্গে মেলে কি না তা মূল্যায়ন করা।
গবেষণায় অংশ নেওয়া ব্যক্তিরা টেক্সটনির্ভর আলাপচারিতার মাধ্যমে এআই মডেলটির সঙ্গে কথা বলেন, যেখানে তারা মূল্যায়ন করেন এ আলাপচারিতা অন্য কোনও মানুষ না কি মেশিনের সঙ্গে হচ্ছে।
এ গবেষণায় প্রায় তিনশ জন অংশ নেন, যারা বিভিন্ন চ্যাটবট ও লার্জ ল্যাঙ্গুয়েজ মডেল বা এলএলএম-এর জন্য পরীক্ষা চালান। ব্যক্তি হিসেবে বিবেচনার ক্ষেত্রে ওপেনএআইয়ের জিপিটি ৪.৫’কে ৭৩ শতাংশ সময় মানুষ হিসেবে বিচার করেছেন তারা।
গবেষণায় নেতৃত্ব দিয়েছেন ‘ইউনিভার্সিটি অফ ক্যালিফোর্নিয়া, সান দিয়েগো বা ইউসি সান দিয়েগো’র গবেষক ড. ক্যামেরন জোনস।
এক এক্স পোস্টে তিনি লিখেছেন, “আমরা মনে করি, এটি বেশ শক্তিশালী প্রমাণ যে এআই চ্যাটবটটি টিউরিং পরীক্ষায় পাস করেছে। জিপিটি ৪.৫-কে আসল মানুষের চেয়ে বেশিবার মানুষ হিসেবে বিচার করা হয়েছে গবেষণায়।”
কোনও এআই প্রোগ্রামের টিউরিং টেস্টকে পরাস্ত করার ঘটনা এবারই প্রথম নয়। তবে গবেষণা চালানো ইউসি সান দিয়েগো’র গবেষকরা দাবি করেছেন, এটিই সবচেয়ে বড় প্রমাণ, জিপিটি ৪.৫ এ পরীক্ষাটি পাস করেছে।
এ গবেষণায় পরীক্ষিত অন্যান্য মডেলের মধ্যে রয়েছে মেটার লামা ৩.১, যা কম স্কোর নিয়ে পরীক্ষায় উত্তীর্ণ হয়েছে এবং ‘এলিজা’ নামের আরেকটি প্রাথমিক চ্যাটবট এ পরীক্ষায় ফেইল করেছে।
টিউরিং পরীক্ষায় পাস করার পরও গবেষকরা বলেছেন, এর মানে এই নয় যে বিভিন্ন এআই চ্যাটবটের মানুষের পর্যায়ের বুদ্ধিমত্তা রয়েছে, যা আর্টিফিশিয়াল জেনারেল ইনটেলিজেন্স বা এজিআই নামেও পরিচিত।
কারণ হচ্ছে, সঠিক উত্তর কী হতে পারে তা অনুমানের জন্য বড় বিভিন্ন ডেটা সেটের মাধ্যমে এলএলএম’কে প্রশিক্ষণ দেয় বিভিন্ন কোম্পানি, যা এগুলোকে প্যাটার্ন বা ধরন চেনার উন্নত এক রূপে পরিণত করে।
“তার মানে কি এসব এলএলএম বুদ্ধিমান? আমার ধারণা, এটি খুব জটিল প্রশ্ন, যা এক কথায় বলে সমাধান করা কঠিন,” বলেছেন জোনস।
“তবে বড় পরিসরে বিভিন্ন এলএলএম যে ধরনের বুদ্ধিমত্তা দেখায় তার জন্য অন্যান্য অনেক প্রমাণের মধ্যে এ পরীক্ষাটিকে একটি হিসাবে মূল্যায়ন করা যেতে পারে।”
‘লার্জ ল্যাঙ্গুয়েজ মডেলস পাস দ্য টিউরিং টেস্ট’ শিরোনামে এ গবেষণার বিস্তারিত তুলে ধরা হয়েছে ‘কর্নেল ইউনিভার্সিটি’র প্রিপ্রিন্ট স্টাডিতে।