ষাট দশকের কম্পিউটার প্রোগ্রামে ‘পরাস্ত’ চ্যাটজিপিটি

ষাট দশকের মাঝামাঝি সময়ে ‘এলিজা’ নামে পরিচিত এ প্রাথমিক পর্যায়ের চ্যাটবটটি বানিয়েছেন এমআইটি’র বিজ্ঞানী জোসেফ জোসেফ উইজেনবাউম।

প্রযুক্তি ডেস্কবিডিনিউজ টোয়েন্টিফোর ডটকম
Published : 8 Dec 2023, 05:58 AM
Updated : 8 Dec 2023, 05:58 AM

কৃত্রিম বুদ্ধিমত্তা ও মানুষের সক্ষমতার মধ্যে তুলনা করা এক পরীক্ষায় ভাইরাল চ্যাটবট চ্যাটজিপিটিকে ‘হারিয়ে দিয়েছে’ ষাটের দশকে বানানো এক কম্পিউটার প্রোগ্রাম।

ষাটের দশকের মাঝামাঝি সময়ে ‘এলিজা’ নামে পরিচিত এ প্রাথমিক পর্যায়ের চ্যাটবটটি বানিয়েছেন এমআইটির বিজ্ঞানী জোসেফ জোসেফ উইজেনবাউম। সম্প্রতি চ্যাটজিপিটির বিপরীতে এর সক্ষমতা পরীক্ষা করেছেন ‘ইউনিভার্সিটি অফ ক্যালিফোর্নিয়া স্যান ডিয়েগো’র গবেষকরা।

ওই পরীক্ষায় উঠে আসে, এলিজার পারফর্মেন্স চ্যাটজিপিটির বিনামূল্যের সংস্করণ ‘জিপিটি ৩.৫’ এর চেয়ে ভালো।

মেশিনের মানবীয় কথোপকথন অনুকরণের সক্ষমতা যাচাইয়ের জন্য যে মানদণ্ড ব্যবহার করা হয়, তার নাম ‘টিউরিং টেস্ট’। আর এর উদ্ভাবক হলেন পঞ্চাশের  দশকের ব্রিটিশ কম্পিউটার বিজ্ঞানী অ্যালেন টিউরিং।

সাম্প্রতিক পরীক্ষায় অংশ নেন ৬৫২ জন মানুষ, যাদের যাচাই করে দেখতে হয়েছে তারা ইন্টারনেটে অন্য কোনো মানুষ বা এআই চ্যাটবটের সঙ্গে কথা বলছেন কিনা।

তবে, পরীক্ষায় এলিজার চেয়ে ৪১ শতাংশ বেশি সাফল্য দেখিয়েছে ওপেনএআইয়ের আর্থিক ফিভিত্তিক চ্যাটবট ‘জিপিটি ৪’।

পরীক্ষায় ২৭ শতাংশ ক্ষেত্রে মানুষ হিসাবে বিশ্বাসযোগ্যতা পেয়েছে এলিজা। অন্যদিকে, জিপিটি ৩.৫-এর সাফল্যের হার কেবল ১৪ শতাংশ।

এলিজার এ সাফল্যকে এআই চ্যাটবট নিয়ে কাজ করা আধুনিক প্রযুক্তি কোম্পানিগুলোর জন্য ‘বিব্রতকর’ হিসেবে ব্যাখ্যা করেছেন এআই বিশেষজ্ঞ গ্যারি মার্কাস। তবে শিক্ষাবিদদের একটি অংশের দাবি, টার্নিং টেস্টে ভালো ফলাফল দেখানোর উদ্দেশ্যে চ্যাটজিপিটি নকশা করা হয়নি।

“পরীক্ষার প্রশ্নপত্র পড়লে, আপনার কাছে এলিজার জিপিটি ৩.৫’কে পরাজিত করার বিষয়টি মোটেও চমকপ্রদ মনে হবে না,” এক্স-এ পোস্ট করেছেন যুক্তরাষ্ট্রের হোয়ারটন স্কুলের এআই বিষয়ক অধ্যাপক ইথান মল্লিক।

“ছদ্মবেশ ধারণের ঝুঁকিকে গুরুত্বের সঙ্গে নিয়েছে ওপেনএআই। এছাড়া আরএলএইচএফ (রিইনফোর্সমেন্ট লার্নিং ফ্রম হিউম্যান ফিডব্যাক) নিশ্চিত করার ক্ষেত্রেও মানুষের সক্ষমতা ছাড়িয়ে যাওয়ার চেষ্টা করে না চ্যাটজিপিটি। অন্যদিকে, এলিজা এমনভাবে নকশা করা, যেখানে এটি আমাদের মনস্তত্ত্বকে কাজে লাগিয়ে পরীক্ষায় পাশ করতে সক্ষম।”

পরীক্ষায় অংশ নেওয়া ব্যক্তিরা যে এলিজাকে মানুষ হিসেবে বিবেচনা করেছেন, তার আরেকটি সম্ভাব্য কারণ হল, প্রচলিত এআই মডেলগুলোর চেয়ে এর ‘ভুল জবাব দেওয়ার’ প্রবণতা বেশি। ফলে, অনেকেই ধরে নিয়েছিলেন যে এটি মানুষ বলে প্রশ্নের উত্তর দিতে পারছে না।

গবেষণার অংশ না হলেও প্রিন্সটন ইউনিভার্সিটির কম্পিউটার বিজ্ঞান বিভাগের অধ্যাপক অরবিন্দ নারায়ানান বলেন, “পরীক্ষার ফলাফল থেকে চ্যাটবটের সক্ষমতা যাচাই করা সম্ভব নয়। চ্যাটজিপিটি’র নিজস্ব ধাঁচ আছে, যেখানে মতামত প্রকাশের সুযোগ নেই। তাই একে তুলনামূলক কম মানবীয় মনে হয়।”

গবেষণাটি প্রকাশ পেয়েছে ‘ডাজ জিপিটি ৪ পাস দ্য টার্নিং টেস্ট’ শিরোনামে।