টেক

টিউরিং টেস্টে পাস করে ৭৬ বছরের রেকর্ড ভাঙল এআই

সবচেয়ে বেশিবার নির্বাচিত হয়ে শীর্ষে ছিল ‘জিপিটি-৪.৫’, এর জয়ের হার ৭৩ শতাংশ। এর পরেই ৫৬ শতাংশ জয়ের হার নিয়ে দ্বিতীয় অবস্থানে রয়েছে মেটার লামা।

প্রাকৃতিক ভাষা ব্যবহারের মাধ্যমে মানুষের মতো বুদ্ধিমত্তা অনুকরণের যান্ত্রিক সক্ষমতা পরিমাপের জন্য ‘ইমিটেশন গেইম’ ধারণাটি দিয়েছিলেন অ্যালান টিউরিং। ছবি: ফ্রিপিক

প্রযুক্তি ডেস্ক

বিডিনিউজ টোয়েন্টিফোর ডটকম

Published : 04 Jun 2026, 01:10 PM

Summary

মানুষ ও মেশিনের মধ্যকার পার্থক্য বোঝার দীর্ঘ ৭৬ বছরের পুরানো বৈজ্ঞানিক রেকর্ড বা মানদণ্ডটি অবশেষে ভাঙল।

আধুনিক বিভিন্ন এআই মডেল সফলভাবে টিউরিং টেস্ট পাস করতে পেরেছে, যা মানুষের সঙ্গে এআইয়ের পার্থক্য করাকে অসম্ভব করে তুলেছে বলে উঠে এসেছে সাম্প্রতিক এক গবেষণায়।

নতুন গবেষণা বলছে, সংক্ষিপ্ত আলাপে এআইকে এখন আর মানুষের থেকে আলাদা করা যাচ্ছে না, যা প্রযুক্তির অভূতপূর্ব অগ্রগতির পাশাপাশি নতুন সামাজিক ও অর্থনৈতিক চ্যালেঞ্জ তৈরি করেছে বলে প্রতিবেদনে লিখেছে আমেরিকান সাময়িকী সাইকোলজি টুডে।

গবেষণাটি প্রকাশ পেয়েছে বিজ্ঞানভিত্তিক জার্নাল ‘প্রসিডিংস অফ দ্য ন্যাশনাল একাডেমি অফ সায়েন্সেস’-এ।

‘ইউনিভার্সিটি অফ ক্যালিফোর্নিয়া, স্যান ডিয়েগো’ বা ইউসিএসডি ও এ গবেষণার সহ-লেখক ক্যামেরন জোনস ও বেঞ্জামিন বার্গেন লিখেছেন, “গবেষণার ফলাফলে স্পষ্ট ইঙ্গিত মিলেছে, বর্তমানের বিভিন্ন এআই সিস্টেম সংক্ষিপ্ত আলাপে কার্যকরভাবে মানুষকে অনুকরণ করতে পারে।

“তবে গবেষণাটি একইসঙ্গে বুদ্ধিমত্তা পরিমাপের উপায় হিসেবে এ টিউরিং টেস্ট কতটা কার্যকর তা নিয়েও প্রশ্ন তুলেছে।”

‘ইমিটেশন গেইম’ বা অনুকরণ খেলা

একজন সাধারণ মানুষ বিভিন্ন ওয়েবসাইট ভিজিটের সময় অজান্তেই বহুবার কোনো না কোনোভাবে টিউরিং টেস্টের মুখে পড়েছেন। আর এমনটা খুব স্বাভাবিক।

এক্ষেত্রে কোনো ওয়েবসাইটের নিরাপত্তা নিশ্চিত করতে ব্যবহারকারীকে একটি বাইসাইকেল আছে এমন সব ছবিতে ক্লিক করতে বা দুমড়েমুচড়ে থাকা অক্ষর ও চিহ্নের সংমিশ্রণ টাইপ করতে বলা হয়। এ সময় সেই ‘কমপ্লিটলি অটোমেটেড পাবলিক টিউরিং টেস্ট টু টেল কম্পিউটারস অ্যান্ড হিউম্যানস অ্যাপার্ট’ বা ক্যাপচা পরীক্ষাটি আসলে টিউরিং টেস্টেরই একটি রূপ।

পরীক্ষাটির ধারণা তুলনামূলকভাবে আধুনিক। ১৯৫০ সালের অক্টোবরে সাইকোলজি ও ফিলোসফির ত্রৈমাসিক সাময়িকী ‘মাইন্ড’-এ ‘কম্পিউটিং মেশিনারি অ্যান্ড ইন্টেলিজেন্স’ শিরোনামে এক প্রবন্ধ প্রকাশ করেন ব্রিটিশ গণিতবিদ অ্যালান টিউরিং।

এ প্রবন্ধে তিনি প্রাকৃতিক ভাষা ব্যবহারের মাধ্যমে মানুষের মতো বুদ্ধিমত্তা দেখানো বা অনুকরণের যান্ত্রিক সক্ষমতা পরিমাপের জন্য ‘ইমিটেশন গেইম’ ধারণাটি দিয়েছিলেন, যাতে মেশিনের আচরণকে প্রকৃত মানুষের থেকে আলাদা করা যায়। বর্তমানে তা ‘টিউরিং টেস্ট’ নামে পরিচিত এবং পদ্ধতিটি ৭৫ বছরেরও বেশি সময় ধরে নির্ভরযোগ্যভাবে ব্যবহৃত হয়ে আসছে।

গবেষকরা লিখেছেন, “মেশিনের বুদ্ধিমত্তা পরিমাপের পরীক্ষা হিসেবে টিউরিং টেস্ট নিয়ে ব্যাপকভাবে আলোচনা হলেও তা একইসঙ্গে মানুষ কীভাবে অন্য একজন মানুষকে মেশিন থেকে আলাদা করে দেখে তারও এক পরিমাপক হিসেবে কাজ করে।”

কে বেশি পারদর্শী, এআই নাকি মানুষ?

এ গবেষণায় চারটি এলএলএম-এর কার্যকারিতা মূল্যায়ন করেছেন গবেষকরা। ওপেনএআইয়ের ‘জিপিটি-৪.৫’ ও ‘জিপিটি-৪ও’, মেটার ‘এলএলএএমএ-৩.১-৪০৫বি’ ও ১৯৬০-এর দশকের মাঝামাঝি সময়ে ‘ম্যাসাচুসেটস ইনস্টিটিউট অফ টেকনোলজি’ বা এমআইটি’র অধ্যাপক জোসেফ উইজেনবামের তৈরি প্রথম যুগের চ্যাটবট ‘এলিজা’।

পরীক্ষাটি চালানোর জন্য গবেষক জোন্স ও বার্গেন মোট ২৮৪ জন অংশগ্রহণকারীকে নিয়েছেন। তাদের মধ্যে ১৫৮ জন অনলাইন থেকে ও বাকি ১২৬ জন ‘ইউসিএসডি’র সাইকোলজি সাবজেক্ট পুল থেকে এসেছিলেন।

খেলার প্রতিটি রাউন্ডে প্রশ্নকারী একজন মানব সাক্ষী ও একজন এআই সাক্ষীর সঙ্গে টেক্সট বার্তার মাধ্যমে পাঁচ মিনিট ধরে আলাপ চালান। সময় শেষ হওয়ার পর, প্রশ্নকর্তাকে নির্ধারণ করতে হত যে দুই সাক্ষীর মধ্যে কে মানুষ ও কে এআই এবং একইসঙ্গে তার এ সিদ্ধান্তের পেছনের কারণও জানাতে হত।

প্রত্যেক অংশগ্রহণকারী মোট আট রাউন্ডের আলাপে অংশ নিয়েছেন, যার অর্ধেক সময় তারা প্রশ্নকর্তা হিসেবে এবং বাকি অর্ধেক সময় সাক্ষী হিসেবে ভূমিকা পালন করেছেন।

কোনো সাক্ষীকে প্রশ্নকর্তা ‘মানুষ’ হিসেবে বেছে নিলে তা সেই সাক্ষীর জন্য ‘জয়’ হিসেবে বিবেচিত হত। সব মিলিয়ে ইউসিএসডি’র গবেষকরা এক হাজার ২৩টি খেলা পর্যবেক্ষণ করেছেন। যার মধ্যে প্রশ্নকর্তার কাছে মানুষ হিসেবে সবচেয়ে বেশিবার নির্বাচিত হয়ে শীর্ষে ছিল ‘জিপিটি-৪.৫’, এর জয়ের হার ৭৩ শতাংশ। এর পরেই ৫৬ শতাংশ জয়ের হার নিয়ে দ্বিতীয় অবস্থানে রয়েছে মেটার লামা।

গবেষকরা লিখেছেন, “এসব মডেল যে এত নিখুঁতভাবে পারফর্ম করছে তা টিউরিং টেস্ট আসলে কী পরিমাপ করে তা বোঝার ক্ষেত্রে নতুন চ্যালেঞ্জ তৈরি করছে।”

খুব স্বাভাবিকভাবেই পুরানো ও কম উন্নত বিভিন্ন এলএলএম প্রশ্নকারীকে খুব একটা বোকা বানাতে পারেনি এবং তাদের জয়ের হারও ছিল বেশ কম, যেখানে ‘জিপিটি-৪ও’-এর জয়ের হার ছিল ২১ শতাংশ এবং এলিজা’র ছিল ২৩ শতাংশ।

‘নকল’ মানুষের উত্থান

গবেষকেরা বলেছেন, সংক্ষিপ্ত আলাপের ক্ষেত্রে আধুনিক এলএলএমগুলো সফলভাবে মানুষের ছদ্মবেশ ধারণ করতে পারে। যার মাধ্যমে এরা ৭৬ বছরের পুরানো টিউরিং টেস্টের রেকর্ড ভেঙে দিয়েছে।

গবেষক বার্গেন ও জোন্স সতর্ক করে বলেছেন, “টিউরিং টেস্টে পাস করার মানে এসব এলএলএম মানুষের মতো বা বুদ্ধিমান হয়ে গেছে কি না সেই বিতর্ক বাদ দিলেও এ গবেষণার ফলাফল আমাদের সমাজ ও অর্থনীতির ওপর সরাসরি প্রভাব ফেলবে।”

গবেষকরা মানুষের মতো আচরণ করতে পারা এ এআই বা ‘নকল মানুষ’দের সম্ভাব্য নেতিবাচক পরিণতির কথা তুলে ধরেছেন। এ ধরনের উন্নত এলএলএম মানুষের কর্মসংস্থান কেড়ে নিতে, বাস্তব সামাজিক যোগাযোগকে দূরে ঠেলে দিতে এবং যারা এ এআই নিয়ন্ত্রণ করছে তাদের মাধ্যমে সাধারণ মানুষের ওপর প্রভাব বিস্তার করতে পারে। একইসঙ্গে ‘মানুষের মধ্যকার প্রকৃত পারস্পরিক যোগাযোগের মূল্য কমিয়ে দিতে পারে’ এরা।

গবেষণায় প্রমাণ মিলেছে, মেশিন বা যন্ত্রগুলো আনুষ্ঠানিকভাবে এমন সীমা পেরিয়ে গেছে, যা অনলাইন নিরাপত্তা ও পারস্পরিক বিশ্বাসের ওপর বড় প্রভাব ফেলবে।

তবে, আমাদের অনুকরণের জন্য তৈরি এসব এলএলএমের থেকে মানুষ কীভাবে নিজেদের আলাদা প্রমাণ করবে, গবেষকেরা সেই পথটি খোলা রেখেছেন।

তারা বলেছেন, “এবারই প্রথম কোনো যন্ত্র টিউরিং টেস্টে পাস করল, তবে এটাই শেষ নয়। মানুষের সামনে এখনও এ পরীক্ষায় সফলভাবে টিকে থাকার সুযোগ রয়েছে।”