Published : 04 Jun 2026, 01:10 PM
মানুষ ও মেশিনের মধ্যকার পার্থক্য বোঝার দীর্ঘ ৭৬ বছরের পুরানো বৈজ্ঞানিক রেকর্ড বা মানদণ্ডটি অবশেষে ভাঙল।
আধুনিক বিভিন্ন এআই মডেল সফলভাবে টিউরিং টেস্ট পাস করতে পেরেছে, যা মানুষের সঙ্গে এআইয়ের পার্থক্য করাকে অসম্ভব করে তুলেছে বলে উঠে এসেছে সাম্প্রতিক এক গবেষণায়।
নতুন গবেষণা বলছে, সংক্ষিপ্ত আলাপে এআইকে এখন আর মানুষের থেকে আলাদা করা যাচ্ছে না, যা প্রযুক্তির অভূতপূর্ব অগ্রগতির পাশাপাশি নতুন সামাজিক ও অর্থনৈতিক চ্যালেঞ্জ তৈরি করেছে বলে প্রতিবেদনে লিখেছে আমেরিকান সাময়িকী সাইকোলজি টুডে।
গবেষণাটি প্রকাশ পেয়েছে বিজ্ঞানভিত্তিক জার্নাল ‘প্রসিডিংস অফ দ্য ন্যাশনাল একাডেমি অফ সায়েন্সেস’-এ।
‘ইউনিভার্সিটি অফ ক্যালিফোর্নিয়া, স্যান ডিয়েগো’ বা ইউসিএসডি ও এ গবেষণার সহ-লেখক ক্যামেরন জোনস ও বেঞ্জামিন বার্গেন লিখেছেন, “গবেষণার ফলাফলে স্পষ্ট ইঙ্গিত মিলেছে, বর্তমানের বিভিন্ন এআই সিস্টেম সংক্ষিপ্ত আলাপে কার্যকরভাবে মানুষকে অনুকরণ করতে পারে।
“তবে গবেষণাটি একইসঙ্গে বুদ্ধিমত্তা পরিমাপের উপায় হিসেবে এ টিউরিং টেস্ট কতটা কার্যকর তা নিয়েও প্রশ্ন তুলেছে।”
‘ইমিটেশন গেইম’ বা অনুকরণ খেলা
একজন সাধারণ মানুষ বিভিন্ন ওয়েবসাইট ভিজিটের সময় অজান্তেই বহুবার কোনো না কোনোভাবে টিউরিং টেস্টের মুখে পড়েছেন। আর এমনটা খুব স্বাভাবিক।
এক্ষেত্রে কোনো ওয়েবসাইটের নিরাপত্তা নিশ্চিত করতে ব্যবহারকারীকে একটি বাইসাইকেল আছে এমন সব ছবিতে ক্লিক করতে বা দুমড়েমুচড়ে থাকা অক্ষর ও চিহ্নের সংমিশ্রণ টাইপ করতে বলা হয়। এ সময় সেই ‘কমপ্লিটলি অটোমেটেড পাবলিক টিউরিং টেস্ট টু টেল কম্পিউটারস অ্যান্ড হিউম্যানস অ্যাপার্ট’ বা ক্যাপচা পরীক্ষাটি আসলে টিউরিং টেস্টেরই একটি রূপ।
পরীক্ষাটির ধারণা তুলনামূলকভাবে আধুনিক। ১৯৫০ সালের অক্টোবরে সাইকোলজি ও ফিলোসফির ত্রৈমাসিক সাময়িকী ‘মাইন্ড’-এ ‘কম্পিউটিং মেশিনারি অ্যান্ড ইন্টেলিজেন্স’ শিরোনামে এক প্রবন্ধ প্রকাশ করেন ব্রিটিশ গণিতবিদ অ্যালান টিউরিং।
এ প্রবন্ধে তিনি প্রাকৃতিক ভাষা ব্যবহারের মাধ্যমে মানুষের মতো বুদ্ধিমত্তা দেখানো বা অনুকরণের যান্ত্রিক সক্ষমতা পরিমাপের জন্য ‘ইমিটেশন গেইম’ ধারণাটি দিয়েছিলেন, যাতে মেশিনের আচরণকে প্রকৃত মানুষের থেকে আলাদা করা যায়। বর্তমানে তা ‘টিউরিং টেস্ট’ নামে পরিচিত এবং পদ্ধতিটি ৭৫ বছরেরও বেশি সময় ধরে নির্ভরযোগ্যভাবে ব্যবহৃত হয়ে আসছে।
গবেষকরা লিখেছেন, “মেশিনের বুদ্ধিমত্তা পরিমাপের পরীক্ষা হিসেবে টিউরিং টেস্ট নিয়ে ব্যাপকভাবে আলোচনা হলেও তা একইসঙ্গে মানুষ কীভাবে অন্য একজন মানুষকে মেশিন থেকে আলাদা করে দেখে তারও এক পরিমাপক হিসেবে কাজ করে।”
কে বেশি পারদর্শী, এআই নাকি মানুষ?
এ গবেষণায় চারটি এলএলএম-এর কার্যকারিতা মূল্যায়ন করেছেন গবেষকরা। ওপেনএআইয়ের ‘জিপিটি-৪.৫’ ও ‘জিপিটি-৪ও’, মেটার ‘এলএলএএমএ-৩.১-৪০৫বি’ ও ১৯৬০-এর দশকের মাঝামাঝি সময়ে ‘ম্যাসাচুসেটস ইনস্টিটিউট অফ টেকনোলজি’ বা এমআইটি’র অধ্যাপক জোসেফ উইজেনবামের তৈরি প্রথম যুগের চ্যাটবট ‘এলিজা’।
পরীক্ষাটি চালানোর জন্য গবেষক জোন্স ও বার্গেন মোট ২৮৪ জন অংশগ্রহণকারীকে নিয়েছেন। তাদের মধ্যে ১৫৮ জন অনলাইন থেকে ও বাকি ১২৬ জন ‘ইউসিএসডি’র সাইকোলজি সাবজেক্ট পুল থেকে এসেছিলেন।
খেলার প্রতিটি রাউন্ডে প্রশ্নকারী একজন মানব সাক্ষী ও একজন এআই সাক্ষীর সঙ্গে টেক্সট বার্তার মাধ্যমে পাঁচ মিনিট ধরে আলাপ চালান। সময় শেষ হওয়ার পর, প্রশ্নকর্তাকে নির্ধারণ করতে হত যে দুই সাক্ষীর মধ্যে কে মানুষ ও কে এআই এবং একইসঙ্গে তার এ সিদ্ধান্তের পেছনের কারণও জানাতে হত।
প্রত্যেক অংশগ্রহণকারী মোট আট রাউন্ডের আলাপে অংশ নিয়েছেন, যার অর্ধেক সময় তারা প্রশ্নকর্তা হিসেবে এবং বাকি অর্ধেক সময় সাক্ষী হিসেবে ভূমিকা পালন করেছেন।
কোনো সাক্ষীকে প্রশ্নকর্তা ‘মানুষ’ হিসেবে বেছে নিলে তা সেই সাক্ষীর জন্য ‘জয়’ হিসেবে বিবেচিত হত। সব মিলিয়ে ইউসিএসডি’র গবেষকরা এক হাজার ২৩টি খেলা পর্যবেক্ষণ করেছেন। যার মধ্যে প্রশ্নকর্তার কাছে মানুষ হিসেবে সবচেয়ে বেশিবার নির্বাচিত হয়ে শীর্ষে ছিল ‘জিপিটি-৪.৫’, এর জয়ের হার ৭৩ শতাংশ। এর পরেই ৫৬ শতাংশ জয়ের হার নিয়ে দ্বিতীয় অবস্থানে রয়েছে মেটার লামা।
গবেষকরা লিখেছেন, “এসব মডেল যে এত নিখুঁতভাবে পারফর্ম করছে তা টিউরিং টেস্ট আসলে কী পরিমাপ করে তা বোঝার ক্ষেত্রে নতুন চ্যালেঞ্জ তৈরি করছে।”
খুব স্বাভাবিকভাবেই পুরানো ও কম উন্নত বিভিন্ন এলএলএম প্রশ্নকারীকে খুব একটা বোকা বানাতে পারেনি এবং তাদের জয়ের হারও ছিল বেশ কম, যেখানে ‘জিপিটি-৪ও’-এর জয়ের হার ছিল ২১ শতাংশ এবং এলিজা’র ছিল ২৩ শতাংশ।
‘নকল’ মানুষের উত্থান
গবেষকেরা বলেছেন, সংক্ষিপ্ত আলাপের ক্ষেত্রে আধুনিক এলএলএমগুলো সফলভাবে মানুষের ছদ্মবেশ ধারণ করতে পারে। যার মাধ্যমে এরা ৭৬ বছরের পুরানো টিউরিং টেস্টের রেকর্ড ভেঙে দিয়েছে।
গবেষক বার্গেন ও জোন্স সতর্ক করে বলেছেন, “টিউরিং টেস্টে পাস করার মানে এসব এলএলএম মানুষের মতো বা বুদ্ধিমান হয়ে গেছে কি না সেই বিতর্ক বাদ দিলেও এ গবেষণার ফলাফল আমাদের সমাজ ও অর্থনীতির ওপর সরাসরি প্রভাব ফেলবে।”
গবেষকরা মানুষের মতো আচরণ করতে পারা এ এআই বা ‘নকল মানুষ’দের সম্ভাব্য নেতিবাচক পরিণতির কথা তুলে ধরেছেন। এ ধরনের উন্নত এলএলএম মানুষের কর্মসংস্থান কেড়ে নিতে, বাস্তব সামাজিক যোগাযোগকে দূরে ঠেলে দিতে এবং যারা এ এআই নিয়ন্ত্রণ করছে তাদের মাধ্যমে সাধারণ মানুষের ওপর প্রভাব বিস্তার করতে পারে। একইসঙ্গে ‘মানুষের মধ্যকার প্রকৃত পারস্পরিক যোগাযোগের মূল্য কমিয়ে দিতে পারে’ এরা।
গবেষণায় প্রমাণ মিলেছে, মেশিন বা যন্ত্রগুলো আনুষ্ঠানিকভাবে এমন সীমা পেরিয়ে গেছে, যা অনলাইন নিরাপত্তা ও পারস্পরিক বিশ্বাসের ওপর বড় প্রভাব ফেলবে।
তবে, আমাদের অনুকরণের জন্য তৈরি এসব এলএলএমের থেকে মানুষ কীভাবে নিজেদের আলাদা প্রমাণ করবে, গবেষকেরা সেই পথটি খোলা রেখেছেন।
তারা বলেছেন, “এবারই প্রথম কোনো যন্ত্র টিউরিং টেস্টে পাস করল, তবে এটাই শেষ নয়। মানুষের সামনে এখনও এ পরীক্ষায় সফলভাবে টিকে থাকার সুযোগ রয়েছে।”