Published : 14 Dec 2023, 11:35 AM
এআই মডেল প্রশিক্ষণে ব্যবহৃত হাজার হাজার কপিরাইটভুক্ত বই ব্যবহারে আইনি বাধার কথা আগেই জানিয়ে ছিলেন টেক জায়ান্ট মেটার আইনজীবীরা, কিন্তু তাতে কর্ণপাত করেনি কোম্পানিটি।
গত গ্রীষ্মে কোম্পানিটির বিরুদ্ধে দায়ের করা কপিরাইট লঙ্ঘনের মামলায় সোমবার এই নতুন অভিযোগ যুক্ত করেছেন মামলাটির বাদী কৌতুক শিল্পী সারা সিলভারম্যান, পুলিৎজার জয়ী মিশেল শাবনসহ অন্যান্য প্রখ্যাত লেখক।
মামলাটির প্রাথমিক অভিযোগে বলা হয়েছে, অনুমতি না নিয়েই তাদের সৃষ্টিকর্ম ব্যবহার করে এআই ল্যাঙ্গুয়েজ মডেল এললামা বানিয়েছে ফেইসবুক ইনস্টাগ্রামের মালিক কোম্পানি মেটা।
ক্যালিফোর্নিয়ার একজন বিচারক নভেম্বরে সিলভারম্যানের মামলাটির অংশবিশেষ খারিজ করে দিলেও লেখকদের তাদের অভিযোগকে সংশোধনের সুযোগ দান করেন।
এই অভিযোগের বিষয়ে যোগাযোগ করলে তাৎক্ষণিকভাবে কোনো জবাব দেয়নি কোম্পানিটি, বলেছে রয়টার্স।
সংশোধিত অভিযোগটিতে বাদীপক্ষ একটি চ্যাট লগ যুক্ত করেন, সেখানে দেখা যায় মেটা সংশ্লিষ্ট একজন গবেষক ডিসকর্ড সার্ভারে থাকা একটি ডেটাসেট ক্রয়ের ব্যাপারে আলোচনা করছেন। বইগুলো ব্যবহারে মার্কিন কপিরাইট লঙ্ঘন হবে –এ ব্যাপারে কোম্পানিটির অবগত থাকার সম্ভাব্য গুরুত্বপূর্ণ প্রমাণ হিসাবে কথোপকথনটিকে উল্লেখ করেছে রয়টার্স।
চ্যাটের কথোপথনটিতে গবেষক টিম ডিটমেরস মেটার আইন বিভাগকে বারবার জিজ্ঞেস করছিলেন বইগুলো ধারণকারী সেই ডেটাকে ব্যবহার করা “আইন সম্মত” হবে কিনা।
“ফেইসবুকে অনেকেই আছেন, যারা এই বিশাল আকারের ডেটা নিয়ে কাজ করতে আগ্রহী, আমিও তাদের একজন। কিন্তু আইনি জটিলতার কারণে এগুলোকে বর্তমান অবস্থায় ব্যবহার সম্ভব নয়,” ২০২১ সালে লিখেন ডিটমেরস। যে ডেটাসেটকে মেটা তাদের এললামা এআই মডেলের প্রথম সংস্করণটি প্রশিক্ষণ দিতে ব্যবহার করতে সম্মত হয়েছে, মামলার নতুন অভিযোগে বলেছে বাদীপক্ষ।
একমাস পূর্বে ডিটমেরস লিখেন যে মেটার আইনজীবী তাকে বলেছনে “এই ডেটা ব্যবহার করা যাবে না, কিংবা ব্যবহার করলেও সেই এআই মডেলগুলোকে প্রকাশ করা যাবে না,” বলেছে অভিযোগটি।
চ্যাটিংয়ে আলাপকালে অপর পক্ষের সঙ্গে আইনজীবীর কথা উল্লেখ না করলেও “বইগুলো সক্রিয়ভাবে কপিরাইটারের আওতাধীন” বলে সেটিকে সবচেয়ে বড় আশংকার বিষয় বলে চিহ্নিত করেন। তাদের আলোচনায় প্রশিক্ষণে ব্যবহৃত ডেটার “বৈধ ব্যবহারের” কথা উঠে আসে, এবং মার্কিন মেধাসত্ত্ব আইন কপিরাইটভুক্ত সৃষ্টিকর্মকে অযাচিত ব্যবহারের হাত থেকে রক্ষা করে।
মেটা ফেব্রুয়ারিতে তাদের এললামা ল্যাঙ্গুয়েজ মডেলের প্রথম সংস্করণটি প্রকাশ করে, সেইসঙ্গে প্রশিক্ষণে ব্যবহৃত “বুকস৩ সেকশন অফ দ্যা পাইল”সহ ডেটাসেটের তালিকা প্রকাশ করে। যে ব্যাক্তি সে ডেটাসেটটি সংগ্রহ করেছেন তিনি অন্য একটি স্থানে বলেছেন ডেটাসেটটিতে এক লাখ ৯৬ হাজার ৬৪০টি বই রয়েছে, বলেছে অভিযোগটি।
গত গ্রীষ্মে কোম্পানিটি তাদের এআই মডেলের সর্বশেষ সংস্করণ এললামা ২ বাণিজ্যিক ব্যবহারের জন্য উন্মুক্ত করলেও সেটির প্রশিক্ষণ ডেটার ব্যপারে কিছু প্রকাশ করেনি।
মাসিক ৭০ কোটি বা তার কম সক্রিয় গ্রাহক আছে এমন কোম্পানিগুলোর জন্য বিনামূল্যে এললামা ২ এর ব্যবহারের সুযোগ প্রদান করে মেটা, যার ফলে এই সেক্টরে ওপেনএআই এবং গুগলের মতো উচ্চমূল্যে সেবা প্রদানকারী প্রতিদ্বন্দীদের আধিপত্যে ঝুঁকি তৈরি হয় বলে মন্তব্য করেছে রয়টার্স।