Site icon رسانه تخصصی هوش مصنوعی سیمرغ

هشدار جدی MIT: ضعف چت بات های هوش مصنوعی در پاسخ به کاربران آسیب‌پذیر

ناعدالتی پنهان در دل هوش مصنوعی(ضعف چت بات های هوش مصنوعی)

ناعدالتی پنهان در دل هوش مصنوعی(ضعف چت بات های هوش مصنوعی)

ناعدالتی پنهان در دل هوش مصنوعی(ضعف چت بات های هوش مصنوعی)

پژوهشگران مرکز ارتباطات سازنده MIT (MIT CCC) طی یک مطالعه جدید به نتیجه‌ای نگران‌کننده رسیده‌اند: چت‌بات‌های مبتنی بر هوش مصنوعی در تعامل با برخی گروه‌های کاربری عملکرد ضعیف‌تری دارند. این پژوهش نشان از سوگیری‌های اجتماعی انسانی، به شکلی دیجیتال در رفتار مدل‌های زبانی بزرگ دارد.

مقدمه: دلیل نابرای رفتار مدل‌ها در برابر کاربران و اهمیت آن؟

مقیاس‌پذیری و دسترسی‌پذیری مدل‌های زبانی بزرگ باعث شده تا میلیون‌ها نفر از این سامانه‌ها برای کسب اطلاعات پزشکی، حقوقی، آموزشی و کاری استفاده کنند. گزارش جدید اما هشدار می‌دهد که این سیستم‌ها ممکن است نابرابری‌های اجتماعی را بازتولید یا تشدید کنند: یعنی دقیقاً آن گروه‌هایی که به اطلاعات درست و قابل‌اعتماد نیاز بیشتری دارند، ممکن است اطلاعاتی با کیفیت نازل‌تر یا حتی فریبنده(اشتباه) دریافت کنند.

روش‌شناسی پژوهش

پژوهشگران CCC مجموعه‌ای از پرسش‌ها را از دو دیتاست استاندارد (TruthfulQA و SciQ) انتخاب کردند و برای شبیه‌سازی تفاوت‌های کاربران، مشخصات کوتاهی (biographies) شامل سطح تحصیلات، تسلط به زبان انگلیسی و کشور مبدا را به ابتدا یا متن ورودی افزودند. سپس پاسخ‌های سه مدل بزرگ بررسی و از نظر دقت، نرخ امتناع از پاسخ و لحن مورد تحلیل انسانی و آماری قرار گرفتند. مدل‌های مورد آزمون شامل سه مدل پیشرو جهان بودند:

یافته‌های کلیدی: دقت پایین‌تر برای کاربران آسیب‌پذیر(دانش تخصصی کمتر)

چرا این اتفاق رخ میدهد؟ (تحلیل فنی و اجتماعی)

پژوهشگران این نابرابری رفتار را انعکاس‌دهنده‌‌ی سوگیری‌های داده‌های آموزشی و طراحی‌های هدفمندِ شخصی‌سازی (personalization) می‌دانند. اگر مدل‌ها در داده‌های آموزشی یا فرایندهای تنظیم‌شان (alignment) با نمونه‌هایی مواجه شده باشند که غیرانگلیسی‌زبانان یا افراد کم‌تحصیل را با لحن کم‌احترام یا به‌عنوان «کم‌دانش» نشان می‌دهد، رفتار مشابهی یاد می‌گیرند. علاوه بر این، سیاست‌های محافظتی یا قواعد امتناع (safety/guardrails) می‌توانند به‌صورت نامتقارن علیه گروه‌هایی اعمال شوند که مدل آنها را «کم‌قابلیت» تشخیص می‌دهد.

پیامدها برای دسترسی، عدالت و تنظیم‌گری

نتایج این مطالعه پیامدهای جدی دارد:

چشم‌انداز: چه باید کرد؟ (پیشنهادهای اجرایی)

۱. آزمایش‌های معطوف به برابری (fairness testing): شرکت‌ها باید ارزیابی‌های استاندارد شده‌ای اجرا کنند که عملکرد را بین گروه‌های دارای ویژگی‌های زبانی، تحصیلی و جغرافیایی مقایسه کند.
۲. تنوع در داده‌های آموزشی و برچسب‌گذاری انسانی: افزایش نمونه‌های متنوع و بازنگری در توضیع داده‌ها برای کاهش سوگیری‌های زبانی و فرهنگی.
۳. شفاف‌سازی و گزارش‌دهی: انتشار گزارش‌های شفاف درباره آزمون‌های عدالت، نرخ امتناع و نمونه‌هایی از لحن پاسخ‌ها برای کنترل عمومی و تحقیق مستقل.
۴. طراحی سیاست‌های امتناع یکنواخت و انسانی: بازبینی قواعدی که منجر به امتناع نامتناسب یا لحن توهین‌آمیز می‌شوند و جایگزینی آنها با سیاست‌هایی که از کرامت و دسترسی برابر حمایت کند.

جمع‌بندی

مطالعه‌ی MIT Center for Constructive Communication یک هشدار صریح است: سامانه‌های زبانی قدرتمند، بدون مداخله آگاهانه در داده، معیارهای ارزیابی و تنظیمات طراحی، می‌توانند سوگیری‌های انسانی را بازتولید کنند و دقیقاً به افرادی که به کمک قابل‌اطمینان‌تر نیاز دارند، کمتر کمک کنند. این یافته باید هم توسعه‌دهندگان مدل‌ها، هم سیاست‌گذاران و هم کاربران را به همراهی در مسیر ساختن سامانه‌هایی منصفانه‌تر و مسئول‌تر فراخواند.

منبع: news.mit.edu

Exit mobile version