شنبه / ۲۰ دی ۱۴۰۴ / ۲۳:۰۷
کد خبر: 35939
گزارشگر: 548
۳۲
۰
۰
۱
در این فرآیند، ابتدا یک تصویر جعلی بر اساس تصاویر واقعی تولید می‌شود و سپس بررسی می‌شود که آیا تصویر واقعی است یا جعلی؟!

چطور چهره های ساخته شده با هوش مصنوعی را تشخیص دهیم؟

چطور چهره های ساخته شده با هوش مصنوعی را تشخیص دهیم؟
هوش مصنوعی روزبه‌روز در تولید چهره‌های انسانی واقع‌گراتر می‌شود؛ تا جایی که حتی «اَبَرتشخیص‌دهنده‌ها»، یعنی همان افرادی که توانایی فوق‌العاده در تشخیص چهره دارند نیز در شناسایی تصاویر جعلی عملکردی چشمگیر نداشتند. با این حال، یک پژوهش تازه نشان می‌دهد که آموزش کوتاه‌مدت می‌تواند این ضعف را تا حد قابل‌توجهی جبران کند. پژوهشی که در نشریه علمی Royal Society Open Science منتشر شده، تصاویر چهره‌ای که با هوش مصنوعی تولید می‌شوند آن‌قدر واقعی‌اند که حتی افراد دارای مهارت‌های استثنایی در پردازش چهره نیز اغلب فریب می‌خورند. افراد با توانایی تشخیص معمولی، حتی عملکرد ضعیف‌تری دارند و در بیشتر موارد، چهره‌های تولیدشده با هوش مصنوعی را واقعی تلقی می‌کنند.

آسیانیوز ایران؛ سرویس علم و تکنولوژی:

هوش مصنوعی روزبه‌روز در تولید چهره‌های انسانی واقع‌گراتر می‌شود؛ تا جایی که حتی «اَبَرتشخیص‌دهنده‌ها»، یعنی همان افرادی که توانایی فوق‌العاده در تشخیص چهره دارند نیز در شناسایی تصاویر جعلی عملکردی چشمگیر نداشتند. با این حال، یک پژوهش تازه نشان می‌دهد که آموزش کوتاه‌مدت می‌تواند این ضعف را تا حد قابل‌توجهی جبران کند. پژوهشی که در نشریه علمی Royal Society Open Science منتشر شده، تصاویر چهره‌ای که با هوش مصنوعی تولید می‌شوند آن‌قدر واقعی‌اند که حتی افراد دارای مهارت‌های استثنایی در پردازش چهره نیز اغلب فریب می‌خورند. افراد با توانایی تشخیص معمولی، حتی عملکرد ضعیف‌تری دارند و در بیشتر موارد، چهره‌های تولیدشده با هوش مصنوعی را واقعی تلقی می‌کنند.

با این حال، پژوهش نشان می‌دهد تنها پنج دقیقه آموزش درباره خطاهای رایج در رندر چهره‌های مصنوعی می‌تواند توانایی افراد را در تشخیص تصاویر جعلی به‌طور محسوسی افزایش دهد. به گفته کتی گری، نویسنده اصلی این مطالعه و دانشیار روان‌شناسی دانشگاه ریدینگ بریتانیا، نکته دلگرم‌کننده این است که همین آموزش بسیار کوتاه، عملکرد هر دو گروه را به شکل قابل‌توجهی بهبود داد. در این پژوهش میزان بهبود عملکرد در میان اَبَرتشخیص‌دهنده‌ها و افراد عادی تقریباً یکسان بود. از آن‌جا که اَبَرتشخیص‌دهنده‌ها در حالت پایه عملکرد بهتری دارند، این نتیجه نشان می‌دهد آن‌ها احتمالاً از سرنخ‌هایی متفاوت از خطاهای رندرینگ برای شناسایی چهره‌های جعلی استفاده می‌کنند.

او امیدوار است که در آینده بتوان از توانایی‌های تشخیصی اَبَرتشخیص‌دهنده‌ها برای مقابله مؤثرتر با تصاویر تولیدشده توسط هوش مصنوعی بهره گرفت. نویسندگان پژوهش نیز پیشنهاد می‌کنند که بهترین راه تشخیص چهره‌های مصنوعی، ترکیب الگوریتم‌های تشخیص هوش مصنوعی با رویکرد «انسان در حلقه» است؛ یعنی انسانی که آموزش دیده و از نوع اَبَرتشخیص‌دهنده‌ها باشد.

با چهره‌های دیپ‌فیک چه کنیم؟!

در سال‌های اخیر، اینترنت با سیلی از تصاویر تولیدشده توسط هوش مصنوعی روبه‌رو شده است. چهره‌های دیپ‌فیک معمولاً با استفاده از الگوریتم‌های دو مرحله‌ای موسوم به شبکه‌های مولد تخاصمی (GAN) ساخته می‌شوند. در این فرآیند، ابتدا یک تصویر جعلی بر اساس تصاویر واقعی تولید می‌شود و سپس یک «تمایزدهنده» بررسی می‌کند که آیا تصویر واقعی است یا جعلی. با تکرار این چرخه، تصاویر جعلی به‌تدریج آن‌قدر واقعی می‌شوند که می‌توانند سیستم تشخیص را فریب دهند. این الگوریتم‌ها اکنون به حدی پیشرفت کرده‌اند که افراد اغلب چهره‌های جعلی را واقعی‌تر از چهره‌های واقعی می‌دانند؛ از این پدیده‌ با عنوان «فراواقع‌گرایی» یاد می‌شود. در واکنش به این وضعیت، پژوهشگران به دنبال طراحی برنامه‌های آموزشی هستند که توانایی افراد را در تشخیص چهره‌های مصنوعی افزایش دهد. این آموزش‌ها به خطاهای رایج در تصاویر تولیدشده با هوش مصنوعی اشاره می‌کنند؛ از جمله دندان میانی غیرطبیعی، خط رویش عجیب مو، بافت غیرواقعی پوست، یا تناسب بیش‌ازحد اجزای صورت، چراکه چهره‌های جعلی اغلب متقارن‌تر از چهره‌های واقعی‌اند.

اَبَرتشخیص‌دهنده‌ها در تئوری، باید در تشخیص چهره‌های جعلی بهتر از افراد عادی باشند. این افراد در آزمون‌های ادراک و شناسایی چهره عملکردی بسیار بالاتر از میانگین دارند؛ برای مثال، می‌توانند با دقت بالا تشخیص دهند که آیا دو تصویر از یک فرد ناآشنا متعلق به یک شخص هستند یا نه. با این حال، تاکنون مطالعات اندکی توانایی آن‌ها در تشخیص چهره‌های جعلی را بررسی کرده بودند. برای پر کردن این خلأ، محققان مجموعه‌ای از آزمایش‌های آنلاین طراحی کردند و عملکرد اَبَرتشخیص‌دهنده‌ها را با افراد عادی مقایسه کردند. اَبَرتشخیص‌دهنده‌ها از پایگاه داده داوطلبان آزمایشگاه تشخیص چهره و صدا در گرینویچ انتخاب شدند؛ افرادی که در میان ۲ درصد برتر آزمون‌های تشخیص چهره قرار داشتند.

آزمایش اول

در نخستین آزمایش، تصویری از یک چهره واقعی یا تولیدشده توسط رایانه به شرکت‌کنندگان نمایش داده شد و آن‌ها ۱۰ ثانیه فرصت داشتند واقعی یا جعلی بودن آن را تشخیص دهند. نتیجه شگفت‌آور بود: ابرشناساگرها تنها ۴۱ درصد از چهره‌های جعلی را درست شناسایی کردند؛ عملکردی که تفاوتی با حدس تصادفی نداشت. افراد عادی حتی ضعیف‌تر عمل کردند و فقط حدود ۳۰ درصد از تصاویر جعلی را تشخیص دادند. همچنین، هر دو گروه در بخشی از موارد، چهره‌های واقعی را جعلی تشخیص دادند؛ این خطا در ۳۹ درصد موارد برای ابرشناساگرها و حدود ۴۶ درصد برای افراد عادی رخ داد.

آزمایش دوم

در آزمایش دوم، گروه جدیدی از شرکت‌کنندگان ابتدا یک جلسه آموزش پنج‌دقیقه‌ای دریافت کردند که در آن نمونه‌هایی از خطاهای رایج در چهره‌های تولیدشده با هوش مصنوعی به آن‌ها نشان داده شد. سپس آن‌ها با دریافت بازخورد لحظه‌ای، ۱۰ تصویر را ارزیابی کردند و در پایان، نکات کلیدی آموزش مرور شد. پس از این مرحله، شرکت‌کنندگان دوباره آزمون اصلی را انجام دادند.

نتایج نشان داد آموزش تأثیر چشمگیری دارد؛ اَبَرتشخیص‌دهنده‌ها توانستند ۶۴ درصد از چهره‌های جعلی را شناسایی کنند و این رقم برای افراد عادی به ۵۱ درصد رسید. نرخ اشتباه در تشخیص چهره‌های واقعی تقریباً مشابه آزمایش اول باقی ماند؛ به‌طوری که اَبَرتشخیص‌دهنده‌ها در ۳۷ درصد موارد و افراد عادی در ۴۹ درصد موارد، چهره‌های واقعی را جعلی دانستند. شرکت‌کنندگان آموزش‌دیده همچنین زمان بیشتری را صرف بررسی تصاویر کردند؛ افراد عادی به‌طور میانگین ۱.۹ ثانیه و ابرشناساگرها ۱.۲ ثانیه کندتر عمل کردند. به گفته گری، این نکته پیام مهمی دارد: برای تشخیص واقعی یا جعلی بودن یک چهره، باید مکث کرد و با دقت به جزئیات نگاه کرد.

البته پژوهشگران تأکید می‌کنند که این آزمایش بلافاصله پس از آموزش انجام شده و مشخص نیست اثر این آموزش تا چه مدت باقی می‌ماند. مایکه رامون، استاد علم داده کاربردی و متخصص پردازش چهره در دانشگاه علوم کاربردی برن سوئیس، در ارزیابی این پژوهش نوشته است که بدون آزمون مجدد شرکت‌کنندگان در بازه‌های زمانی بعدی، نمی‌توان این آموزش را یک مداخله پایدار و بلندمدت دانست. او همچنین اشاره می‌کند که برای سنجش دقیق میزان بهبود مهارت‌ها، لازم است همان افراد قبل و بعد از آموزش مورد آزمایش قرار گیرند.

https://www.asianewsiran.com/u/idn
اخبار مرتبط
انتخاب نام فرزند یکی از شخصی‌ترین تصمیم‌های زندگی است، اما زوجی تصمیم گرفتند این وظیفه را به هوش مصنوعی بسپارند و صدای اعتراض همه را درآوردند. اقدامی که بسیاری آن را مرگ خلاقیت انسانی و فرار از مسئولیت‌های اولیه والدگری نامیده‌اند. سارا و استیون وینکلر اعتراف کردند که برای پیداکردن نامی هماهنگ با نام خانوادگی‌شان، دست‌به‌دامان ChatGPT شده‌اند. مادر و پدر از چت‌بات خواستند نام‌های پسرانه‌ای را پیشنهاد دهد که با «وینکلر» هم‌خوانی داشته باشد و حتی برای انتخاب نام میانی هم از همین ابزار کمک گرفتند. نتیجه‌ی تعامل ماشینی، تولد نوزادی با نام «هادسون اوکلی وینکلر» بود؛ ترکیبی که اگرچه خوش‌آهنگ است، بلافاصله با برچسب‌هایی نظیر بی‌روح، تکراری و نامی مخصوص نسل هزاره، از سوی کاربران اینترنت بمباران شد.
گزارش مؤسسه آکسفورد اینسایتس، عربستان سعودی را در رتبه هفتم جهان و نخست خاورمیانه در شاخص آمادگی دولت‌ها برای هوش مصنوعی در سال ۲۰۲۵ قرار داد. این موفقیت با حمایت مستقیم محمد بن سلمان از سازمان داده و هوش مصنوعی عربستان محقق شده و نشان از سرعت بالای دیجیتالی‌سازی خدمات عمومی در این کشور دارد. در مقابل، انتقادها از نگاه امنیتی و فیلترینگ‌محور ایران به فناوری شدت گرفته و هشدار می‌دهند کشور در خطر تبدیل شدن به یک «جزیره عقب‌مانده دیجیتال» است.
گوگل با بهره‌گیری از مدل هوش مصنوعی پیشرفته "جمینای"، سرویس ترجمه خود را متحول کرد. این به‌روزرسانی، کیفیت ترجمه را به ویژه در زمینه اصطلاحات و ضرب‌المثل‌ها به سطحی بی‌سابقه رسانده است. یکی از قابلیت‌های انقلابی جدید، امکان شنیدن ترجمه همزمان مکالمات از طریق هدفون است. این ویژگی بتا، فعلاً برای کاربران اندروید در سه کشور و با پشتیبانی از بیش از ۷۰ زبان ارائه شده است. همچنین ابزارهای آموزشی این سرویس گسترش یافته و به زودی به کشورهای بیشتری خواهد رسید. این تحول، مرزهای زبانی را کمرنگ‌تر و ارتباطات جهانی را ساده‌تر می‌کند.
گوگل مرورگر آزمایشی جدیدی به نام «دیسکو» را معرفی کرده که با استفاده از هوش مصنوعی Gemini، مفهوم سنتی جست‌وجو را دگرگون می‌کند. این مرورگر با قابلیت «GenTabs» به جای نمایش لینک، بر اساس درخواست کاربر یک مینی‌اپلیکیشن تعاملی و شخصی‌سازی‌شده ایجاد می‌کند. به عنوان مثال، با تایپ «برنامه سفر به اصفهان»، دیسکو همزمان با باز کردن صفحات مرتبط، یک رابط کاربری کامل شامل نقشه، زمان‌بندی و لیست جاذبه‌ها می‌سازد. هسته این فناوری، مدل Gemini 3 است که توانایی ساخت رابط‌های کاربری پویا را دارد. تیم سازنده تأکید کرده که هدف، حذف وب‌گردی نیست، بلکه تشویق کاربر به کشف منابع بیشتر برای خلق محتوای دقیق‌تر توسط هوش مصنوعی است. آینده این پروژه — به عنوان محصولی مستقل یا بخشی از کروم — هنوز نامشخص است.
آسیانیوز ایران هیچگونه مسولیتی در قبال نظرات کاربران ندارد.
تعداد کاراکتر باقیمانده: 1000
نظر خود را وارد کنید