امروز : 16 خرداد 1405
  • تاریخ انتشار : 1405/03/13 - 08:25
  • تعداد بازدید : 44
  • زمان مطالعه : 2 دقیقه

جلسه دفاع از پایان‌نامه ارشد با موضوع کاهش توهم در مدلهای زبانی کوچک با تولید تقویت شده با بازیابی ترکیبی

 

 

دانشکده مهندسی کامپیوتر

گروه مهندسی نرم ‌افزار

 

استاد راهنما: دکتر افسانه فاطمی                

 

استاد داور داخل: دکتر محمدعلی نعمت‌بخش

 

استاد داور خارج: دکتر حمیدرضا برادران                   

 

پژوهشگر: امیرحسین محمدی

 

تاریخ برگزاری:۱۳/۰۳/۱۴۰۴  ساعت ۰۸:۳۰

 

مکان برگزاری: 

سالن ویدیو کنفرانس

باسمه‌تعالی

جلسه دفاع از پایان‌نامه کارشناسی ارشد

مهندسی کامپیوتر، گرایش مهندسی نرم‌افزار

 

کاهش توهم در مدلهای زبانی کوچک با تولید تقویت شده با بازیابی ترکیبی

 

در سال‌های اخیر، سیستم‌های تولید تقویت‌شده با بازیابی به یکی از رویکردهای کلیدی برای کاهش خطاهای محتوایی و تعامل ایمن با اسناد تخصصی تبدیل شده‌اند. با این حال، چالش «توهم» به‌ویژه هنگام استفاده از مدل‌های زبانی ‌کوچک در محیط‌های محدود از نظر منابع (نظیر پردازش لبه)، همچنان مانعی اساسی برای دستیابی به عملکرد پایدار و قابل اتکا محسوب می‌شود. این پژوهش بر کاهش توهم در سیستم‌های RAG مبتنی بر مدل‌های زبانی کوچک تمرکز دارد و دو نوآوری مکمل را ارائه می‌کند. ابتدا یک تنظیم‌گر خودکار ابرپارامترها معرفی می‌شود که بدون نیاز به جستجوی جامع، با تنظیم هوشمندانه پارامترهایی همچون پیکربندی قطعه‌بندی، مقادیر top‑k در بازیابی چگال و پراکنده، وزن‌دهی بازیابی ترکیبی و تنظیمات بازرتبه‌بندی، موجب بهبود عملکرد RAG می‌گردد. سپس یک ماژول بازیابی عامل‌بنیان پس از تولید ارائه می‌شود که با بهره‌گیری از برنامه‌ریزی و تجزیه پرسش به زیرپرسش‌ها، پاسخ‌های مبتنی بر «نمی‌دانم» را مورد پردازش مجدد قرار داده و آن‌ها را به پاسخ‌های درست یا نیمه‌درست تبدیل می‌کند، بدون آن‌که منجر به توهم‌ شود. پیاده‌سازی سیستم با استفاده از مدل زبانی Qwen3 (با ۱.۷ میلیارد پارامتر) و چارچوب LangChain بر روی یک کارت گرافیک RTX 3090 انجام شده است. ارزیابی نیز با بهره‌گیری از روش «مدل زبانی به‌عنوان داور» بر روی مجموعه پرسش‌های پیچیده HotpotQA (مستخرج از RAGBench) صورت پذیرفته است. نتایج نشان می‌دهد که تنظیم‌گر طی ۳۱ دقیقه پردازش، ٪۸.۸۱ بهبود نسبت به RAG پایه ایجاد کرده و ماژول عامل‌بنیان پس از تولید نیز با کاهش ٪۴۶.۷ پاسخ‌های IDK و با افزایش ٪۱.۸ دقت، به بهبود نهایی ٪۱۰.۶۱ در کل سامانه منجر شده است. علاوه بر این، روش پیشنهادی به ترتیب نسبت به بهترین روش مبتنی بر ابرپارامترها (کیم و همکاران) ٪۷.۷۱ و نسبت به بهترین روش مبتنی بر بازیابی چندمرحله‌ای خودمختار (یو و همکاران) ٪۳۷.۵۸ بهبود مطلق داشته است. رویکرد پیشنهادی با معماری ماژولار، سرعت اجرای بالا و بدون نیاز به اصلاح خط‌لوله پایه RAG، قابلیت انطباق با انواع پیاده‌سازی‌ها و پیکره‌های متنی را دارد و بستر مناسبی برای تحقیقات آینده در زمینه کاهش توهم مدل‌های زبانی کوچک در سیستم‌های RAG فراهم می‌سازد.

 

کلمات کلیدی
مدیر سیستم
خبرنگار :

مدیر سیستم

نظرات

0 نظر برای این مطلب وجود دارد

نظر دهید

آخرین بروزرسانی: 1405/03/13 08:25
تنظیمات قالب