گمشدگی داده در تمامی پژوهشها، بخصوص در علوم پزشـکی وجود دارد. در آمار زیستی، گمشدن داده به وضعیتی گفته میشود که بخشی از مجموعه دادهها گزارش نشده باشد. گمشدگی داده باعث کاهش تطـابق جامعه نمونه با جامعه کل شده و میتواند منجر به نتیجهگیری اشـتباه در مورد جمعیت اصلی شود. گمشدگی داده یک اتفاق معمول بوده و بسته به میزان آن، میتواند اثر قابلتوجهی در نتیجهگیری به دست آمده از دادهها داشـته باشد. تمامی روشهای برآورد پارامترها بر پایه فرض کامل بودن مجموعـه دادهها استوار هستند و تحت برقراری ایـن شرایط منجر به برآوردهایی اشتباه میشوند؛ و البته با افزایش نسـبت گمشدگی، مقدار اریبی نیـز افزایش خواهد یافت. در این پژوهش ابتدا در یک مطالعه مروری روشهای برخورد با دادههای گمشده در علوم پزشکی استخراج گردید. سپس این روشها از نظر معیارهایی نظیر نوع گمشدگی، درصد گمشدگی، ضریب همبستگی و غیره مورد بررسی قرار گرفتند و روش رگرسیونی MICE به عنوان بهترین روش انتخاب گردید. در مرحله بعد، یک مدل با کمک الگوریتم بهینهسازی تجمع ذرات ارائه گردید که این مدل از ترکیب چندین روش دادهکاوی نیز بهره میبرد. سپس این مدل توسط دادههای واقعی مورد بررسی و ارزیابی قرار گرفت. برای ارزیابی بهتر مدل، سه الگوریتم تولید دادههای شبیهسازی پزشکی نیز طراحی گردید. حسب نیاز برای شبیهسازی دادههای پزشکی یک روش الگوریتمی جهت شبیهسازی دادههای پزشکی با بیشترین شباهت از نظر ضریب همبستگی به دادههای واقعی نیز ارائه و مورد استفاده واقع گردید. در این پژوهش مدل پیشنهادی با دادههای واقعی چهار بیماری سرطان معده، کبد چرب، بیماری ATLL و تالاسمی مورد ارزیابی قرار گرفت. برای داده واقعی، دقت مدل پیشگویی با جانهی مدل پیشنهادی نسبت به دقت مدل پیشگویی با روشهای دیگر جانهی مقادیر گمشده ببین 0.5 تا 16.5 درصد بهبود داده است. همچنین مدل طراحی شده با دادههای شبیهسازی شده بیماری COVID-19 نیز مورد بررسی قرار گرفت و در پایان مدل پیشنهادی با چند نمونه الگوریتم با عملکرد مشابه نیز قیاس شد که در همه موارد نتایج قابل قبولی حاصل گردید. در پایان مشخص شد استفاده از مدل پیشنهادی برای جانهی گمشدگی دادهها، دقت بالاتری نسبت به الگوریتمهای مشابه EM و MICE دارد. بنابراین این مدل برای جانهی دادههای گمشده که قرار است بر روی آنها دستهبندی اعمال گردد، پیشنهاد میشود." />
ارائه مدل پویا جهت جانهی داده های گمشده پزشکی بر اساس بهینه سازی تجمع ذرات چند هدفه
A Dynamic Model for Imputing Missing Medical Data based on Multi-Objective Particle Swarm Optimization
همکاران: پژوهشگر خارج از دانشگاه , امین گلاب پور , پژوهشگر خارج از دانشگاه , پژوهشگر خارج از دانشگاه , احمد خسروی
کلمات کلیدی:
کد |
1220 |
عنوان فارسی پایاننامه |
ارائه مدل پویا جهت جانهی داده های گمشده پزشکی بر اساس بهینه سازی تجمع ذرات چند هدفه |
عنوان لاتین پایاننامه |
A Dynamic Model for Imputing Missing Medical Data based on Multi-Objective Particle Swarm Optimization |
گروه |
|
دانشکده/مرکز |
|
محل ارایه طرح |
|
تاریخ تصویب |
1398/06/30 |
تاریخ شروع |
|
تاریخ پایان (دفاع) |
|
سال ارائه |
|
فصل |
|
مقطع تحصیلی پایان نامه |
دکترای تخصصی (.Ph.D) |
نوع پایان نامه |
سایر |
رشته تخصصی |
سایر |
بودجه پایان نامه |
|
اطلاعات همکاران پایان نامه