یادگیری عمیق برای ارزیابی کیفیت تصویر آنژیوگرافی توموگرافی انسجام نوری

از بازدید شما از Nature.com سپاسگزاریم.شما از یک نسخه مرورگر با پشتیبانی محدود CSS استفاده می کنید.برای بهترین تجربه، توصیه می کنیم از یک مرورگر به روز شده استفاده کنید (یا حالت سازگاری را در اینترنت اکسپلورر غیرفعال کنید).علاوه بر این، برای اطمینان از پشتیبانی مداوم، سایت را بدون سبک و جاوا اسکریپت نشان می دهیم.
اسلایدرهایی که سه مقاله را در هر اسلاید نشان می دهند.برای حرکت در اسلایدها از دکمه های پشت و بعدی استفاده کنید یا از دکمه های کنترلر اسلاید در انتها برای حرکت در هر اسلاید استفاده کنید.
آنژیوگرافی توموگرافی انسجام نوری (OCTA) یک روش جدید برای تجسم غیر تهاجمی عروق شبکیه است.اگرچه OCTA کاربردهای بالینی امیدوارکننده زیادی دارد، تعیین کیفیت تصویر همچنان یک چالش است.ما یک سیستم مبتنی بر یادگیری عمیق را با استفاده از طبقه‌بندی‌کننده شبکه عصبی ResNet152 که با ImageNet از قبل آموزش داده شده بود، برای طبقه‌بندی تصاویر شبکه مویرگی سطحی از 347 اسکن از 134 بیمار ایجاد کردیم.تصاویر همچنین به صورت دستی به عنوان حقیقت واقعی توسط دو ارزیاب مستقل برای یک مدل یادگیری نظارت شده ارزیابی شدند.از آنجا که الزامات کیفیت تصویر ممکن است بسته به تنظیمات بالینی یا تحقیقاتی متفاوت باشد، دو مدل آموزش داده شدند، یکی برای تشخیص تصویر با کیفیت بالا و دیگری برای تشخیص تصویر با کیفیت پایین.مدل شبکه عصبی ما یک ناحیه عالی زیر منحنی (AUC)، 95% فاصله اطمینان (CI): 0.96-0.99، \(\kappa\) = 0.81) را نشان می دهد، که به طور قابل توجهی بهتر از سطح سیگنال گزارش شده توسط ماشین است (AUC = 0.82، 95). ٪ CI).0.77-0.86، \(\kappa\) = 0.52 و AUC = 0.78، 95% فاصله اطمینان (CI): 0.73-0.83، \(\kappa\) = 0.27، به ترتیب).مطالعه ما نشان می‌دهد که روش‌های یادگیری ماشینی را می‌توان برای توسعه روش‌های کنترل کیفیت انعطاف‌پذیر و قوی برای تصاویر OCTA استفاده کرد.
آنژیوگرافی توموگرافی انسجام نوری (OCTA) یک تکنیک نسبتا جدید مبتنی بر توموگرافی انسجام نوری (OCT) است که می تواند برای تجسم غیر تهاجمی ریز عروق شبکیه استفاده شود.OCTA تفاوت در الگوهای انعکاس را از پالس‌های نور مکرر در همان ناحیه شبکیه اندازه‌گیری می‌کند و سپس بازسازی‌ها را می‌توان برای آشکار کردن رگ‌های خونی بدون استفاده تهاجمی از رنگ‌ها یا سایر عوامل کنتراست محاسبه کرد.OCTA همچنین تصویربرداری عروقی با وضوح عمق را امکان پذیر می کند و به پزشکان اجازه می دهد تا لایه های سطحی و عمیق عروق را به طور جداگانه بررسی کنند و به تمایز بین بیماری کوریورتینال کمک می کند.
در حالی که این تکنیک امیدوارکننده است، تغییر کیفیت تصویر یک چالش اصلی برای تجزیه و تحلیل تصویر قابل اعتماد است، که تفسیر تصویر را دشوار می کند و از پذیرش گسترده بالینی جلوگیری می کند.از آنجایی که OCTA از چندین اسکن OCT متوالی استفاده می کند، نسبت به OCT استاندارد به مصنوعات تصویر حساس تر است.اکثر پلتفرم های تجاری OCTA معیار کیفیت تصویر خود را به نام قدرت سیگنال (SS) یا گاهی اوقات شاخص قدرت سیگنال (SSI) ارائه می دهند.با این حال، تصاویر با ارزش SS یا SSI بالا عدم وجود مصنوعات تصویر را تضمین نمی کنند، که می تواند بر هر تحلیل تصویر بعدی تأثیر بگذارد و منجر به تصمیمات بالینی نادرست شود.مصنوعات تصویر رایجی که می توانند در تصویربرداری OCTA رخ دهند شامل مصنوعات حرکتی، مصنوعات قطعه بندی، مصنوعات تیرگی رسانه و مصنوعات طرح ریزی1،2،3 هستند.
از آنجایی که معیارهای مشتق شده از OCTA مانند تراکم عروقی به طور فزاینده ای در تحقیقات ترجمه، آزمایشات بالینی و عملکرد بالینی مورد استفاده قرار می گیرند، نیاز فوری به توسعه فرآیندهای کنترل کیفیت تصویر قوی و قابل اعتماد برای حذف مصنوعات تصویر وجود دارد.اتصالات پرش، همچنین به عنوان اتصالات باقیمانده شناخته می‌شوند، پیش‌بینی‌هایی در معماری شبکه‌های عصبی هستند که به اطلاعات اجازه می‌دهند تا لایه‌های کانولوشنی را دور بزنند در حالی که اطلاعات را در مقیاس‌ها یا وضوح‌های مختلف ذخیره می‌کنند.از آنجایی که مصنوعات تصویر می توانند بر عملکرد تصویر در مقیاس کوچک و کلی در مقیاس بزرگ تأثیر بگذارند، شبکه های عصبی اتصال پرش برای خودکارسازی این وظیفه کنترل کیفیت مناسب هستند.کار اخیراً منتشر شده نویدبخش شبکه‌های عصبی کانولوشنی عمیقی است که با استفاده از داده‌های با کیفیت بالا از تخمین‌گرهای انسانی آموزش داده شده‌اند.
در این مطالعه، ما یک شبکه عصبی کانولوشنال پرش اتصال را آموزش می دهیم تا به طور خودکار کیفیت تصاویر OCTA را تعیین کند.ما با توسعه مدل‌های جداگانه برای شناسایی تصاویر با کیفیت بالا و تصاویر با کیفیت پایین، بر روی کار قبلی ایجاد می‌کنیم، زیرا ممکن است الزامات کیفیت تصویر برای سناریوهای بالینی یا تحقیقاتی خاص متفاوت باشد.ما نتایج این شبکه‌ها را با شبکه‌های عصبی کانولوشنال بدون اتصالات از دست رفته مقایسه می‌کنیم تا ارزش گنجاندن ویژگی‌ها در سطوح مختلف دانه‌بندی را در یادگیری عمیق ارزیابی کنیم.سپس نتایج خود را با قدرت سیگنال مقایسه کردیم، معیاری که معمولاً پذیرفته شده از کیفیت تصویر ارائه شده توسط سازندگان است.
مطالعه ما شامل بیماران مبتلا به دیابت بود که بین 11 اوت 2017 تا 11 آوریل 2019 به مرکز چشم ییل مراجعه کردند. بیماران مبتلا به هر گونه بیماری کوریورتینال غیر دیابتی از مطالعه خارج شدند.هیچ معیار ورود یا خروج بر اساس سن، جنسیت، نژاد، کیفیت تصویر یا هر عامل دیگری وجود نداشت.
تصاویر OCTA با استفاده از پلت فرم AngioPlex بر روی Cirrus HD-OCT 5000 (Carl Zeiss Meditec Inc, Dublin, CA) تحت پروتکل های تصویربرداری 8\(\times\)8 میلی متر و 6\(\times\)6 میلی متر به دست آمد.رضایت آگاهانه برای شرکت در مطالعه از هر شرکت کننده در مطالعه اخذ شد و هیئت بررسی نهادی دانشگاه ییل (IRB) استفاده از رضایت آگاهانه همراه با عکاسی جهانی را برای همه این بیماران تایید کرد.پیروی از اصول اعلامیه هلسینکی.این مطالعه توسط IRB دانشگاه ییل تایید شد.
تصاویر صفحه سطحی بر اساس امتیاز مصنوع حرکتی (MAS) که قبلاً توضیح داده شد، امتیاز مصنوع قطعه‌بندی (SAS) که قبلاً توضیح داده شد، مرکز فووئال، وجود کدورت رسانه، و تجسم خوب مویرگ‌های کوچک که توسط ارزیاب تصویر تعیین شد، ارزیابی شدند.تصاویر توسط دو ارزیاب مستقل (RD و JW) تجزیه و تحلیل شدند.اگر تمام معیارهای زیر رعایت شود، یک تصویر دارای امتیاز 2 (واجد شرایط) است: تصویر در مرکز فووآ (کمتر از 100 پیکسل از مرکز تصویر)، MAS 1 یا 2، SAS 1 است، و کدورت رسانه کمتر از 1 است. در تصاویر با اندازه / 16 وجود دارد و مویرگ های کوچک در تصاویر بزرگتر از 15/16 دیده می شوند.اگر یکی از معیارهای زیر رعایت شود، یک تصویر 0 (بدون رتبه) رتبه بندی می شود: تصویر خارج از مرکز باشد، اگر MAS 4 باشد، اگر SAS 2 باشد، یا متوسط ​​کدورت بیشتر از 1/4 تصویر باشد، و مویرگ های کوچک را نمی توان بیش از 1 تصویر /4 برای تشخیص تنظیم کرد.تمام تصاویر دیگری که معیارهای امتیاز دهی 0 یا 2 را ندارند به عنوان 1 (بریده شدن) نمره داده می شوند.
روی انجیر1 تصاویر نمونه را برای هر یک از برآوردهای مقیاس شده و مصنوعات تصویر نشان می دهد.پایایی بین ارزیاب نمرات فردی با وزن کاپا کوهن ارزیابی شد.نمرات فردی هر ارزیاب برای به دست آوردن یک نمره کلی برای هر تصویر، از 0 تا 4، جمع می شود. تصاویر با نمره کل 4 خوب در نظر گرفته می شوند.تصاویر با نمره کل 0 یا 1 کیفیت پایین در نظر گرفته می شوند.
یک شبکه عصبی کانولوشنال معماری ResNet152 (شکل 3A.i) که از قبل بر روی تصاویر از پایگاه داده ImageNet آموزش داده شده است، با استفاده از fast.ai و چارچوب PyTorch ایجاد شده است5، 9، 10، 11. فیلترهایی برای اسکن قطعات تصویر برای مطالعه ویژگی های فضایی و محلی.ResNet آموزش دیده ما یک شبکه عصبی 152 لایه است که با شکاف ها یا "اتصالات باقیمانده" مشخص می شود که به طور همزمان اطلاعات را با وضوح های متعدد منتقل می کند.با نمایش اطلاعات با وضوح های مختلف در شبکه، این پلت فرم می تواند ویژگی های تصاویر با کیفیت پایین را در سطوح مختلف جزئیات بیاموزد.علاوه بر مدل ResNet خود، AlexNet را نیز آموزش دادیم، یک معماری شبکه عصبی به خوبی مطالعه شده، بدون اتصالات از دست رفته برای مقایسه (شکل 3A.ii)12.بدون اتصالات از دست رفته، این شبکه نمی‌تواند ویژگی‌ها را با جزئیات بالاتر ضبط کند.
مجموعه تصویر اصلی 8\(\times\) 8 میلی متری OCTA13 با استفاده از تکنیک های بازتاب افقی و عمودی بهبود یافته است.سپس مجموعه داده کامل به طور تصادفی در سطح تصویر به مجموعه داده‌های آموزش (51.2%)، تست (12.8%)، تنظیم فراپارامتر (16%) و اعتبارسنجی (20%) با استفاده از جعبه ابزار scikit-learn python14 تقسیم شد.دو مورد در نظر گرفته شد، یکی بر اساس تشخیص تنها تصاویر با بالاترین کیفیت (امتیاز کلی 4) و دیگری بر اساس تشخیص تنها تصاویر با کیفیت پایین (امتیاز کلی 0 یا 1).برای هر مورد استفاده با کیفیت بالا و با کیفیت پایین، شبکه عصبی یک بار بر روی داده های تصویری ما آموزش داده می شود.در هر مورد استفاده، شبکه عصبی برای 10 دوره آموزش داده شد، همه وزن‌ها به جز بالاترین لایه‌ها منجمد شدند، و وزن تمام پارامترهای داخلی برای 40 دوره با استفاده از روش نرخ یادگیری متمایز با تابع از دست دادن آنتروپی متقابل 15، آموخته شد. 16..تابع از دست دادن آنتروپی متقاطع معیاری از مقیاس لگاریتمی اختلاف بین برچسب های شبکه پیش بینی شده و داده های واقعی است.در طول آموزش، شیب نزول بر روی پارامترهای داخلی شبکه عصبی انجام می شود تا تلفات به حداقل برسد.فراپارامترهای میزان یادگیری، نرخ ترک تحصیل و کاهش وزن با استفاده از بهینه سازی بیزی با 2 نقطه شروع تصادفی و 10 تکرار تنظیم شدند و AUC روی مجموعه داده با استفاده از فراپارامترها به عنوان هدف 17 تنظیم شد.
نمونه هایی از تصاویر OCTA 8 × 8 میلی متری شبکه های مویرگی سطحی با امتیاز 2 (A، B)، 1 (C، D)، و 0 (E، F).مصنوعات تصویر نشان داده شده عبارتند از: خطوط سوسو زن (فلش)، آرتیفکت‌های تقسیم‌بندی (ستاره‌ها) و تیرگی رسانه (فلش‌ها).تصویر (E) نیز خارج از مرکز است.
سپس منحنی‌های ویژگی‌های عملیاتی گیرنده (ROC) برای همه مدل‌های شبکه عصبی تولید می‌شوند و گزارش‌های قدرت سیگنال موتور برای هر مورد استفاده با کیفیت پایین و با کیفیت بالا تولید می‌شوند.مساحت زیر منحنی (AUC) با استفاده از بسته pROC R محاسبه شد و فواصل اطمینان 95% و مقادیر p با استفاده از روش DeLong18،19 محاسبه شد.نمرات تجمعی ارزیاب‌های انسانی به‌عنوان پایه برای همه محاسبات ROC استفاده می‌شود.برای قدرت سیگنال گزارش شده توسط دستگاه، AUC دو بار محاسبه شد: یک بار برای برش امتیاز مقیاس پذیری با کیفیت بالا و یک بار برای برش امتیاز مقیاس پذیری با کیفیت پایین.شبکه عصبی با قدرت سیگنال AUC مقایسه می شود که شرایط آموزش و ارزیابی خود را منعکس می کند.
برای آزمایش بیشتر مدل یادگیری عمیق آموزش‌دیده بر روی یک مجموعه داده جداگانه، مدل‌های با کیفیت بالا و کیفیت پایین به طور مستقیم برای ارزیابی عملکرد 32 تصویر دال سطحی 6 میلی‌متری 6\(\times\) 6 میلی‌متری جمع‌آوری‌شده از دانشگاه ییل استفاده شدند.Eye Mass همزمان با تصویر 8 \(\times \) 8 میلی متر در مرکز قرار می گیرد.تصاویر 6\(\×\) 6 میلی متری به صورت دستی توسط همان ارزیاب ها (RD و JW) به همان روشی که تصاویر 8\(\×\) 8 میلی متری ارزیابی شدند، AUC و همچنین دقت و کاپا کوهن محاسبه شد. .به همان اندازه .
نسبت عدم تعادل کلاس 158:189 (\(\rho = 1.19\)) برای مدل با کیفیت پایین و 80:267 (\(\rho = 3.3\)) برای مدل با کیفیت بالا است.از آنجایی که نسبت عدم تعادل طبقات کمتر از 1:4 است، هیچ تغییر معماری خاصی برای اصلاح عدم تعادل طبقاتی ایجاد نشده است20,21.
برای تجسم بهتر فرآیند یادگیری، نقشه های فعال سازی کلاس برای هر چهار مدل یادگیری عمیق آموزش دیده ایجاد شد: مدل ResNet152 با کیفیت بالا، مدل ResNet152 با کیفیت پایین، مدل AlexNet با کیفیت بالا و مدل AlexNet با کیفیت پایین.نقشه‌های فعال‌سازی کلاس از لایه‌های کانولوشنی ورودی این چهار مدل تولید می‌شوند، و نقشه‌های حرارتی با همپوشانی نقشه‌های فعال‌سازی با تصاویر منبع از مجموعه‌های اعتبارسنجی ۸×۸ میلی‌متر و ۶×۶ میلی‌متر تولید می‌شوند22، 23.
نسخه R 4.0.3 برای تمام محاسبات آماری استفاده شد و تجسم ها با استفاده از کتابخانه ابزار گرافیکی ggplot2 ایجاد شدند.
ما 347 تصویر پیشانی از شبکه مویرگی سطحی با اندازه 8 \(\ بار \) 8 میلی متر از 134 نفر جمع آوری کردیم.ماشین قدرت سیگنال را در مقیاس 0 تا 10 برای همه تصاویر گزارش کرد (میانگین = 2.29 ± 6.99).از 347 تصویر به دست آمده، میانگین سنی در معاینه 6/14 ± 7/58 سال بود و 2/39 درصد از بیماران مرد بودند.از تمام تصاویر، 30.8٪ از قفقازی ها، 32.6٪ از سیاه پوستان، 30.8٪ از اسپانیایی ها، 4٪ از آسیایی ها، و 1.7٪ از نژادهای دیگر بودند (جدول 1).).توزیع سنی بیماران مبتلا به OCTA بسته به کیفیت تصویر به طور قابل توجهی متفاوت بود (001/0p<).درصد تصاویر با کیفیت بالا در بیماران جوان 18-45 سال 33.8 درصد در مقایسه با 12.2 درصد تصاویر با کیفیت پایین بود (جدول 1).توزیع وضعیت رتینوپاتی دیابتی نیز در کیفیت تصویر به طور قابل توجهی متفاوت بود (017/0p<).در بین تمام تصاویر با کیفیت بالا، درصد بیماران مبتلا به PDR 18.8٪ در مقایسه با 38.8٪ از تمام تصاویر با کیفیت پایین بود (جدول 1).
رتبه‌بندی‌های فردی همه تصاویر، قابلیت اطمینان بین رتبه‌بندی متوسط ​​تا قوی را بین افرادی که تصاویر را می‌خوانند نشان می‌دهد (کاپا وزنی کوهن = 0.79، 95% فاصله اطمینان (CI: 0.76-0.82))، و هیچ نقطه تصویری وجود نداشت که در آن امتیازدهندگان بیش از 1 تفاوت داشته باشند (شکل 1). 2A)..شدت سیگنال به طور قابل توجهی با امتیازدهی دستی همبستگی داشت (همبستگی لحظه محصول پیرسون = 0.58، 95% فاصله اطمینان (CI): 0.51-0.65، p<0.001)، اما بسیاری از تصاویر دارای شدت سیگنال بالا اما امتیاز دستی پایین شناسایی شدند (شکل .2B).
در طول آموزش معماری ResNet152 و AlexNet، از دست دادن آنتروپی متقابل در اعتبارسنجی و آموزش بیش از 50 دوره می افتد (شکل 3B,C).دقت اعتبارسنجی در دوره آموزشی نهایی بیش از 90٪ برای موارد استفاده با کیفیت بالا و کیفیت پایین است.
منحنی های عملکرد گیرنده نشان می دهد که مدل ResNet152 به طور قابل توجهی از قدرت سیگنال گزارش شده توسط دستگاه در هر دو موارد استفاده با کیفیت پایین و با کیفیت بهتر عمل می کند (001/0p<).مدل ResNet152 نیز به طور قابل توجهی از معماری AlexNet بهتر عمل می کند (به ترتیب برای موارد با کیفیت پایین و با کیفیت p = 0.005 و p = 0.014).مدل‌های به‌دست‌آمده برای هر یک از این وظایف به ترتیب به مقادیر AUC 0.99 و 0.97 دست یافتند که به طور قابل‌توجهی بهتر از مقادیر AUC مربوط به 0.82 و 0.78 برای شاخص قدرت سیگنال ماشین یا 0.97 و 0.94 برای AlexNet است. ..(شکل 3).تفاوت بین ResNet و AUC در قدرت سیگنال هنگام تشخیص تصاویر با کیفیت بالا بیشتر است که نشان دهنده مزایای اضافی استفاده از ResNet برای این کار است.
نمودارها توانایی هر ارزیاب مستقل برای امتیازدهی و مقایسه با قدرت سیگنال گزارش شده توسط دستگاه را نشان می دهد.(الف) مجموع امتیازهایی که باید ارزیابی شوند برای ایجاد تعداد کل امتیازهایی که باید ارزیابی شوند استفاده می شود.به تصاویر با نمره مقیاس پذیری کلی 4 با کیفیت بالا اختصاص داده می شود، در حالی که تصاویر با نمره مقیاس پذیری کلی 1 یا کمتر کیفیت پایینی دارند.(ب) شدت سیگنال با تخمین های دستی مرتبط است، اما تصاویر با شدت سیگنال بالا ممکن است کیفیت پایین تری داشته باشند.خط قرمز نقطه چین آستانه کیفیت توصیه شده سازنده را بر اساس قدرت سیگنال (قدرت سیگنال \(\ge\)6) نشان می دهد.
یادگیری انتقال ResNet بهبود قابل توجهی در شناسایی کیفیت تصویر برای موارد استفاده با کیفیت پایین و با کیفیت بالا در مقایسه با سطوح سیگنال گزارش شده توسط ماشین ارائه می دهد.(الف) نمودارهای معماری ساده شده از پیش آموزش دیده (i) ResNet152 و (ii) معماری AlexNet.(ب) تاریخچه تمرین و منحنی‌های عملکرد گیرنده برای ResNet152 در مقایسه با قدرت سیگنال گزارش‌شده ماشین و معیارهای کیفیت پایین AlexNet.(C) تاریخچه آموزش گیرنده ResNet152 و منحنی های عملکرد در مقایسه با قدرت سیگنال گزارش شده توسط ماشین و معیارهای کیفیت بالای AlexNet.
پس از تنظیم آستانه مرز تصمیم، حداکثر دقت پیش‌بینی مدل ResNet152 برای مورد با کیفیت پایین 95.3 درصد و برای مورد با کیفیت بالا 93.5 درصد است (جدول 2).حداکثر دقت پیش‌بینی مدل AlexNet برای موارد با کیفیت پایین 91.0 درصد و برای موارد با کیفیت بالا 90.1 درصد است (جدول 2).حداکثر دقت پیش‌بینی قدرت سیگنال برای موارد استفاده با کیفیت پایین 76.1٪ و برای موارد استفاده با کیفیت بالا 77.8٪ است.مطابق کاپا کوهن (\(\kappa\))، توافق بین مدل ResNet152 و تخمین‌گرها برای مورد با کیفیت پایین 0.90 و برای مورد با کیفیت بالا 0.81 است.کاپا AlexNet کوهن برای موارد استفاده با کیفیت پایین و کیفیت بالا به ترتیب 0.82 و 0.71 است.کاپا قدرت سیگنال کوهن برای موارد استفاده با کیفیت پایین و بالا به ترتیب 0.52 و 0.27 است.
اعتبارسنجی مدل‌های تشخیص با کیفیت بالا و پایین بر روی تصاویر 6\(\x\) از یک صفحه تخت 6 میلی‌متری، توانایی مدل آموزش‌دیده را برای تعیین کیفیت تصویر در پارامترهای مختلف تصویربرداری نشان می‌دهد.هنگام استفاده از صفحات کم عمق 6\(\x\) 6 میلی متری برای کیفیت تصویربرداری، مدل با کیفیت پایین دارای AUC 0.83 (95% CI: 0.69-0.98) و مدل با کیفیت بالا دارای AUC 0.85 بود.(95% CI: 0.55-1.00) (جدول 2).
بازرسی بصری نقشه‌های فعال‌سازی کلاس لایه ورودی نشان داد که همه شبکه‌های عصبی آموزش‌دیده از ویژگی‌های تصویر در طول طبقه‌بندی تصویر استفاده می‌کنند (شکل 4A, B).برای 8 تصویر 8 میلی متری \(\times \) و 6 \(\times \) 6 میلی متری، تصاویر فعال سازی ResNet دقیقاً از عروق شبکیه پیروی می کنند.نقشه‌های فعال‌سازی AlexNet نیز عروق شبکیه را دنبال می‌کنند، اما با وضوح درشت‌تر.
نقشه های فعال سازی کلاس برای مدل های ResNet152 و AlexNet ویژگی های مربوط به کیفیت تصویر را برجسته می کند.(الف) نقشه فعال‌سازی کلاس که فعال‌سازی منسجم پس از عروق سطحی شبکیه را در 8 تصویر تأیید اعتبار 8 میلی‌متری و (B) وسعت را روی تصاویر اعتبارسنجی 6 \(\times\) کوچک‌تر نشان می‌دهد.مدل LQ با معیارهای کیفیت پایین آموزش دیده، مدل HQ با معیارهای کیفیت بالا آموزش دیده است.
قبلاً نشان داده شده بود که کیفیت تصویر می تواند تا حد زیادی بر هر کمیت تصاویر OCTA تأثیر بگذارد.علاوه بر این، وجود رتینوپاتی بروز مصنوعات تصویری را افزایش می دهد 7،26.در واقع، در داده‌های ما، مطابق با مطالعات قبلی، ارتباط معنی‌داری بین افزایش سن و شدت بیماری شبکیه و بدتر شدن کیفیت تصویر پیدا کردیم (001/0p<، 017/0=p به ترتیب برای سن و وضعیت DR؛ جدول 1) 27 بنابراین، ارزیابی کیفیت تصویر قبل از انجام هر گونه تجزیه و تحلیل کمی از تصاویر OCTA بسیار مهم است.اکثر مطالعاتی که تصاویر OCTA را تجزیه و تحلیل می‌کنند، از آستانه‌های شدت سیگنال گزارش‌شده توسط ماشین برای رد تصاویر با کیفیت پایین استفاده می‌کنند.اگرچه نشان داده شده است که شدت سیگنال بر کمیت پارامترهای OCTA تأثیر می گذارد، شدت سیگنال بالا به تنهایی ممکن است برای رد تصاویر با مصنوعات تصویری کافی نباشد.بنابراین، لازم است روش قابل اعتمادتری برای کنترل کیفیت تصویر ایجاد شود.برای این منظور، ما عملکرد روش‌های یادگیری عمیق تحت نظارت را در برابر قدرت سیگنال گزارش‌شده توسط ماشین ارزیابی می‌کنیم.
ما چندین مدل برای ارزیابی کیفیت تصویر ایجاد کرده‌ایم زیرا موارد استفاده مختلف OCTA ممکن است الزامات کیفیت تصویر متفاوتی داشته باشند.به عنوان مثال، تصاویر باید کیفیت بالاتری داشته باشند.علاوه بر این، پارامترهای کمی خاص مورد علاقه نیز مهم هستند.به عنوان مثال، مساحت ناحیه آواسکولار فووآل به کدورت محیط غیر مرکزی بستگی ندارد، بلکه بر تراکم عروق تأثیر می گذارد.در حالی که تحقیقات ما بر روی یک رویکرد کلی برای کیفیت تصویر تمرکز دارد، که به الزامات هیچ آزمایش خاصی وابسته نیست، اما قصد دارد مستقیماً قدرت سیگنال گزارش شده توسط دستگاه را جایگزین کند، امیدواریم به کاربران درجه بیشتری از کنترل را ارائه دهیم تا آنها می تواند معیار خاص مورد علاقه کاربر را انتخاب کند.مدلی را انتخاب کنید که مطابق با حداکثر درجه مصنوعات تصویر قابل قبول باشد.
برای صحنه‌های با کیفیت پایین و با کیفیت بالا، ما عملکرد عالی شبکه‌های عصبی کانولوشنال عمیق فاقد اتصال را نشان می‌دهیم، به ترتیب با AUCهای 0.97 و 0.99 و مدل‌های با کیفیت پایین.ما همچنین عملکرد برتر رویکرد یادگیری عمیق خود را در مقایسه با سطوح سیگنال گزارش شده توسط ماشین‌ها نشان می‌دهیم.اتصالات پرش به شبکه‌های عصبی اجازه می‌دهد تا ویژگی‌ها را در سطوح مختلف جزئیات بیاموزند و جنبه‌های ظریف‌تری از تصاویر (مثلاً کنتراست) و همچنین ویژگی‌های عمومی (مثلاً مرکزگذاری تصویر30،31) را ثبت کنند.از آنجایی که مصنوعات تصویری که بر کیفیت تصویر تأثیر می‌گذارند احتمالاً در یک محدوده وسیع شناسایی می‌شوند، معماری شبکه‌های عصبی با اتصالات گمشده ممکن است عملکرد بهتری نسبت به آن‌هایی که وظایف تعیین کیفیت تصویر را ندارند از خود نشان دهند.
هنگام آزمایش مدل خود بر روی تصاویر OCTA 6\(\×6 میلی‌متری)، متوجه کاهش عملکرد طبقه‌بندی برای مدل‌های با کیفیت بالا و کیفیت پایین (شکل 2) شدیم، برخلاف اندازه مدل آموزش‌دیده برای طبقه‌بندی.در مقایسه با مدل ResNet، مدل AlexNet سقوط بزرگتری دارد.عملکرد نسبتاً بهتر ResNet ممکن است به دلیل توانایی اتصالات باقیمانده برای انتقال اطلاعات در مقیاس های چندگانه باشد، که این مدل را برای طبقه بندی تصاویر گرفته شده در مقیاس ها و/یا بزرگنمایی های مختلف قوی تر می کند.
برخی از تفاوت‌ها بین 8 تصویر 8 \(\×\) 8 میلی‌متری و 6 تصویر \(\×\) 6 میلی‌متری می‌تواند منجر به طبقه‌بندی ضعیف شود، از جمله نسبت نسبتاً بالایی از تصاویر حاوی نواحی بدون عروق فووئول، تغییرات در دید، آرکیدهای عروقی، و بدون عصب بینایی در تصویر 6×6 میلی متر.با وجود این، مدل ResNet با کیفیت بالا ما توانست به AUC 85% برای 6 تصویر 6 \(\x\) 6 میلی متری دست یابد، پیکربندی که مدل برای آن آموزش ندیده است، که نشان می دهد اطلاعات کیفیت تصویر در شبکه عصبی رمزگذاری شده است. مناسب است.برای یک اندازه تصویر یا پیکربندی ماشین خارج از آموزش آن (جدول 2).با اطمینان، نقشه‌های فعال‌سازی ResNet و AlexNet با 8 تصویر 8 میلی‌متری و 6 تصویر 6 میلی‌متری توانستند عروق شبکیه را در هر دو مورد برجسته کنند، که نشان می‌دهد مدل اطلاعات مهمی دارد.برای طبقه بندی هر دو نوع تصویر OCTA قابل استفاده هستند (شکل 4).
لاورمن و همکارانارزیابی کیفیت تصویر بر روی تصاویر OCTA به طور مشابه با استفاده از معماری Inception، شبکه عصبی کانولوشنال اتصال پرش 6،32 با استفاده از تکنیک های یادگیری عمیق انجام شد.آنها همچنین مطالعه را به تصاویر شبکه مویرگی سطحی محدود کردند، اما فقط با استفاده از تصاویر کوچکتر 3×3 میلی متر از Optovue AngioVue، اگرچه بیماران مبتلا به بیماری های کوریورتینال مختلف نیز شامل شدند.کار ما بر پایه‌های آنها استوار است، از جمله مدل‌های متعدد برای رسیدگی به آستانه‌های کیفیت تصویر مختلف و تأیید نتایج برای تصاویر با اندازه‌های مختلف.ما همچنین معیار AUC مدل‌های یادگیری ماشین را گزارش می‌کنیم و دقت چشمگیر آن‌ها را (90%)6 برای هر دو مدل با کیفیت پایین (96%) و با کیفیت بالا (95.7%) افزایش می‌دهیم.
این آموزش چندین محدودیت دارد.ابتدا، تصاویر تنها با یک دستگاه OCTA، شامل تنها تصاویر شبکه مویرگی سطحی در 8\(\times\)8 میلی متر و 6\(\times\)6 میلی متر به دست آمد.دلیل حذف تصاویر از لایه های عمیق تر این است که مصنوعات طرح ریزی شده می توانند ارزیابی دستی تصاویر را دشوارتر و احتمالاً کمتر سازگار کنند.علاوه بر این، تصاویر فقط در بیماران دیابتی به دست آمده است، که OCTA به عنوان یک ابزار مهم تشخیصی و پیش آگهی برای آنها در حال ظهور است.اگرچه ما توانستیم مدل خود را روی تصاویر با اندازه‌های مختلف آزمایش کنیم تا از قوی بودن نتایج اطمینان حاصل کنیم، نتوانستیم مجموعه داده‌های مناسب را از مراکز مختلف شناسایی کنیم، که ارزیابی ما را از تعمیم‌پذیری مدل محدود کرد.اگرچه تصاویر تنها از یک مرکز به دست آمده است، اما از بیمارانی با پیشینه های قومی و نژادی مختلف به دست آمده است که نقطه قوت منحصر به فرد مطالعه ما است.با گنجاندن تنوع در فرآیند آموزشی خود، امیدواریم که نتایج ما به معنای گسترده‌تر تعمیم داده شود و از کدگذاری تعصب نژادی در مدل‌هایی که آموزش می‌دهیم اجتناب کنیم.
مطالعه ما نشان می‌دهد که شبکه‌های عصبی پرش اتصال را می‌توان برای دستیابی به عملکرد بالا در تعیین کیفیت تصویر OCTA آموزش داد.ما این مدل ها را به عنوان ابزاری برای تحقیقات بیشتر ارائه می کنیم.از آنجایی که معیارهای مختلف ممکن است الزامات کیفیت تصویر متفاوتی داشته باشند، یک مدل کنترل کیفیت فردی را می توان با استفاده از ساختار ایجاد شده در اینجا برای هر متریک ایجاد کرد.
تحقیقات آینده باید شامل تصاویر با اندازه های مختلف از اعماق مختلف و ماشین های مختلف OCTA باشد تا فرآیند ارزیابی کیفیت تصویر یادگیری عمیق را به دست آورد که می تواند به پلتفرم های OCTA و پروتکل های تصویربرداری تعمیم داده شود.تحقیقات فعلی همچنین مبتنی بر رویکردهای یادگیری عمیق نظارت شده است که نیاز به ارزیابی انسانی و ارزیابی تصویر دارد، که می‌تواند برای مجموعه داده‌های بزرگ زمان بر و کار فشرده باشد.باید دید که آیا روش های یادگیری عمیق بدون نظارت می توانند به اندازه کافی بین تصاویر با کیفیت پایین و تصاویر با کیفیت بالا تمایز قائل شوند یا خیر.
همانطور که فناوری OCTA به تکامل خود ادامه می دهد و سرعت اسکن افزایش می یابد، ممکن است میزان مصنوعات تصویر و تصاویر با کیفیت پایین کاهش یابد.بهبودهایی در نرم افزار، مانند ویژگی حذف مصنوعات طرح ریزی که اخیراً معرفی شده است، می تواند این محدودیت ها را نیز کاهش دهد.با این حال، بسیاری از مشکلات باقی می‌مانند زیرا تصویربرداری از بیماران با تثبیت ضعیف یا کدورت رسانه‌ای قابل توجه همواره منجر به ایجاد مصنوعات تصویری می‌شود.از آنجایی که OCTA در کارآزمایی‌های بالینی به طور گسترده‌تری مورد استفاده قرار می‌گیرد، برای ایجاد دستورالعمل‌های واضح برای سطوح مصنوع تصویر قابل قبول برای تجزیه و تحلیل تصویر، به بررسی دقیق نیاز است.استفاده از روش‌های یادگیری عمیق برای تصاویر OCTA نویدبخش است و تحقیقات بیشتری در این زمینه برای توسعه یک رویکرد قوی برای کنترل کیفیت تصویر مورد نیاز است.
کد مورد استفاده در تحقیق حاضر در مخزن octa-qc، https://github.com/rahuldhodapkar/octa-qc موجود است.مجموعه داده های تولید شده و/یا تجزیه و تحلیل شده در طول مطالعه جاری از نویسندگان مربوطه در صورت درخواست معقول در دسترس است.
مصنوعات تصویری Spaide، RF، Fujimoto، JG و Waheed، NK در آنژیوگرافی انسجام نوری.Retina 35, 2163-2180 (2015).
فنر، بی جی و همکاران.شناسایی ویژگی های تصویربرداری که کیفیت و تکرارپذیری اندازه گیری تراکم شبکه مویرگی شبکیه را در آنژیوگرافی OCT تعیین می کند.BRJ. Ophthalmol.102, 509–514 (2018).
Lauerman، JL و همکاران.تأثیر فناوری ردیابی چشم بر کیفیت تصویر آنژیوگرافی OCT در دژنراسیون ماکولا وابسته به سنطاق قبر.بالینیانقضاچشم پزشکی255، 1535–1542 (2017).
Babyuch AS و همکاران.اندازه گیری تراکم پرفیوژن مویرگی OCTA برای تشخیص و ارزیابی ایسکمی ماکولا استفاده می شود.جراحی چشمتصویربرداری لیزری شبکیه 51، S30–S36 (2020).
He, K., Zhang, X., Ren, S., and Sun, J. Deep Residual Learning for Recognition Image.در سال 2016 در کنفرانس IEEE در زمینه بینایی کامپیوتری و تشخیص الگو (2016).
Lauerman، JL و همکاران.ارزیابی کیفیت تصویر آنژیوگرافی خودکار OCT با استفاده از الگوریتم های یادگیری عمیق.طاق قبر.بالینیانقضاچشم پزشکی257، 1641–1648 (2019).
Lauermann، J. و همکاران.شیوع خطاهای قطعه بندی و آرتیفکت های حرکتی در آنژیوگرافی OCT به بیماری شبکیه بستگی دارد.طاق قبر.بالینیانقضاچشم پزشکی256، 1807–1816 (2018).
پاسک، آدام و همکارانPytorch: یک کتابخانه یادگیری عمیق ضروری و با کارایی بالا.پردازش پیشرفته اطلاعات عصبیسیستم.32, 8026–8037 (2019).
دنگ، جی و همکاران.ImageNet: پایگاه داده تصویر سلسله مراتبی در مقیاس بزرگ.2009 کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو.248-255.(2009).
طبقه بندی Krizhevsky A., Sutzkever I. و Hinton GE Imagenet با استفاده از شبکه های عصبی کانولوشنال عمیق.پردازش پیشرفته اطلاعات عصبیسیستم.25، 1 (2012).


زمان ارسال: مه-30-2023
  • ویچت
  • ویچت