CUDA Programming Applications

کاربردهای برنامه نویسی کودا

CUDA Programming Applications

کاربردهای برنامه نویسی کودا

تاریخچه ایده Histogram Oriented Gradient(HOG)

HOG یک توصیفگر ویژگی استفاده شده در پردازش تصویر و بینایی ماشین با هدف تشخیص شی و یک روش شمارش رویدادهای جهت گیری گرادیان در قسمت های محلی یک تصویر است، این روش مشابه دیگر توصیفگرها از قبیل هیستوگرام جهت دار لبهEOH  و SIFT ومفهوم شکل و ... است اما از لحاظ محاسبات تفاوتهایی دارد.

HOG توسط Robert K. McConnell  در سال 1986 میلادی معرفی و در سال 1994 توسط Mitsubishi Electric Research Laboratories مورد استفاده قرار گرفت. بهرحال استفاده از این روش درسال 2005 گسترده تر شد، محققان موسسه IRINA کار تکمیلی خود را در این زمینه در کنفرانس بینایی ماشین و الگوی تشخیص CVPR نشان دادند ، در این کار آنها بر روی تصویر عابر پیاده در تصاویر ثابت تمرکز کردند اگرچه آنها از آن به بعد کارشان را بر روی تصاویر ویدیویی متحرک و همچنین برای حیوانات و وسایل نقلیه در تصاویر ثابت نیز بسط دادند.

ایده اصلی پشت این روش نمایش اشیاء محلی و اشکال درون تصویر هستند که می توانند توسط توزیع گرادیان، شدت و جهت لبه را توصیف کنندکه عکس به دو ناحیه مرتبط کوچک تقسیم می شود که سلول نام دارد و برای هر پیکسل درون سلول هیستوگرام جهت گرادیان جمع آوری شده توسط توصیفگر بهم پیوند زده می شود. برای بهبود دقت، هیستوگرام محلی می تواند با محاسبه معیار شدت در سراسر یک ناحیه بزرگتر از تصویر  ، کنتراست آن را نرمال کند، به آن ناحیه بلاک گفته می شود و سپس با استفاده از این مقدار تمامی سلولهای درون بلاک نرمال می شوند، این نرمال سازی  بهتر از تغییر روشنایی و سایه زدن است.

HOG مزیتهای کلیدی تری نسبت به سایر توصیفگرها دارد ،از آنجایی که روی سلولهای محلی اعمال می شود تغییرات هندسی و فتومتریک را به جز چرخش اشیا برای آن غیر ممکن می سازد از قبیل تغییراتی که با تغییر مقیاس بزرگتر ظاهر می شود

فیلتر گابور

از آنجایی که خصوصیات مورد نظر در تصویر مقیاس ها و جهت های مختلفی دارند ،لذا استخراج اطلاعات و ویژگی های جهت دار در مقیاس های مختلف از تصویر یکی از گامهای اساسی می باشد امروزه فیلترهای گابور به علت خواص مناسبی که دارند برای رسیدن به این منظور به طور وسیع مورد استفاده قرار می گیرند. داگمن در سال 1980 با الهام از کار گابور روابط عدم قطعیت در دو بعد بیان و خانواده ای از توابع دو بعدی را که به مینیمم مقدار در اصل عدم قطعیت دست می یابند ، معرفی نمود و آنها را توابع گابور نامگذاری کرد.تابع گابور دو بعدی از حاصلضرب تابع گوسی دو بعدی در تابعی سینوسی در جهات مختلف فضای دو بعدی به دست می آید.این توابع به عنوان فیلتر بعلت خواص بسیار مفیدشان کاربرد زیادی را در زمینه های مختلف بینایی ماشین نظیر تحلیل بافت ،دسته بندی، بازیابی تصویر، تشخیص قلم پیدا کرده اند.از جمله این خواص می توان به سادگی ، تمرکز در حوزه مکان و فرکانس و امکان انتخاب جهت و فرکانس برای استخراج اطلاعات تصویر اشاره کرد.با استفاده از تبدیل موجک دو بعدی گابور می توان ویژگی های جهت دار تصویر را در مقیاس های مختلف استخراج نمود.مهمترین مزیت فیلترهای گابور،در تغییر ناپذیری آن نسبت به روشنایی ،چرخش ،مقیاس دهی و انتقال تصویر می باشد،بعلاوه اینکه این فیلتر می تواند در برابر اختلالات فتومتریکی (همچون تغییرات روشنایی و نویز واقع در تصویر)مقاومت نماید.در حوزه مختصات مکانی یک فیلتر گابور دو بعدی عبارت است از یک تابع کرنل گوسی (مدوله شده توسط یک موج مسطح سینوسی مختلط)که به صورت رابطه زیر می باشد

ورودی و خروجی فیلتر

معرفی LBP و انواع آن

الگوی دودویی محلی در سال 1994 توسط Lowe Wang1ابداع گردید ، این الگو یک روش قدرتمند برای طبقه بندی بافتهای تصویر است که در سیستم بازیابی تصویر چهره کاربرد فراوان دارد و در روش معمولی الگوی باینری محلی از هیستوگرام برای استخراج ویژگی استفاده می نماید و از آنجایی که این روش هم از مشخصه های آماری و هم از ساختار بافتی استفاده می کند ابزاری قدرتمند برای تحلیل بافت به شمار می رود در این روش الگوهای دودویی محلی بوسیله مقایسه مقدار پیکسلهای مجاور با پیکسل مرکز الگوی بافت محلی استخراج می شود و با کدهای دودوئی نشان داده می شود ، این الگو در سال 1996 توسط اوجالا2و همکارانش پیشنهاد شد و به علت مقاومتش نسبت به تغییرات روشنایی و پیچیدگی محاسباتی کم و کدگذاری جزئیات یکی از رایج ترین توصیفگرهاست در اصل الگوی دودویی محلی برای آنالیز بافت پیشنهاد شده است و هنوز به عنوان یک رویکرد قدرتمند برای توصیف ساختار محلی معرفی می شود، و این الگو در بسیاری از کاربردهای گوناگون برای نمونه آنالیز تصویر چهره ،دریافت ویدیو تصویر ،مدلسازی محیط ،نظارت دیداری ،آنالیز حرکت ،آنالیز  تصاویر هوایی و ... مطرح شده است.

انواع دیگر از توصیفگرهای الگوهای محلی دودویی در طول 5 سال اخیر پیشنهاد شدند و همچنین از چندین تحقیق صرفا برای الگوهای یکنواخت استفاده شد و با ترکیب الگوهای یکنواخت و غیر یکنواخت عملکرد الگوی محلی دودویی توسط ژو و همکارانش ارتقا داده شد .

انواع LBP

1-معمولی

2-دایره ای

3-قطری


که اصطلاحا آنها را به الگوهای خطی و محیطی تقسیم بندی می کنیم، در الگوهای محیطی مانند دایره ای چون ناحیه مدنظر نسبت به الگوی خطی مساحت بیشتری را دارد از درونیابی استفاده نموده و نقاط را با توجه به نقاط همسایه بازسازی می نماید در نتیجه کیفیت کار بالا می رود.



1- Lowe Wang




2- Timo Ojala





LQEP

در این مقاله روشی جدید برای توصیفگرهای ویژگی پیشنهاد شده است که ارتباط جهات همسایه ها و پیکسل وسط را جمع آوری می نماید و همچنین الگوی DLEP اطلاعات جهات را برپایه اکسترممهای 0و45و90و135 درجه برای هر پیکسل بدست می آورد.

استخراج داده یکی از شاخه های فعال در بازیابی اطلاعات و یا داده ها در پایگاه داده ها و یا کتابخانه های بزرگ است که در گذشته بازیابی براساس متن برای استخراج و بازیابی اطلاعات استفاده می شد، بدین صورت که در این فرآیند متونی در حاشیه تصویر نوشته می شد و سپس با استفاده از سیستم مدیریت پایگاه داده های بر پایه متن عمل بازیابی تصویر انجام می شد که پیشرفتهای زیادی از قبیل مدل نمودن داده ،شاخصهای چند بعدی ،ارزیابی Query در این روش حاصل شد، بهرحال دو مشکل عمده نیز بر سر راه این روش وجود داشت:


1- زمانیکه سایز تصویر بزرگ می شد (ده یا صد هزار ) مشکلی در ذخیره این تصویر بود.

2-مشکلی که حائز اهمیت بود محتوای درون تصویر و درک صحیح انسان از آن بود که شاید از دو تصویر مشابه درکهای مختلفی صورت می گرفت.


به همین دلایل بود که ایده CBIR  بر اساس محتوای بصری شامل رنگ و بافت و شکل و ... شکل گرفت. رنگهای تصویر فقط برای زیبا سازی تصویر بکار برده نمی شوند بلکه اطلاعاتی در مورد تصویر را به ما می دهند که برای استخراج اطلاعات از تصویر رنگی کاربرد فراوان دارد،یکی از الگوهای CBIR الگوی LBP هست که در روشهای گوناگون مربعی،دایره ای ، قطری کاربرد دارد و الگوی نسبتا موفقی از نظر سرعت و کارآیی در کلاس بندی بافتها جهت موارد تشخیص چهره ، ردیابی شی ، بازیابی تصویر چهره و تشخیص اثر انگشت به شمار می رود.

در شکل زیر نحوه محاسبات نمایش داده شده است.



LBP معمولی




LBP قطری

Rao, L. K., & Rao, D. V. (2015). Local quantized extrema patterns for content-based natural and texture image retrieval. Human-centric Computing and Information Sciences, 5(1), 26.