X
تبلیغات
رایتل

CUDA Programming Applications

تاریخچه ایده Histogram Oriented Gradient(HOG)

HOG یک توصیفگر ویژگی استفاده شده در پردازش تصویر و بینایی ماشین با هدف تشخیص شی و یک روش شمارش رویدادهای جهت گیری گرادیان در قسمت های محلی یک تصویر است، این روش مشابه دیگر توصیفگرها از قبیل هیستوگرام جهت دار لبهEOH  و SIFT ومفهوم شکل و ... است اما از لحاظ محاسبات تفاوتهایی دارد.

HOG توسط Robert K. McConnell  در سال 1986 میلادی معرفی و در سال 1994 توسط Mitsubishi Electric Research Laboratories مورد استفاده قرار گرفت. بهرحال استفاده از این روش درسال 2005 گسترده تر شد، محققان موسسه IRINA کار تکمیلی خود را در این زمینه در کنفرانس بینایی ماشین و الگوی تشخیص CVPR نشان دادند ، در این کار آنها بر روی تصویر عابر پیاده در تصاویر ثابت تمرکز کردند اگرچه آنها از آن به بعد کارشان را بر روی تصاویر ویدیویی متحرک و همچنین برای حیوانات و وسایل نقلیه در تصاویر ثابت نیز بسط دادند.

ایده اصلی پشت این روش نمایش اشیاء محلی و اشکال درون تصویر هستند که می توانند توسط توزیع گرادیان، شدت و جهت لبه را توصیف کنندکه عکس به دو ناحیه مرتبط کوچک تقسیم می شود که سلول نام دارد و برای هر پیکسل درون سلول هیستوگرام جهت گرادیان جمع آوری شده توسط توصیفگر بهم پیوند زده می شود. برای بهبود دقت، هیستوگرام محلی می تواند با محاسبه معیار شدت در سراسر یک ناحیه بزرگتر از تصویر  ، کنتراست آن را نرمال کند، به آن ناحیه بلاک گفته می شود و سپس با استفاده از این مقدار تمامی سلولهای درون بلاک نرمال می شوند، این نرمال سازی  بهتر از تغییر روشنایی و سایه زدن است.

HOG مزیتهای کلیدی تری نسبت به سایر توصیفگرها دارد ،از آنجایی که روی سلولهای محلی اعمال می شود تغییرات هندسی و فتومتریک را به جز چرخش اشیا برای آن غیر ممکن می سازد از قبیل تغییراتی که با تغییر مقیاس بزرگتر ظاهر می شود

فیلتر گابور

از آنجایی که خصوصیات مورد نظر در تصویر مقیاس ها و جهت های مختلفی دارند ،لذا استخراج اطلاعات و ویژگی های جهت دار در مقیاس های مختلف از تصویر یکی از گامهای اساسی می باشد امروزه فیلترهای گابور به علت خواص مناسبی که دارند برای رسیدن به این منظور به طور وسیع مورد استفاده قرار می گیرند. داگمن در سال 1980 با الهام از کار گابور روابط عدم قطعیت در دو بعد بیان و خانواده ای از توابع دو بعدی را که به مینیمم مقدار در اصل عدم قطعیت دست می یابند ، معرفی نمود و آنها را توابع گابور نامگذاری کرد.تابع گابور دو بعدی از حاصلضرب تابع گوسی دو بعدی در تابعی سینوسی در جهات مختلف فضای دو بعدی به دست می آید.این توابع به عنوان فیلتر بعلت خواص بسیار مفیدشان کاربرد زیادی را در زمینه های مختلف بینایی ماشین نظیر تحلیل بافت ،دسته بندی، بازیابی تصویر، تشخیص قلم پیدا کرده اند.از جمله این خواص می توان به سادگی ، تمرکز در حوزه مکان و فرکانس و امکان انتخاب جهت و فرکانس برای استخراج اطلاعات تصویر اشاره کرد.با استفاده از تبدیل موجک دو بعدی گابور می توان ویژگی های جهت دار تصویر را در مقیاس های مختلف استخراج نمود.مهمترین مزیت فیلترهای گابور،در تغییر ناپذیری آن نسبت به روشنایی ،چرخش ،مقیاس دهی و انتقال تصویر می باشد،بعلاوه اینکه این فیلتر می تواند در برابر اختلالات فتومتریکی (همچون تغییرات روشنایی و نویز واقع در تصویر)مقاومت نماید.در حوزه مختصات مکانی یک فیلتر گابور دو بعدی عبارت است از یک تابع کرنل گوسی (مدوله شده توسط یک موج مسطح سینوسی مختلط)که به صورت رابطه زیر می باشد

ورودی و خروجی فیلتر

معرفی LBP و انواع آن

الگوی دودویی محلی در سال 1994 توسط Lowe Wang1ابداع گردید ، این الگو یک روش قدرتمند برای طبقه بندی بافتهای تصویر است که در سیستم بازیابی تصویر چهره کاربرد فراوان دارد و در روش معمولی الگوی باینری محلی از هیستوگرام برای استخراج ویژگی استفاده می نماید و از آنجایی که این روش هم از مشخصه های آماری و هم از ساختار بافتی استفاده می کند ابزاری قدرتمند برای تحلیل بافت به شمار می رود در این روش الگوهای دودویی محلی بوسیله مقایسه مقدار پیکسلهای مجاور با پیکسل مرکز الگوی بافت محلی استخراج می شود و با کدهای دودوئی نشان داده می شود ، این الگو در سال 1996 توسط اوجالا2و همکارانش پیشنهاد شد و به علت مقاومتش نسبت به تغییرات روشنایی و پیچیدگی محاسباتی کم و کدگذاری جزئیات یکی از رایج ترین توصیفگرهاست در اصل الگوی دودویی محلی برای آنالیز بافت پیشنهاد شده است و هنوز به عنوان یک رویکرد قدرتمند برای توصیف ساختار محلی معرفی می شود، و این الگو در بسیاری از کاربردهای گوناگون برای نمونه آنالیز تصویر چهره ،دریافت ویدیو تصویر ،مدلسازی محیط ،نظارت دیداری ،آنالیز حرکت ،آنالیز  تصاویر هوایی و ... مطرح شده است.

انواع دیگر از توصیفگرهای الگوهای محلی دودویی در طول 5 سال اخیر پیشنهاد شدند و همچنین از چندین تحقیق صرفا برای الگوهای یکنواخت استفاده شد و با ترکیب الگوهای یکنواخت و غیر یکنواخت عملکرد الگوی محلی دودویی توسط ژو و همکارانش ارتقا داده شد .

انواع LBP

1-معمولی

2-دایره ای

3-قطری


که اصطلاحا آنها را به الگوهای خطی و محیطی تقسیم بندی می کنیم، در الگوهای محیطی مانند دایره ای چون ناحیه مدنظر نسبت به الگوی خطی مساحت بیشتری را دارد از درونیابی استفاده نموده و نقاط را با توجه به نقاط همسایه بازسازی می نماید در نتیجه کیفیت کار بالا می رود.



1- Lowe Wang




2- Timo Ojala





مفهوم Face Detection و Face Recognition

Face Detection

این ویژگی به دوربین کمک می کند تا چهره افراد را در تصویر به صورت خودکار شناسایی و روی آن زوم کند،این قابلیت موجب تنظیم فلاش و میزان نور ورودی است که از تار شدن و درخشندگی بیش از حد چهره افراد هنگام تصویر برداری جلوگیری می کند.





Face Recognition

ویژگی است که در آن عکس فرد مورد نظر را به سیستم می دهیم و با استفاده از الگوریتمی خاص سیستم ، عکس فرد مورد نظر را در فیلم و یا مجموعه ای از تصاویر شناسایی می کند،بطور کلی Face Recognition  را بدین صورت تعریف می نماییم:توانایی شناسایی تصویر توسط ماشین در بین مجموعه ای از عکسهای ذخیره شده و یا گونه ای از الگوی شناسایی تصویر چهره شخص که در پایگاه داده ذخیره شده است برای هنگامی که سعی در ورود به سیستم دارد  


                                                                                                    



پس نتیجه کلی که از این بحث می گیریم این است که برای انجام هرچه بهتر عمل بینایی ماشین در تشخیص چهره ابتدا باید Face Detection را اعمال نماییم تا کیفیت ظاهری تصویر و نورپردازی آن خوب باشد سپس الگوریتم Face Reconition

 

مفهوم LBP

در تئوری الگوی دودویی محلی ابتدا همسایه هشت گانه هر پیکسل از تصویر را مشخص نموده و سپس تفاضل هر یک از آن همسایه ها را تا پیکسل را بدست می آوریم اگر عدد مثبت بود بجای آن یک وگرنه صفر می گذاریم و سپس عدد باینری بدست آمده (نحوه ابتدا و انتهای عدد در شکل 1 آمده  است)را به دهدهی تبدیل نموده و در برداری ذخیره می کنیم. 

عدد باینری بدست آمده 10001111 است که معادل 143 می باشد سپس برای هریک از عکسهای موجود در پوشه این کار را انجام می دهیم و نتایج را در بردارهای مختلف ذخیره می کنیم تصویر LBP در شکل 2 آمده است

در مرحله بعد هیستوگرام1 هر بردار را در برداری که از صفر تا 255 است ذخیره می نماییم.


1)       هیستوگرام:نمودار فراوانی هر رنگ در تصویر



در مرحله بعد فاصله هر یک از این بردارهای هیستوگرام را تا بردار هیستوگرام شکل مورد نظر را محاسبه می نماییم.


فرمول فاصله:
کوچکترین فاصله به معنای شباهت بیشتر با عکس مورد نظر است،که نتیجه کار در شکل 3 قابل مشاهده است.

همانطور که مشاهده می نمایید فاصله برای im1 برابر با 465شد و برای im2 برابر با 317 شد که به معنای تشابه im2 با عکس مورد نظر است.
1 2 >>