CUDA Programming Applications

کاربردهای برنامه نویسی کودا

CUDA Programming Applications

کاربردهای برنامه نویسی کودا

تبدیل فوریه

تبدیل فوریه یکی از تبدیلات پرکاربرد در حوزه پردازش تصویر و بینایی ماشین به شمار می رود که برای تجزیه تصویر به مولفه های سینوسی و کسینوسی کاربرد دارد، خروجی این تبدیل تصویری معادل تصویر در حوزه مکان، در حوزه فرکانس نمایش می دهد، بدین ترتیب که در حوزه فوریه هر نقطه نشان دهنده یک فرکانس خاصی از تصویر در حوزه مکان است. از انجایی که ما با تصاویر دیجیتال سروکار داریم با تبدیل فوریه گسسته کار را ادامه می دهیم.(Discrete Fourier transform)

روش‌های پردازش تصویر در حوزه مکان مبتنی بر دست‌کاری مستقیم پیکسل‌ها در تصویر است که هنگام اجرای فیلتر کردن از خواص همبستگی و پیچش استفاده می‌شود، ولی پردازش تصویر در حوزه فرکانس شامل تبدیل تصویر به حوزه فوریه، فیلتر کردن تبدیل فوریه تصویر و سپس محاسبه تبدیل معکوس برای بدست آوردن نتیجه‌ی پردازش شده است. در تصاویر کوچک روش پردازش تصویر در حوزه مکان مفید است ولی در تصاویر بزرگ به دلیل پیچیدگی محاسبات از روش پردازش تصویر در حوزه فرکانس استفاده می‌شود.


مفهوم اولیه تبدیل فوریه:


شماتیک کلی فرآیند فیلتر کردن تصویر در حوزه فرکانس  در شکل زیر آمده است:



تصویر حاصل از فیلتر در حوزه فرکانس از رابطه زیر بدست می آید:

G( x  , y ) = H( u , v ) * F( u , v )

که در رابطه فوق G نتیجه تبدیل فوریه بر روی تصویر ورودی است،H فیلتر اعمال شده برروی تصویر در حوزه فرکانس و F تبدیل فوریه تصویر ورودی است، در نتیجه با محاسبه معکوس G تصویر خروجی بدست می آید.


درحالت کلی فیلترهای مورد استفاده در حوزه فرکانس به دو دسته تقسیم می شوند:

1- فیلترهای پایین گذر

2-فیلترهای بالاگذر

فیلترهای پایین گذر فیلترهایی هستند که پیکسلهای با فرکانس پایین را نادیده گرفته و پیکسلهای با فرکانس بالا را تغییر می دهند در مقابل فیلترهای بالاگذر فیلترهایی هستند که پیکسلها با فرکانس بالا را نادیده گرفته و پیکسلهای با فرکانس پایین را تغییر می دهند،
لازم بذکر است که پیکسلهای با فرکانس پایین، پیکسلهای آرام تصویر اصلی را نمایش می دهند و پیکسلهای با فرکانس بالا پیکسلهای تیز تصویر اصلی را نمایش می دهند،پیکسلهای آرام پیکسلهایی هستند که اختلاف شدت روشنایی آنها با پیکسلهای مجاورشان ناچیز است ولی پیکسلهای تیز پیکسلهایی هستند که اختلاف شدت روشنایی آنها با پیکسلهای مجاورشان زیاد است، لبه ها و نویزها نمونه هایی از پیکسلهای تیز تصویر هستند.
در حوزه فرکانس پیکسلهای با فرکانس پایین در مرکز تبدیل فوریه و پیکسلهای با فرکانس بالا در گوشه های آن ظاهر می شود و سپس فیلترهای بالاگذر و پایین گذر بر روی تبدیل فوریه تصویر اعمال می شود.

دستوری که در opencv برای تبدیل فوریه برروی تصاویر وجود دارد fft می باشدکه نتیجه آن در تصاویر زیر قابل رویت می باشد.



Iranian Face DataBase

دیتاستی دیگر از تصاویر چهره افراد ایرانی که بعنوان اولین و بزرگترین دیتاست در خاورمیانه به شمار می رود که شامل شماری از تصاویر رنگی از اشخاص ایرانی در رده های مختلف سنی  است که در سال 2007 در بخش مهندسی دانشگاه آزاد اسلامی واحد کرج ایجاد گردید. این دیتاست می تواند برای کلاس بندی های سنی، استخراج ویژگی های چهره و ... کاربردی باشد. این دیتاست شامل3600 عکس رنگی از 616 چهره صورت است،در این دیتا ست تنها تصاویر چهره مردان بدون محدودیت پوشش قابل دسترسی است .


کتاب Computer vision using local binary pattern

این کتاب نوشته آقایان Matti Pietikäinen  و Abdenour Hadid و Timo Ahonen و خانم Guoying Zhao از اعضای هیئت علمی دانشگاه OULU در زمینه انواع الگو باینری محلی در بحث بینایی ماشین است که در سال 2011 به چاپ رسید برای مشاهده جزئیات اینجا را کلیک نمایید.


دیتاست AR

یک دیتاست شامل 126 تصویر(70مرد و 56 زن)که بالای 4000 تصویر رنگی در آن وجود دارد. این دیتاست توسط Aleix Martinez و Robert Benavente در مرکز بینایی ماشین U.A.B ایجاد شد و تصاویر در حالات مختلف روشنایی و یا حالات دیگر از قبیل با عینک آفتابی بدون عینک ، با روسری و بدون روسری نشان داده شده است و برای هر فرد 2 تصویر وجود دارد که در حالات مختلف گرفته شده است این دیتا ست برای استفاده درتحقیقات دانشگاهی و همچنین استفاده عموم آزاد است و از طریق وب سایت قابل مشاهده است.