یادگیری ماشین(Machine Learning) - قسمت یازدهم

یادگیری ماشین(Machine Learning) - قسمت یازدهم

مدت زمان تقریبی مطالعه : 3 دقیقه
1,997 بازدید

شبکه های عصبی محرمانه (CNN)

شبکه های عصبی تحریک کننده اکنون همه عصبانی هستند. از آنها برای جستجوی اشیاء روی عکس ها و فیلم ها ، تشخیص چهره ، انتقال سبک ، تولید و تقویت تصاویر ، ایجاد جلوه هایی مانند کند کردن سرعت و بهبود کیفیت تصویر استفاده می شود. امروزه در کلیه مواردی که شامل تصاویر و فیلم ها است از CNN استفاده می شود. حتی در iphon خود ، چندین شبکه از عکس های شما برای شناسایی اشیاء موجود در آن استفاده می کنند.

مشکلی که در تصاویر وجود داشت ، همیشه دشواری استخراج ویژگی های خارج از آنها بود. می توانید متن را با جملات تقسیم کنید ، ویژگی های کلمات را در واژگان تخصصی جستجو کنید. این رویکرد نام "ویژگی های صنایع دستی" را داشته و تقریباً توسط همه مورد استفاده قرار می گرفت.

در مورد کارهای دستی بسیاری از مسائل وجود دارد.

اول از همه ، اگر یک گربه گوش خود را پایین آورده یا از دوربین دور شده است: شما دچار مشکل هستید ، شبکه عصبی چیزی را نمی بیند.

دوم اینکه ، سعی کنید 10 ویژگی مختلف را که گربه ها را از حیوانات دیگر متمایز می کند ، در مکان نامگذاری کنید. من برای کسی نتوانستم این کار را انجام دهم ، اما وقتی می بینم که یک سیاه چشمی شب گذشته من را پشت سر می گذارد - حتی اگر آن را فقط در گوشه چشمم ببینم - مطمئناً از موش صحرایی به گربه می گفتم. از آنجا که مردم فقط به فرم گوش یا شمارش پاها نگاه نمی کنند و ویژگی های مختلفی را که حتی به آنها فکر نمی کنند ، حساب می کنند. و بنابراین نمی تواند آن را برای دستگاه توضیح دهد.

بنابراین این بدان معناست که دستگاه باید به تنهایی چنین ویژگی هایی را بیاموزد ، و در بالای خطوط اصلی قرار بگیرد. ما موارد زیر را انجام می دهیم: ابتدا ، کل تصویر را به بلوک های پیکسلی 8x8 تقسیم می کنیم و به هر یک از انواع خط غالب - یا افقی [-] ، عمودی [|] یا یکی از موربها [/] اختصاص می دهیم. این همچنین می تواند باشد که چندین نفر بسیار قابل مشاهده باشند - این اتفاق می افتد و ما همیشه کاملاً مطمئن نیستیم.

خروجی می تواند چندین جدول از چوب باشد که در حقیقت ساده ترین ویژگی های حاشیه اشیاء روی تصویر هستند. آنها خود تصاویر هستند اما از چوب ساخته شده اند. بنابراین ما می توانیم یک بار دیگر از 8x8 استفاده کنیم و ببینیم که چگونه آنها با هم هماهنگ هستند.

این عمل "Convolution" نام دارد که نام این روش را داده است. نتیجه گیری می تواند به عنوان لایه ای از شبکه عصبی نشان داده شود ، زیرا هر نورون می تواند مانند هر عملکردی عمل کند.

هنگامی که شبکه عصبی خود را با تعداد زیادی عکس از گربه ها تغذیه می کنیم ، به طور خودکار وزن بیشتری را به آن دسته از چوب هایی که اغلب دیده می شود ، اختصاص می دهد. فرقی نمی کند این یک خط مستقیم پشت گربه باشد یا یک جسم پیچیده هندسی مانند صورت گربه ، چیزی که بسیار فعال می شود.

به عنوان خروجی ، ما یک پرسپترون ساده قرار می دهیم که به فعال ترین ترکیب ها نگاه می کند و بر اساس آن گربه ها را از سگ متمایز می کند.

زیبایی این ایده این است که ما یک شبکه عصبی داریم که متمایزترین ویژگی های اشیاء را به خودی خود جستجو می کند. نیازی نیست که آنها را به صورت دستی انتخاب کنیم. ما می توانیم هر مقدار تصویر از هر جسم را فقط با googling میلیاردها تصویر با آن تغذیه کنیم و شبکه ما نقشه های ویژگی را از چوب ایجاد می کند و یاد می گیرد هر شیء را به تنهایی متمایز کند.

به شبکه عصبی خود ماهی بدهید و قادر است تا آخر عمر ماهی را تشخیص دهد. به شبکه عصبی خود میله ماهیگیری بدهید و می تواند تا آخر عمر میله های ماهیگیری را تشخیص دهد ... .

 

قسمت دوازدهم

مقالات مرتبط