A Dynamically Configurable Coprocessor for Convolutional Neural Networks
پردازنده کمکی پویای قابل تنظیم برای شبکه های عصبی کانولوشن
فرمت ترجمه مقاله : word – قابل ویرایش
تعداد صفحات ترجمه مقاله به همراه پاسخ به سوالات : 47 صفحه
رعایت تمام قوانین نگارشی و دارای فهرست اشکال،جداول و محتوا
سال چاپ مقاله : 2013
دانلود اصل مقاله – رایگان
قیمت : 29000 تومان
این فایل علاوه بر ترجمه به سوالات زیر در باب مقاله مذکور پاسخ میدهید:
۸-۱ مقاله دقیقا چی مساله ای را میخواهد حل کند؟
۸-۲ چه جنبه این مساله جنبه مهمی است؟ چرا؟
۸-۳ راه حل های قبلی چه هستند؟
۸-۴ مشکلات راه حلهای قبلی چیست و چرا ناکافی هستند؟
۸-۵ راه حل پشنهادی چیست؟
۸-۶ چگونه راه حل طراحی و پیاده سازی شده است؟
۸-۷ چرا این راه حل کار خواهد کرد و بهتر از راه حل های قبلی خواهد بود؟
۸-۸ فرضیات بکار رفته چه هستند؟ این فرضیات چقدر واقع گرایانه هستند؟
۸-۹ روش پشنهادی چگونه ارزیابی شده است؟
۸-۱۰ ارزش راه حل چگونه اثبات شده است؟
۸-۱۱ نتایج اصلی مقاله چه هستند؟
۸-۱۲ نتایج چقدر نسبت به فرضیات حساس هستند؟
۸-۱۳ روندهای آتی این کار تحقیقاتی از نظر نویسندگان چیست؟
۸-۱۴ در نگاه کلی، این مقاله چه چیزی به ما میدهد؟
۸-۱۵ نقاط قوت کار از نظر شما کدامند؟در ایده اولیه، در راه حل، و در ارزیابی؟
۸-۱۶ نقاط ضعف کار از نظر شما کدامند؟
۸-۱۷ شما چه جهت هایی برای ادامه کار می بینید؟
۸-۱۸ چه سوالاتی در مورد مقاله به ذهن شما می آید؟
چکیده
برنامه های کاربردی شبکههای عصبی کانولوشن (CNN) برنامه هایی هستند که از شناسایی و استدلال (مانند شناسایی دست خط، شناسایی حالت چهره و نظارت فیلمها) تا برنامه های هوشمند متنی مثل تحلیل فنی شماتیک و برنامه های پردازش زبان طبیعی را شامل میشوند. دو مشاهده کلیدی باعث ساختن طرحی جدید برای CNN شد؛ اول، بارِ کاری CNN، مخلوطی وسیع از سه نوع موازیسازی را ارائه داده است: موازی سازی درون یک عملیات کانولوشن، موازی سازی در داخل-خروجی که در آن چندین منابع ورودی (ویژگیها) ترکیب میشوند تا یک خروجی واحد بسازند، و موازی سازی بین-خروجی که در آن چندین خروجی (ویژگی) مستقل، همزمان محاسبه میشوند. بارهای کاری در برنامه های مختلف CNN و لایه های متفاوت CNN، تفاوت چشمگیری دارند. دوما، تعداد المانهای محاسبه در یک معماری، نسبت به پهنای باند خارج از حافظه (pin-count) با نسبت بسیار بیشتری (همانند قانون مور[1]) افزایش می یابد. بر اساس این دو مشاهده، ما نشان میدهیم که در ازای مقدار مشخصی المان محاسبه و پهنای باند خارج از حافظه، یک معماری سخت افزاری جدید CNN که برای رسیدن به مقدار مشخصی از موازیسازی در یک بارِکاری مشخص، سخت افزار را به طور پویا و درجا تنظیم میکند و بهترین توان عملیاتی را میدهد. کامپایلر CNN ما، مشخصات خلاصه شده شبکه را به طور خودکار به یک ریزبرنامه (دستهای از دستورات سطح پایین VLIW) ترجمه میکند که توسط یک Coprocessor، برنامه ریزی، زمانبندی و اجرا میشود. به نسبت یک 4.3GHz quad-core dual socket Intel Zenon، 1.35 GHz C910 GPU و یک 1200MHz FPGA، معماری قابل تنظیم 120 مگاهرتز، حدود 4 تا 8 برابر سریعتر است. این اولین معماری CNN است که توانسته شناسایی اشیای زیادی را در یک فیلم برداری (25 تا30 فریم بر ثانیه) به طور همزمان انجام دهد.
گروهها و توضیح دهندههای موضوعات
c.1.3 (حالت های دیگر معماری): معماری های سازگار شونده، شبکه های عصبی، پردازنده های پاپ لاین[2]
واژههای عمومی
طرح، آزمایش، کارایی
کلمههای کلیدی
شبکه های عصبی کانولوشن، تنظیم دوباره پویا، معماری رایانه موازی
[1] Moore
[2] Pipeline processors.