وبلاگ دیجی پروژه

پروژه و ترجمه های هوش مصنوعی

وبلاگ دیجی پروژه

پروژه و ترجمه های هوش مصنوعی

وبلاگ دیجی پروژه

دیجی پروژه را در کانال تلگرام دیجی پروژه دنبال نمایید
https://telegram.me/DigiProjects

آخرین نظرات
۲۸
اسفند

Adaptive threshold-based block classification in medical image compression

for teleradiology

دسته ­بندی بلوکی مبتنی بر حدآستانه­ی انطباقی در فشرده‌سازی تصویر پزشکی رادیولوژی


فرمت ترجمه مقاله : word – قابل ویرایش

تعداد صفحات ترجمه مقاله : 18 صفحه

دانلود اصل مقاله – رایگان

قیمت : 20000 تومان

چکیده

ارتباطات راه دور، در میان دیگر چیزها، شامل ذخیره‌سازی و انتقال تصاویر پزشکی است که به آن رادیولوژی از راه دور نیز گفته می‌شود. به علت محدودیت روی پهنای باند و ظرفیت ذخیره‌سازی، یک تصویر پزشکی ممکن است قبل از انتقال/ ذخیره نیاز به فشرده شدن داشته باشد. در میان روش‌های مختلف فشرده‌سازی، تکنیک‌های مبتنی بر تبدیل که یک تصویر را در حوزه‌ی فضایی به داده‌ها در حوزه‌ی طیفی تبدیل می‌کنند بسیار مؤثر است. تبدیل گسسته‌ی کسینوسی (DCT) احتمالاً محبوب‌ترین تبدیل استفاده شده در فشرده‌سازی تصویر در استانداردهایی مانند گروه متخصصان گرافیکی متصل (JPEG) است. در فشرده‌سازی مبتنی بر DCT، تصویر به بلوک‌های کوچکتری برای سادگی محاسبات تقسیم می‌شود. بلوک‌ها بر اساس محتوای اطلاعاتی طبقه‌بندی می‌شوند تا نرخ فشرده‌سازی بدون از بین رفتن اطلاعات تشخیصی، به حداکثر برسد. مقاله‌ی حاضر، یک تکنیک همراه با الگوریتم محاسباتی برای طبقه‌بندی بلوک‌ها بر اساس مقدار آستانه‌ی انطباقی واریانس ارائه می‌کند. روش انطباقی، تکنیک طبقه‌بندی را برای همه‌ی تصاویر پزشکی مناسب می‌کند. کارایی آن با اعمال به تصاویر CT، X-ray و فرا صوتی و مقایسه با JPEG از لحاظ شاخص‌های کیفی و عینی مختلف نشان داده شده است.

۲۸
اسفند

3-D medical image compression using 3-D wavelet coders

فشرده‌سازی سه بعدی تصاویر پزشکی با استفاده از کدگذارهای ویولت 3 بعدی

فرمت ترجمه مقاله : word – قابل ویرایش

تعداد صفحات ترجمه مقاله : 12 صفحه

دانلود اصل مقاله – رایگان

قیمت : 15000 تومان

چکیده

این مقاله، فشرده‌سازی تصاویر پزشکی سه بعدی با استفاده از کدگذارهای ویولت سه بعدی را ارائه می‌دهد. چهار تبدیل ویولت به نام‌های Daubechies 4، Daubechies 6، Cohen-Daubechies-Feauveau 9/7 و Cohen-Daubechies-Feauveau 5/3 در اولین مرحله با کدگذارهایی مثل SPHIT سه بعدی، SPECK سه بعدی و BISK سه بعدی در مرحله‌ی دوم برای فشرده‌سازی و ترکیب بهینه‌ی ویولت- کدگذار تعیین می‌شود. دو نسخه از تبدیل ویولت یعنی تبدیل‌های ویولت متقارن و جداگانه در نظر گرفته می‌شود.

آزمایشات با استفاده از تصاویر تست دارویی مانند تصاویر رزونانس مغناطیسی (MRI) و رگ نگاری‌های اشعه‌ی X (XA) انجام می‌شوند.

کارایی طرح پیشنهادی از لحاظ نسبت سیگنال به نویز و نرخ بیتی ارزیابی می‌شود. شاخص تشابه ساختاری میانگین (MSSIM) نیز برای ارزیابی تشابه ساختاری بین تصاویر اصلی و بازسازی شده معرفی می‌شود. با توجه به نتایج تست، مشخص شده است که ویولت متقارن Cohen-Daubechies-Feauveau 9/7 سه بعدی همراه با کدگذار سه بُعدی SPIHT منجر به بهترین نتیجه‌ی فشرده‌سازی می‌شود.

1.        مقدمه

برای کاربردهای رادیولوژی از راه دور، کیفیت تصاویر پزشکی بازسازی شده، نقش مهمی را در تشخیص و درمان بیماران دارد. در سال‌های اخیر، تقاضای ذخیره‌سازی و انتقال تصاویر پزشکی، علاقه‌ی بسیاری را در زمینه‌ی فشرده‌سازی تصاویر پزشکی جلب کرده است. فشرده‌سازی می‌تواند بدون اتلاف باشد اگر کپی دقیقی از نسخه‌ی اصلی را ایجاد کند و می‌تواند با اتلاف باشد اگر کمی‌سازی‌های خاصی را لحاظ کند. برای فشرده‌سازی تصاویر پزشکی، فشرده‌سازی با اتلاف، تا وقتی مجاز است که کیفیت تشخیصی مورد نیاز در تصاویر بازسازی شده حفظ شود. مشخص است که متخصصان پزشکی، تصاویر سه بعدی را برای تحلیل ترجیح می‌دهند زیرا انعطاف‌پذیری در دیدن بخش‌های آناتومی مورد نیاز برای تشخیص دقیق ناهنجاری‌ها را فراهم می‌آورد.

۲۸
اسفند

3-D warped discrete cosine transform for MRI image compression

تبدیل کسینوسی گسسته‌ی پیچشی سه بعدی برای فشرده‌سازی تصویر MRI

فرمت ترجمه مقاله : word – قابل ویرایش

تعداد صفحات ترجمه مقاله : 17 صفحه

دانلود اصل مقاله – رایگان

قیمت : 20000 تومان


چکیده

فشرده‌سازی تصویر، کاربرد فشرده‌سازی داده‌ها روی تصاویر دیجیتال است. تکنیک‌های کدگذاری تبدیل با اتلاف/ بدون اتلاف متعددی برای فشرده‌سازی تصویر استفاده می‌شود. تبدیل کسینوسی گسسته (DCT) روشی بسیار پرکاربرد است. از نوعی DCT به نام تبدیل کسینوسی گسسته‌ی پیچشی (WDCT) برای فشرده‌سازی دو بعدی تصویر استفاده می‌شود و نشان داده شده که بهتر از DCT در نرخ‌های بیتی بالا عمل می‌کند. ما این ایده را توسعه داده و WDCT سه بعدی را ارائه دادیم که تبدیلی است که قبلاً بررسی نشده است. ما برخی از ویژگی‌های مهم آن را مطرح می‌کنیم که آن را برای فشرده‌سازی تصویر مناسب می‌کند. سپس، یک طرح کدگذاری کامل تصویر برای مجموعه داده‌های حجمی بر اساس طرح سه بعدی WDCT پیشنهاد می‌کنیم. نشان داده شده است که طرح فشرده‌سازی مبتنی بر WDCT سه بعدی بهتر از طرح مشابه DCT سه بعدی برای مجموعه داده‌های حجمی در نرخ‌های بیتی بالا عمل می‌کند.



۲۸
اسفند

Facial expression feature extraction using hybrid PCA and LBP

استخراج ویژگی حالت تصویر با استفاده از PCA و LBP ترکیبی

فرمت ترجمه مقاله : word – قابل ویرایش

تعداد صفحات ترجمه مقاله : 9 صفحه

دانلود اصل مقاله – رایگان

قیمت : 15۰۰۰ تومان

چکیده

این مقاله برای تشخیص دقیق حالات چهره، یک روش ترکیبی از تحلیل اجزای اصلی (PCA) و الگوی محلی باینری پیشنهاد داده است. در ابتدا، روش قطعه‌بندی هشت چشم معرفی شده است تا نواحی مؤثر تصویر حالت چهره را استخراج کند که می‌تواند برخی از اطلاعات غیر مفید را برای استخراج بعدی ویژگی کاهش دهد. پس PCA ویژگی سیاه و سفید از کل تصویر حالت چهره را استخراج کرده و اندازه‌ی داده‌ها را نیز به طور همزمان کاهش می‌دهد. LBP ویژگی متنی همسایه‌ی محلی ناحیه‌ی دهان را استخراج می‌کند که بیشتر به تشخیص حالت چهره اختصاص دارد. در هم آمیختن ویژگی سراسری و محلی برای تشخیص حالت چهره مؤثرتر است. در نهایت، ماشین بردار پشتیبان (SVM) از ویژگی ترکیب برای تکمیل تشخیص حالت چهره استفاده می‌کند. نتایج آزمایشی نشان می‌دهد که روش پیشنهادی در این مقاله می‌تواند حالات مختلف را به طور کاراتری طبقه‌بندی کرده و نرخ تشخیص بالاتری نسبت به روش‌های تشخیص قدیمی ارائه دهد.

۲۶
اسفند

تشخیص حالت چهره بر اساس الگوهای باینری محلی: یک مطالعه‌ی جامع

Facial expression recognition based on Local Binary Patterns

A comprehensive study


فرمت ترجمه مقاله : word - قابل ویرایش

تعداد صفحات ترجمه مقاله : 30 صفحه

دانلود اصل مقاله - رایگان

قیمت : 20000 تومان


چکیده مقاله

تحلیل اتوماتیک حالت چهره، یک مسئله‌ی جالب و چالش‌برانگیز است و روی کاربردهای مهم در بسیاری از نواحی مانند تعامل انسان کامپیوتر و انیمیشن مبتنی بر داده، تأثیر گذار است. استخراج یک نمایش مؤثر چهره از تصاویر اصلی صورت، یک گام حیاتی برای تشخیص موفق حالت چهره است. در این مقاله، ما به طور تجربی، نمایش چهره را بر اساس ویژگی‌های محلی آماری، الگوهای باینری محلی، برای تشخیص مستقل از شخص حالت چهره ارزیابی می‌کنیم. روش‌های مختلف یادگیری ماشین روی پایگاه‌داده‌های متعدد بررسی شده‌اند. آزمایشات وسیعی نشان می‌دهد که ویژگی‌های LBP برای تشخیص حالت چهره، مؤثر و کاراست. ما LBP تقویت شده را نیز فرمول سازی می‌کنیم تا متمایزترین ویژگی‌های LBP را استخراج کنیم و بهترین کارایی تشخیص با استفاده از طبقه‌بندهای ماشین بردار پشتیبان با ویژگی‌های LBP تقویت شده بدست می‌آید. به علاوه، ما ویژگی‌های LBP را برای تشخیص حالت چهره ا وضوح پایین بررسی می‌کنیم که یک مسئله‌ی حیاتی است اما به ندرت در کارهای موجود به آن پرداخته شده است. ما در آزمایشات مشاهده می‌کنیم که ویژگی‌های LBP به طور ثابت و محکم و در محدوده‌ی وضوح پایین تصاویر چهره کار می‌کنند و منجر به کارایی خوبی در دنباله‌های ویدئویی با وضوح پایین فشرده شده و گرفته شده در محیط‌های جهان واقعی می‌شوند.


۲۶
اسفند

فرمت ترجمه مقاله : word - قابل ویرایش

تعداد صفحات ترجمه مقاله : 36 صفحه

دانلود اصل مقاله

قیمت : ۲۵۰۰۰ تومان


چکیده مقاله

تحقیقات در زمینه‌ی تشخیص حالت چهره، در تصاویر چهره تنها به صورت دید روبرو انجام شده است. تلاش‌هایی برای تولید طبقه‌بندهای حالت چهره‌های متغیر انجام شده است. با این حال، اکثر این تلاش‌ها تنها تغییرات افقی تا 45 درجه را در نظر گرفته‌اند که همه‌ی چهره مشخص است. کارهای اندکی برای بررسی پتانسیل ذاتی حالات مختلف برای تشخیص حالت چهره انجام شده است. این امر عمدتاً به دلیل پایگاه داده‌های موجود است که تنها تصاویری از چهره از دید روبرو را می‌اندازند. پایگاه داده‌های اخیر BU3DFE و multi-pie تحقیقات تجربی تشخیص حالت چهره برای زوایای دید مختلف را اجازه می‌دهند. یک روش دو مرحله‌ای برای طبقه‌بندی حالت و طبقه‌بندی حالت چهره مستقل از دید در نظر گرفته شده است. الگوهای باینری محلی (LBP) و تغییرات LBPها به عنوان توصیفگرهای بافتی بررسی می‌شود. این ویژگی‌ها، بررسی تأثیر موقعیت و تحلیل چند وضوحی برای تشخیص حالت چهره با چندین دید را اجازه می‌دهند. تأثیر حالت روی حالات مختلف چهره بررسی شده است. عوامل دیگر شامل وضوح و ایجاد بردارهای ویژگی محلی و سراسری بررسی شده است. از یک روش مبتنی بر ظاهر با تقسیم تصویر به زیر بلوک‌های قرار گرفته در چهره استفاده شده است. بردارهای ویژگی شامل هیستوگرام‌های الحاقی ویژگی ایجاد شده از هر زیر بلوک است. از ماشین‌های بردار پشتیبان چند کلاسی، برای یادگیری حالت و طبقه‌بندهای حالت چهره‌ی مستقل از موقعیت استفاده شده است.



۲۸
آذر

محققان دانشکده مهندسی کامپیوتر و فناوری اطلاعات دانشگاه صنعتی امیرکبیر، نرم‌افزاری برای خلاصه سازی فایل‌های گفتاری عرضه کردند که بر اساس جستجوی اطلاعات مهم اقدام به خلاصه سازی فایل‌ها می‌کند.

به گزارش سرویس فناوری ایسنا، هدی‌ سادات جعفری، مجری طرح با بیان اینکه دنیای کنونی دنیای انتقال اطلاعات بوده و این انتقال به صورت‌های مختلفی مانند متن،‌ صوت و تصویر انجام می‌شود، افزود: امروزه با رشد روزافزون اطلاعات و قرار گرفتن حجم بالایی از فایل‌های صوتی بر روی شبکه‌ها و کامپیوترها، یافتن راه‌حل‌های کارا برای ذخیره‌سازی، بازیابی، جستجو و مرورگری سریع این فایل‌های صوتی مورد نیاز است.

وی خلاصه‌سازی گفتار را یکی از راه‌های پیشنهادی برای انتقال سریعتر اطلاعات گفتاری نام برد و اظهار کرد: با اجرای مطالعاتی اقدام به طراحی و ساخت نرم‌افزاری برای خلاصه‌سازی فایل‌های صوتی شد. این نرم‌افزار قادر است اطلاعات مهم فایل‌های گفتاری را پیدا کند و به صورت خلاصه شده در خروجی به کاربر تحویل دهد.

جعفری با تاکید بر اینکه طراحی این نرم‌افزار صرفه‌جویی در زمان و تسهیل دسترسی به نکات کلیدی فایل‌های گفتاری را به دنبال خواهد شد، خاطرنشان کرد: در طراحی این نرم افزار از روش یادگیری ماشین به نام روش «نیمه‌نظارتی» استفاده شده است؛ به این معنی که یکسری داده کم از قبل به ماشین ارائه می‌شود تا ماشین چگونگی خلاصه‌سازی را یاد بگیرد و ماشین با استفاده از مدل‌های ساخته شده می‌تواند فایل‌های بعدی را خلاصه‌سازی کند.

جعفری با بیان اینکه نرم‌افزار طراحی شده در مرحله تحقیقاتی قرار دارد، تاکید کرد: در این نرم‌افزار کاربران با وارد کردن فایل گفتاری و انتخاب درصد خلاصه‌سازی می‌توانند از فایل خلاصه‌سازی شده استفاده کنند.

جعفری اضافه کرد: در این نرم افزار خلاصه‌سازی گفتار بدون استفاده از سامانه بازشناسی گفتار ارائه شده است. به ‌این صورت که بخش‌های شاخص گفتار مستقیما از روی سیگنال گفتار شناسایی می‌شوند و خلاصه به صورت گفتاری در اختیار کاربر قرار می‌گیرد.

مجری طرح، با بیان اینکه در حال حاضر این نرم افزار برای خلاصه سازی فایل‌های گفتار رسمی مانند فایل‌های گفتاری اخبار رادیو و تلویزیون کاربرد دارد، یادآور شد: اضافه کردن قابلیت‌هایی مانند پشتیبانی از خلاصه‌سازی فایل‌های جلسات که چندین گوینده دارد، سخنرانی‌ها،‌ کلاس‌های درس،... از دیگر برنامه‌های پیش روی این نرم‌افزار هستند.

وی استفاده از این نرم‌افزار را در موتورهای جستجو مفید دانست و عنوان کرد: با پیشرفت این نرم افزار می‌توانیم فایل‌های گفتاری را با استفاده از کلمات کلیدی جستجو کنیم.

دو مقاله ترجمه شده در فروشگاه دیجی پروژه موجود می باشد برای مشاهد و دانلود بر روی لینک های زیر کلیک نمایید.

خلاصه کردن گفتار خبری با مرزهای شناخته شده ی مطالب

خلاصه سازی گفتار بدون ویژگی واژگان برای پخش اخبار ماندرین

۲۷
آذر

پیش ثبت نام  : ٧ آذر - ۱ بهمن ۱۳۹۴


بررسی فنی تیم ها : ۲ - ۳۰ بهمن ۱۳۹۴

 

ثبت نام زود هنگام : ۱ - ۲۱ اسفند ۱۳۹۴

 

ثبت نام با تاخیر :  ۲۲ اسفند ۱۳۹۴ - ۱۰ فروردین ۱۳۹۵

 

حضور و آماده سازی تیم ها در محل مسابقات  :  ۱۶ - ۱٧ فروردین ۱۳۹۵

 

برگزاری مسابقات (بازدید آزاد برای عموم) :  ۱۸ - ۲۰ فروردین ۱۳۹۵

 

۲۶
آذر

برای عضویت در کانال تلگرام هوش مصنوعی میتوانید بر روی تصویر ذیل کلیک کنید


تلگرام هوش مصنوعی

@HomeAI

https://telegram.me/HomeAI


۲۴
آذر

تشخیص حالت چهره

مایکروسافت یک ابزار جدید رونمایی کرده که می‌تواند تصاویر را آنالیز کند و احساسات انسانی را تشخیص دهد. به عنوان مثال، تصور کنید که در یک سینما نشسته‌اید و دوربینی به سمت مخاطبان تنظیم شده و شما فیلم‌برداری می‌کند. Ryan Galgon، مدیر پروژه‌های تحقیقاتی مایکروسافت می‌گوید، دوربینی مجهز به این تکنولوژی می‌تواند به تهیه‌کنندگانِ فیلم نشان دهد که چه تعداد مردم در چه صحنه‌هایی از فیلم واکنش‌هایی مثل غمگینی و شگفت‌زدگی را از خود نشان می‌دهند.

صاحبان فروشگاه هم می‌توانند با استفاده از آن ببینند که مشتریان به محصولات و کالاهای خاص چه واکنشی نشان می‌دهند. سازندگان اپلیکیشن‌ها هم می‌توانند مجموعه‌ی تصاویر کاربر را مرور کنند و فقط تصاویر شاد را ذخیره‌ کنند. این موارد چند نمونه‌ از کاربردهای احتمالی این تکنولوژی است. مایکروسافت هم نمی‌داند که توسعه‌دهندگان دقیقا از این فناوری چه استفاده‌ای می‌کنند.

این تکنولوژی بخشی از یکی از پرو‌ژه‌های مایکروسافت به نام «پروژه‌ی آکسفورد» (Oxford Project) است. مایکروسافت نتیجه‌ی سال‌‌ها تجربه‌اش در یادگیری ماشینی و هوش مصنوعی را در این ابزار پیشرفته و پیچیده به ثمر رسانده است. مایکروسافت در نظر دارد آن را به‌طور رایگان در اختیار عموم قرار دهد. Galgon می‌گوید: “همه‌ی توسعه‌دهنده‌‌ها نمی‌تواند به یک کارشناس متخصص یادگیری ماشینی تبدیل شوند. هدف‌ پروژه‌ی آکسفورد این است که این ابزار در اختیار همه‌ی توسعه‌دهندگان قرار بگیرد تا بتوانند با خلاقیت‌شان استفاده‌های مختلفی از آن ببرند.”

در فروشگاه دیجی پروژه میتوانید کدهای متلب مربوط به تشخیص حالت چهره با نرم افزار متلب مشاهده نمایید :

پروژه شماره ۴( استخراج ویژگی LBP برای تشخیص حالت چهره – پیاده سازی مقاله)