Towards Abstractive Speech Summarization Exploring Unsupervised
and Supervised Approaches for Spoken Utterance Compression
خلاصهسازی تجردی گفتار: کاوش روشهای نظارتی و بدون نظارت
برای فشردهسازی نطق بیان شده
فرمت ترجمه مقاله : word – قابل ویرایش
تعداد صفحات ترجمه مقاله به همراه پاسخ به سوالات : 35 صفحه
رعایت تمام قوانین نگارشی و دارای فهرست اشکال،جداول و محتوا
سال چاپ مقاله : 2013
قیمت : 12000 تومان
چکیده
اکثر مطالعات قبلی در زمینهی خلاصهسازی گفتار، روی روشهای تجردی تمرکز کردهاند. الحاق نطقهای گفتاری استخراجی هنوز، شکل خوبی از خلاصه را به دلیل وجود عدم روانیها و افزونگیها در گفتار محاورهای بدون برنامه ایجاد نمیکند. در این مقاله، ما تولید خلاصههای گفتاری فشرده را با جفت کردن فشردهسازی سطح جملهای و روشهای خلاصهسازی به عنوان یک گام مناسب در تولید خلاصههای تجردی پیشنهاد میکنیم. ما دو روش فشردهسازی نطق را مقایسه کردیم: یک روش بدون نظارت مبتنی بر چارچوب برنامهنویسی خطی صحیح[1] (ILP) و یک روش نظارتی با استفاده از فیلدهای تصادفی شرطی[2] (CRF) که مسئلهی فشردهسازی نطق را به صورت یک عمل برچسبزنی دنبالهای تنظیم میکند. ما کارایی فشردهسازی را با استفاده از آوانویسیهای انسانی و ASR از جلسات ICSI ارزیابی کرده و هر دو ارزیابی انسانی و اتوماتیک را انجام دادیم. نتایج ما نشان میدهد که میتوانیم به کارایی فشردهسازی نطق قابل قبولی دست یابیم و اینکه روش مبتنی بر CRF به طور کلی بهتر عمل میکند. با ترکیب روشهای فشردهسازی و خلاصهسازی، میتوانیم خلاصههای گفتاری فشرده که اطلاعات بیشتری در محدوده طول معین پوشش میدهد را تولید کنیم و کارایی مطلق 5٪ را در آوانویسیهای انسانی و اتوماتیک ارزیابی شده توسط رتبههای ROUGE-1 بدست آوریم.
[1] Integer Linear Programming
[2] conditional random fileds
SUMMARIZATION OF NEWS SPEECH WITH UNKNOWN TOPIC BOUNDARY
خلاصه کردن گفتار خبری با مرزهای شناخته شده ی مطالب
فرمت ترجمه مقاله : word – قابل ویرایش
تعداد صفحات ترجمه مقاله : 14 صفحه
قیمت : 10000 تومان
چکیده
بینندگان تلویزیون تمایل دارند تمام اجزای یک برنامه خبری را در زمان کوتاه بدست آورند و این به دلیل تعداد روز افزون کانالهای خبری است. روش های خلاصهبرداری مرسوم بر اساس استخراج جملات مهم از یک مطلب است که در یک گفتار خبری گنجانده شده. این روشها چندان مناسب نیستند چون جملات مهم به دلیل مرزهای ناشناختهی مطلب همیشه به راحتی قابل استخراج نیست. برای حل این مشکل، در این مقاله ما به ارائهی یک روش خلاصهبرداری برای برنامه خبری تلویزیون پرداختهایم که با استفاده از قطعه بندی متن خبری به چندین مطلب و سپس استخراج جملهی مهم از هر مطلب عمل میکند.
Speech Summarization Without Lexical Features
for Mandarin Broadcast News
خلاصه سازی گفتار بدون ویژگی واژگان برای پخش اخبار ماندرین
فرمت ترجمه مقاله : word – قابل ویرایش
تعداد صفحات ترجمه مقاله : 12 صفحه
قیمت : 10000 تومان
چکیده
ما اولین مطالعه شناخته شده تجربی روی خلاصه گفتار بدون خصوصیات واژگانی برای پخش اخبار ماندارین را ارائه میدهیم. ما خصوصیات صوتی، واژگانی و ساختاری را به عنوان پیشبینیهای جملات خلاصه ارزیابی میکنیم. ما پیدا میکنیم که تلخیص کننده، اجرای خوب در متوسط سنجش F با مقدار 0.5646 را حتی توسط استفاده از ترکیب خصوصیات صوتی و ساختاری به تنهایی نتیجه میدهد که مستقل از خصوصیات واژگانی میباشند. در مجموع، ما نشان میدهیم که خصوصیات واژگانی برای خصوصیات واژگانی مافوق هستند و تلخیص کننده ما به طور حیرت انگیزی در متوسط سنجش F با مقدار 0.3914 تنها با استفاده از خصوصیات صوتی بخوبی انجام کار میکند. این یافتهها ما را قادر میسازند تا گفتار را بدون قرار دادن یک نیاز دقیق روی دقت تشخیص گفتار خلاصه نماییم.
محققان دانشکده مهندسی کامپیوتر و فناوری اطلاعات دانشگاه صنعتی امیرکبیر، نرمافزاری برای خلاصه سازی فایلهای گفتاری عرضه کردند که بر اساس جستجوی اطلاعات مهم اقدام به خلاصه سازی فایلها میکند.
به گزارش سرویس فناوری ایسنا، هدی سادات جعفری، مجری طرح با بیان اینکه دنیای کنونی دنیای انتقال اطلاعات بوده و این انتقال به صورتهای مختلفی مانند متن، صوت و تصویر انجام میشود، افزود: امروزه با رشد روزافزون اطلاعات و قرار گرفتن حجم بالایی از فایلهای صوتی بر روی شبکهها و کامپیوترها، یافتن راهحلهای کارا برای ذخیرهسازی، بازیابی، جستجو و مرورگری سریع این فایلهای صوتی مورد نیاز است.
وی خلاصهسازی گفتار را یکی از راههای پیشنهادی برای انتقال سریعتر اطلاعات گفتاری نام برد و اظهار کرد: با اجرای مطالعاتی اقدام به طراحی و ساخت نرمافزاری برای خلاصهسازی فایلهای صوتی شد. این نرمافزار قادر است اطلاعات مهم فایلهای گفتاری را پیدا کند و به صورت خلاصه شده در خروجی به کاربر تحویل دهد.
جعفری با تاکید بر اینکه طراحی این نرمافزار صرفهجویی در زمان و تسهیل دسترسی به نکات کلیدی فایلهای گفتاری را به دنبال خواهد شد، خاطرنشان کرد: در طراحی این نرم افزار از روش یادگیری ماشین به نام روش «نیمهنظارتی» استفاده شده است؛ به این معنی که یکسری داده کم از قبل به ماشین ارائه میشود تا ماشین چگونگی خلاصهسازی را یاد بگیرد و ماشین با استفاده از مدلهای ساخته شده میتواند فایلهای بعدی را خلاصهسازی کند.
جعفری با بیان اینکه نرمافزار طراحی شده در مرحله تحقیقاتی قرار دارد، تاکید کرد: در این نرمافزار کاربران با وارد کردن فایل گفتاری و انتخاب درصد خلاصهسازی میتوانند از فایل خلاصهسازی شده استفاده کنند.
جعفری اضافه کرد: در این نرم افزار خلاصهسازی گفتار بدون استفاده از سامانه بازشناسی گفتار ارائه شده است. به این صورت که بخشهای شاخص گفتار مستقیما از روی سیگنال گفتار شناسایی میشوند و خلاصه به صورت گفتاری در اختیار کاربر قرار میگیرد.
مجری طرح، با بیان اینکه در حال حاضر این نرم افزار برای خلاصه سازی فایلهای گفتار رسمی مانند فایلهای گفتاری اخبار رادیو و تلویزیون کاربرد دارد، یادآور شد: اضافه کردن قابلیتهایی مانند پشتیبانی از خلاصهسازی فایلهای جلسات که چندین گوینده دارد، سخنرانیها، کلاسهای درس،... از دیگر برنامههای پیش روی این نرمافزار هستند.
وی استفاده از این نرمافزار را در موتورهای جستجو مفید دانست و عنوان کرد: با پیشرفت این نرم افزار میتوانیم فایلهای گفتاری را با استفاده از کلمات کلیدی جستجو کنیم.
دو مقاله ترجمه شده در فروشگاه دیجی پروژه موجود می باشد برای مشاهد و دانلود بر روی لینک های زیر کلیک نمایید.