Towards Abstractive Speech Summarization Exploring Unsupervised
and Supervised Approaches for Spoken Utterance Compression
خلاصهسازی تجردی گفتار: کاوش روشهای نظارتی و بدون نظارت
برای فشردهسازی نطق بیان شده
فرمت ترجمه مقاله : word – قابل ویرایش
تعداد صفحات ترجمه مقاله به همراه پاسخ به سوالات : 35 صفحه
رعایت تمام قوانین نگارشی و دارای فهرست اشکال،جداول و محتوا
سال چاپ مقاله : 2013
قیمت : 12000 تومان
چکیده
اکثر مطالعات قبلی در زمینهی خلاصهسازی گفتار، روی روشهای تجردی تمرکز کردهاند. الحاق نطقهای گفتاری استخراجی هنوز، شکل خوبی از خلاصه را به دلیل وجود عدم روانیها و افزونگیها در گفتار محاورهای بدون برنامه ایجاد نمیکند. در این مقاله، ما تولید خلاصههای گفتاری فشرده را با جفت کردن فشردهسازی سطح جملهای و روشهای خلاصهسازی به عنوان یک گام مناسب در تولید خلاصههای تجردی پیشنهاد میکنیم. ما دو روش فشردهسازی نطق را مقایسه کردیم: یک روش بدون نظارت مبتنی بر چارچوب برنامهنویسی خطی صحیح[1] (ILP) و یک روش نظارتی با استفاده از فیلدهای تصادفی شرطی[2] (CRF) که مسئلهی فشردهسازی نطق را به صورت یک عمل برچسبزنی دنبالهای تنظیم میکند. ما کارایی فشردهسازی را با استفاده از آوانویسیهای انسانی و ASR از جلسات ICSI ارزیابی کرده و هر دو ارزیابی انسانی و اتوماتیک را انجام دادیم. نتایج ما نشان میدهد که میتوانیم به کارایی فشردهسازی نطق قابل قبولی دست یابیم و اینکه روش مبتنی بر CRF به طور کلی بهتر عمل میکند. با ترکیب روشهای فشردهسازی و خلاصهسازی، میتوانیم خلاصههای گفتاری فشرده که اطلاعات بیشتری در محدوده طول معین پوشش میدهد را تولید کنیم و کارایی مطلق 5٪ را در آوانویسیهای انسانی و اتوماتیک ارزیابی شده توسط رتبههای ROUGE-1 بدست آوریم.
[1] Integer Linear Programming
[2] conditional random fileds