هادی ويسی خرداد 1388

66
ش رداز پ و ي س ا ن ش از ب از ن ف گ ي س ي هادی و رداد خ1388 ي س از از ف ن ف گ ي س ا ن ش از ب ی وز ل و ن ک ب کدازی ب ا ب ت ع ن ص ه ب ردی ک ب ا زو ب

description

تکنولوژي بازشناسي گفتار فارسي با رويکردي به صنعت بانکداري. هادی ويسی خرداد 1388. فهرست. معرفی تکنولوژی بازشناسی گفتار مروري بر کاربردهاي بازشناسي گفتار نمايش عملي سامانه تايپ گفتاري فارسي نويسا نمايش عملي يک سيستم ‌ ديالوگ تلفني ويژه بانکداري پرسش و پاسخ. - PowerPoint PPT Presentation

Transcript of هادی ويسی خرداد 1388

Page 1: هادی ويسی خرداد 1388

گفتار بازشناسي و پردازش

هادی ويسی

1388خرداد

تکنولوژي بازشناسي گفتار فارسيبا رويکردي به صنعت بانکداري

Page 2: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 2 1388خرداد

فهرست

معرفی تکنولوژی بازشناسی گفتار بازشناسي گفتارمروري بر کاربردهاي نمايش عملي سامانه تايپ گفتاري فارسي

نويسا ديالوگ تلفني نمايش عملي يک سيستم

ويژه بانکداري پرسش و پاسخ

Page 3: هادی ويسی خرداد 1388

گفتار بازشناسي و پردازش

(ASR Gooyesh Pardaz) عصر گويش پرداز

مروري بر بازشناسي خودکار گفتار (Automatic Speech Recognition- A Review)

Page 4: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 4 1388خرداد

سيستم هاي بازشناسي خودکار گفتار-معرفي

گفتار ساده ترين و کارآمدترين راه ارتباطانسان هاست

هدف بازشناسي خودکار گفتارAutomatic Speech Recognition )ASR(

تبديل گفتار انسان به متن يا دستورالعمل معادل گفتار مي تواند يک فايل صوتي، ورودي با ميکروفون، از

طريق خط تلفن و يا فرمان از راه دور باشد.

Page 5: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 5 1388خرداد

سيستم هاي بازشناسي خودکار گفتار-معرفي

يک سيستم بازشناسي کامل :.قادر به بازشناسي گفتار پيوسته و محاوره اي باشد.گفتار افراد مختلف، حتي با لهجه هاي متفاوت را بازشناسي نمايد.در محيط هاي شلوغ و نويزي هم جوابگو باشد.بصورت بالدرنگ عمل کند.قادر به فراگيري اطالعات جديد نظير کلمات، قوانين زباني و . . . باشد

:سيستم هاي کاربردي امروزي.گفتار بايستي به صورت کتابي باشد گفتار بايستي بر اساس حالت استاندارد زبان باشد و تغييرات مربوط به

لهجه ها منجر به کاهش کارايي مي شود. استفاده از آنها در محيط و شرايط نويزي منجر به افت کارايي و دقت آنها

مي شود. .اغلب سيستم هاي کاربردي امروزي تقريبا بالدرنگ هستند سيستم هاي موجود محدود به کلمات موجود در واژگان هستند و از اطالعات

زباني و معنايي به صورت محدود استفاده مي کنند.

Page 6: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 6 1388خرداد

سيستم هاي بازشناسي خودکار گفتار-پيچيدگي ها

بازشناسي گفتار کار پيچيده اي استارتباط انسان با ماشين امروزه بر پايه دکمه ها و کليدهاست، نه گفتار بار مختلف بيان نماييد، 10اگر شما يک کلمه خاص مانند ”آسمان“ را

تقريبا در هيچ دو حالتي فايل هاي ضبط شده ديجيتالي آنها دقيقا يکسان نيست!

پيچيدگي هاي مطرح در سيستم هاي بازشناسي گفتار ميزان وابستگي يا استقالل از گوينده پيوسته يا گسسته بودن گفتار اندازه ي واژگان محدوديت هاي زباني کارايي در حضور نويز و در محيط هاي کاربردي مختلف ابهام آکوستيکي و ميزان اشتباه بين کلمات

Page 7: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 7 1388خرداد

سيستم هاي بازشناسي خودکار گفتار-پيچيدگي ها

پيچيدگي هاي مطرح در سيستم هاي بازشناسي گفتار ميزان وابستگي يا استقالل از گوينده

گوينده هاي مختلف از نظر مشخصات صدا، سن، لهجه، جنس، نحوه صحبت کردن و ... باهم متفاوتند

) وابسته به گويندهSD: Speaker Dependent به يک و يا چند گوينده خاص پاسخ :(مي دهد

) مستقل از گويندهSI: Speaker Independent به تمام گويندگان يک زبان پاسخ (مي دهند

بيشتر روش هاي بازشناسي گفتار امروزي قادرند به هر دو صورت عمل کنند. وابستگي يااستقالل از گوينده در مورد يک سيستم بازشناسي گفتار، در مرحله ي آموزش مشخص

مي شود. ) باالتر از بعلت محدوديت و تنوع کمتردقت بازشناسي در حالت وابسته به گوينده (

) است ولي نياز به آموزش سيستم به پيچيدگي بيشترحالت مستقل از گوينده (بعلت صداي آن کاربر خاص را دارد.

در کاربردهاي واقعي که گوينده از ابتدا مشخص نيست سيستم را مستقل ازگوينده آموزش داده مي شود و سپس هنگام استفاده به کمک برخي

(، سيستم براي يک گوينده خاص تطبيق Adaptationرويکردها مانند تطبيق )مي شود.

در برخي کاربردهاي ديگر مانند بازشناسي از پشت خط تلفن وابسته بهگوينده بودن چندان معني خاصي ندارد چون گوينده از ابتدا مشخص نيست.

Page 8: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 8 1388خرداد

سيستم هاي بازشناسي خودکار گفتار-پيچيدگي ها

پيچيدگي هاي مطرح در سيستم هاي بازشناسي گفتار پيوسته يا گسسته بودن گفتار

محدوديت بر نحوة اداي کلمات توسط گوينده ميزان پيوستگي يا گسستگيکلمات

) بازشناسي کلمات مجزاIWR: Isolated Word Recognition(مجزا – هر فايل صوتي يک کلمه kگفتار کلمه به کلمه و کامًال

) بازشناسي گفتار متصلConnected Word Recognition( دنباله اي از کلمات که به وسيلة سکوتي کوتاه از هم جدا شوند – هر فايل چند

کلمه با سکوت در بين کلمات) بازشناسي گفتار پيوسته کتابيCSR: Continuous Speech Recognition(

گفتار به صورت ديکته کتابي و روان) بازشناسي گفتار پيوسته محاوره ايSpontaneous Speech(

،طبيعي بيان ميشود، شامل جمًالت ناقص، سرفه، تپق kگفتار به صورت کامًالمکث هاي طوالني و ... است.

پيچيدگي بازشناسي گفتار پيوسته و في البداهه بسيار زياد است (مشکالت ناشي از اثر بافت مانند مشخص نبودن مرز کلمات متوالي و ادغام شدن

ابتداي يک کلمه با انتهاي کلمة قبلي) سيستم هاي امروزي فقط براي خواندن کتابي کاربردي هستند و تشخيص گفتار

في البداهه يکي از زمينه هاي فعال تحقيقات مي باشد.

Page 9: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 9 1388خرداد

سيستم هاي بازشناسي خودکار گفتار-پيچيدگي ها

پيچيدگي هاي مطرح در سيستم هاي بازشناسي گفتار اندازه ي واژگان

اندازة واژگان يا تعداد کلمات مورد استفاده در يک سيستم بازشناسي از فقط براي IWRعوامل موثر در دقت و سرعت سيستم است. سيستم هاي

تشخيص تعداد محدودي کلمه طراحي شده اند درحالي که بعضي ديگر از سيستم ها قادرند مجموعة بزرگي از کلمات را تشخيص دهند.

.دقت يک سيستم بازشناسي با افزايش تعداد کلمات کم مي شود � معموالچرا که در اين حالت کلمات شبيه به هم زياد شده و احتمال جايگزيني يک

کلمه با ديگري بيشتر است.

)واژگان کوچکSmall Vocabulary :(1 کلمه99 تا ) واژگان متوسطMedium Vocabulary کلمه1000 تا 100): بين ) واژگان بزرگLarge Vocabulary کلمه60000 تا 1000) : بين ) واژگان خيلي بزرگVery Large Vocabulary کلمه60000): بيشتر از

Page 10: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 10 1388خرداد

سيستم هاي بازشناسي خودکار گفتار-پيچيدگي ها

پيچيدگي هاي مطرح در سيستم هاي بازشناسي گفتار محدوديت هاي زباني

اطالعات زباني شامل دستور زبان و معنا از مهمترين اطالعات مورداستفاده در يک سيستم بازشناسي گفتار است

) مدل زبانيLanguage Model بيانگر اطالعات زباني در سيستم (بازشناسي گفتار هستند.

اطالعات معنايي به ندرت در اين سيستم ها استفاده مي شوند ولي � در تمامي سيستم هاي بازشناسي گفتار محدوديت هاي دستوري تقريبا

پيوسته مورد استفاده قرار مي گيرند. ميزان محدوديتي که توسط مدل زباني درون يک سيستم بازشناسي ايجاد

) آن مدل زباني ناميده مي شود که هرچه Perplexityمي شود، پيچيدگي (مقدار اين پيچيدگي کمتر باشد فضاي مورد جستجو کوچک تر مي شود.

تاثير اطالعات زباني در تشخيص (و درک) گفتار در سيستم هاي تشخيصگفتار امروزي تا اندازه اي است که مي توان ادعا کرد که تحقق يک سيستم

تشخيص گفتار با واژگان بزرگ (يا خيلي بزرگ) با کاربرد واقعي بدون استفاده از اطالعات زباني غير ممکن است.

Page 11: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 11 1388خرداد

سيستم هاي بازشناسي خودکار گفتار-پيچيدگي ها

پيچيدگي هاي مطرح در سيستم هايبازشناسي گفتار

کارايي در حضور نويز و در محيط هاي کاربردي مختلف کارايي سيستم هاي بازشناسي گفتار با وجود اثرات مخربي چون

� از محيط، ميکروفن، کانال نويز، پژواک، تداخل و اعوجاج که معموالانتقال و يا صداي گوينده ناشي مي شوند به شدت کاهش مي يابد.

روش هاي مختلفي جهت مقابله با نويز در سيستم هاي بازشناسيارائه شده است که مي توان آنها را در سه دسته ي ويژگي هاي مقاوم به نويز، تخمين گفتار تميز و مبتني بر اصالح مدل آکوستيکي تقسيم

کرد.

عدم حفظ کارايي سيستم در شرايط واقعي و عملي (که با نويز همراه است) يکي از بزرگترين مشکالت سيستم هاي بازشناسي

گفتار امروزي است.

Page 12: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 12 1388خرداد

سيستم هاي بازشناسي خودکار گفتار-پيچيدگي ها

پيچيدگي هاي مطرح در سيستم هاي بازشناسيگفتار

ابهام آکوستيکي و ميزان اشتباه بين کلمات کلماتي که شکل نوشتاري متمايز ولي تلفظ يکسان يا شبيه به هم

دارند ]هم آوا[ سبب ايجاد ابهام آکوستيکي شده و ممکن است بجاي يکديگر بازشناسي شوند

مثال: »سمر« و »ثمر« - »خواستن« و »خاستن« - »خويش« و»خيش« - »ارز« و »عرض« و »ارض« - و ...

]کلماتي که شکل نوشتاري آنها به يکديگر شباهت دارند ]هم نگارهدر استخراج مدل زباني دچار اشکال مي کنند

هر« - »گل« وzرد« - »مهر« و »مzه« و »نه« - »کرد« و »کzمثال: »ن»گ}ل« - ...

هر چه تعداد اين گونه کلمات در بانک واژگان بيشتر شود، دقتسيستم بازشناسي پايين تر مي آيد. براي جبران اين مسأله، سيستم بازشناسي بايد از مدل زباني در سطوح گرامر و معنا کمک گرفت.

Page 13: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 13 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- دياگرام کلي

سيستم بازشناسي گفتار با رويکرد تشخيص الگو

) داراي دو فاز آموزشTrain) و آزمون (Test( آموزش

الگوهاي مربوط به هرکالس (واحدهاي آوايي مانند کلمه، واج و ...) با استفاده از روش هايي مدل سازي مي شوند.

(استفاده) آزمون مقايسه گفتار ورودي با الگوهاي آموزش داده شده جهت

تشخيص واحدهاي آوايي موجود د رگفتار ورودي

Page 14: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 14 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- دياگرام کلي

سيستم بازشناسي گفتار با رويکرد تشخيص الگو

مدلهاي آوايي تخمين مدلهاواژگانمدلهاي زباني

دادگان گفتاري

تخمين مدلها

دادگان متني

جستجو استخراج ويژگي

دنباله کلمات

سيگنال گفتار

آموزش

آزمون

Page 15: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 15 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- تعريف اجزا

مدل سازي آوايي(کلمه، هجا، سه واجي، واج) مدل کردن واحدهاي آوايي گفتار

:روش ها) مدل انطباق زماني پوياDTW (

ساده و قديمي – مورد استفاده درVoice dialingگوشي هاي تلفن همراه

) شبکه عصبي مصنوعيANN ( ساده و کارا، سرعت تشخيص بًالدرنگ، نسبتا مقاوم به نويز، فرايند

آموزش زمان بر

) مدل مخفي مارکوفHMM (آماري گفتار موفق ترين رويکرد، مدل کردن

مدل هاي ترکيبي (ترکيب شبکه هاي عصبي وHMM (

Page 16: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 16 1388خرداد

اجزاي سيستم هاي بازشناسي خودکار گفتار- دادگان

دادگان هاي گفتاري استفاده جهت تهيه مدل هاي آوايي تنوع گويندگان و حجم دادگان مهمترين پارامترهاي

طراحي دادگان هستند. تا 200دادگان هاي کاربردي زبان انگليسي شامل حدود

گوينده هستند.300 ساعت گفتار با حدود 300 اين دادگان معموال به صورت فايل هاي صوتي با

متني معادل در سطح واج يا کلمه هستند که برچسپ در سطح واج، کلمه يا جمله نيز تقطيعگاهي داراي

هستند

Page 17: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 17 1388خرداد

اجزاي سيستم هاي بازشناسي خودکار گفتار- دادگان

دادگان هاي متني(آماري، معنايي، گرامري) استخراج اطالعات زباني

ميليون کلمه 300 تا 250حجم مناسب براي استخراج آمار معتبر = حدود ) استخراج خودکار گرامر زبان با استفاده از دادگان هاي پارس شدهtree

bank ( استخراج معنا از دادگان: دادگان هاي شبکه لغات ياword net

واژگان واژگان ياLexicon ها نيز از شامل ليست کلماتي مورد استفاده در

سيستم است در واژگان عالوه بر ليست خود کلمات، اطالعات مختلفي در مورد هر

)، نقش (هاي) N-gramکلمه مانند احتمال وقوع آن در زبان (احتمال گرامري در جمله و ... را نيز شامل مي شود. به اين گونه واژگان ها،

گفته مي شود.واژگان محاسباتي

Page 18: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 18 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- ارزيابي

پارامترهاي موثر ،تعداد کلمات موجود در واژگان سيستم

) تعداد کلمات خارج از دادگان مجموعه آزمونOOV،(

، سازگاري/عدم سازگاري داده هاي آموزش و آزمون محيط آکوستيکي آزمون و ميزان سيگنال به نويز سيگنال

گفتاروابسته/مستقل از گوينده

خطاهاي) خطاي حذفDeletion) خطاي درج ،(Insertion و خطاي (

)Substitutionجايگزيني(

Page 19: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 19 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- ارزيابي

معيارها)دقتAccuracy (

) صحتCorrectness (

) نرخ خطاي کلماتWER(

100)(

%...

All

SubInsDelAll

N

NNNNAccuracy

100)(

%..

All

SubDelAll

N

NNNsCorrectnes

100%1%...

All

SubInsDel

N

NNNAccuracyWER

تعداد کل کلمات

تعداد کلمات حذف، درج و جايگزين شده

Page 20: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 20 1388خرداد

مروري بر وضعيت تحقيقات بازشناسي گفتار

5بازشناسي گفتار از گذشته تاکنون در دهه اخير

Page 21: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 21 1388خرداد

مروري بر وضعيت تحقيقات بازشناسي گفتار

وضعيت کارايي سيستم هاي بازشناسي گفتار امروزي درکاربردهاي مختلف

WERاندازه واژگان

دادگاننوع

0.3% (صفر تا نه 11

)ohو رشته اعداد پيوسته - دادگان گفتار في البداهه

TI

RMگفتار کتابي2%1.000

ATISگفتار في البداهه2.5%2.500

NAB/WSJگفتار کتابي6.6%64.000

اخبار تلويزيوني13-17%210.000 Broadcastانتشار اخبار (News(

25-29%45.000مکالمه تلفني

محاوره ايSwitchboard

Page 22: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 22 1388خرداد

مروري بر وضعيت تحقيقات بازشناسي گفتار

مقايسه کارايي سيستم هاي بازشناسي خودکار گفتار با انسان

خطاي کامپيوتر

تا 10100

برابر بيشتر از انسان است!

Page 23: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 23 1388خرداد

مروري بر وضعيت تحقيقات بازشناسي گفتار

آينده سيستم هاي بازشناسي گفتار

Page 24: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 24 1388خرداد

مروري بر وضعيت تحقيقات بازشناسي گفتار

برخي از مراکز پژوهشي مطرح در سطح جهان در زمينه بازشناسيگفتار

واحد تحقيقات پردازش گفتار مايکروسافت گروه گفتار دانشگاهCMU گروهLTI دانشگاهCMU گروه گفتار در آزمايشگاه هوش ماشين دانشگاه کمبريج آزمايشگاهCSLU دانشگاه اورگون آزمايشگاهCSLR دانشگاه کلرادو گروهCSLP در دانشگاه جان هاپکينز گروه گفتارICSI دانشگاه برکلي آزمايشگاهSTAR در SRI آزمايشگاهSAIL) دانشگاه کاليفرنياي جنوبي USC ( گروهHLT در IBM گروهLDCو آزمايشگاه LINC از دانشگاه پنسيلوانيا گروهSLS در آزمايشگاه CSAIL دانشگاه MIT

Page 25: هادی ويسی خرداد 1388

گفتار بازشناسي و پردازش

(ASR Gooyesh Pardaz) عصر گويش پرداز

اهميت و کاربردهاي سيستم هاي بازشناسي خودکار گفتار

Page 26: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 26 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- اهميت

زبان معمولترين رسانه ارتباطي و ابزار بازنمايي جهان در ذهن انسان است

گفتار ساده ترين و رايج ترين ابزار ارتباطي انسانهااست

اولين دستاورد بازشناسي گفتار: راحت تر کردن ارتباطات بين انسان و ماشين ها

دسترسي به تکنولوژي همواره منجر به برتري مي گردد،

برتري براي تکنولوژي بازشناسي گفتار مي تواند از ابعاد مختلف فرهنگي، اجتماعي، اقتصادي، نظامي-سياسي

و علمي باشد

Page 27: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 27 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- اهميت

اهميت فرهنگي کمک به زبان و صيانت از بزرگترين ميراث فرهنگي ملت

بويژه در محيط رايانه و اينترنتاستفاده بيشتر از زبان و زنده نگه داشتن آن فراهم کردن بستر ايجاد تعامل بيشتر با زبان و کمک به

ابعاد توريستي، سياسي ، تجاري و ... راحت تر کردن ارتباط افراد با زبانهاي مختلف با زبان

مورد نظر (مترجم گفتار به گفتار)

Page 28: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 28 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- اهميت

اهميت اجتماعي ،ايجاد آسايش و سادگي بيشتر باال بردن کيفيت ارائه خدماتافزايش سرعت پاسخگويي کسب رضايت مشتريانکمک به معلولين....

مثال: سيستم گزارش راديولوژي شرکت Philips زمان ، ساعت تقليل يافته و منجر 48يک هفته اي تهيه گزارش به

به رضايت بيشتر مشتريان، افزايش سرعت پاسخگويي و شده است. صرفه جويي قابل توجه در هزينه

Page 29: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 29 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- اهميت

:اهميت اقتصادي و تجاري قابل استفاده در همه کاربردهايي که نياز به ارتباط انسان و ماشين وجود

دارد ،راحتي و سادگي بيشتر، تسريع در انجام کار ساعته 24خستگي ناپذير بودن و دسترسي عملي کردن برخي ارتباطات غير عملي.... :تسريع ارتباط در سيستم 1 مثال .IVR ثانيه،28 دقيقه به 2:55 از

کلمه در 105. سرعت ديکته گفتاري به طور متوسط حدود 2 33دقيقه، در حاليکه سرعت متوسط تايپ توسط يک فرد عادي حدود

کلمه در دقيقه استبازدهي اقتصادي و کاهش هزينه

عالوه بر سازمان ها و جاهاي دولتي، شرکت هاي بزرگي چونNuance، IBM فيليپس، مايکروسافت و ... نيز جزو سرمايه گزاران اين تکنولوژي ،

چراکه به آينده اقتصادي آن مطمئن هستند.هستند،

Page 30: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 30 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- اهميت

مثال: سيستمIVR مبتني بر گفتار و سيستم IVR کًالسيک

Page 31: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 31 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- کاربردها

تايپ گفتاري و سيستم ديکته ،( ... نامه، گزارش و) تايپ متن ،مکتوب کردن گفتار جلسات و سخنرانيها تبديل اخبار به متن معادل و ... هر جايي که نياز به تايپ نوعي متون وجود داشته

باشد.

،قابل استفاده براي همه کاربران رايانه: مديرانپزشکان، وکال، تايپيست ها، مسئولين دفتر و منشي ها

و ...

Page 32: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 32 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- کاربردها

کاربرد درسيستم هاي تلفني منشي هاي تلفني (جهت متصل نمودن تماس گيرنده با يک فرد يا يک

بخش با بيان گفتار نام فرد يا بخش)، ،اپراتور خودکار تلفنيسيستم هايIVR ، سيستم هاي ارتباط با مشتري وCRM ، ،سيستم هاي تلفن بانک ،سيستم هاي اطالع رساني تلفني ،دايرکتوريهاي گوياي تلفني ،فرمهاي تلفني و نظر سنجي هاي تلفني ،رزرواسيون تلفني ،دايرکتوريهاي تلفني با بيان نام فرد يا موسسه . . .تعيين هويت و شناسايي کاربران

سيستم هاي

ديالوگ

Page 33: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 33 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- کاربردها

مزايا کاهش زمانصرفه جويي در هزينهتسهيل و تسريع ارتباط مشتريان امنيت باالتر نسبت به کليد و دکمه هاي تلفن

Page 34: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 34 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- کاربردها

تحقيق شرکتFluency Voice بر سيستم هاي تلفني بانکها

70%ترجيح مي دهند با اپراتور انساني کار کنند 21% اپراتور خودکار مبتني بر گفتار ترجيح مي دهند با

کار کنند9% ترجيح مي دهند با سيستم touch-toneکار کنند

برابر سريع تر از 40 تراکنش تلفني با گفتار touch-toneاست

علت: حذف منوها و راهنمايي هاي مرتبط

Page 35: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 35 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- کاربردها

سيستم هاي تلفني بانکي مبتني بر گفتارColumbia Bank

  سيستمColumbia OnCall 0050-304-800-1, 0050-305-253 شماره تماس

Standard Life Bank (UK)توسط Fluency Voice Technology 56% تعيين هويت ها با سيستم گفتاري90 تماس ها و %

ABN Amro کشور60 شعبه در 3500 بانک بزرگ دنيا با 20يکي از در آمريکا با نام LaSalle Bank

Page 36: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 36 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- کاربردها

تشخيص فرامين و دستورات صوتي اجراي برنامه هاي رايانه با گفتن نام آنها، کنترل لوازم خانگي با

دستورات صوتياتوماسيون اداري و خانگي مثال در ساختمانهاي هوشمندفرمان دادن به ربات هافرمان هاي صوتي در خودرو کنترل برنامه هاي کامپيوتري مثلofficeفرمهاي گويا براي ورود اطالعات با فرامين صوتي(متصل، پيوسته) تشخيص اعداد) ورود اطالعاتdata entry( کيوسک هاي اطالعاتدستگاههاي خود پرداز بانک ها ... و

Page 37: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 37 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- کاربردها

کاربردهاي مربوط به معلولين، ناشنوايان و نابينايان

معلولين حرکتي و نابينايان با ماشينها و رايانه ارتباط برقراريها

فراهم کردن امکان استفاده از سيستم هاي موجود توسط معلولين و نابينايان (مانند سيستم هاي تلفني خودکار)

استفاده در سيستم هاي تبديل گفتار به حرکات ايما و اشاره جهت ارتباط با ناشنوايان

معلولين، ناشنوايان و نابينايان معموال توانايي گويايي دارند، از اين حس ميتوانند

براي جبران فقدان حس هاي ديگر کمک بگيرند.

Page 38: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 38 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- کاربردها

کاربردهايي ترکيبي ترجمه گفتار به گفتار سيستم هاي اتوماسيون اداري وPaper less سيستم هاي ديالوگ و رابط ها گفتاري انسان و ماشين

)HMI(تشخيص درستي تلفظ براي سيستم هاي آموزش زبان استفاده در بازي هاي کامپيوتري جهت افزايش

قابليت هاي و جذابيت هاي آنها

/p2.aspx Praselator

Page 39: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 39 1388خرداد

سيستم هاي بازشناسي خودکار گفتار- کاربردها

ساير موارد تشخيص گفتار بر روي کامپيوترهاي جيبي، تلفن همراه و

به عنوان رابط کاربر و ورود Hands-freeساير وسايل اطالعات

) جستجوگر واژه هاي كليدي در گفتارWord Spotting( کاربردهاي تحت وب مانندVoiceXML تصديق و/يا تشخيص هويت گوينده براي کاربردهاي

امنيتي ...

Page 40: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 40 1388خرداد

مروري بر وضعيت کاربردي بازشناسي گفتار

مهمترين شرکت هاي مطرح جهاني دربازشناسي گفتار

Nuance همان) ScanSoft(Philips IBM Microsoft BBN Loquendo LumenVox

Page 41: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 41 1388خرداد

مروري بر وضعيت کاربردي بازشناسي گفتار

( مثال : سيستم ديکته مخصوص پزشکانNuance)روش کالسيک

هزينه تخميني زمان صرف شده توسط پزشک جهت تهيه اسناد وگزارش بيماران

دالر18.000براي هر پزشک به طور متوسط در هر سال

زمان آماده شدن گزارش (نوشتن گزارش توسط پزشک، تايپ آنتوسط منشي، تصحيح توسط پزشک و تايپ اصالحات)

ساعت 48حداقل

9روش جديد: استفاده از سيستم دراگون (نسخه ( دالر 1.039 تا 899هزينه فوق = بين زمان آماده شدن گزارش = تقريبا همزمان با بيان گفتار و در زمان

ساعت)12گزارش گيري (حداکثر

80صرفه جويي در زمان و کاهش هزينه به ميزان %

Page 42: هادی ويسی خرداد 1388

گفتار بازشناسي و پردازش

(ASR Gooyesh Pardaz) عصر گويش پرداز

بازشناسي خودکار گفتار زبان فارسي

Page 43: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 43 1388خرداد

...معرفي شرکت

)شركت عصرگويش پرداز )سهامي خاص :1384، ثبت : مرداد 1381شروع فعاليت ايراني فعال در زمينه پردازش و تشخيص گفتار اولين و تنها شركت هدف: طراحي و توسعه نرم افزارها و سخت افزارهاي مبتني بر

گفتار (به ويژه براي زبان فارسي)

:زمينه هاي تخصصي پردازش سيگنال (تبديل گفتار به متن) تشخيص گفتار(تبديل متن به گفتار) سنتز گفتارطراحي دادگان هاي گفتاريپردازش زبان طبيعي بهبود كيفيت گفتار

Page 44: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 44 1388خرداد

...معرفي شرکت

سيستم هاي مبتني بر گفتار در انحصاريارائه دهنده فارسي

برخي از محصوالتنويسا؛ نرم افزار ديكتة گفتاري براي زبان فارسينيوشا؛ تشخيص گفتار تلفني

منـشي خودکار تلفنـي مبتني بر گفتار ، تشخيص اعداد و فرامين صوتي از تلفنـي مبتني بر گفتار IVRپشت تلفن، سيستم هاي

جستجوگر واژه هاي كليدي در گفتارپارسيا؛ متـرجم صـوتي گفتار به گفتارنويسيار؛ تايپ هوشمند فارسي ،تشخيص گفتار در كامپيوترهاي كوچك (تلفن همراهPDA( ...و

پارسيا جيبي(مترجم صوتي-نسخه کامپيوتر هاي جيبي) و اجرا کننده صوتيبرنامه ها

Page 45: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 45 1388خرداد

سيستم تشخيص گفتار فارسي نويسا

نويسا موتور تشخيص گفتار پيوسته مستقل از گوينده با واژگان بزرگ زبان

فارسي توسط شرکت عصر گويش پرداز

:مشخصات مبتني برHMM ،با مدل سازي واج و سه واجي استفاده از رايج ترين ايده هاي مقاوم سازي و تطبيق گويندهاستفاده روشهاي مدل هاي زباني آماري و گرامري قابليت استخراج محصوالت مختلف

نويسا: نرم افزار تايپ گفتارينيوشا: تشخيص گفتار تلفنيجستجوي کلمات کليدي در گفتار تشخيص فرامين و دستورات صوتي

Page 46: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 46 1388خرداد

سيستم تشخيص گفتار فارسي نويسا

نويسا: نرم افزار تايپ گفتاري فارسي با خواندن متن آنرا تايپ نماييد

Page 47: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 47 1388خرداد

سيستم تشخيص گفتار فارسي نويسا

)قابليت هاي نويسا )تايپ گفتاري فارسي 95دقت تشخيص بسيار باال (حدود(%

تايپ سريع متون همزمان با صحبت گوينده

امكان نوشتن در همه محيط هاي تايپ ،نر م افزارهاي اتوماسيونWord... محيط هاي تهيه ايميل و ،

قابليت تايپ عالئم نگارشي مانند نقطه، عالمت سوال و ... با گفتار

قابليت تايپ اعداد به صورت عددي يا حروفي

ايجاد پروفايل شخصي براي هر گوينده

قابليت آموزش به صداي کاربران و يادگيري لهجه و لحن بيان گوينده

هزار کلمه)21شامل تمامي لغات پركاربرد زبان فارسي (حدود

امكان افزودن كلمه جديد به واژگان كاربر در نرم افزار

قابليت تطبيق به انشاي کاربر توسط تيم پشتيباني شركت عصرگويش پرداز

ک نسخه و ت ت

ب به صورل نص

قاب

تحت شبکه

Page 48: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 48 1388خرداد

سيستم تشخيص گفتار فارسي نويسا

)مزاياي نويسا )تايپ گفتاري فارسي افزايش سرعت تايپ و ورود اطالعات

کلمه در دقيقه،105ديکته گفتاري= به طور متوسط حدود کلمه در دقيقه33سرعت متوسط تايپ توسط يک فرد عادي= حدود

صرفه جويي در زمانکاهش هزينه هاحفظ امنيت اطالعات در هنگام ورود داده ها امالييجلوگيري از اشتباهات

Page 49: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 49 1388خرداد

سيستم تشخيص گفتار فارسي نويسا

:کاربردهاي نويسا:تايپ هرگونه متوني که مستلزم تايپ با صفحه کليد هستند

نامه هاي اداري يا شخصيپاراف نامه هاتايپ گزارش(... يادداشت ها، وبالگ ها، مقاالت و) تايپ متون شخصي

. . . و

Page 50: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 50 1388خرداد

سيستم تشخيص گفتار فارسي نويسا

برخي از مشتريان نويسا(تجارت, ملت, پارسيان, سامان, سرمايه)بانک ها (بخش انفورماتيک) مجلس شوراي اسالمي ايرانسازمان زندان هاي کل کشورسازمان توسعه تجارت ايرانسازمان نظام پرستاريسازمان بازرسي کشور(ستاد تحول اقتصادي) سازمان صنايع و معادن سازمان جهاد کشاورزي(مرکز تحقيقات, دانشکده) سازمان صدا و سيماي جمهوري اسالمي ايرانوزارت دفاعستاد مشترک سپاه پاسداران انقالب اسالمي نيروی زميني ارتشقرارگاه خاتم االنبياءبنياد تعاون ناجانيروي مقاومت بسيج شرکت (ملي پااليش و پخش فرآورده هاي نفتي، فوالد مبارکه، بيمه البرز، نفت فالت قاره

و ...) دانشگاه (صنعتي شريف، مالک اشتر، امام حسين(ع)، دانشگاه آزاد اسالمي (واحد يزد, قايم

شهر)) (آبادان، پااليشگاه تهران) پااليشگاه 000و

Page 51: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 51 1388خرداد

محصوالت مبتني بر بازشناسي گفتار فارسي

تين تکست: نسخه پزشکي نويساتهيه گزارش هاي پزشکان به صورت گفتاري

راديولوژي CT MRI...

Page 52: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 52 1388خرداد

محصوالت مبتني بر بازشناسي گفتار فارسي

جستجوگر کلمات کليدي در گفتار:کاربردها

استخراج و طبقه بندي اطالعات گفتاري شنود و رديابي مکالمه هاي تلفني

Page 53: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 53 1388خرداد

محصوالت مبتني بر بازشناسي گفتار فارسي

نيوشا: بازشناسي گفتار تلفني:کاربردها

منشي خودکار تلفني مبتني بر گفتارتشخيص اعداد و فرامين صوتي از پشت تلفن تلفن گوياي اطالع رساني سازمان ها با قابليت

تشخيص گفتار

Page 54: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 54 1388خرداد

محصوالت مبتني بر بازشناسي گفتار فارسي

نيوشا: بازشناسي گفتار تلفني سيستمIVR تلفني مبتني بر گفتار براي بانک ها

Page 55: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 55 1388خرداد

محصوالت مبتني بر بازشناسي گفتار فارسي

نيوشا: بازشناسي گفتار تلفني پزشک تلفني: تلفن گوياي بهداشت و قرآن با قابليت

تشخيص گفتار

Page 56: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 56 1388خرداد

محصوالت مبتني بر بازشناسي گفتار فارسي

بازشناسي گفتار رويPDAپارسيا-جيبي: مترجم گفتار به گفتار

Page 57: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 57 1388خرداد

محصوالت مبتني بر بازشناسي گفتار فارسي

تشخيص فرامين صوتي:کاربردها

اجراکننده صوتي برنامه هااتوماسيون خانگي و صنعتي با به كارگيري تشخيص گفتار سيستم صوتي قرآنزبان گوياي فارسي براي نرم افزارهاي آفيس آموزش و بازي مبتني بر تشخيص گفتار براي کودکان

Page 58: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 58 1388خرداد

محصوالت مبتني بر بازشناسي گفتار فارسي

فرم هاي شنواپر کردن فرم هاي کامپيوتري به صورت گفتاري

Page 59: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 59 1388خرداد

محصوالت مبتني بر بازشناسي گفتار فارسي

پارسيا: مترجم گفتار به گفتاربه انگليسي ترجمه جمالت و عبارات رايج مکالمات روزمره فارسي

و عربي

Page 60: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 60 1388خرداد

محصوالت مبتني بر بازشناسي گفتار فارسي

نويسيار: تايپ هوشمند فارسيپيش بيني کلمات بعدي بصورت هوشمند در هنگام تايپ

Page 61: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 61 1388خرداد

محصوالت مبتني بر بازشناسي گفتار فارسي

( قابليت هاي نويسيار)تايپ هوشمند فارسي تايپ سريع و آسان از طريق پيش بيني کلمات بعدي بصورت

هوشمند جلوگيري از اشتباهات تايپي و اماليي تکميل خودکار کلمات در حين تايپ متناسب با محتواي متن بکارگيري اطالعات دستوري و آماري زبان فارسي سازگار باNotepad، M.S. Word™ و M.S. Outlook™ سازگار باM.S. Office 2000,XP, 2003, 2007

Page 62: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 62 1388خرداد

منابع

کتاب ها1. S. Young, et. al., the HTKBook Version 3.2,

http://htk.eng.cam.ac.uk/, 2002.

2. X.D. Huang, A. Acero, and H. Hon, Spoken language processing , Prentice Hall, 2000.

3. Daniel Jurafsky, James H. Martin, SPEECH and LANGUAGE PROCESSING: An Introduction to Natural Language Processing, Computational Linguistics, and

Speech Recognition, Prentice-Hall, 2000.

4. Chris Manning, Hinrich Schütze, Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, May 1999.

5. E.A. Wan, A.T. Nelson, Handbook of Neural Networks for Speech Processing , Boston, USA, 1998.

6. L. Rabiner, B.H. Juang, Fundamentals of Speech Recognition , Prentice Hall, 1993.

7. J.R. Deller, J.G. Proakis & J.H.L. Hansen, Discrete-Time Processing of Speech Signals , Macmillan Publishing Company, 1993.

Page 63: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 63 1388خرداد

منابع

پايان نامه ها و مقاالت1. Lawrence Rabiner, Challenges in Speech in Speech Recognition and Natural

Recognition and Natural Language Processing Language Processing, Lecture, SPECOM'2006, June 25th, 2006.

2. Barker, J., Coy, A., Ma, N., Cooke, M., Recent advances in speech fragment decoding techniques. In: Proc. Interspeech, pp. 85–88, 2006.

1. B.-H. Juang and L. R. Rabiner, Automatic speech recognition - A brief history of the technology development, K. Brown (Ed.) Encyclopedia of Language and Linguistics, Elsevier, 2005

2. Sadaoki Furui, 50 Years of Progress in Speech and Speaker Recognition Research, ECTI TRANSACTIONS ON COMPUTER AND INFORMATION TECHNOLOGY VOL.1, NO.2 NOVEMBER 2005.

3. S. Furui, Recent progress in corpus-based spontaneous speech recognition, IEICE Trans. Inf. & Syst., E88-D, 3, pp. 366-375, 2005

4. S. Furui, Speech-to-text and speech-to-speech summarization of spontaneous speech, IEEE Trans. Speech & Audio Processing, 12, 4, pp. 401- 408, 2004

5. L. R. Rabiner and B. H. Juang, Statistical Methods for the Recognition and Understanding of Speech, Encyclopedia of Language and Linguistics, 2004.

6. S. Katagiri, Speech pattern recognition using neural networks, W. Chou and B.-H. Juang (Eds.) Pattern Recognition in Speech and Language Processing, CRC Press, pp. 115-147, 2003.

Page 64: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 64 1388خرداد

منابع

پايان نامه ها و مقاالت1. L. R. Rabiner and B. H. Juang, Statistical Methods for the Recognition and

Understanding of Speech, Encyclopedia of Language and Linguistics, 2004.

2. S. Katagiri, Speech pattern recognition using neural networks, W. Chou and B.-H. Juang (Eds.) Pattern Recognition in Speech and Language Processing, CRC Press, pp. 115-147, 2003.

3. Seltzer, M. L., Microphone Array Processing for Robust Speech Recognition , PhD Thesis, Carnegie Mellon University, Pittsburgh, PA, USA, 2003.

4. DUSAN, S., and FLANAGAN, J., Adaptive Dialog Based upon Multimodal Language Acquisition, The Fourth IEEE International Conference on Multimodal Interfaces, Pittsburgh, PA, USA, pp. 135-140, 2002.

5. H. G. Hirsch, D. Pearce, The AURORA Experimental Framework for the Performance Evaluations of Speech Recognition Systems under Noisy Conditions , ISCA ITRW ASR2000, Paris, September 2000.

6. Bazzi, I, Modeling Out-of-Vocabulary words for Robust Speech Recognition, PhD Thesis, MIT, 2000.

7. Martin S., Liemann J., Ney H., Algorithms for Bi-gram and Tri-gram Word Clustering , Speech Communication 24, 1998.

8. R. P. Lippmann, Speech recognition by machines and humans, Speech Communication, 22,pp. 1-15, 1997.

Page 65: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 65 1388خرداد

منابع

پايان نامه ها و مقاالت

1. P.J. Moreno, Speech Recognition in Noisy Environments , Ph.D. thesis, Camegie Mellon University, Pittsburgh, Pennsylvania 15213, April 1996.

2. M.J.F. Gales, P.C. Woodland, Mean and Variance Adaptation within the MLLR Framework , Computer Speech & Language, Vol. 10, PP.249-264, 1996.

3. M. K. Ravishankar, Efficient Algorithms for Speech Recognition , PhD thesis, Carnegie Mellon University, 1996.

4. M.J.F. Gales, Model-Based Techniques for Noise Robust Speech Recognition , Ph.D. thesis, University of Cambridge, September 1995.

5. Brown P.F., Della Pietra V.J., deSouza P.V., Lai J.C., Mercer R. L., Class-Based n-gram Models of Natural Language, Computational Linguistics, Vol. 18, No. 4, pp. 467-479, 1992.

6. C. H. Lee, et. al., Acoustic modeling for large vocabulary speech recognition, Computer Speech and Language, 4, pp. 127-165, 1990.

7. A. Acero, Acoustical and Environmental Robustness in Automatic Speech Recognition , Ph.D. thesis, Camegie Mellon University, Pittsburgh, Pennsylvania, September 1990.

Page 66: هادی ويسی خرداد 1388

در صنعت بانکداريبازشناسی گفتار )فارسي(

-www.asr-www.asr عصر گويش پرداز عصر گويش پرداز gooyesh.comgooyesh.com

66از 66 1388خرداد

تماس با عصر گويش پرداز

آدرس و تلفن :13445- 1516 تهران - صندوق پستي :021 (66003710 تلفکس(

وب سايت و پست الکترونيکي www.asr-gooyesh.com [email protected]