طبقه بندی صدا در محیط مبتنی بر شبکه عصبی عمیق و اجرای آن در برنامه سمعک

به طور کلی ، برنامه سمعک برای افرادی که ناتوانی جزئی یا کامل شنیدن دارند ، بسیار مفید است. در حال حاضر برای طبقه بندی صداهای مختلف محیطی ، هیچ برنامه خاصی در برنامه سمعک وجود ندارد. در این مقاله الگوریتمی برای طبقه بندی صدای محیط بر اساس بلوک های صوتی سوار شده با استفاده از شبکه های عصبی عمیق (SAB – DNN) و همچنین اجرای آن در برنامه سمعک ارائه شده است. این سیستم می تواند پنج نوع زمینه مختلف صدا را بطور خودکار تشخیص دهد: اتوبوس ، مترو ، خیابان ، سرپوشیده ، ماشین. در این سیستم ، ۵۱۲ نقطه نمونه برداری به عنوان یک قاب صوتی گرفته می شود و چندین فریم صوتی در بلوک صوتی (AB) جمع می شوند. هنگامی که ۷ فریم صوتی در بلوک صوتی (AB) جمع می شوند ، میزان دقت طبقه بندی محیط صوتی با استفاده از (AB – DNN) بهترین (تمایل به ۹۶٫۱۸٪) است. بر این اساس ، آزمایش چندین بلوک صوتی (AB) را در یک واحد صوتی بنام Superimposed Audio Blocks (SAB) ادغام کرده و آن را با استفاده از DNN طبقه بندی می کند. بهینه ، ۳۰ بلوک صوتی در SAB ادغام می شوند که منجر به دقت طبقه بندی تا ۹۸٫۸٪ می شود. تا آنجا که می دانیم ، این اولین بار است که در برنامه سمعک برای پیاده سازی سیستم طبقه بندی مبتنی بر شبکه عصبی Deep Neural (DNN) بهبود یافته و ترکیب فریم و بلوک های چند صوتی استفاده می شود.

رفتن به محتوا