محققان از هوش مصنوعی متصل به هدفون‌های موجود در بازار استفاده کردند تا سیستمی بسازند که تنها با نگاه کردن به یک فرد خاص، صدای گوینده را از میان صدای یک جمعیت شلوغ جدا می‌کند.

به گزارش ایسنا، شنیدن صحبت‌های یک نفر در فضای شلوغ و پر سر و صدایی که افراد زیادی در آن صحبت می‌کنند، دشوار است. این امر به ویژه برای افرادی که کم شنوایی دارند، صادق است. در حالی که سمعک‌های مدرن از فناوری حذف نویز استفاده می‌کنند، نمی‌توانند صدای پس زمینه را به طور کامل حذف کنند.

به نقل از نیواطلس، محققان دانشگاه واشنگتن (UW) راه حلی برای شنیدن بهتر صدا در محیط‌های پر سر و صدا ابداع کرده‌اند. آنها با استفاده از هدفون‌های کاهش‌دهنده نویز معمولی مجهز به هوش مصنوعی، سیستمی را توسعه دادند که می‌تواند صدای گوینده را فقط با یک بار نگاه کردن به آن تشخیص دهد.

شیام گولاکوتا (Shyam Gollakota)، استاد دانشکده علوم و مهندسی کامپیوتر پل جی آلن و نویسنده ارشد این مطالعه، می‌گوید: ما در حال حاضر هوش مصنوعی را به عنوان چت‌بات مبتنی بر وب در نظر می‌گیریم که به سؤالات پاسخ می‌دهند. اما در این پروژه، ما هوش مصنوعی را توسعه می‌دهیم تا درک شنیداری هر کسی که از هدفون استفاده می‌کند را با توجه به اولویت‌هایش اصلاح کند. با دستگاه‌های ما اکنون می‌توانید یک صدا را واضح بشنوید، حتی اگر در یک محیط پر سر و صدا با افراد زیادی در حال صحبت باشید.

سیستم «شنوایی گفتار هدف» که توسط محققان ایجاد شده است، ساده اما مؤثر است. هدفون‌های موجود در بازار دارای دو میکروفون، یکی در هر بخش هدفون هستند. کاربر برای استفاده از این قابلیت باید در حالی که به فردی که می‌خواهد صدای آن را بشنود نگاه می‌کند، یک دکمه در کنار هدفون را یک بار، به مدت سه تا پنج ثانیه فشار دهد. امواج صوتی از صدای آن گوینده به طور همزمان به هر دو میکروفون می‌رسد و به یک رایانه داخلی فرستاده می‌شود، جایی که نرم‌افزار یادگیری ماشینی الگوهای صوتی گوینده را یاد می‌گیرد. البته یک حاشیه خطای ۱۶ درجه‌ای نیز وجود دارد. سپس صدای گوینده جدا شده و از طریق هدفون هدایت می‌شود و حتی زمانی که آنها در اطراف حرکت می‌کنند، نویزهای اضافی فیلتر می‌شوند.

انتهای پیام

source

توسط artmisblog.ir