صبحانه پرس: مایکروسافت میگوید فناوری تشخیص صدای خود را تا بدان حد ارتقا داده که میتواند به همان خوبی بشر جملات انسانها را درک کرده و تشخیص دهد.
مهندسان مایکروسافت که در حوزه هوش مصنوعی فعال هستند مدعی شدهاند که نرخ اشتباه سیستم تشخیص صدای ساخته شده توسط این شرکت به ۵.۹ درصد کاهش یافته که تقریبا برابر با توانایی انسان برای درک اصوات دیگر انسانهاست.
Xuedong Huang مدیر واحد طراح این سیستم میگوید بعد از دهه ها آزمایش و بررسی دستیار صوتی مایکروسافت به حدی از بلوغ رسیده که به خوبی میتواند گفتهها انسانها را درک کند و این موفقیت تاثیر شگرفی بر کارکرد محصولاتی همچون دستیار صوتی کورتانا، ایکسباکس، ویندوز و غیره خواهد گذاشت.
محققان برای رسیدن به چنین حدی از موفقیت از شبکههای عصبی دارای قابلیت خودآموزی استفاده کرده و حجم زیادی از دادهها را بر روی انها ذخیره کردهاند تا بتوانند به آموزش آنها کمک کنند. از این طریق الگوهای بهتری برای درک اظهارات انسانها ابداع شده است. بدین منظور علاوه بر صدا، تصاویری هم برای تعلیم این شبکههای عصبی و ارتقای کارآیی آنها به کار گرفته شده است.
مایکروسافت امیدوار است در آینده دقت این شبکههای عصبی باز هم افزایش یابد و آنها در زمینه درک صدای انسان در محیط های شلوغی مانند رستورانها، خیابانهای پرترافیک و حتی در زمان وزش بادهای تند هم موفق باشند. سیستمهای یادشده در آینده نه تنها قادر به تشخیص درست اصوات انسانها هستند، بلکه میتوانند آنها را درک کنند.