PRKernel

Доставчик на новини в реално време в България, който информира своите читатели за последните български новини, събития, информация, пътувания, България.

Speechmatics, компания за разпознаване на реч, която побеждава технологичните гиганти в намаляването на пристрастията

Млада жена, използваща софтуер за разпознаване на глас на смартфон.

Луис Алварес | Digital Vision | Getty Images

ЛОНДОН – Британска компания за разпознаване на реч твърди, че нейният софтуер е превъзхождал големи технологични компании като google браузър И Amazon В разбирането на черни гласове.

Speechmatics, базирана в Кеймбридж, Англия, заяви във вторник, че нейната система има общ процент на точност от 83% за афроамериканските гласове.

Това е по-високо от Microsoft (73%), Amazon (69%), Google (69%), IBM (62%) и Ябълка (55%) според Изследвания публикуван от Станфордския университет през 2020 г., който сравнява резултатите на големите технологични компании за това колко точно техният софтуер за разпознаване на реч разбира афроамериканците.

Системите на Amazon, IBM, Google, Microsoft и Apple са допуснали почти два пъти повече грешки при тълкуването на думите, произнесени от афроамериканци, отколкото белите, според изследователи от Станфордския университет.

Speechmatics казва, че нейната система разпознава погрешно думите, взети от черни гласове в 17% от времето, срещу 31% за Google и Amazon.

„От решаващо значение е да се проучи и подобри справедливостта в системите за преобразуване на говор в текст поради потенциала за различни вреди за хората чрез сектори надолу по веригата, вариращи от здравеопазване до наказателно правосъдие“, каза Алисън Кьоницки, водещ автор на проучването в Станфорд.

Предубеждения в изкуствения интелект

Технологията за разпознаване на глас се превърна в неразделна част от ежедневието, благодарение на разпространението на виртуални асистенти на смарт устройства като телефони и високоговорители.

Apple е пионер в използването на гласово активиран софтуер на мобилни устройства със своя дигитален асистент Siri, докато Amazon беше един от първите, който въведе разпознаване на говор в дома със своите високоговорители Echo и Alexa асистент.

Изследователите стават все по-загрижени за пристрастията в алгоритмите, които поддържат тези услуги за разпознаване на реч. По-конкретно, експертите казват, че много софтуери за разпознаване на глас се обучават върху ограничен набор от данни, което ги прави по-малко ефективни.

Докато приложенията за разпознаване на говор нямат много трудности при транскрибирането, белият мъж, водещ на новини от Източното крайбрежие „няма същото ниво на точност“ с недостатъчно представени гласове, според Уил Уилямс, вицепрезидент по машинно обучение на Speechmatics.

„Както при всички тези неща, става въпрос за качеството на данните в наборите за обучение“, каза Стефани Хеър, изследовател по етика на ИИ, пред CNBC. „Има расови пристрастия, пристрастия към пола и регионални диалектни пристрастия в технологията за разпознаване на говор от дълго време.“

„Тази технология не работи по един и същи начин за всички“, добави Харе. „Може, в крайна сметка, с усъвършенстване.“

Некатегоризирани данни

Speechmatics казва, че е обучила своя AI с анонимни данни от социални медии и подкасти, за да му помогне да научи различни аспекти на речта, включително акцент, език и интонация.

„Можем да го сучим почти по същия начин, по който суче бебето“, каза Уилямс пред CNBC.

Компанията заяви, че нейната технология е обучена за 1,1 милиона часа звук.

Speechmatics нарече разработката „пробив“ и заяви, че се надява други технологични компании да станат по-прозрачни относно усилията за намаляване на пристрастията в AI.

„Би било добре хората да използват тестови пакети с отворен код, които ви позволяват да оцените колко добре се справяте в тази област“, ​​каза Уилямс. Част от проблема е маскирането на напредъка в определени демографски данни.“

Технологичните гиганти също са били Увеличете инвестициите си в разпознаване на реч Наскоро с Microsoft се съгласи да придобие софтуерна компания Nuance Communications за 16 милиарда долара през април.