favorites basket
user
Наука10 юни 2024

Изкуствен интелект превежда кучешки лай

С помощта на ИИ учени учени разграничат игривите от агресивните звуци

снимка: iStock
снимка: iStock
С помощта на ИИ учени успяха да анализират кучешки лай и да разграничат игривите от агресивните звуци. Изследователите определиха по лая възрастта, породата и пола на кучетата. 

Разработените от изследователи от Мичиганския университет модели, освен че определят дали лаят на кучето изразява игривост или агресия, събират и информация за възраст, порода и пол на животното. Екипът, в сътрудничество с Института на Мексиканския национален институт по астрофизика, оптика и електроника (INAOE) в Пуебла, твърди, че моделите на ИИ, първоначално обучени на човешка реч, могат да бъдат използвани като отправна точка за обучение на нови системи, насочени към общуването на животните. Резултатите бяха представени на Съвместната международна конференция по компютърна лингвистика, езикови ресурси и оценка. 
„Има толкова много неща, които все още не знаем за животните, споделящи този свят с нас. Напредъкът в изкуствения интелект може да се използва за революция в разбирането ни за общуването с животните и нашите открития показват, че може да не се наложи да започваме от нулата“, казват учените.
Една от преобладаващите пречки пред разработването на AI модели, които могат да анализират вокализациите на животните, е липсата на публично достъпни данни. Въпреки че има много ресурси и възможности за запис на човешка реч, събирането на такива данни от животни е по-трудно. „Вокализацията на животните е логистично много по-трудна за търсене и записване“, каза Артьом Абзалиев, водещ автор и докторант по компютърни науки и инженерство. „Те трябва да бъдат  записани в дивата природа или ако са домашни любимци – с разрешението на собствениците.“

Изследователите записали как лаят 74 кучета от различни породи, възраст и пол, в различни ситуации. С базата данни бил модифициран модел на машинно обучение – вид компютърен алгоритъм, който идентифицира модели в големи масиви от данни. Екипът избрал модел за представяне на речта, наречен Wav2Vec2, който първоначално бил обучен върху данни за човешка реч.

Авторите на този проект твърдят, че Wav2Vec2 не само е успял в четирите задачи за класификация. Той превъзхождал други модели, обучени специално върху данни за кучешки лай, с точност до 70%. 

Разбирането на нюансите на вокализациите на кучетата може значително да подобри начина, по който хората разбират и реагират на емоционалните и физически нужди на домашните любимци. Така ще можем да се грижим по-добре за четирикраките си приятели и  да предотвратяваме възможно опасни ситуации, казаха изследователите.

Източник
ПОДКРЕПИ НИ

Още по темата:

Абонирай се за нашия бюлетин

Не забравяй да се абонираш за нашия бюлетин, който ще те уведомява за активни промоции, нови продукти и случващото се при нас.