Изначально команда UCLA разрабатывала программу в помощь слабослышащим родителям, которая могла бы различать плач ребенка на общем фоне и подавать сигнал. Приложение получило название Chatterbaby и в ходе его тестирования стало очевидно, что все младенческие звуки можно отнести к трем категориям: голод, боль и скука. Опытная мама может по интонации понять, чего хочет малыш, но как насчет создать для этого программный алгоритм?
Задача оказалась и проще, и сложнее, чем думалось. Поскольку младенец действует рефлекторно, болевые ощущения заставляют его кричать непрерывно, тогда как при обычной суете между звуками есть отчетливые периоды паузы. У требований еды свой акустический окрас и после изучения 2000 образцов программа научилась распознавать три вида воплей с точностью до 90 %. Вопрос лишь в изначальной калибровке системы.
Генотип, точный возраст, климат, окружение и прочие факторы достаточно сильно влияют на голос младенца, поэтому в UCLA решили собрать базу данных с образцами криков как можно большего количества детей. Пользователям Chatterbaby предлагается записывать и присылать голоса их отпрысков, но информация не будет персонифицирована. Это просто технические данные, тесты для отладки системы и оптимизации алгоритмов.
Но у такого банка младенческих голосов может быть и более широкое применение — например, раннее распознавание аутизма. У пожилых людей с этой проблемой голос ощутимо меняется – может, после анализа тысяч записей, удастся вывести такие закономерности и для малышей? Для этого родителей просят пойти исследователям навстречу и присылать короткие, по 5 секунд, записи голосов их детишек, плюс регулярно проходить комплексные обследования, чтобы можно было сопоставлять данные и вести наблюдения.Источник — UCLA
Источник: