Искусственный интеллект от Google распознает отдельный голос в толпе
Опубликованно 04.05.2018 00:40
Разработка Google-это шаг вперед в анализе голосовых данных, что поможет с ограниченными физическими возможностями слуха и повышения эффективности служб Google. Об этом пишет Engadget.
Распознавать голос человека, даже в присутствии помехи, легко — проблема в том, чтобы определить его владельца. Разработчики из Google просто указал на микрофон видеокамеры с алгоритмом, который реагирует на мимику человека. Система сопоставляет движения на лице, кто говорит, "читать по губам" и параллельно анализирует звук. Если результаты совпадают — хорошо, АЙОВА отклонил этого персонажа, и может только смотреть, как его речь на фоне общей какофонии звуков.
Нейронная сеть, прежде обученный цен на технику чтения по губам, так что они научили различать людей, которые говорят только смеяться, распознавать мимику во время разговора, даже если лицо частично скрыто бородой или микрофон. Так что в систему добавлен механизм сортировки — когда динамик вычислить данные поступают в акустический профиль. Благодаря этому искусственный интеллект не в состоянии различать слова разных людей, даже если те специально пытается запутать и говорят или поют в унисон.
Понять разговор человека, в частности — хорошее дело, не только для уровня. Например, вы можете с большой точностью перенести на слуховой аппарат, слова собеседника с ограниченными физическими возможностями, скрининг других голосов, как шум. Или расширить функции видеозвонка, как тусовки и Дуэт. Кроме того, это новые возможности для систем голосового управления, и взломать защиту, голоса только с помощью ложного акустической регистрации, теперь можете.
Инженеры компании пока не понимают, как можно использовать новую технологию. Издание отмечает, что область применения такой системы гораздо шире — начиная от группы видео-чат, запись голоса, а также взаимодействие со слуховым аппаратом.
Категория: Мобильные технологии