Сегодня 02 июля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Программное обеспечение

Угадай мелодию, или Системы идентификации музыкальных композиций

Любителей слушать музыку несть числа. Для одних меломанов она является источником вдохновения и играет важную роль в жизни, другим она позволяет расслабиться и собраться с мыслями, а третьим - увидеть в ней отражение собственных эмоций и переживаний. Немало находится и тех, для кого данный вид искусства является лишь средством развлечения, скрашивающим суровые будни и заставляющим изредка ломать голову над идентификацией той или иной композиции, доносящейся из колонок или наушников. Да что говорить, наверняка, каждый из читателей 3DNews хоть раз да сталкивался с ситуацией, когда по радио звучит красивая мелодия, а вспомнить ее название и исполнителя (для последующего пополнения личной фонотеки, например) не получается. В таких случаях приходится еще долго прокручивать в памяти полюбившееся произведение и сожалеть о том, что ди-джей поскупился на слова и умолчал о том, кто же был автором композиции. Обычные поисковые машины в решении данной задачи не помогут, а вот специальные сервисы, по небольшому записанному отрывку песни определяющие ее название и исполнителя, вполне могут с ней справиться. Обзору таких необычных инструментов мы и посвятим данный материал.

Прежде чем перейти непосредственно к знакомству с героями сегодняшней статьи, позволим себе сделать небольшое лирическое отступление и вкратце рассказать о принципах работы рассматриваемых систем. В самом простом изложении техническая суть работы систем распознавания музыки сводится к использованию метода идентификации композиций с применением технологии акустических отпечатков, представляющих собой компактную цифровую последовательность, которая описывает характерные частотные составляющие звукового сигнала. Для каждой записи аудиоотпечаток уникален и может быть использован для определения треков, записанных с разным качеством, подвергнутых искажениям и преобразованиям. Эта особенность делает упомянутую методику крайне эффективной и обеспечивает высокий уровень распознавания.

Принцип распознавания песни таков: с записанного на скорую руку фрагмента неизвестной мелодии продолжительностью от 15 до 45 секунд снимается отпечаток, который затем отправляется в базу данных используемой системы, где происходит поиск совпадений с аудиоотпечатками уже опознанных композиций. В результате такого распознавания обнаруживаются один или несколько треков-кандидатов, совпадающих с обработанным файлом с той или иной вероятностью.

Для оценки возможностей каждого рассматриваемого сервиса мы подготовили три тестовых аудиофрагмента в формате MP3 продолжительностью по 30 секунд: один из известной всем поклонникам группы The Beatles композиции Michelle, второй из песни Владимира Высоцкого "Кругом пятьсот" (альтернативное название - "Дорожная история") и третий из созданного по книге Эдуарда Успенского "Дядя Федор, Пес и Кот" мультипликационного фильма "Зима в Простоквашино" (помните строчки "А я все чаще замечаю, что меня как будто кто-то подменил"?). Для чистоты эксперимента все информационные теги, содержащиеся в проверочных композициях, были удалены, а сами файлы были переименованы в ни о чем не говорящие объекты с именами track1.mp3, track2.mp3 и track3.mp3.

AudioTag.info. Первый попавший в поле нашего зрения ресурс для распознавания музыки начал свою работу 6 марта 2009 года и умеет общаться с пользователем на русском и английском языках. Несмотря на молодость, проект может похвастаться не только внушительных размеров базой данных, хранящей сведения о более чем 1,3 млн музыкальных треках самых разных жанров, но и универсальным движком, распознающим файлы в форматах WAV, MP3, OGG, FLV, AMR, MP4 и многих других. Регистрации для работы с AudioTag.info не требуется: достаточно открыть браузер, загрузить фрагмент композиции (оптимальная продолжительность 15-45 секунд), ввести проверочный код, и робот, проанализировав доставшийся ему файл, постарается распознать его и выдать о нем подробную информацию. В нашем случае система безошибочно распознала все три отрывка тестовых композиций, что, конечно же, не может не радовать.

Shazam. Мобильный сервис, представляющий собой альтернативу присутствующему в телефонах Sony Ericsson инструментарию TrackID и реализованный с прицелом на широкий спектр портативных устройств, функционирующих на базе Windows Mobile, Symbian, Android, Apple iOS и BlackBerry. Клиентское приложение Shazam записывает отрывок (10-12 секунд) музыкального произведения с помощью встроенного микрофона телефона, формирует аудиоотпечаток и отсылает его на сервер, где он сравнивается с представленными в базе данных образцами треков. В случае успеха, на дисплее смартфона высвечивается информация о песне с обложкой соответствующего альбома и прочими полезными сведениями. Работает мобильная служба на удивление быстро и просто - от пользователя требуется только нажимать клавишу Tag Now и успевать анализировать поступающие от системы сообщения. С нашими тестовыми заданиями установленная на WM-девайс программа справилась на "четверку", оставив инкогнито только произведение Владимира Семеновича. Впрочем, вряд ли стоит записывать в недостатки Shazam отсутствие в базе данных одной из композиций Высоцкого, так как другую взятую для пробы песню отечественного барда заморский сервис распознал на "ура". Согласно предоставленным разработчиками сведениям, музыкальная база данных проекта насчитывает более восьми миллионов треков. Впечатляет.

Midomi. Сервис, предоставляющий любому посетителю сайта возможность вспомнить врезавшуюся в память композицию путем напевания или насвистывания оной в микрофон компьютера или мобильного устройства. Владельцам последних предоставлен также стандартный функционал, подразумевающий запись отрывка музыкального произведения с микрофона телефона и последующую отправку акустических отпечатков на сайт с базой данных аудиофайлов. Клиентские приложения Midomi доступны для портативных устройств под управлением ОС Windows Mobile, Symbian, Android и Apple iOS. Результат сканирования файлов упомянутым сервисом продемонстрировал англоязычную направленность службы, опознавшей только творение британской рок-группы из Ливерпуля. С творчеством отечественных исполнителей заморский музыкальный эксперт оказался не знаком.

Tunatic. Еще одно решение для идентификации музыки, выполненное в виде небольшой утилиты для операционных систем Windows и Mac OS X. Программа перехватывает звуковой поток с аудиокарты, производит анализ акустической информации в онлайновой базе данных и выдает вердикт о проигрываемой композиции. В случае обнаружения совпадения в БД, Tunatic отображает название песни и имя автора вместе со ссылкой на страницу, где указаны интернет-магазины, в которых можно приобрести полюбившееся произведение. Как показала практика, с определением композиций приложение справляется не ахти как, и разработчики продукта открыто предупреждают, что с классической музыкой к программе можно не обращаться. Знаменитую песню ансамбля "Битлз" утилита определила с ходу, а вот песню кота Матроскина в исполнении Олега Табакова и творчество Владимира Высоцкого не признала.

MusicBrainz. Открытая база данных, хранящая акустические отпечатки для самых разных музыкальных композиций, количество которых усилиями энтузиастов медленно, но верно приближается к планке в 10 миллионов треков. Будучи развиваемым на добровольных началах, проект предлагает пользователя внушительную коллекцию клиентских приложений для разных платформ, функциональная начинка которых позволяет работать не только с отдельными аудиофайлами, но и с целыми альбомами, наводя порядок в хранящихся на компьютере медиабиблиотеках. Потенциал MusicBrainz огромен, однако на практике выяснилось, что 30-секундных отрывков песен системе явно недостаточно для определения композиций, и что в ее познаниях русской музыки фигурируют обширные пробелы.

В случае если ни один из рассмотренных выше сервисов не помог в деле опознания неизвестной мелодии, на помощь может прийти музыкальная энциклопедия Musipedia, предлагающая несколько вариантов поиска песен: посредством напевания или насвистывания их в микрофон ПК, "настукивания" произведения с помощью клавиши "пробел", наигрывания мелодии на виртуальном фортепиано или введения кодов Парсонса. Естественно, качество поиска зависит от многих факторов, важнейшим из которых, по сути, является тривиальное наличие у пользователя чувства ритма и слуха. Кому понравилось стучать по клавиатуре и играть с компьютером в "Угадай мелодию", тому мы может порекомендовать сервис SongTapper и его отечественный аналог "Ритмотека". С одной стороны, работа с упомянутыми инструментами может напоминать забавный аттракцион, с другой - их использование может стать последней возможностью найти песню, мелодия которой никак не выходит из головы.

Если у кого-то из уважаемых читателей возникнет желание поделиться своими находками и опытом в данной области, таковых милости просим в наш форум. Не исключено, что совместными усилиями удастся собрать наиболее полную подборку способов определения авторства неизвестных мелодий.

 
 
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

window-new
Soft
Hard
Тренды 🔥
«Самое янское дополнение в истории»: геймплейный трейлер сюжетного аддона The Alters: Last Variable порадовал фанатов 55 мин.
Epic Games Store устроил раздачу классической игры I Have No Mouth, and I Must Scream о последних людях на Земле, которых пытает безумный суперкомпьютер 3 ч.
Авторитетный инсайдер опроверг закрытие Obsidian Entertainment и работу студии над новой Fallout 4 ч.
Правительство США снова взломали: хакеры проникли в федеральную платформу для обмена разведданными 4 ч.
Браузер Opera получил продвинутую защиту от ввода вредоносных команд через буфер обмена 4 ч.
ИИ оказался слишком дорогим: компании урезают сотрудникам доступ к ChatGPT и Claude 5 ч.
Студия создателя Deus Ex и System Shock перестанет делать игры — после провала Thick as Thieves в OtherSide осталось меньше десяти человек 5 ч.
Google не смогла отбиться от рекордного штрафа в €4,1 млрд в Европе 5 ч.
Кризис Xbox поставил под угрозу закрытия Obsidian — студию в ответе за Fallout: New Vegas, Pillars of Eternity и South Park: The Stick of Truth 6 ч.
Toyota собирается при помощи ИИ навести порядок в своей документации и терминологии 6 ч.
Philips анонсировала 27-дюймовые игровые мониторы Evnia M4 с тремя режимами работы: 1440p@275 Гц, 1080p@360 Гц и 720p@540 Гц 2 ч.
Anthropic ведёт переговоры с Samsung о создании собственного ИИ-чипа 3 ч.
У Tesla внезапно подскочили продажи электромобилей во втором квартале 4 ч.
Amazon запустила достаточно спутников для запуска конкурента Starlink 5 ч.
ИИ подрывает экологические цели: выбросы углекислого газа у Amazon подскочили на 16 % в 2025 году 5 ч.
«Яндекс» разрабатывает новые ИИ-устройства — «Пин», «Хронум» и другие загадочные продукты 6 ч.
Инвестиции с кешбэком: NVIDIA вкладывается в создание ИИ-инфраструктуры партнёров в обмен на доход от её эксплуатации 6 ч.
Weave представила бытового робота Isaac 1 — он будет наводить порядок, пока хозяев нету дома 6 ч.
Будущая Xbox Project Helix, вероятно, будет лишена дисковода 7 ч.
В центре Москвы открыли новый флагманский магазин Xiaomi Store 7 ч.