题目:基于音频指纹的音频检索系统设计与实现
● 摘要
随着信息时代的到来,信息每天都在以惊人的速度增长。Web网页、文本、图形图像、音频视频和空间数据等非结构化数据越来越多,当今80%的数据是非结构化数据。其中声音媒体是除视觉媒体外最重要的媒体,占总信息量的20%左右。如何在这样浩繁的音频数据库里像文本搜索一样迅速、准确地找到所需要的音频片段,已经成为音频管理的重要研究内容。传统的音频信息检索技术主要是基于文本的。由于基于文本的音频检索存在文本信息的标注有难度和文本信息难以表达的音乐特征(比如旋律、音调)等问题,所以基于内容的音频检索技术成为国内外研究的热点问题之一,引起了各国众多研究机构和学者的广泛重视。本文通过对音频检索系统基本框架的分析并结合非结构化数据管理系统的特点,设计并实现了一套音频检索系统。从功能上包括音乐识别功能和相似音频检索功能,从系统上包括集中式音频检索系统和分布式音频检索系统。针对音乐识别功能,本文通过对音频指纹算法现有技术的研究,提出一种音乐识别算法,该算法包括一种新的MFCC Peaks特征,使用词汇树和倒排文件索引进行检索,以及用旋律线进行检索结果的再排序,通过实验和与其他算法的比较证明本算法具有内存使用少、检索速度快、准率高的特点。针对相似音频检索功能,本文实现了一种基于拍谱特征的相似音频检索方案,以及采用MapReduce的分布式处理的方案。最后,本文从系统的角度,对检索粒度、检索性能、分布式处理的性能三个方面对系统进行了测试和分析。测试证明了本系统基本符合功能目标和性能目标,以内存、时间的消耗为主要考虑点,兼顾准确率和系统的实际使用价值,实现了对音频的快速有效的检索管理。
相关内容
相关标签