我是一只忘歌词的鱼



         看下一个

我是一只忘歌词的鱼 不相关的其它视频
我是鱼 我是鱼你是水吗? 我是鱼 你.. 我是鱼 洗唰唰 洗唰唰小孩 麦迪Top0 李卫辞官拍摄花絮
关于 音乐 的百科小常识
广义的讲 音乐就是任何一种艺术的、令人愉快的、审慎的或其他什么方式排列起来的声音。所谓的音乐的定义仍存在着激烈的争议 但通常可以解释为一系列对于有声、无声具有时间性的组织 并含有不同音阶的节奏、旋律及和声。
音乐可以通过几种途径来体验 最传统的一种是到现场听音乐家的表演。现场音乐也能够由无线电和电视来播放 这种方式接近于听录音带或看音乐录像。有些时候现场表演也会混合一些事先做好的录音 如DJ用唱片做出的摩擦声。当然 也可以制作自己的音乐 通过歌唱 玩乐器或不太严密的作曲。
甚至耳聋的人也能够通过感觉自己身体的震动来体验音乐 最著名聋音乐家的例子便是贝多芬 其绝大部分著名的作品都是在他完全丧失听力后创作的。
人们想学习音乐的时候会去上音乐课。音乐学是一个历史的科学的研究音乐的广阔领域 其中包括音乐理论和音乐史。
音乐作为一门古老的艺术 极大量的音乐流派已经发生变化。人种音乐学作为人类学的一个分支是专门研究这些流派起源及发展的学科。

这是一个见仁见智的问题 说法很多。笔者认为音乐是一种声音艺术而非视觉或其它什么感觉的艺术。把乐音(有时也适当使用噪音)按一定的规律组织起来 使人听之产生美感 这种艺术就叫音乐。

有关音乐的知识音响声音的四要素

声音四要素是:音强、音高、音色和波形包络。现将它们的含义分述如下:

1.音强

音强就是人们在听闻时感到的响度 也就是我们通常说的声音的强弱或大、小 重 轻。它是人耳对声音稳弱的主观评价尺度之一。其客观评价尺度——也即物理量的测量 是声波的振幅。音强与振幅并不完全一致或成正比 在声频范围的低频段相差很大 高频段也有相当的差别。

声频范围也就是人们可以听到的声振动频率范国 为20赫到20千赫。20赫以下称为次声 20千赫以上称为超声。在声频频率范围内 人耳对中频段1~3千赫的声音最为灵敏 对高、低频段的声音 特别是低频段的声音则比较迟钝。人耳还有一种特征 对很强的声音 感觉其响度与频率的关系不大 或者说同振幅的各频率的声音 听起来响度差不多.但对低声级信号(即很轻的声音) 感觉到它的响度与频率关系甚大:对于同样振幅的声音 低、高频段的声音听起来响度比中频段的轻。声音振幅愈小 鸡种现象就愈严重。对1千赫的声音信号 人耳所能感觉到的最低声压为2X10(负4次方)微巴。微巴是声压的单位 它相当于在1平方厘米面积上具有1达因压力。电声工作者把这一声压称为声压级的0分贝 通常写为O分贝SPL(SPL是声压级的缩写) 正如把0。775伏定为在6OO欧电路中的0分贝一样。不用声压而用以对数表示的“声压级”来表示声音振幅的大小 有明显的好处。这是因为人耳能听闻的声压范围很大 可由2X10(负4次方)微巴到2XlO(负四次方)微巴 相差一千万(1C)倍。对如此大范围的变化 计算很不方便 用声压级表达就比用声压方便多了。另外由于人耳对响度的感觉是非线性的 用对数来计量更接近于人耳的主观特性。当声压级达120分贝SPL时 人耳将感到痛楚 无法忍受 因此 人听闻的动态范国由0~120分贝SPL 在音乐厅中听乐队演奏 音乐的自然动态范围是多少呢?对大型交响音乐 最响的音乐片段可达115分贝SPL 最弱的音乐片段约为25分贝SPL 因而动态范围可达90分贝。当然 这是很少有的情况。通常交响音乐的动态范围约为50~80分贝 中、小型音乐的动态范国约在40分贝左右 语言的动态范围约在30分贝左右。

因此 要求家用放音设备能够尽可能地再现:

1〕上述音乐或语言的自然声级动态范围。

2〕音乐或语言的自然声压级。对于家庭内常用的放音音量 平均声压级对音乐来说约为86分贝SPL 对语言则约为70分贝SPL左右。

2.音高音高或称音调 是人耳对声音调子高低的主观评价尺度。它的客观评价尺度是声波的频率。和音强与振幅的关系不一样 音高与频率基本上是一致的。当两个声音信号的频率相差一倍时 也即f2=2f1时 则称f2比f1高一个倍频程。音乐中的1(do)与i 正好相差一个倍频程 在音乐学中也称相差一个八度音。在一个八度音内 有12个半音。以1—i八音区为例 12个半音是:1—#1、#1—2、2—#2、#2—3、3—4、4—#4 #—5、5一#5、#5—6、6—#6、#6—7、7—i。请注意 这12个音阶的分度基本上是以对数关系来划分的。

各种不同的乐器 当演奏同样的频率的音符时 人们感觉它们的音高相同 这里指的演奏的声音具有同样的基频。但乐器每发一个音 这个音除了具有基频fo 以外 还有与fo成正整数倍关系的谐波。前面说过 每个音的音高感觉由fo决定 而每种乐器的不同各次谐波成分 则决定乐器特有的音色。那么 音乐的自然基频范围是多少呢?乐器中 基音频串范围最宽的是钢琴 由27.5~4136赫。管弦乐、交响乐的基音范围是30~60OO赫。我国民族乐器的基音范围则为50~4500赫。 顺便介绍一下 现代电声学研究说明 乐音的自然频率范围已经超出20~20000赫可闻声频串范围之外 例如某些非洲鼓的基音在次声频频段 而某些中国木管的谐波(泛音)可达25千赫之高。次声信号虽不能为人耳所感闻 但可为人的皮肤所感知。另外 语言画基频在150~3500赫范围内。

3.音色

人们除对响度、音高有明显的都别力外 还能准确地判断声音的“色调”。单簧管、圆号虽然演奏同一音高(基频)的音符 但人们能够明确分辨出哪个是单管管 哪个是圆号 而不会混淆。这是由于它们的音色、波形包络不同。音色决定于乐音的泛音(谐波)频谱 也可以说是乐音的波形所确定的。因为乐音的波形(可由电子示波器上看到〉绝大多数都不是简单的正弦波 而是一种复杂的波。分析表明这种复杂的波形 可以分解为一系列的正弦波 这些正弦波中有基频f0 还有与f0成整数倍关系的谐波:f1、f2、f3、f4 它们的振幅有特定的比例。这种比例 赋予每种乐器以特有的“色彩”一—音色。如果没有谐波成分 单纯的基音正弦信号是毫无音乐感的。因此 乐器乐音的频率范围 决非只是基频的频率范围 应把乐器乐音的各次谐波都包括在内 甚至很高次数的泛音 对乐器音色影响仍很大。高保真放声系统要十分注意让各次泛音都能重放出来 这就使重放频串范围至少达15000赫 要求潮的应达20千赫或更高。另外 语言的泛音可达7~8千赫。

4.波形包络

乐音的波形包络指乐音演奏(弹、吹、拉 拨)每一音符时 单个乐音振幅起始和结束的瞬态 也就是波形的包络。有些乐器 在弹、吹、拉、拨的开始一瞬间 振幅马上达到最大值 然后振幅逐步衰减 有的乐器则相反 在开始的瞬间振奋较小 然后逐渐加大 再逐渐衰减。这些波形包络变化也影响乐器的音色。 显然重放设备也要求有较好的瞬态跟随能力 不然就会引起乐音自然包络的畸变。

近古音乐——两千年的理论探索与十二平均律的诞生

在中国传统音乐理论遗产中 有一门科学 自公元前7世纪起便有人开始探究。其后2600余年 绵延不绝 一直持续到今天。它就是一度被学术界称为“绝学”的“律学”。

律学 即研究乐音体系中音高体制及**互的数理逻辑关系的科学。它是音乐声学(音响学)、数学和音乐学互相渗透的一种交叉学科。在有关音高体制的研究与应用中 律学规律几乎无处不在。例如:旋律音程的结构与音准;调式与和声理论中的和谐原则;多声部纵向结合时的各种音程关系;旋宫转调;乐器制造及调律中的音准与音位的确定;重唱重奏、合唱合奏中的音准调节 都与律学有直接关系。因此 一部“廿四史” 除了“乐志” 每朝都立“律志”、“律书”及“律历志”之类的篇章。

“律学”遗产之丰富 它在中国文化、学术史上的地位 便可想而知了。

中国乐律史上最早产生完备的律学理论 称为“三分损益律” 它大约出现千春秋中期。《管子·地员篇》、《吕氏春秋·音律篇》分别记述了它的基本法则:以一条弦长为基数 将其均分成三段 舍一取二 “三分损一” 便发出第一个上五4度音;如果将均分的三段再加一段 “三分益一” 便发出第一个下4度音 用这种方法继续推算下去 可得12个音 称“十二律” 每律有固定的律名 即:

黄大太夹姑?仲林夷南无应

钟吕簇钟冼吕宾钟则吕射钟

因为这种“生律法”是一步步推算5度音 所以又叫“五度相生律”。管子稍晚 希腊数学家祖毕达哥拉斯(约前580一前501)也以同样的方法推算出“十二律”。

“三分损益”虽然推演出“十二律” 但计算到最后一律时却不能循环复生 哪它是一种不平均的“十二律” 各律之间含有大、小半音之别。因此 为了寻求一种可以自由地旋宫转调的平均律制 就成了两千多年来乐律学家们孜孜以求的理想。

汉代著名律学家京房(前77一37)沿着五度相生的方法连读推算下去 至第53“色育”律时 己基本还原到出发伟“黄钟”(欧洲在16世纪时也出现过53平均律)。

他最后算到60律 后世称“京房律”。表面上看 京房推算60律的繁复律制 与简练的十二平均律理想南辕北辙 但如果抛开它神秘主义的外衣 他在运算过程中得到的许多律高 都可以在曾侯乙编钟所体现的“钟律”上予以印证。南朝的钱乐之、沈重在京房60律的基础上继续按“二分损益法”推演生律 直至更为周密的360律。他们把还生黄钟本律的音差数缩小到最少程度 从而为从其中选择十二平均律各音提供了更大的可能性。但同时沿此途求解十二平均律的探索也步入“山穷水尽”的困境。

不无巧合的是 与钱、沈同时代的乐律学家何承天(370一447)大胆提出一种“新律”。他的作法是把第十二律不能还原所剩的误差数 分作十二份 每律增补一份。

十二次相生后 正好回归黄钟律。这可以说是天才的十二平均律构想 何承天在当时几乎就要叩开这一高深莫测的律制的大门了 可惜他不是按频率比计算 而是依弦长计算 难题再度搁浅。隋代刘焯(581一618)摆脱“三分损益律”的羁绊 以振动体长度桐邻律之间的差数相同 推算出“十二长度等差律”。王朴(905一959)于959年又提出一种“新律” 以倍半关系的八度音程硬性调整各律。他清楚地认识到 解决不平均律的矛盾只能在12律范围内进行 但他的基本方法还是在“三分损益法”上修修补补。

经历乐如此漫长的探索和徘徊 至明朝中时 皇族世了朱傤堉(1536一1611)终于成为登上律学的宝塔顶摘取“十二平均律”明珠的第一人。他以珠算开方的办法 求得律制上的等比数列 第一次解决乐十二律内自由旋宫转调的千古难题 实现了千余年来无数律学家梦寐以求的理想。他的“新法密率”已成为人类科学史上最重要的发现之一 作为一位艺术史上的巨人 朱傤堉在科学、文化特别是传统乐律学理论方面都有建树。他积终生而著的《乐律全书》囊括了音乐艺术的方方面面。然而 由于中国封建社会日趋衰微。朱傤堉发明的“十二平均律”。终于未能付诸实践 被藏在一函书籍之中而束之高阁 成为反映封建帝国扼杀天才的一个悲剧性的侧影。

上古音乐——发展史(一)

先秦典籍《吕氏春秋》里说:“音乐之所由来者远矣!”远至何时 史无确载 但不断发现的音乐文物 一次又一次地证明了它的“由来”之远。

本世纪五十年代初 安阳殷墟“商代虎纹大石磐”出土 证明中国乐器已有3000余年的历史;五十年代中 西安半坡村新石器时代遗址发掘出“一音孔陶埙” 乐器曳一下子上溯到6700余年前;七十年代 浙江余姚河姆渡新石器时代遗址又发现大批7000多年前的“骨哨”和一件“陶埙”……中国音乐确实像一条历史的长河 这条河曲折婉蜒、多姿多彩 永不止息;这条河由涓涓细流汇成滔滔大江。近些年 河南舞阳贾湖村的一次考古发掘使它再向更古老的年代延伸……

中国音乐的历史 古代文献一般追溯到黄帝。尽管关于黄帝的传说夹杂着后人的理想成分 并有不少神怪内容 不完全可信(例如说黄帝时代建立了“十二律” 就是把后来的创造归功于黄帝的说法 与现代科学考古发现不合。)要把黄帝作为中国音乐的源头 也嫌太晚了:现代考古发现已把中国音乐的历史 从黄帝时代大大向前推进枣其历史远比黄帝时代古老!

1986年—987年 在河南省舞阳县贾湖村新石器遗址发掘出了随葬的至少16支骨笛 据碳14测定 这些骨笛距今已有8000—9000年之久!这些骨笛用鹤类尺骨制成 大多钻有7孔 在有的音孔旁还遗留着钻孔前刻划的等分标记 个别音孔旁边另钻一小孔 应是调整音高用的。这些情况起码说明 那时人们已对音高的准确有一定要求 对音高与管长的关系也已具备初步认识。经音乐工作者对其中最完整的一支所作测音可知 号称以五声音阶为主的中国 其实早在七、八千年之前 就已具备了有着稳定结构 超出五声的音阶形态了。(这一历史事实雄辩地说明 中国音乐后来以五声为主 并不象有人臆想的 是所谓“音阶发育不完善” 而是一种历史的、审美的选择结果。)这也证明当时的音乐已发展到了相当高的程度 远远超出人们的想象。在这之前 中国音乐一定还存在一个漫长的历史时期 这段时间以千年还是以万年计 现在难以猜测。

除骨笛外 新石器时期的乐器 还发现有骨哨、埙、陶钟、磬、鼓等。这些乐器分布于中国广袤的土地上 时间跨度也很大 说明它们是中国原始时期的主要乐器。其中钟、磬、鼓在后世得到了极大的发展 至于埙和哨 还有与骨笛形制、原理相同(今天称为“筹”)的乐器 甚至直到今天仍存活于民间。

埙是一种很有特点的乐器 用土烧制而成 外形似蛋(或作各种变形) 其大小近似中人的拳头 中空 顶端开一吹孔 胸腹部开一个或数个指孔。埙是除骨笛之外 已发现的原始时代乐器中唯一能确定地发一个以上乐音的乐器 原始时期的埙只有1-3个音孔 只能吹出2-4个音 (这很可能与在不大的蛋形的埙上开孔 比在管状的笛上开孔要难以计算有关。)它们在一定程度上体现了中国音阶发展的进程 尤其能揭示出在中国音阶的发展进程中占有重要地位的音程关系;当今有学者指出 那就是从只能发两个音的一音孔埙起便一再被强调的小三度音程。这一观点对于认识中国音阶的发展 音阶音之间的律学关系 乃至中国的七声音阶仍以五声为骨干现象的内在机理 无疑有着重要的指导意义。

原始时期的音乐和舞蹈密不可分 这大概是世界各民族历史上共有的现象 中国也不例外。最迟在公元前11世纪 中国已称这种音乐舞蹈结合的艺术形式为“乐” 甚至在音乐舞蹈各自成为独立的艺术形式之后 “乐”仍既可以指舞蹈 也可以指音乐 一直保存着它的模糊词义。今天“乐”已专指音乐 所以学者通称原始时期的“乐”为“乐舞”。现存的有些原始岩画非常生动地描绘了原始乐舞的场面 那是一种群体的歌舞活动。据后来文献保留下的片断“记忆”可知 原始乐舞的举行跟祈求丰年等祭祀是“一而二 二而一”的事 因此其中必然包含有生产活动的再现成份。

原始时期 乐舞并不成其为社会分工对象 原始社会不存在专职的乐工 乐舞一般是部落社会的全社会活动。因此 原始时期的乐舞 并没有以专门的艺术形式的面貌和身份 从社会上独立出来。

严格地说 到大约公元前21世纪夏代建立以后 乐舞才真正作为一种社会分工 从社会中取得独立。传说夏代初期的国君启和最后的国君桀 都曾用大规模乐舞供自己享乐 说明终夏一代 社会已造就出一大批专职的乐舞人员 这正是乐舞作为艺术而独立于社会的标志。

由于原始乐舞即和原始巫术、祭祀等活动结合无间的缘故 人们对乐舞乃至一些乐器所抱有的神秘思想可能产生得很早。国家产生以后 统治者便会利用和加强音乐神秘观 以便操纵、控制乐舞 用来加强其统治。保存下来的一些音乐神话故事便是这样的社会背景的产物。传说分为章节的大型乐舞《九辩》、《九歌》都是夏代国君启从天上得来的。我们从出土的战国初年(公元前5世纪)的乐器上 还能看到启的图象 似乎他那时已具有司音乐之神的地位了。又传说黄帝得到一种长得象牛 名字叫夔的动物 便用它的皮蒙鼓 用雷兽的骨头作鼓槌 敲打起来 “声闻五百里” 黄帝用这面鼓扬威天下。夔和雷兽都是想象中的神奇动物。那时的鼓 实际上和后世一样 多蒙牛皮 但也不乏用(今称扬子鳄)皮的 因此也成了神话材料。后来 夔转化成为主管音乐的“人”(神)。蒙鼓的夔成为主管音乐的神 应该看作是支配节奏的鼓这件乐器在乐舞中具有主宰作用的曲折反映。

贾湖骨笛的出土地点 靠近传说中夏代的夏台 这告诉我们 夏代的活动区域 正是中国音乐高水平发展的地区。传说中夏代乐舞明显超越前代 是完全可以理解的。如果我们剥去上述《九辩》、《九歌》是启从天上得来的神话成份 那么 就只剩下现实中的《九辩》、《九歌》确实无比瑰丽优美这一点了。唯其如此 才足以引发人们产生“此曲只应天上有”的遐想 并由此而进一步创造出神话来。

1.便携MP3播放器的俗称.
用来播放MP3格式音乐(现在可以兼容wma wav等格式)的一种便携式的播放器.便携式MP3播放器最初由韩国人文光洙和黄鼎夏(Moon & Hwang)于1997年发明 并申请了相关专利.

2.MP3作为一种音乐格式
MPEG-1 Audio Layer 3 经常称为MP3 是当今较流行的一种数字音频编码和有损压缩格式 它设计用来大幅度地降低音频数据量 而对于大多数用户来说重放的音质与最初的不压缩音频相比没有明显的下降。它是在1991年由位于德国埃尔朗根的研究组织Fraunhofer-Gesellschaft的一组工程师发明和标准化的。

概观

MP3是一个数据压缩格式。它丢弃掉脉冲编码调制(PCM)音频数据中对人类听觉不重要的数据(类似于JPEG是一个有损图像压缩) 从而达到了小得多的文件大小。

在MP3中使用了许多技术其中包括心理声学以确定音频的哪一部分可以丢弃。MP3音频可以按照不同的位速进行压缩 提供了在数据大小和声音质量之间进行权衡的一个范围。

MP3格式使用了混合的转换机制将时域信号转换成频域信号:

    * 32波段多相积分滤波器(PQF)
    * 36或者12 tap 改良离散余弦滤波器(MDCT);每个子波段大小可以在0...1和2...31之间独立选择
    * 混叠衰减后处理

根据MPEG规范的说法 MPEG-4中的AAC(Advanced audio coding)将是MP3格式的下一代 尽管有许多创造和推广其他格式的重要努力。然而 由于MP3的空前的流行 任何其他格式的成功在目前来说都是不太可能的。MP3不仅有广泛的用户端软件支持 也有很多的硬件支持比如便携式媒体播放器(指MP3播放器)DVD和CD播放器。

历史

发展

MPEG-1 Audio Layer 2编码开始时是德国Deutsche Forschungs- und Versuchsanstalt für Luft- und Raumfahrt(后来称为Deutsches Zentrum für Luft- und Raumfahrt 德国太空中心)Egon Meier-Engelen管理的数字音频广播(DAB)项目。这个项目是欧盟作为EUREKA研究项目资助的 它的名字通常称为EU-147。EU-147 的研究期间是1987年到1994年。

到了1991年 就已经出现了两个提案:Musicam(称为Layer 2)和ASPEC(自适应频谱感知熵编码)。荷兰飞利浦公司、法国CCETT和德国Institut für Rundfunktechnik提出的Musicam方法由于它的简单、出错时的健壮性以及在高质量压缩时较少的计算量而被选中。基于子带编码的Musicam 格式是确定MPEG音频压缩格式(采样率、帧结构、数据头、每帧采样点)的一个关键因素。这项技术和它的设计思路完全融合到了ISO MPEG Audio Layer I、II 以及后来的Layer III(MP3)格式的定义中。在Mussmann教授(University of Hannover)的主持下 标准的制定由Leon van de Kerkhof(Layer I)和Gerhard Stoll(Layer II)完成。

一个由荷兰Leon Van de Kerkhof、德国Gerhard Stoll、法国Yves-François Dehery和德国Karlheinz Brandenburg 组成的工作小组吸收了Musicam和ASPEC的设计思想 并添加了他们自己的设计思想从而开发出了MP3 MP3能够在128kbit/s达到MP2 192kbit/s 音质。

所有这些算法最终都在1992年成为了MPEG的第一个标准组MPEG-1的一部分 并且生成了1993年公布的国际标准ISO/IEC 11172-3。MPEG音频上的更进一步的工作最终成为了1994年制定的第二个MPEG标准组MPEG-2标准的一部分 这个标准正式的称呼是1995年首次公布的ISO/IEC 13818-3。

编码器的压缩效率通常由位速定义 因为压缩率依赖于位数(:en:bit depth)和输入信号的采样率。然而 经常有产品使用CD参数(44.1kHz、两个通道、每通道16位或者称为2x16位)作为压缩率参考 使用这个参考的压缩率通常较高 这也说明了压缩率对于有损压缩存在的问题。

Karlheinz Brandenburg使用CD介质的Suzanne Vega的歌曲Tom's Diner来评价MP3压缩算法。使用这首歌是因为这首歌的柔和、简单旋律使得在回放时更容易听到压缩格式中的缺陷。一些人开玩笑地将Suzanne Vega称为“MP3之母”。来自于EBU V3/SQAM参考CD的更多一些严肃和critical 音频选段(glockenspiel triangle accordion ...)被专业音频工程师用来评价MPEG音频格式的主观感受质量。

MP3走向大众

为了生成位兼容的MPEG Audio文件(Layer 1、Layer 2、Layer 3) ISO MPEG Audio委员会成员用C语言开发的一个称为ISO 11172-5的参考模拟软件。在一些非实时操作系统上它能够演示第一款压缩音频基于DSP的实时硬件解码。一些其它的MPEG Audio实时开发出来用于面向消费接收机和机顶盒的数字广播(无线电DAB和电视DVB)。

后来 1994年7月7日Fraunhofer-Gesellschaft发布了第一个称为l3enc的MP3编码器。

Fraunhofer开发组在1995年7月14日选定扩展名.mp3(以前扩展名是.bit)。使用第一款实时软件MP3播放器Winplay3(1995年9月9日发布)许多人能够在自己的个人电脑上编码和回放MP3文件。由于当时的硬盘相对较小(如500MB) 这项技术对于在计算机上存储娱乐音乐来说是至关重要的。

MP2、MP3与因特网

1993年10月 MP2(MPEG-1 Audio Layer 2)文件在因特网上出现 它们经常使用Xing MPEG Audio Player播放 后来又出现了Tobias Bading为Unix开发的MAPlay。MAPlay于199年2月22日首次发布 现在已经移植到微软视窗平台上。

刚开始仅有的MP2编码器产品是Xing Encoder和CDDA2WAV CDDA2WAV是一个将CD音轨转换成WAV格式的CD抓取器。

Internet Underground Music Archive(IUMA)通常被认为是在线音乐革命的鼻祖 IUMA是因特网上第一个高保真音乐网站 在MP3和网络流行之前它有数千首授权的MP2录音。

从1995年上半年开始直到整个九十年代后期 MP3开始在因特网上蓬勃发展。MP3的流行主要得益于如Nullsoft于1997年发布的Winamp和Napster于1999年发布的Napster这样的公司和软件包的成功 并且它们相互促进发展。这些程序使得普通用户很容易地播放、制作、共享和收集MP3文件。

关于MP3文件的点对点技术文件共享的争论在最近几年迅速蔓延—这主要是由于压缩使得文件共享成为可能 未经压缩的文件过于庞大难于共享。由于MP3文件通过因特网大量传播一些主要唱片厂商通过法律起诉Napster来保护它们的版权(参见知识产权)。

如iTunes Music Store这样的商业在线音乐发行服务通常选择其它或者专有的支持数字版权管理(DRM)的音乐文件格式以控制和限制数字音乐的使用。支持DRM的格式的使用是为了防止受版权保护的素材免被侵犯版权 但是大多数的保护机制都能被一些方法破解。这些方法能够被计算机高手用来生成能够自由复制的解锁文件。一个显著的例外是微软公司的Windows Media Audio 10格式 目前它还没有被破解。如果希望得到一个压缩的音频文件 这个录制的音频流必须进行压缩并且带来音质的降低。

MP3的音频质量

因为MP3是一种有损格式 它提供了多种不同“位速”的选项—也就是用来表示每秒音频所需的编码数据位数。典型的速度介于每秒128和320kb之间。与此对照的是 CD上未经压缩的音频位速是1411.2 kbit/s(16 位/采样点 × 44100 采样点/秒 × 2 通道)。

使用较低位速编码的MP3文件通常回放质量较低。使用过低的位速 “压缩噪声(:en:compression artifact)”(原始录音中没有的声音)将会在回放时出现。说明压缩噪声的一个好例子是压缩欢呼的声音:由于它的随机性和急剧变化 所以编码器的错误就会更明显 并且听起来就象回声。

除了编码文件的位速之外 MP3文件的质量也与编码器的质量以及编码信号的难度有关。使用优质编码器编码的普通信号 一些人认为128kbit/s的MP3以及44.1kHz的CD采样的音质近似于CD音质 同时得到了大约11:1的压缩率。在这个比率下正确编码的MP3能够获得比调频广播和卡式磁带更好的音质 这主要是那些模拟介质的带宽限制、信噪比和其它一些限制。然而 听力测试显示经过简单的练习测试听众能够可靠地区分出128kbit/s MP3与原始CD的区别。在许多情况下他们认为MP3音质太低是不可接受的 然而其他一些听众或者换个环境(如在嘈杂的车中或者聚会上)他们又认为音质是可接受的。很显然 MP3 编码的瑕疵在低端计算机的扬声器上比较不明显 而在连接到计算机的高质量立体声系统 尤其是使用高质量的headphone时则比较明显。

Fraunhofer Gesellschaft(FhG)在他们的官方网站上公布了下面的MPEG-1 Layer 1、2和3的压缩率和数据速率用于比较:

    * Layer 1: 384 kbit/s 压缩率 4:1
    * Layer 2: 192...256 kbit/s 压缩率 8:1...6:1
    * Layer 3: 112...128 kbit/s 压缩率 12:1...10:1

不同层面之间的差别是因为它们使用了不同的心理声学模型导致的;Layer 1的算法相当简单 所以透明编码就需要更高的位速。然而 由于不同的编码器使用不同的模型 很难进行这样的完全比较。

许多人认为所引用的速率出于对Layer 2和Layer 3记录的偏爱而出现了严重扭曲。他们争辩说实际的速率如下所列:

    * Layer 1: 384 kbit/s 优秀
    * Layer 2: 256...384 kbit/s 优秀 224...256 kbit/s 很好 192...224 kbit/s 好
    * Layer 3: 224...320 kbit/s 优秀 192...224 kbit/s 很好 128...192 kbit/s 好

当比较压缩机制时 很重要的是要使用同等音质的编码器。将新编码器与基于过时技术甚至是带有缺陷的旧编码器比较可能会产生对于旧格式不利的结果。由于有损编码会丢失信息这样一个现实 MP3算法通过建立人类听觉总体特征的模型尽量保证丢弃的部分不被人耳识别出来(例如 由于noise masking) 不同的编码器能够在不同程度上实现这一点。

一些可能的编码器:

    * Mike Cheng在1998年早些时候首次开发的LAME。 与其它相比 它是一个完全遵循LGPL的MP3编码器 它有良好的速度和音质 甚至对MP3技术的后继版本形成了挑战。
    * Fraunhofer Gesellschaft:有些编码器不错 有些有缺陷。

有许多的早期编码器现在已经不再广泛使用:

    * ISO dist10 参考代码
    * Xing
    * BladeEnc
    * ACM Producer Pro.

好的编码器能够在128到160kbit/s下达到可接受的音质 在160到192kbit/s下达到接近透明的音质。所以不在特定编码器或者最好的编码器话题内说128kbit/s或者192kbit/s下的音质是容易引起误解的。一个好的编码器在 128kbit/s下生成的MP3有可能比一个不好的编码器在192kbit/s下生成的MP3音质更好。另外 即使是同样的编码器同样的文件大小 一个不变位速的MP3可能比一个变位速的MP3音质要差很多。

需要注意的一个重要问题是音频信号的质量是一个主观判断。Placebo effect is rampant with many users claiming to require a certain quality level for transparency.许多用户在A/B测试中都没有通过 他们无法在更低的位速下区分文件。一个特定的位速对于有些用户来说是足够的 对于另外一些用户来说是不够的。每个人的声音感知可能有所不同 所以一个能够满足所有人的特定心理声学模型并不明显存在。仅仅改变试听环境 如音频播放系统或者环境可能就会显现出有损压缩所产生的音质降低。上面给出的数字只是大多数人的一个大致有效参考 但是在有损压缩领域真正有效的压缩过程质量测试手段就是试听音频结果。

如果你的目标是实现没有质量损失的音频文件或者用在演播室中的音频文件 就应该使用无损压缩算法 目前能够将16位PCM音频数据压缩到38%并且声音没有任何损失 这样的压缩工具有Lossless Audio LA、Apple Lossless、TTA、FLAC、Windows Media Audio 9 Lossless (wma) 和Monkey's Audio 等等。对于需要进行编辑、混合处理的音频文件要尽量使用无损格式 否则有损压缩产生的误差可能在处理后无法预测 多次编码产生的损失将会混杂在一起 在处理之后进行编码这些损失将会变得更加明显。无损压缩在降低压缩率的代价下能够达到最好的结果。

一些简单的编辑操作 如切掉音频的部分片段 可以直接在MP3数据上操作而不需要重新编码。对于这些操作来说 只要使用合适的软件(mp3DirectCut和MP3Gain) 上面提到的所关心的问题可以不必考虑。

位速

位速对于MP3文件来说是可变的。总的原则是位速越高则声音文件中包含的原始声音信息越多 这样回放时声音质量也越高。在MP3编码的早期 整个文件使用一个固定的位速。

MPEG-1 Layer 3允许使用的位速是32、40、48、56、64、80、96、112、128、160、192、224、256和320 kbit/s 允许的采样频率是32、44.1和48kHz。44.1kHz是最为经常使用的速度(与CD的采样速率相同) 128kbit/s是事实上“好品质”的标准 尽管192kbit/s在对等文件共享网络上越来越受到欢迎。MPEG-2和[非正式的]MPEG-2.5包括其它一些位速:6、12、24、32、40、48、56、64、80、96、112、128、144、160kbit/s。

可变位速(VBR)也是可能的。MP3文件的中的音频切分成有自己不同位速的帧 这样在文件编码的时候就可以动态地改变位速。尽管在最初的实现中并没有这项功能 VBR现在已经得到了广泛的应用。这项技术使得在声音变化大的部分使用较大的位速而在声音变化小的部分使用较小的位速成为可能。这个方法类似于声音控制的磁带录音机不记录静止部分节省磁带消耗。一些编码器在很大程度上依赖于这项技术。

高达640kbit/s的非标准位速可以使用LAME编码器和自由格式来实现 但是几乎没有MP3播放器能够播放这些文件。

MP3的设计局限

MP3格式有一些不能仅仅通过使用更好的编码器绕过的内在限制。一些新的压缩格式如Vorbis和AAC不再有这些限制。

按照技术术语 MP3有如下一些限制:

    * 位速最大是320 kbit/s
    * 时间分辨率相对于变化迅速的信号来说太低
    * 对于超过15.5/15.8 kHz的频率没有scale factor band
    * Joint stereo 是基于帧与帧完成的
    * 没有定义编码器/解码器的整体时延 这就意味着gapless playback缺少一个正式的规定

然而 即使有这些限制 一个好好的调整MP3编码器能够非常有竞争力地完成编码任务。

MP3音频编码

MPEG-1标准中没有MP3编码器的一个精确规范 然而与此相反 解码算法和文件格式却进行了细致的定义。人们设想编码的实现是设计自己的适合去除原始音频中部分信息的算法(或者是它在频域中的修正离散余弦(MDCT)表示)。在编码过程中 576个时域样本被转换成576个频域样本 如果是瞬变信号就使用192而不是576个采样点 这是限制量化噪声随着随瞬变信号短暂扩散。

这是听觉心理学的研究领域:人类主观声音感知。

这样带来的结果就是出现了许多不同的MP3编码器 每种生成的声音质量都不相同。有许多它们的比较结果 这样一个潜在用户很容易选择合适的编码器。需要记住的是高位速编码表现优秀的编码器(如LAME这个在高位速广泛使用的编码器)未必在低位速的表现也同样好。

MP3音频解码
另一方面 解码在标准中进行了细致的定义。

多数解码器是bitstream compliant 也就是说MP3文件解码出来的非压缩输出信号将与标准文档中数学定义的输出信号一模一样(在规定的近似误差范围内)。

MP3文件有一个标准的格式 这个格式就是包括384、576、或者1152个采样点(随MPEG的版本和层不同而不同)的帧 并且所有的帧都有关联的头信息(32位)和辅助信息(9、17或者32字节 随着MPEG版本和立体声或者单通道的不同而不同)。头和辅助信息能够帮助解码器正确地解码相关的霍夫曼编码数据。

所以 大多数的解码器比较几乎都是完全基于它们的计算效率(例如 它们在解码过程中所需要的内存或者CPU时间)。

ID3和其它标签

    Main articles: ID3 and APEv2 tag

“标签”是MP3(或其它格式)中保存的包含如标题、艺术家、唱片、音轨号或者其它关于MP3文件信息等添加到文件的数据。最为流行的标准标签格式目前是ID3 ID3v1和ID3v2标签 最近的是APEv2标签。

APEv2最初是为MPC 文件格式开发的(参见 APEv2规范)。APEv2可以与ID3标签在同一个文件中共存 但是它也可以单独使用。

音量归一化(normalization)

由于CD和其它各种各样的音源都是在不同的音量下录制的 在标签中保存文件的音量信息将是有用的 这样的话回放时音量能够进行动态调节。

人们已经提出了一些对MP3文件增益进行编码的标准。它们的设计思想是对音频文件的音量(不是“峰值”音量)进行归一化 这样以保证在不同的连续音轨切换时音量不会有变化。

最流行最常用的保存回放增益的解决方法是被简单地称作“Replay Gain”的方法。音轨的音量平均值和修剪信息都存在元数据标签中。

可选技术

有许多其它的有损音频编解码存在 其中包括:

    * MPEG-1/2 Audio Layer 2 (MP2) MP3的前辈;
    * MPEG-4 AAC MP3的继承者 Apple的iTunes Music Store和iPod使用;
    * Xiph.org Foundation的Ogg Vorbis 自由软件和没有专利的编解码器;
    * MPC 也称作Musepack(以前叫MP+) 由MP2派生出来;
    * Thomson Multimedia的MP3和SBR的组合mp3PRO;
    * AC-3 Dolby Digital和DVD中使用;
    * ATRAC Sony的Minidisc使用;
    * Windows Media Audio(WMA)来自于微软公司;
    * QDesign 用于低速QuickTime;
    * AMR-WB+ 针对蜂窝电话和其它有限带宽使用进行了优化的增强自适应多速宽带编解码器(Enhanced Adaptive Multi Rate WideBand codec);
    * RealNetworks的RealAudio 经常用于网站的流媒体;
    * Speex 基于CELP的专门为语音和VoIP设计的自由软件和无专利编解码器。

mp3PRO、MP3、AAC、和MP2都是同一个技术家族中的成员 并且都是基于大致类似的心里声学模型。Fraunhofer Gesellschaft拥有许多涵盖这些编解码器所用技术的基本专利 Dolby Labs、索尼公司、Thomson Consumer Electronics和AT&T拥有其它一些关键专利。

在因特网上有一些其它无损音频压缩方法。尽管它们与MP3不同 它们是其它压缩机制的优秀范例 它们包括:

    * FLAC 表示'自由无损音频编解码(Free Lossless Audio Codec)'
    * Monkey's Audio
    * SHN 也称为Shorten
    * TTA
    * Wavpack
    * Apple Lossless

听觉测试试图找出特定位速下的最好质量的有损音频编解码。在128kbit/s下 Ogg Vorbis、AAC、MPC和WMA Pro性能持平处于领先位置 LAME MP3稍微落后。在64kbit/s下 AAC-HE和mp3pro少许领先于其它编解码器。在超过128kbit/s下 多数听众听不出它们之间有明显差别。什么是“CD音质”也是很主观的:对于一些人来说128kbit/s的MP3就足够了 而对于另外一些人来说必须是200kbit/s以上的位速。

尽管如WMA和RealAudio这些新的编解码器的支持者宣称它们各自的算法能够在64kbit/s达到CD音质 听觉测试却显示了不同的结果;然而 这些编解码器在64kbit/s的音质明显超过同样位速下MP3的音质。无专利的Ogg Vorbis编解码器的开发者宣称它们的算法超过了MP3、RealAudio和WMA的音质 上面提到的听觉测试证实了这种说法。Thomson宣称它的mp3PRO 在64kbit/s达到了CD音质 但是测试者报告说64kbit/s的mp3Pro文件与112kbit/s的MP3文件音质类似 但是直到 80kbit/s时它才能接近CD音质。

专门为MPEG-1/2视频设计的、优化的MP3总体上在低于48kbit/s的单声道数据和低于80kbit/s的立体声上表现不佳。

授权和专利问题

Thomson Consumer Electronics在认可软件专利的国家控制着MPEG-1/2 Layer 3 专利的授权 这些国家包括美国和日本 欧盟国家不包括在内。Thomson积极地加强这些专利的保护。Thomson已经在欧盟国家被欧洲专利局(:en:European Patent Office授予软件专利 但是还不清楚它们是否会被那里的司法所加强。参见欧洲专利协定中的软件专利(:en:Software patents under the European Patent Convention)。

关于Thomson专利文件、授权协议和费用的最新信息请参考它们的网站mp3licensing.com。

在1998年9月 Fraunhofer Institute向几个MP3软件开发者发去了一封信声明“发布或者销售编码器或者解码器”需要授权。这封信宣称非经授权的产品“触犯了 Fraunhofer和THOMSON的专利权。制造、销售或者发布使用[MPEG Layer-3]标准或者我们专利的产品 你们需要从我们这里获得这些专利的授权协议。”

这些专利问题极大地减慢了未经授权的MP3软件开发并且导致人们的注意力转向开发和欢迎其它如WMA和Ogg Vorbis这样的替代品。Windows开发系统的制造商微软公司从MP3专向它们自有的Windows Media格式以避免与专利相关的授权问题。直到那些关键的专利过期之前 未经授权的编码器和播放器在认可软件专利的国家看起来都是非法的。

尽管有这些专利限制 永恒的MP3格式继续向前发展;这种现象的原因看起来是由如下因素带来的网络效应:

    * 熟悉这种格式 不知道有其它可选格式存在
    * 这些可选格式没有普遍地明显超过MP3的优势这样一个现实
    * 大量的MP3格式音乐
    * 大量的使用这种格式的不同软件和硬件
    * 没有DRM保护技术 这使得MP3文件可以很容易地修改、复制和通过网络重新发布
    * 大多数家庭用户不知道或者不关心软件专利争端 通常这些争端与他们个人用途而选用MP3格式无关。

另外 专利持有人不愿对于开源解码器加强授权费用的征收 这也带来了许多免费MP3解码器的发展。另外 尽管他们试图阻止发布编码器的二进制代码 Thomson已经宣布使用免费MP3编码器的个人用户将不需要支付费用。这样 尽管专利费是许多公司打算使用MP3格式时需要考虑的问题 对于用户来说并没有什么影响 这就带来了这种格式的广受欢迎。

Sisvel S.p.A. [1]和它的美国子公司Audio MPEG Inc. [2]以前曾经以侵犯MP3技术专利为由起诉Thomson[3] 但是那些争端在2005年11月最终以Sisvel给Thomson MP3授权而结束。Motorola最近也与Audio MPEG签署了MP3的授权协议。由于Thomson和Sisvel都拥有他们声称编解码器必需的单独的专利 MP3专利的法律状态还不清晰。

Fraunhofer的专利将在2010年4月到期 到了那时MP3算法将不再受专利保护。

机票搜索 便民查询网 9V无限车网 国家司法考试教育网 薇薇化妆品网 拍拍趣视频
火车票网 大学生团购网 BJGW 战队 漂流瓶网络 ImageMagick 中文站

京ICP备06059836号