MP3 наръчник
и аудио наръчник като цяло
Източник на информацията: http://kaldata.com/articles.php?action= ... article=91
Автор: Night_Raven
В този наръчник ще се опитам да разясня някои термини свързани с MP3 компресията, нейни основни принципи на функциониране, ще спомена алтернативи на тази компресия, ще се опитам да разсея някои митове, които са пуснали дълбоки корени сред много потребители и ще споделя най-добрия начин за рипване на аудио диск (прехвърляне на музика от аудио диск в mp3). Ще се опитам да съм максимално изчерпателен с минимално количество опростена теория.
Съдържание:
1. Кратко определение
2. Кратка история
3. Sampling rate и bitrate
4. Как работи mp3 форматът
5. CBR, ABR, VBR
6. ID3 етикетът
7. MP3 енкодери
8. Може ли MP3 компресията да осигури добро качество?
9. Може ли един обикновен аудио компакт диск да осигури достатъчно качествен звук спрямо „по-качествени” източници?
10. Какви други формати за компресия съществуват и по-добри ли са те от MP3?
11. Какво му е по-доброто на LAME от другите mp3 енкодери?
12. Lossless и lossy. Каква е разликата?
13. Транскодиране ли? Що е то?
14. Обобщение на казаното до момента
15. Митове и легенди ширещи се в аудио средите
16. Как да си запишем максимално качествено аудио диск в mp3?
17. Промяна на нивото на звука с MP3Gain
18. Линкове за теглене
19. Финални думи
1. Кратко определение
Пълното название на MP3 е MPEG-1 Layer 3. Това е цифров формат за съхранение и компресиране на аудио информация, създаден с цел да намали многократно размера (до над 10 пъти) на нужната информация за възпроизвеждане на звуков сигнал и все пак да запази максимално добре звученето с оригинала.
2. Кратка история
Разработката на MPEG-1 Layer 3 (MP3) започва още през 1987 г. с разработването на предшественика му – MPEG-1 Layer 2 – в Германия от Егон Майер-Енгелен. Проектът се нарича Digital Audio Broadcast (DAB). През 1991 г. се предоставят два пътя на развитие: Musicam (известен още като Layer 2) и ASPEC (Adaptive Spectral Perceptual Entropy Coding). Избира се първия метод заради простотата си, устойчивостта на грешки и малкото компютърна мощ нужна за създаване на такъв файл. По-късно Дж. Д. Джонстън (САЩ), Герхард Щол (Германия), Ев-Франсоа Дехери (Франция) и Карлхайнц Бранденбург (Германия) вземат идеите заложени в Musicam и ASPEC и добавят техни собствени. Така се ражда MP3 алгоритъмът.
По-късно, на 7 юли 1994 г., Фраунхоферският институт за интегрални схеми (Fraunhofer IIS) със сътрудничеството на университета в Ерланген пускат първия софтуерен MP3 енкодер – l3enc. Първоначално файловото разширение е било .bit, но от обществото Фраунхофер на 14 юли 1995 г. решават да го сменят на .mp3.
3. Sampling rate и bitrate
За да се разбере по-добре какво е sampling rate, ще трябва първо да се спра на термините continuous signal, descrete signal и sample. Continuous signal (постоянен сигнал) е всеки аналогов сигнал, той е непрекъснат във времевото пространство. Този сигнал трябва да бъде превърнат в descrete signal за да се възпроизведе цифрово – това е сигнал раздробен на дребни частици, наречени семпъли (sample). Това е все едно да се разположат точки по координатната система за да може след това по тези точки да се изгради цялата вълна. Ето и графика:
Така стигаме до...
Sampling rate (Sampling frequency) – честотата на семплиране определя броя на семпълите за 1 сек., които се вземат от постоянния сигнал за да се създаде descrete сигнала. Измерва се в херци (Hz). Според теоремата на Найкуист-Шанън-Котелников, за да се възпроизведат даден диапазон от честоти, честотата на семплиране трябва да е двойно по-висока от максималната реална честота, която искаме да постигнем. Да вземем за пример най-обикновен аудио компакт диск, той има честота на семплиране 44,100 Hz (или 44,1 kHz). Това значи, че той може успешно да възпроизвежда честоти до около 22 050 Hz (или 22,05 kHz). Сравнено с възможностите на човешкия слух, това е повече от достатъчно.
Просто за информация ето и списък с някои от по-използваните честоти на семплиране:
* 8,000 Hz – телефон, достатъчна за човешка реч
* 22,050 Hz – радио
* 44,100 Hz – аудио дискове, използва се и в MPEG-1 (VCD, SVCD, MP3)
* 48,000 Hz – цифров звук използван при цифровата телевизия, DVD, DAT, филми и професионално аудио
* 96,000 или 192,400 Hz – DVD-Audio, Blu-ray дисковете и HD-DVD (High-Definition DVD)
Bitrate – количеството битове за единица време използвани за пресъздаване на постоянен сигнал. Kbps (Kilobits per second) – килобити в секунда. Логично, колкото повече, толкова по-реално и по-добро е пресъздаването – т.е. е по-високо е качеството.
По-популярните битрейти: 96, 112, 128, 160, 192, 256 и 320.
4. Как работи mp3 форматът
MP3 е от т.нар. lossy файлови формати. Думата ”lossy” произлиза от думата ”loss”, която значи ”загуба”. Това значи, че при компресиране има реална загуба на информация. Тук изниква въпросът „Как е възможно да се изхвърли около 90% от аудио информацията без да се навреди на качеството на звука?”
Чрез използване на три основни техники за компресиране. Ето ги и тях:
Perceptual Coding (кодиране на базата на човешкото възприятие) – това е определено най-важният метод използван в MP3. Този принцип се гради на метода на изхвърлянето на информация, която човешкото ухо не може да чуе поради несъвършенството си (много високи или ниски честоти) или звуци замаскирани от други. Предполагам първото е ясно. За второто ще дам два примера. Всеки, който е слушал грамофонна плоча знае за онези пукания и леко пращене, които се чуват. При усилване на звука те вече не се чуват. Те не са изчезнали, просто са „замаскирани” от по-силните звуци. Ето още един пример: представете си разходка по някой хълм. Чува се поточе, птички пеят, овца блее – въобще идилия. Изведнъж, от нищото, се появяват няколко реактивни самолети за поредното въздушно учение. В един момент единственото, което чувате, е заглушителния рев на реактивни двигатели. Нито поточето е спряло да тече, нито птичките са спрели да пеят, нито овцата е спряла да блее. Тези звуци още са там някъде, но вече не се чуват, защото са заглушени от други, много по-силни. Ако имахте запис на точно тези събития и използвате lossy енкодер, то той ще премахне именно тези звуци, които не се чуват и така ще намали размера. Идеята на тази методика при mp3 е откриване и елиминиране на подобни звуци.
Huffman Coding – докато предният метод е основната причина mp3 да е lossy формат, при този няма никаква загуба на качеството. Идеята е да се открива еднакъв и повтарящ се наниз от битове и да се заменя с по-кратък код. Същият метод се използва и при ZIP и RAR компресията, например.
The Bit Reservoir – това е резервоар за битове. Той складира останалите битове от даден по-прост фрейм за да се използват в някой по-сложен. Така се оползотворяват по-добре.
Има още една техника, която се използва за подобряване на качеството и компресията и тя се нарича Joint Stereo. Тук ще се спра по-подробно, защото това е един от митовете при mp3 компресията, който е адски труден за изкореняване.
Много хора вярват, че истинското стерео е по-добро от Joint Stereo, но са в заблуда. Те вярват, че при този метод се губи качество, но това само показва колко малко са запознати с методиката на Joint Stereo режима.
Създателите на Joint Stereo режима са направили две много големи грешки при създаването му: 1) избрали са много объркващо име – от него човек може да изходи, че двата канал са някак съединени, което всъщност няма нищо общо с истината и 2) дали са това име на два напълно различни метода - Intensity Stereo и Mid/Side Stereo (именно този се има предвид всъщност).
Време е да обясним какво значи всеки от тези режими:
Stereo – двата канала се енкодират отделно, но енкодерът решава за всеки фрейм поотделно на кой канал да зачисли повече битове в зависимост кой от двата е по-динамичен. В даден фрейм левият канал може да получи 60%, а десният – 40%, докато в друг фрейм левият - 38%, а десният – 62%. Примерите са произволни.
Duall Mono (Independent Channels) – двата сигнала се енкодират отделно, но при този режим за двата сигнала се заделя абсолютно еднакво количество битрейт, т.е. всеки разполага с 50% от битрейта. Това е много лошо, защото ако в даден момент даден канал има повече информация за енкодиране и се нуждае от повече битове от другия, то той няма да ги получи и качеството се влошава, защото се губи стерео пресъздаването. За щастие този режим не се използва вече.
Intensity Stereo – единият от режимите под шапката на Joint Stereo. Точно на него терминът Joint Stereo приляга повече, защото комбинира левия и десния канал и където са почти еднакви, ги енкодира в Mono. По този начин се губи много от стерео ефекта и качеството пада значително. Този режим е предназначен за битрейти от 96 Kbps или по-ниски, когато размерът е важен, а качеството – не. В днешно време този режим се използва от енкодерите именно от 96 Kbps и надолу. Над този битрейт всички енкодери използват Mid/Side Stereo.
Mid/Side Stereo – вместо да се енкодират двата канала отделно, енкодерът не складира стандартните Left (ляв) и Right (десен) канали, а Mid (среден) и Side (страничен). В средният канал се складират еднаквите стойности (средно аритметично) на левия и десния канал – (L+R)/2. В страничният канал се складират различията на оригиналните ляв и десен канали – (L-R)/2. Реално погледнато информация не се губи, а просто се пренарежда за да заема по-малко място, а освободените битове се използват за по-сложни фреймове (кадри), които – логично – изискват и повече битове за да се пресъздадат по-добре. Тъжният факт е, че много хора си мислят, че този режим изхвърля информация, което няма нищо общо с истината. Този принцип на компресия се използва и в Lossless кодеците, при които НЯМА и капка загуба на сигнал и за които ще стане въпрос по-късно. А щом се използва при тях, значи и при него също няма загуба. За успокоение ще добавя, че всеки уважаващ себе си енкодер проверява за всеки фрейм дали ще има полза от Mid/Side Stereo и ако има твърде много информация за енкодиране, ще премине на обикновено стерео. Всъщност се получава, че Joint Stereo е или равнопоставено или по-добро като качество от обикновеното стерео, но НЕ и по-зле. Поне така е на теория. Тънкостта се крие именно в правилното определяне на нужния метод за всеки фрейм (кадър). Процесът за определяне в днешно време е далеч от съвършенството, но все пак е достатъчно развит за да осигури достатъчно добро качество на звука.
Тук някой може да зададе изпълненият с невежество въпрос защо след като Joint Stereo е толкова добър, не се използва при аудио дисковете на мястото на обикновеното стерео. На такъв човек е трудно да се обясни точно защо, защото явно той просто не е запознат със самата идея на Joint Stereo. Самият метод е изцяло създаден за спестяване на колкото се може повече битове при компресия, които да отиват там, където наистина е нужно. При аудио дисковете няма компресия и – следователно – цялата информация си е налице, затова просто няма смисъл – няма да се усети никаква реална разлика. Другата причина е, че Joint Stereo е малко по-сложен метод, докато обикновеното стерео е по-опростен.
5. CBR, ABR, VBR
CBR = Constant Bitrate – задава се една константна (непроменлива) стойност за битрейта и тя се запазва една и съща през цялата песен.
ABR = Average Bitrate – средноаритметична стойност; задава се една стойност и енкодерът се придържа към нея с тази разлика, че на някои по-сложни фреймове вдига битрейта, а на по-прости – го смъква; получава се файл с почти същия размер като при CBR режим, но с по-добро качество.
VBR = Variable Bitrate – задават се долна и горна граница на битрейта и оттам нататък енкодерът сам решава кой кадър с какъв битрейт да енкодира; получава се по-голям файл отколкото при предните два режима, но и качеството е по-добро, защото докато в CBR режим кадрите, които имат нужда от повече битове за енкодиране, а не ги получават, са повече от останалите и като цяло качеството пада. Този проблем се елиминира от VBR като се използват толкова битове, колкото са нужни.
Забележка: участъците съставени само от тишина се енкодират с 32Kbps независимо каква е указаната долна граница.
Тук застъпваме и друг мит, които се рее сред много аудио ентусиасти – че VBR не струва и CBR е истината. Това са врели-некипели. CBR има две реални предимства: 1) размерът на файла е напълно предсказуем и 2) декодира се малко по-лесно. Най-вероятно затова от Native Instruments препоръчват да се ползват предимно CBR mp3-ки в Traktor DJ, но да не се отклонявам.
Този мит е много труден за изкореняване (както и този за Stereo и Joint Stereo).
В действителност много хора изпадат в пристъп на ужас притеснявайки се, че някой фрейм ще се енкодира с по-малко битове от нужното. Да, такава опасност на теория наистина съществува, но на практика всеки добре написан енкодер може да определя много добре кога колко бита да зачисли за да се получи оптималния резултат. Може би тези хора са наплашени от стария енкодер на Xing, който се използва в Audio Catalyst и имаше много лоша имплементация на Joint Stereo и VBR. Истината е, че дори Xing вече преодоляха този проблем. Разбира се, това не го спасява от титлата за най-лош mp3 енкодер. Колкото и да не им се вярва на повечето живеещи в миналото и с остаряла информация твърдоглавци, VBR e достатъчно развита технология за да осигури отлично качество. Надали с тези думи ще мога да убедя истински фанатизираните FhG последователи, но такава е истината независимо дали им харесва или не.
6. ID3 етикетът
Мета информация съдържаща се във всеки mp3 файл, която позволява въвеждане на изпълнител, име на песен, име на албум, жанр, година, номер на песен и коментар. Това е за ID3 v1. Проблемът е, че този стандарт позволява ограничен брой символи за въведената информация. После стандарта се разширява на ID3 v2 (и подверсиите му). Той също е ограничен, но горната му граница е толкова висока, че може да се счита за неограничен. Освен това той добавя и още полета: original artist, copyright, URL и encoder.
ID3 етикетът е това, което се появява, когато изберете View file info във Winamp.
7. MP3 енкодери
Ето и списък на най-известните енкодери:
* Fraunhofer – това, както вече споменах, не е името на енкодера а на институцията създала го. Има доста енкодери базирани на него, които като цяло са на добро ниво. Има няколко такива: L3enc е първият и не особено добър, Mp3enc е може би най-добрият енкодер базиран на кодека Fraunhofer, Gogo не впечатлява с качество, но е много добре оптимизиран и затова е и много бърз. Версията на Radium е малко допълнително бутната (може да се тълкува и „хакната”), но това не я прави по-добра от останалите. Напротив, хич не е добра. Недостатъкът на тези енкодери (с изключение на последния) е, че са платени.
* Blade – този енкодер отдавна е отживелица и работата по него е спряна преди години. Самият енкодер е и с доста лошо качество, не поддържа VBR и Joint Stereo. Няма никаква реално предимство за да се използва. Безплатен.
* Xing – използва се в продуктите на едноименната фирма – Audio Catalyst. Доста бърз енкодер, но с много сериозни проблеми в качеството. Поддържа както VBR, така и Joint Stereo и макар да е основоположникът на VBR, имплементацията на този режим в енкодера е на доста ниско ниво. Ако наистина не ви пука и грам за качеството, не е проблем да го използвате.
* Lame – усещам как си прося камилско наплюване от върлите фенове на Fraunhofer, но истината не може да се отрича – това за момента е най-добрият енкодер. Максимално добро оползотворяване както на VBR, така и на Joint Stereo. Върху енкодера се работи усилено, правят се тестове почти непрекъснато. Енкодерът се развива постоянно. На всичкото отгоре е open-source и напълно безплатен. Има доста широка поддръжка и реално погледнато няма нито една причина да не се използва.
8. Може ли MP3 компресията да осигури добро качество?
Разбира се, че може. При добре подбран енкодер, достатъчен битрейт и сносен плеър, mp3 може да звучи еднакво с оригинала без никакви проблеми. Не е изключено да се чуят дефекти дори и на 320 Kbps битрейт, но файлът трябва да се слуша на много качествена апаратура, да съдържа специфична аудио информация, която да спомага за чуването на дефекта и човек трябва да знае за какво да се заслушва. Това обаче са изключително редки случаи. Далеч по вероятно е да се получава пласибо (placebo) ефекта. Това е, когато човек е толкова убеден, че дадено нещо е там, че си въобразява съществуването му дори и на практика то да не съществува.
9. Може ли един обикновен аудио компакт диск да осигури достатъчно качествен звук спрямо „по-качествени” източници?
Може, разбира се. Фанатизираните аудиофили са били, са и винаги ще бъдат против компресията под всякаква форма. Това са може би същите хора, които дават и някакви луди пари за кабели (за това по-късно) и говорят глупости по адрес на обикновения компакт диск, че е недостатъчен и че Super Audio CD (SACD) или DVD Audio са далеч по-качествени формати. На теория наистина са по-качествени. На практика са съвсем друга бира. За да се оползотворят тези стандарти е нужна добра техника, но колкото и пари да се „кихат”, винаги ще има един наличен ограничител – човешкият слух. Какво значение има дали дадена апаратура може да възпроизведе 25kHz, 30kHz или дори 40kHz, след като човешкото ухо не може и 20kHz да чуе нормално? Домашните любимци може и да могат да се „насладят” на звука, но надали си струват такива инвестиции за да може домашния кокер шпаниол да слуша музика по-пълноценно. Един аудио диск има всички качества за да възпроизведе същия като чуваемост звук както и DVD Audio и Super Audio CD. Всякакви твърдения на противоположното са напълно погрешни и разликите са плод на нечие въображение.
10. Какви други формати за компресия съществуват и по-добри ли са те от MP3?
MP3 определено е старичък формат и в момента има алтернативи. Ето по-известните lossy енкодери:
MPC – съкращение от Musepack
+ много ефективен на средно високи битрейти
+ енкодира се и се декодира доста бързо
+ с отворен код (open source)
- не поддържа многоканалност
- има малко проблеми с търсенето (т.нар. превъртане в песента)
- невъзможност за поточно аудио (stream)
- не поддържа по-високи честоти на семплиране от 48kHz
- файл енкодиран в този формат не може да бъде редактиран директно
AAC – Advanced Audio Coding; официалният наследник на MP3
+ част от MPEG4 кодека
+ международен стандарт одобрен от ISO
+ поддържа много честоти на семплиране и многоканалност
+ различни енкодери базирани на кодека (iTunes, Nero AAC, FAAC)
+ всеки може да си направи своя имплементация (сорс кода и спецификациите са общодостъпни)
+ доста ефективен около 150Kbps
- силно патентован
- има някои проблеми, които пречат трансформиращите кодеци
- доста сложен формат
OGG Vorbis
+ напълно безплатен както за некомерсиална, така и за комерсиална употреба
+ доста изчистен откъм спецификации и структура формат
+ доста добър за поточно аудио (stream)
+ много ефективен на средно ниски битрейти (около 128Kbps)
+ много неразкрит потенциал
- много неразкрит потенциал
- понастоящем енкодирането и декодирането е сравнително неоптимизирано и изисква повечко изчислителна мощ
- ограничена официална разработка, окуражават се всякакви отделни такива
Всеки един от тези енкодери превъзхожда MP3 в поне няколко параметъра. На теория всички те са по-добри от него. На практика нещата стоят различно. Ако изключим MPC, понеже работата по него е почти зарязана, то останалите формати имат доста светло бъдеще. И AAC и OGG Vorbis имат много потенциал, който обаче за жалост все още не е оползотворен, защото това са все още нови енкодери. MP3, за разлика от тях, е на сцената от доста време и в лицето на LAME има изключително ефективен енкодер, който успешно се съревновава с останалите макар и бидейки наистина стар кодек. Ако разработката по алтернативните формати продължава с добри темпове, то те след време ще са осезаемо по-добри, но за момента още не са ошлайфайни.
11. Какво му е по-доброто на LAME от другите mp3 енкодери?
LAME е съкращение от Lame Ain't an MP3 Encoder. Е, такъв е, макар името да твърди друго. Това е най-разработваният mp3 енкодер, за разлика от останалите, работата по които е преустановена. Той се тества постоянно и се оптимизира с всяка изминала версия. Той е специално оптимизиран за да се възползва от максимално от VBR и Joint Stereo. Този енкодер прави направо чудеса от иначе стария mp3 формат и усъвършенстването му не спира. На всичкото отгоре е напълно безплатен.
12. Lossless и lossy. Каква е разликата?
Lossless кодеците са режими на компресия при които няма никаква загуба на качеството, за разлика от lossy събратята им. При тях се използват познатите от mp3 компресията методи, но само тези, които не вредят на качеството. Докато при mp3 степента на компресия може да достигне 10 пъти, то при lossless форматите тя е около 2-2,5 пъти, но за сметка на това качеството се запазва 1:1. Информацията се преподрежда така, че да заема по-малко място, нищо не се изхвърля. Подобно на това да архивирате wav файл в ZIP или RAR формат с разликата, че ще можете да го слушате. Алгоритмите, използвани за lossless компресията са по-ефективни, защото са специално оптимизирани за компресиране на аудио информация.
Най-популярните lossless кодеци са: FLAC (Free Lossless Audio Codec), WavPack и Monkey’s Audio (
Lossless компресията е отлично решение за създаване на музикален архив, защото тя не страда от проблемите при транскодиране.
13. Транскодиране ли? Що е то?
Ще се спра поотделно на всеки от тях:
Lossless -> Lossless
Няма загуба на качеството. Можете да си преобразувате между различни lossless формати, колкото ви душа иска без да се страхувате, че ще загубите и един бит. Полезно е ако ви потрябват предимствата на друг lossless формат пред настоящия ви (стабилност, съвместимост и т.н.)
Lossless -> Lossy
Реално погледнато това е същото като да обърнете и обикновен WAV файл в lossy формат. Lossless форматите са много добри за архиви (за каквото е и пример настоящото транскодиране), както вече споменах, защото от тях винаги можете да си енкодирате какъвто друг формат ви е нужен, но не заемат толкова място като WAV файловете.
Lossy -> Lossy
Това вече е често срещано явление. Най-често се среща при желание да се намали големината на дадена mp3-ка още. Ако размерът е много важен, а качеството е от много малко (или никакво) значение, тогава е няма проблеми.
Друга ситуация е, когато имате даден mp3 файл с нисък битрейт и искате да му повишите качеството като го енкодирате наново, но с по-висок битрейт. Това няма да доведе до повишаване в качеството. В най-добрия случай ще получите файл със същото качество. Размерът обаче ще нарастне.
Тоест ако качеството е важно, то транскодирането е КРАЙНО НЕЖЕЛАТЕЛЕН процес. Нека обясня защо. При компресиране на дадена песен от аудио диск имаме изхвърляне на ненужна информация за да остане само критичната за възпроизвеждане на звука. Дотук – добре. При евентуално транскодиране, mp3 файлът се обръща обратно (разгъва се) във wav и после обратно се компресира в mp3, но с различни настройки. Процесът на разгъване във wav няма да повиши качеството, защото вече информацията е изхвърлена и няма начин да се вземе отникъде. Т.е. получвате файл със същото качество, каквото е това на mp3-ката. После обаче следва ново компресиране, при което имаме повторно пресяване на информацията и – съответно – още информация се изхвърля и качеството се влошава. Това ако смалявате файла. Ако искате да го „подобрите” имаме по-висок битрейт, но така или иначе информацията вече я няма и енкодирате същата информация с по-висок битрейт, което води до по-голям файл.
Обобщено: или получавате файл със същия размер и влошено качество или получавате файл със същото качество, но повишен размер. И в двата случая губите.
Ако ви е трудно да го разберете по абстрактния начин, ще дам пример: имате си кофа с вода – това ви олицетворява WAV файла. Искате да го компресирате в mp3 – да го пресипете в една чаша. Водата, която се губи при компресията (преливането) не ви трябва, вие не сте жаба и една чаша вода ви стига. Речено сторено – преливате водата и вече си имате хубава чаша пълна с вода (mp3-ка). Сега нека приемем, че искате да извършите една от горепосочените операции. Връщате водата от чашата обратно в кофата, но сега кофата е доста по-празна, нали? Това ви олицетворява WAV файла, който е създаден от mp3. Сега е на ред ново преливане в чаша, което олицетворява повторната компресия. Ако този път преливате в по-голяма чаша от първия път (по-висок битрейт), няма да излеете вода настрани, но после ще имате същото количество вода в по-голяма чаша. Ако преливате същия по размер чаша, като нищо ще разлеете малко и ето ви на загуба на качество. Ако преливате във по-малка (по-нисък битрейт), то отново ще се наложи да изхвърлите вода и ще имате още по-малко от първия път. Както виждате никоя от тези манипулации не води до нищо положително.
Дано съм бил ясен, защото това е важно.
Би трябвало да сте се досетили, но в случай, че не сте, нека поясня, че положението е абсолютно същото при запис на аудио диск от mp3-ки. Като ги записвате на аудио диск, не печелите нищо. А ако дадете този диск на някой приятел и той реши да си запише някоя песничка в mp3 ще осакати още качеството на получената mp3-ка. Така дадена песен ако премине през много сесии на Audio CD -> MP3 -> Audio CD -> MP3 …и в един момент ще започне да звучи като на баба тенджерите в мазата.
14. Обобщение на казаното до момента
Нека обобщим най-важното до момента:
1) При mp3 компресията има изхвърляне на ненужна информация и се запазва само критично важната за възпроизвеждане на звука.
2) Противно на популярното мнение, Joint Stereo в никакъв случай не е по-лош режим от обикновеното Stereo, дори е по-добър.
3) VBR е по-добър режим от CBR, а не обратното, както се вярва от много хора.
4) LAME е по-добър енкодер от тези базирани на Fraunhofer.
5) MP3 има достатъчно потенциал да възпроизведе песен неразличима от оригинала.
6) Обикновеният компакт диск с нищо не е по-лош от DVD-Audio или Super Audio CD.
7) Транскодирането е ЛОШО нещо. Да се енкодира дадена песен от mp3 отново в mp3, независимо от настройките, е пълна глупост АКО качеството е от значение.
Дотук сигурно си мислите, че това беше доста ударно количество информация. Да, не беше малко, но има и още.
15. Митове и легенди ширещи се в аудио средите
Тези митове и легенди засягат предимно аудиофилите и онази хай-енд (high-end) сфера на аудио оборудването. Някои от тях надали са познати на „простосмъртния” потребител, но осведомеността никога не е излишна.
Лъжата за кабелите
Много вманиачени аудиофили вярват, че качеството на звука зависи много от кабела, който се използва за свързване на усилвателя с озвучителните тела. Компаниите, разбира се, се възползват от подобни наивни и умопомрачени хора и предлагат кабели за някакви колосални суми. Става въпрос за цени, които достигат до над $20 000 за 2м. кабел. Не, не съм объркал броя на нулите, говорим си за ХИЛЯДИ долари за 2 метра кабел. Не си измислям. Това, разбира се, няма голямо влияние върху основния пазар, това са по-екстремните случаи, но като цяло лъжата се поддържа и от нея страдат дори и в малко по-ниските слоеве на аудио ентусиастите. Все пак има доста хора, които много държат на качествен звук, имат добър запас от финанси, но не са особено запознати. Тогава влизат в действие служителите в магазина, които изтърсват, че един кой си кабел, който е доста по-скъп от по-обикновения, би допринесъл за по-качествен звук. Това са глупости на кутийки. Истината е, че съпротивлението, индукцията и капацитивното съпротивление са единствените фактори, които влияят върху сигнала. Да, най-голямата евтиния наистина може да се окаже недостатъчна ако купувате истински качествена апаратура и ще се наложи да се бръкнете малко повече от най-ниската възможна цена за сносни кабели и букси. Освен това ще трябва да внимавате за съпротивлението в по-дългите кабели. С това се изчерпва значението на кабела. В действителност две метални закачалки за дрехи опънати във формата на кабел няма да се справят по-зле от магически кабел за $2000 или повече. Ето и компонентите изброени по важност:
1. озвучителни тела,
2. усилвател
3. плеър
4. кабели (и то доста по-надолу от 3-тото място)
Лъжата за „улягането”
Има разпространено вярване, че на даден кабел или аудио електроника им е нужно време за „улягане”. Има се предвид време, което трябва да се прекара в работа за да достигнат оптимално състояние. Това пълни измишльотини. Всеки сносен кабел и добре проектиран плеър или усилвател ще работят по еднакъв начин дори и след 1000 часа работа. Разлика просто няма. При високоговорителите е възможно след кратък период да достигнат оптималното си състояние на работа, но все пак това е високоговорител и има механични и подвижни части, докато другото си е електроника.
Лъжата за ламповите усилватели
Широко разпространено е вярването, че ламповите усилватели вадят по-добър звук от транзисторните такива. Това е напълно невярно. Транзисторните усилватели, ако са проектирани кадърно, са напълно способни да се справят с всяко предизвикателство по-надеждно и на по-ниска цена от ламповите си конкуренти. Разлика? Дължи се на:
1) оцветяването на звука, което явно е сметнато за добра идея от създателя на ламповия усилвател. Всеки транзисторен усилвател може да се справи със задачата – да оцвети звука – стига на инженерът проектиращ го да му мине глупавата мисъл през главата да го направи или на
2) нечие заблудено въображение, на което толкова му се вярва, че разлика има, че дори я „чува”.
Лъжата за обработването на дисковете
Ако преди време е имало разни спрейове и течности, с които да се подобрява качеството на звука при грамофонните плочи, то ги има и сега. Комерсиализъм. Има една разлика обаче, докато при плочите може и да има минимален смисъл от тях, то при аудио дисковете ползата е нулева. Самият диск съдържа нули (0) и единици (1). Те не могат да бъдат подобрени или влошени. Или ще бъдат прочетени, или няма да бъдат. Елементарно. Да, един прашасал и зацапан диск няма да се чете (добре), затова е нужно едно бързо забърсване с памучно парцалче или, ако наистина е много зацапан, да мине през една вода и да се подсуши. Воала, имаме си отново работещ диск. Не е нужно да се купуват специални мазила и други ненужни боклуци, те не могат по никакъв начин да подобрят качеството на един компакт диск. Дори и някой да твърди, че полза от подобни манипулации има, то той посмъртно няма да може да разпознае обработен с магически препарати диск от необработен такъв. Ако му се пуснат без да е наясно кой кой е.
Лъжата за цифровия звук
Говорейки си за плочи и дискове стигаме една много разпространена лъжа, а именно, че плочата по-добър носител на информация от компакт диска, което си е пълно вуду. Не виждам причина някой да избере пуканията на грамофонната плоча пред изпълнените с тишина цифрови пътечки на аудио диска. Освен това компакт диска има и предимство – информацията на него е изградена от единици и нули, които просто няма как да се деформират, за разлика от плочата, която си е аналогов носител. Да, възможно е даден диск да звучи по-зле от плоча, но това се дължи на по-лошо разположение на микрофони, по-лоша звукозаписна техника и/или по-лоша обработка на материала след записа му, а НЕ на цифровата технология на компакт диска като такава.
Ако вземем два максимално добре направени записи на плоча и диск, то те ще звучат еднакво добре.
Ще продължим с начинът за изкопиране (рипване) на аудио компакт диск в mp3.
16. Как да си запишем максимално качествено аудио диск в mp3?
Стигнахме и до частта, в която ще стане ясно как да си направите рип на аудио диск с отлично качество. Изключвам онези сборки, които всеки си прави на аудио дискове, защото те са правени от mp3-ки, което автоматично елиминира качеството като вариант. Става въпрос за рип на оригинален аудио диск в mp3.
Методът не е толкова опростен както е при работа с db PowerAmp или CDex, например, но ако наистина държите на оптималното качество, то това е за вас.
Ще са ни нужни от 2 до 4 неща, в зависимост от предпочитанията и нуждите ви.
И четирите продукта са напълно безплатни, дишайте спокойно.
Ето нужният софтуер с описание за какво служи (линкове за теглене – в края на темата):
* Exact Audio Copy (EAC) – категорично и безапелационно най-добрият рипър (ripper) на аудио дискове във WAV формат.
* LAME Encoder – най-добрият MP3 енкодер; него ще използваме да обръщаме рипнатите от EAC WAV файлове в MP3.
* RazorLame – доста добър графичен интерфейс за LAME.
* MP3Gain – служи за анализ на получените mp3-ки и промяна на нивото на звука, нещо като нормализиране, но не съвсем. За тази програма, ще спомена по-подробно по-нататък.
Без EAC и LAME сме за никъде – те са задължителните елементи. RazorLame ще ви е нужен ако предпочетете да енкодирате ръчно песните си, а MP3Gain е по желание. Ще опиша начините и вие, на базата на нуждите и предпочитанията си, ще прецените кой вариант е по-удачен за вас.
Първият вариант включва интеграция на LAME в EAC и ще можете директно да записвате mp3-ки. Вторият вариант включва и RazorLame. Тогава ще рипвате аудио диска във WAV с EAC, а после ръчно ще енкодирате с помощта на RazorLame. Малко по-тромаво е в някои отношения, но предлага по-голяма гъвкавост. Ще опиша именно този метод, а ако има интерес, ще добавя и описание и на другия.
Започваме с инсталация и конфигуриране на EAC. За да съм сигурен, че всичко е ясно, ще обяснявам като за идиоти. Не искам да обидя никого, а просто да съм сигурен, че ще съм ясен. Пригответе си някакъв аудио диск, но оригинален, а не записан CD-R или CD-RW.
Теглите си желаната от вас инсталация на EAC и си инсталирате/разархивирате в удобна за вас папка, която няма да местите и си пускате програмата. Тя ще ви посрещне с вълшебника за настройка.
Като добър потребител си кликате Next.
На втората страница ще ви се изведе списък с наличните устройства, които предлага да конфигурира. Ако имате инсталиран Daemon Tools, Alcohol 120%, Virtual CloneDrive или друг софтуер, който създава виртуално оптично устройство, то ще бъде включено в списъка. Махнете отметката и оставете отметки само за истинските оптични устройства (фиг. 1). Аз, в случая, имам две:
На следващата страница EAC ще започне с настройките на устройствата. Ще трябва да повторите операцията толкова пъти, колкото на брой устройства имате. Аз имам две, но ще спестя конфигурацията на второто, за да не се губи ценно място и време. В прозореца избирате I prefer to have accurate results (фиг. 2):
Ако на следващата страница ви се появи прозорец със следните две стойности:
Use these values to configure this drive и I don’t trust these values, detect the features for my drive (фиг. 3), изберете втората и кликнете Next:
(фиг. 3)
Сложете си аудио диска и на следващата страница си кликнете спокойно:
Ще се появи прозорец, който показва прогреса и резултатите от теста на функциите на устройството (фиг. 4), а след като приключи, ще се изведе прозорец с готовите резултати (Внимание: запомнете ги или си запишете за всеки случай.) (фиг. 5), в който си кликате Next:
След като приключите с настройките на всички устройства (ако са повече от едно), при натискане на Next ще се каже, че устройствата са вече настроени (фиг. 6):
На следващата страница ще ви се предложи да инсталирате и конфигурирате LAME.exe, но няма да го правите още, затова махнете отметката на Install and configure the external LAME.EXE compressor (фиг. 7) и кликнете Next:
На следващата страница ще имате възможност да въведете email адреса си ако желаете достъп до freedb. Ако не ви трябва или не знаете какво е това, просто оставете полето празно и кликнете Next.
Следва последната страница от вълшебника. В нея си изберете I am an expert, let me use the full potential of EAC и кликнете Finish (фиг. 8):
След натискане на бутона Finish, EAC ще е почти готов за работа, остават още малко настройки.
От меню EAC изберете EAC Options (или натиснете F9). В страницата Extraction е най-добре да имате отметки на следните опции: Fill up missing offset samples with silence, Synchronize between tracks (много важна опция) и Lock drive tray during extraction. Накрая променете Error recovery quality от Medium на High от падащото меню. Трябва да изглежда ето така (фиг. 9):
Другата важна опция при настройките на EAC е в страницата Normalize. По подразбиране тя е изключена и така и трябва да бъде. Споменавам го за да знаете да НЕ я включвате. Всички останали опции можете да си настроите по ваш вкус ако имате време и желание.
Като приключите тук, кликате OK.
Сега от меню EAC изберете Drive Options (или натиснете F10). Тук ще е малко по-сложно. В страницата Extraction Method изберете Secure Mode, ако вече не е избран, и проверете дали отметките под него съвпадат с засечените по рано от EAC функции. Ако не съвпадат сменете отме