Dažnai įrašus kolekcionuojantis muzikos
mėgėjas susiduria su problema, kokiu
formatu saugoti savo muzikos kūrinių kolekciją:
pasirinkti tradicines vinilines
plokšteles, šiuo metu populiarius muzikos
CD ar naujas, patobulintas laikmenas, pavyzdžiui,
“Sony Super Audio CD”? O gal
verta naudoti muzikos suspaudimo (kompresijos)
programas ir į vieną CD-R diską
sudėti iki kelių šimtų kūrinių?
Dažniausiai suspaudžiant rinkmenas
prarandama dalis informacijos. Todėl jei
nebūtina, kad garsas visiškai prilygtų originalui,
jas suspauskite. Tačiau suspaudimo
algoritmas naudojamas tik esant galutiniam
garso įrašo variantui.
Kaip pasirinkti suspaudimo parametrus?
Yra du pagrindiniai kodavimo režimai:
128 Kb/sek. (gaunama priimtina
garso kokybė, pasiekiamas didžiausias
suspaudimo laipsnis; aktualus skelbiant
kūrinius internete) ir 256 Kb/sek. (originalo
kokybė išlaikoma mažiau suspaudžiant
informaciją). Be abejo, yra daug
tarpinių variantų, todėl kiekvienas
žmogus gali jį pasirinkti pagal turimos
garso aparatūros lygį ir kitus keliamus
reikalavimus.
Kokį suspaudimo formatą geriausiai taikyti:
MP3, LQT, WMA, MP+, “MP3Pro” ar
“ogg vorbis”? Populiariausias — MP3 formatas:
kokybės ir populiarumo atžvilgiu
jam neprilygsta net naujasis “MP3Pro”.
šiuo metu vieni didžiausių MP3 konkurent
ų yra “Microsoft WMA”, “ogg vorbis” ir
“MP3Pro”, tačiau, remiantis interneto svetainės
IXBT.com atliktais išsamiais tyrimais,
MP3 formatui jie dar neprilygsta,
ypač kai kalbama apie kokybę koduojant
garsą dideliu (192 — 320 Kb/sek.) duomenų
srautu (bitrate). Duomenų srauto dydis —
svarbiausias garso autentiškumo kriterijus.
Kaip gauti geresnę kokybę taikant MP3
formatą? Pirmiausia reikia muzikos CD
garso takelius perkelti į diskinį kaupiklį
WAV formatu (procesas angl. vadinamas
ripping). šiam tikslui skirta daugybė įvairiausi
ų programų, tačiau geriausiai darbą
atlieka daugelio pripažinta programa
“Exact Audio Copy 0.9b2” (www. exactaudiocopy.
de). šią programą galima naudoti
ne tik garso takeliams kopijuoti ar
esantiems traškesiams pašalinti (jei muzikos
CD buvo pažeistas ar yra blogas įra-
šas), bet ir jiems redaguoti, suspausti bei
įrašyti į CD-R diskus. Programa yra nemokama.
Ar prieš suspaudžiant reikia papildomai
apdoroti WAV rinkmenas? Jei didžiausias
signalo lygis yra apie 0 dB, t.y.
per aukštas, jį reikia sumažinti. To nepadarius,
suspaudžiant signalas gali pakisti.
Jo lygį reikia nustatyti atsižvelgiant į signalo
kodavimo duomenų srautą: kuo
srautas mažesnis, tuo daugiau jį reikia sumažinti.
Pavyzdžiui, koduojant garsą 128
Kb/sek. srautu, siūloma apie 25 proc. (iki
3 dB) sumažinti signalą. Koduojant 320
Kb/sek., pakaks sumažinti 2 — 5 proc.
(100 proc. = 0 dB). Normalizavimo algoritmo
naudoti dažniausiai nereikia, ypač
jei normalizuojama iki labai aukšto lygio
(98 ar net 100 proc.).
Dirbant su muzikos CD, normalizavimo
algoritmas visiškai nereikalingas, jį
verta naudoti nebent rašant kūrinius iš
kitų šaltinių, kai labai žemas signalo lygis.
Tokiu atveju normalizuoti reikia visą
kūrinių rinkinį (albumą).
Baigus pirmąjį etapą, turimas WAV
rinkmenas reikia koduoti (encode) specialia
programine įranga. Remiantis jau minėtos
IXBT.com svetainės bandymų duomenimis,
šiam tikslui geriausiai tiks LAME
3.91 (lame.sourceforge.net, mitiok.
cjb.net) programa, pasižyminti įvairiomis
nustatymo galimybėmis, be to, ji geriausiai
suspaudžia garsinę informaciją dideliu
(192 — 320 Kb/sek.) duomenų srautu.
LAME yra sparčiai besiplečiantis atvirojo
kodo projektas (kaip ir “Linux”), prie kurio
gali prisidėti visi programuotojai.
Vis dėlto prasčiausiomis laikomos
XING branduolio pagrindu sukurtos kodavimo
programos (geriausiai žinoma
“Audio Catalyst”), negailestingai “nupjaunančios”
aukštus dažnius. Tiems, kurie
nori suspausti duomenis 128 Kb/sek.,
siūloma rinktis “Fraunhofer” (wwwšiis.
fhg.de/amm/) branduolio pagrindu sukurtas
programas (geriausia garso kokybė
pasiekiama būtent esant šiam diapazonui).
Ødomu pastebėti, kad kūrinys, suspaustas
XING branduoliu paremta programa
“XingMPEG Encoder” (256 Kb/sek.
duomenų srautu), kokybe prilygsta 192
Kb/sek. srautu suspaustam kūriniui naudojant
LAME.
LAME neturi grafinės aplinkos (dirbama
komandinėje eilutėje), todėl darbą su
ja labai palengvina grafinės sąsajos (frontend)
programos — kodavimo procesas
tampa greitesnis ir patogesnis. Viena populiariausi
ų šio tipo programų — nemokama
“RazorLame 1.1.5” (www.dors.de/razorlame/).
LAME kodeką gali naudoti ir
anksčiau minėta “Exact Audio Copy”
programa, tačiau ji leidžia keisti tik paprasčiausius
parametrus, neišnaudojamos
visos LAME galimybės.
Naujausiose LAME versijose naudojamas
GPSYCHO pavadintas psichoakustinis
modelis. Psichoakustika yra neatsiejama
ir viena svarbiausių suspaudimo algoritmo
dalių.
Kiekvienam dažnių diapazonui nustatomas
nustelbiančio efekto, kurį sudaro
greta esančių diapazonų signalas, dydis.
Jei šis nustelbiančio efekto dydis viršija
mus dominančio diapazono signalo galingumą
arba diapazono signalo galingumas
yra žemesnis už girdimumo ribą, šis
signalo diapazonas praleidžiamas ir nekoduojamas.
Kitaip tariant, programuotojai
sukuria statistinio žmogaus girdėjimo
modelį, ir jei šio modelio “žmogus” negirdi
kai kurių dažnių (dažniai yra per silpni
klausai ar juos nustelbia stipresni garsai),
jie nebus koduojami. LAME projekto pradžioje
psichoakustinio modelio pagrindas
buvo standartinis ISO modelis, tačiau, kitaip
negu ISO, LAME modelis buvo nuo-
lat tobulinamas ir dabar jame liko tik labai
nedidelė ISO kodo dalis.
Ar reikia atsisakyti LAME naudojamo
GPSYCHO modelio? Geriau to nedaryti,
nes LAME sukurtas GPSYCHO skamba
geriau už originalų ISO modelį ir šiuo
metu laikomas pačiu geriausiu.
Kokio tipo kodavimą geriau taikyti:
CBR, VBR ar ABR?
CBR (Constant Bitrate — nuolatinis duomen
ų srautas) kodavimo tipas yra seniausias
ir dažniausiai naudojamas. Visoms
kūrinio dalims koduoti skiriamas
vienodas bitų skaičius, todėl bendra kūrinio
kokybė skiriasi — sudėtingos dalys užkoduojamos
prastesne kokybe, paprastesnės
— geresne.
Koduojant VBR (variable bitrate) metodu
stengiamasi išlaikyti viso kūrinio vartotojo
nurodytą kokybę. Todėl kiekvienai
kūrinio daliai bandoma parinkti optimal
ų bitų skaičių. šis metodas kol kas tobulinamas.
ABR (Average Bitrate — vidutinis duomen
ų srautas) kodavimo algoritmas sujungia
CBR ir VBR tipų gerąsias savybes,
jį naudoti rekomenduoja ir LAME kūrėjai.
Nurodomas vidutinis skiriamų bitų
skaičius, todėl sudėtingesnėms kūrinio
dalims bus skirta daugiau bitų, paprastesnėms
— mažiau. ši technologija būdinga
dar dviems suspaudimo formatams: AAC
ir komerciniam “Liquid Audio”.
Kaip geriau koduoti stereosignalą: “stereo”,
“joint-stereo” ar “dual channel” režimu?
“Joint-stereo” patartina naudoti
koduojant iki 160 Kb/sek. duomenų srautu,
“stereo” — aukštesniam ir aukštam 160
— 320 Kb/sek. srautui, o “dual channel”
siūlomas tuomet, kai vartojamos kelios
kalbos (pvz., vienu kanalu — anglų kalba,
kitu — prancūzų). Tuomet kiekvienas kanalas
koduojamas atskirai. Naudojant
“dual channel” muzikos kūriniams, gaunama
prastesnė kokybė.
Ar verta “nupjauti” žmogaus ausiai negirdimus
dažnius? Vieni siūlo palikti dažnius
iki 16 000 Hz, kiti — iki 22 000 Hz. Atlikus
tyrimus, kurių metu bandyta nustatyti,
kaip žmogus atskiria tikro akustinio
instrumento garsą nuo sintetinio jo pakaitalo,
paaiškėjo, kad būtent “negirdimi”
dažniai lemia žmogaus juntamą skirtumą
tarp originalo ir kopijos.
Daugiau apie nustatymus ir jų įtaką
kokybei sužinosite perskaitę LAME technin
ę dokumentaciją.
Kokį duomenų srautą koduojant pasirinkti:
256 Kb/sek. ar 320 Kb/sek.? Dar ir
dabar tenka išgirsti, kad 128 Kb/sek. —
muzikos CD kokybė. Gaila, tačiau taip
nėra, nors šis mitas tikrai populiarus. CD
kokybei prilygti gali nebent kūrinys, užkoduotas
256 — 320 Kb/sek. duomenų
srautu.
Daugeliu atvejų 256 Kb/sek. atitinka
tikrąjį CD ir atskirti kopiją nuo originalo
beveik neįmanoma. 320 Kb/sek. duomen
ų srautą verta naudoti tuomet, kai koduojant
256 Kb/sek. gaunami girdimi signalo
iškraipymai (tai mažai tikėtina, ypač
taikant ABR kodavimą). Kai kurie autoriai
siūlo 320 Kb/sek. taikyti koduojant
klasikinės muzikos kūrinius.
Jei nenorite gilintis į muzikos kodavimo
subtilybes, pasinaudokite nemokama
rusų autoriaus programa “OrlSoft Mpeg
eXtension 2.10” (wwwšorlsoft.ru, orlsoft.
timus.ru), kuri pasistengė įgyvendinti
visus kodavimo procesui keliamus
uždavinius, kad būtų gauta geriausia kokybė.
ši programa taip pat atlieka LAME grafinės
sąsajos vaidmenį. Tai ypač aktualu
“Windows 2000” operacijų sistemos vartotojams,
nes joje nei “RazorLame”, nei
daugelis kitų LAME programų neveiks.
Tačiau tai — tik maža programos galimybi
ų dalis: ji taip pat gali kopijuoti muzikos
takelius iš CD į WAV, panaikinti tylą
kūrinio pradžioje ir pabaigoje, suvienodinti
įrašo lygį, tvarkyti ID3 informaciją
ir t.t. Beje, “OrlSoft Mpeg eXtension”
autorius rekomenduoja taikant 256
— 320 Kb/sek. kodavimą riboti dažnius iki
20 000 Hz (LAME raktas — lowpass 20.0).
Iš interneto verta atsisiųsti naujausias
Lame.exe bei lame_enc.dll versijas ir jomis
pakeisti senesnes, esančias programos kataloge.
---
[^] Atgal
[«] Skaitykla

* * Gen. time: 0.0233
* © xneox.com