2011. július-szeptember
A projektorok kalibrációjáról szóló írásunkban szóba került, hogy mennyire fontos (egyebek mellett) a gamma megfelelő beállítása ahhoz, hogy a forrás képét a vetítő korrekt módon reprodukálja. Érdemes azonban a gamma fogalmát közelebbről is szemügyre venni. A cikk végére talán kiderül, hogy miért…
Rögtön szögezzük le, hogy a gamma fogalmát használják a fotográfiában és a filmkészítésben, a szkennelés és a nyomtatás területén is, vagyis mindenütt, ahol képátvitelről, képvisszaadásról van szó. Bár nem lenne haszontalan ezeket a témaköröket is körbejárni – a film gammája különösen érdekes a vetítéstechnikában, és később sort kerítünk a magyarázatára –, ám ebben az írásban csak az elektronikus megjelenítés (megjelenítők), illetve általánosítva az elektronikus képátviteli lánc gammájával foglalkozunk.
A CRT hagyatéka: a gradációtorzítás
Az elektronikus képjel képpé való átalakítását több mint fél évszázadon át kizárólagosan uralta a katódsugárcső vagy elektronsugárcső (CRT – Cathode Ray Tube), azaz a mindenki által ismert hagyományos képcső. Ez így volt a televízió, a videó, és hosszú ideig a számítógépek és grafikus munkaállomások esetében is. A képcső ma már erősen kiszorulóban van a használatból, de ez semmit nem változtat azon, hogy néhány jellemzője véglegesen (vagy legalábbis belátható ideig) meghatározta a képátvitel néhány sajátosságát.
A katódsugárcsőről kezdettől fogva tudott dolog volt – az egyszerűség kedvéért egyelőre beszéljünk a fekete-fehér képcsőről –, hogy a képtartalmat reprezentáló vezérlő videojel feszültsége és a képernyő világossága (fénysűrűsége) nem egyenesen arányos egymással, hanem az összefüggés meglehetősen drasztikusan eltér a lineáristól. (Itt most szigorúan a mérhető mennyiségekről beszélünk, a szubjektíve érzékelhető világosság és a mérhető fénysűrűség kapcsolatát későbbre hagyjuk.)
A nemlinearitás oka a képcső működési elvében keresendő, ugyanis a képernyő foszforbevonatát gerjesztő elektronsugár intenzitása (a sugáráram) és az említett vezérlő feszültség kapcsolatát ún. hatványfüggvény írja le. (Figyelem! NEM exponenciális függvény, mint ahogy gyakran állítják bizonyos források.)
Talán a legismertebb hatványfüggvény az y = x2, amelyen jól szemléltethető a nemlinearitás mértéke: x-et kétszeresére, háromszorosára stb. növelve y a négyszeresére, kilencszeresére stb. növekszik, illetve x-et felére, harmadára stb. csökkentve, y a negyedére, kilencedére stb. csökken. Általánosan azt, hogy y növekedése, illetve csökkenése mennyivel rohamosabb, mint x-é, a kitevő nagysága dönti el, de érzékelhető, hogy már 2-es kitevő is meglehetősen durva nemlinearitást okoz.
A képcső esetében a nemlinearitás mértékét hasonlóképpen a hatványkitevő - mégpedig egy 2-nél nagyobb hatványkitevő - fejezi ki, amelyet gammának nevezünk (γ). Pici matematikát hozva a fejtegetésbe, ha L a fénysűrűség vagy „fényerő” a képernyőn (a képcső „kimeneti” jellemzője, azaz y), U a videojel feszültsége (a képcső bemeneti feszültsége, azaz x), k egy állandó szorzótényező, γ pedig maga az említett hatványkitevő, akkor kissé leegyszerűsítve igaz, hogy
L = k × Uγ. Ábránkon mindkét mennyiséget (a feszültséget és a fénysűrűséget is) „normalizáltuk”, azaz relatív egységekben, a maximális értékekhez viszonyítva tüntettük fel, mert csak az összefüggés jellegét akartuk szemléltetni.
A katódsugárcső átviteli karakterisztikáját szemléltető gammagörbe, amely egy szabályos hatványfüggvény kb. 2,5 körüli kitevővel. Mivel a vezérlő videojel (feszültség) és a képernyő világossága (fénysűrűsége) között az összefüggés erősen nemlineáris, a képcső ún. gradációtorzítást okoz, az eredeti jelenet vagy kép részleteinek világossága közötti arányok megváltoznak: a sötét tartomány öszenyomódik, a világos széthúzódik
A színes képcsövek esetében természetesen a gamma mindhárom alapszínre ugyanakkora, különben a helyes színvisszaadás eleve csorbát szenvedne. Azaz mindhárom alapszínre külön-külön is a fenti összefüggés érvényes. A három gammagörbe persze ugyanakkora videojelnél (szürke kép) más-más fénysűrűségnek felel meg a képernyőn, az alapszínek eltérő súlyozó együtthatói miatt. Ennek hátterében az az ismert tény áll, hogy szemünk a különféle hullámhosszúságú fények világosságára (fénysűrűségére) nem egyformán érzékeny: a legérzékenyebb a zöld-sárga tartományban, kevésbé érzékeny a vörösben, és legkevésbé a kékben. Jól beállított fehér (szürke) esetében a három alapszín egyforma teljesítménnyel sugároz, a háromféle képpont fénysűrűsége azonban a szem V(λ) érzékenységének megfelelően különbözik. Vagyis az R, G, B gammagörbék menete és a gamma értéke is egyforma, csak a függőleges tengely szerinti értékek különböznek.
Egy konkrét, számítógépről meghajtott katódsugárcsöves monitor képcsövének mért R, G, B gammagörbéi. A képcső R, G, B bemeneti jeleti természetesen gammakorrigált jelek, így helyesebb lenne az R', G', B' jelöléseket használni
A gamma értéke (és ezen most kizárólag a képcső natív, fizikai jellemzőjét értjük) valahol 2,2 és 2,6 között van, függ a konkrét konstrukciótól, a cső öregedésétől stb. Régebben általában 2,5-ös képcsőgammával számoltak, manapság inkább a 2,2 körüli értéket tekintik irányadónak, de ebbe olykor beleszámítják az elektronikus módosítás lehetőségét is. Ha pusztán egy konkrét képcsövet nézünk, a natív gamma közvetlen befolyásolására nincs mód, de közvetve – elektronikusan, a vezérlő feszültség módosításával – ha nem is maga a függvénykapcsolat, de a gradációtorzítás mértéke az eredeti gradációhoz képest megváltoztatható. (A műsorkészítő master stúdiókban ma is működő professzionális képcsöves ellenőrző monitorok gammáját 2,4 körüli értékre állítják (csaknem teljesen sötét környezethez). A konzumer képcsöveknél (házi használatú televízióknál) nincs, ill. nem volt ilyen lehetőség, kivéve talán néhány mai csúcsmodellt.
A feketeszint állítása (a BRIGHTNESS/fényerő szabályozóval), illetve a fehérszint állítása (a CONTRAST/kontraszt szabályozóval) a tévhittel ellentétben nem magának gammának az értékét változtatja a teljes jeltartományban, hanem a „fekete” vezérlőfeszültséghez tartozó fénysűrűséget, illetve a videojel erősítését. Ennek hatása bizonyos fénysűrűség-tartományokban „immitálhatja” a gamma változtatását, pedig valójában a szabályos függvényalakot torzítja szabálytalanná.
Rendkívül félrevezető ugyanakkor, hogy a BRIGHTNESS és CONTRAST szabályozóknak az igazi feladata nem az elnevezésük szerinti fényerő- vagy kontrasztszabályozás, lásd a Mire (nem) használhatók a kezelőszervek? c. írást.
A professzionális CRT ellenőrző monitorokba (stúdiók, közvetítőkocsik stb.), és egyes számítógép-monitorokba viszont ténylegesen beépítik a gamma elektronikus változtatásának lehetőségét, a monitorban található LUT (look up table) formájában. Ez annyit jelent, hogy az eredeti videojel értékeknek megfelelő digitális kódok a LUT szerint módosulnak, és így a natív gammától eltérő lesz a monitor „teljes” gammája, pl. 2,4 vagy 2,2.
Lényeges azonban az, hogy a CRT-nél a gradációtorzítás nagyon jó közelítéssel szabályos (végig ugyanolyan hatványkitevőjű) hatványfüggvénnyel, azaz állandó gammával írható le. Akár szerencsésnek is mondható, hogy az első, nagyon sokáig és széles körben használt képreprodukáló eszköz ilyen szabályosan működött – még ha nem kívánatos jelenségnek tekintjük is a gradációtorzítást. Meglepő, de a gradációtorzításnak, pontosabban a kompenzálásához szükséges nemlineáris korrekciónak áldásos "mellékhatásai" is vannak a forrásoldalon, a fénysűrűségértékek digitális kódolásakor.
A gradációtorzítás hatásának szemléltetése. A felső kép az eredeti fényviszonyokat , illetve fénysűrűség-arányokat mutatja. A háttérben jól megkülönböztethetők a különböző világosságú részletek, sőt még a csónak árnyékában is jól kivehetők a világosságkülönbségek. Az alsó kép (amelyen nem történt előzetes gammakorrekció, lásd később) egy kb. 2,2-es gammájú gradációtorzítás hatását mutatja. A héttér szinte teljesen egybefolyik, csak a bal felső sarokban világít a fehér folt, a csónak árnyékában pedig minden egyformán sötét.
A bal oldali kép szabályosan gammakorrigált és nagyjából helyesen exponált. A jobb oldali képen a gammakorrekció hiánya színesben természetesen ugyanúgy meglátszik, mint a fenti fekete-fehér képen. Az is kiderül azonban, hogy a gradációtorzítás, azaz a megjelenítő nemlineáris átviteli karakterisztikája a színezetet (hue) - lásd pl. a cián "D" betüt és a sárga "A" betűt - és a telítettséget (saturation) is torzítja, kivéve a maximális telítettségű tiszta alapszíneket (ha lennének ilyenek a képen). Érdekes megfigyelni, hogy a súlyosan hibás gradáció ellenére a jobb oldali kép "dinamikusabbnak" tűnik a megnövekedett szaturáció és belső kontrasztarányok eltolódása miatt. A sötét tartomány részleteinek összemosódása mégis élvezhetetlenné teszi ezt a képet.
(Megjegyzés: A fenti képekkel egy kb. 2,2-es gammájú CRT gradációtorzítását akartuk szemléltetni, noha tudjuk, hogy a T. Olvasó most valószínűleg nem CRT monitoron nézi a képeket. Feltételezzük azonban, hogy az olvasó által használt monitor gammája is közel van a 2,2-höz, és a gammagörbe alakja sincs nagyon messze a szabályostól.)
Egy kis kitérő
A LUT-ot illetően (amely tehát tulajdonképpen az igényeknek megfelelő gamma beállítására szolgáló transzformációs/megfeleltető táblázat, és egyben a transzformációt elvégző elektronikus egység) a professzionális CRT monitorokhoz hasonló a helyzet a ma egyre inkább használt professzionális LCD vagy plazma videomonitorok esetében is, vagy akár a projektorokat is ide sorolhatjuk, sőt a LUT szerepe itt alapvetővé vált, mivel a CRT-től eltérő elven működő megjelenítő eszközök natív átviteli karakterisztikája nem követi a szép, szabályos hatványfüggvény görbéjét, hanem a feketétől a fehérig terjedő tartományban változó, és nem fejezhető ki egyetlen „gamma” értékkel, vagy pl. a DLP projektorok DMD chipjének natív gradációátvitele lineáris, így „elő kell állítani” a megfelelő gammát. Így a LUT feladata, hogy olyan gammát állítson elő, mintha CRT-vel lenne dolgunk, lényegében „emulálnia” kell a CRT-t. A számítógép-monitoroknál ugyanez a helyzet.
Újabb fejlemény, hogy egyes csúcskategóriájú konzumer megjelenítőkbe (projektor, plazma, LCD TV) is beleteszik a gamma szabályozásának lehetőségét. Mint látni fogjuk, ez azért indokolt, mert a környezeti feltételektől függően az optimális gradáció beállításához (az alkotói szándék érvényesüléséhez) szükség lehet a gamma állíthatóságára. Körülményesebb ugyanis fix gammához beállítani a megfelelő környezeti világítást, mint fordítva.
A feszültség, ill. a fénysűrűség abszolút értékekben is megadható (pl. millivoltban és nitben), de a leggyakrabban relatív, azaz 0 és 1 vagy 0% és 100% között skálát használnak mindkét tengelyen.
A szabványos (abszolút) feszültségértékek a „feketétől” a „fehérig” analóg kompozit videojel esetében a 0…700 mV-os tartomány (NTSC: 54 mV…714 mV), illetve „relatív” egységben, amelyet az Institute of Radio Engineers szervezet javaslatára vezettek be még a múlt század első felében, 0 IRE…100 IRE (NTSC: 7,5 IRE..100 IRE). Valójában az IRE értékekhez is tartozik egy abszolút feszültségérték, a PAL esetében 1 IRE = 7 mV, az NTSC-nél 1 IRE = 7,14 mV. Az IRE idejétmúlt egység, de szokásból még használják. A digitális videóban az IRE egység használatának már egyáltalán nincs értelme, helyette a kvantálási szinteknek megfelelő kódokat adják meg, általában decimális alakban (pl. 0, 1, 2,..., 253, 254, 255).
Digitális videojelet feltételezve, a CCIR Rec. 601 szerint (SD videojel) a feszültséget 8 biten, 16-tól 235-ig kódolják, egyébként pedig egy számítógép rasztertárolójában (frame buffer) a kódok 0 és 255 között vannak (színenként). Az alsó, illetve felső értékek megfelelnek a referencia-feketének, illetve a referencia-fehérnek. 10-bites kvantálás mellett a teljes kódkészlet (decimális formában) 0, 1, 2, … 1023. Ekkor a digitális videóban a referencia-feketének a 64-es kód, a referencia-fehérnek a 940-es kód felel meg. A 64 (16) alatti részt nevezzük footroomnak, a 940 (235) fölötti tartományt pedig headroomnak. Hogy ennek mi a szerepe, arról később…
Sajátos tény, hogy az adóoldali vagy forrásoldali szabványokban a leggyakrabban a megjelenítésnél 2,2-es CRT (vagy általánosságban kijelző) gammát feltételeznek – ez afféle kiindulási alap, és szoros kapcsolatban van a fent elmondottakkal.
A képcső gammájának kompenzálása
Megállapítottuk tehát, hogy a képcső átviteli karakterisztikája eredendően nemlineáris, más szóval gradációs torzítást okoz a képvisszaadásban. Kézenfekvő, hogy ha egy jelenet vagy tárgy, vagy akár egy beszkennelt fotó fényviszonyait, részleteinek világosságát (akár fekete-fehérben, akár színesben) helyesen akarták reprodukálni, akkor a képcsőnek ezt a „viselkedését” korrigálni kellett, mégpedig úgy, hogy a teljes közvetítési lánc átviteli karakterisztikája lineáris legyen – első közelítésben! Azért mondjuk most, hogy első közelítésben, mert kiderült, hogy látásunk sajátosságai miatt mégsem a teljesen lineáris karakterisztika a kívánatos. Ezt a későbbiekben bővebben kifejtjük.
A képcső gradációs torzításának forrásoldali (előzetes) kompenzációját nevezték el gammakorrekciónak. Ha ez nem történne meg, akkor egy felvett jelenet gradációját (világosságkülönbségeit) a képcső elfogadhatatlan mértékben eltorzítaná (lásd a fenti képeket). A sötét árnyalatok egybefolynának, a világosak pedig aránytalanul széthúzódnának. Mivel ez a forrásoldali vagy adóoldali korrekció előírásosan általánossá vált (nem csak a televízióban/videóban, hanem a számítástechnikában is, bár itt a gammakorrekciót olykor több lépésben, a frame buffer előtt vagy/és után végzi el a gép), az új típusú megjelenítő eszközöknek is alkalmazkodni kellett a már kialakult helyzethez.
Elvben a gammakorrekció (helyesebb szó lenne a kompenzáció) az átviteli lánc bármely pontján elvégezhető lenne a képcső (általánosságban: kijelző eszköz) előtt, de a videotechnikában megállapodásszerűen, történelmi, költségtakarékossági és egyéb okokból mindig a képforráshoz közeli ponton (kamera, képszkenner) iktatják be az átviteli láncba, így a megjelenítő eszközbe (pl. a képcsöves vevőkészülékekbe) nem kell(ett) emiatt plusz áramköröket beépíteni. Más kérdés az, hogy a gammát (de nem a most tárgyalt alapkompenzációt) sok esetben szándékosan akarjuk a vevőoldalon változtathatóvá tenni. Már utaltunk rá – bár ez külön témakör, és feltétlenül beszélni kell róla –, hogy a gammakorrekciónak nagyon nagy a szerepe abban, hogy alapesetben elegendő a színenkénti 8-bites kvantálás a digitális videojel előállításához.
Egy élő vagy rögzített jelet előállító videós/televíziós láncban tehát a gammakorrekciót rögtön a felvevő kamera, pontosabban már a képérzékelő(k) jelén, illetve alapszínjelein elektronikusan végezték/végzik el, vagyis a kamera kimenetén nem az eredeti lineáris Y, illetve R, G, B jeleket (feszültségeket), hanem a gammakorrigált, nemlineáris Y’, illetve R’, G’, B’ jeleket kapjuk. Ez azt jelenti, hogy a kamera „bemenete” (fénysűrűség, fényintenzitás) és kimeneti feszültsége közötti, egyébként lineáris összefüggést a képcsövet jellemző átviteli görbére (lásd az első ábrát) „tükrözött” ún. inverz görbének megfelelően kellett/kell korrigálni. Azaz a korrekciós függvény is egy hatványfüggvény, csak a kitevője a képcső gammájának éppen fordított értéke, elméletben 1/2,5 = 0,4. A teljes lánc gammája (és ez már a gamma fogalmának kiterjesztése, lásd később) így pontosan 1-es értékű, azaz a képernyőn pontosan olyan világosságértékeket látunk, mint amit a kamera lát, illetve, amit mi látnánk a helyszínen, eltekintve persze az átviteli lánc és a megjelenítő eszköz okozta dinamika-korlátozástól.
Azért mondtuk a 0,4-re, hogy „elméletben”, mert a manapság (sőt már az 1953-as NTSC szabványban) feltételezett kijelzőgamma (ami nem feltétlenül azonos a CRT fizikai gammájával) 2,2-es érték. A gammakorrekció (a „kamera gammája”) ennek fordított értéke, azaz 0,45. Sajátságos módon még a mai HDTV stúdiószabványban (Rec. 709) is ez az érték szerepel. Itt azonban bejön még egy „csavar”! A gammakorrekciós görbe legalsó rövid szakaszát ugyanis egy egyenes szakaszként (lineáris átvitel 1-es gammával) definiálják. Így végeredményben a kétféle függvényből álló forrásoldali gammakorrekciós görbe „helyettesíthető” egy kb. 0,5-ös gammájú „szabályos” hatványfüggvénnyel, és a kalibráló szakemberek a Rec. 709 szabvány szerinti beállításkor valójában 0,5 körüli értékkel számolnak. Vajon miért? Ezt próbáljuk hamarosan megmagyarázni.
A 0,5-ös forrásoldali gammakorrekció és a 2,2-es kijelzőgamma kb. 1,1-es eredő átviteli nemlinearitást jelent, azaz a 2,2-es gamma némileg "alulkompenzált". Ha a kijelzőgamma 2,5, ugyanez a gammakorrekció 1,25-ös "alulkompenzációhoz" vezet. Az 1,0 értékkel jelölt egyenes az elvben ideális lineáris eredő átvitelt jelöli, amit a fenti esetben 2,0 gammával lehetne elérni - a szubjektív eredmény azonban nem lenne kielégítő. Hogy miért jó az alulkompenzáció, azaz a lineáristól eltérő, 1-nél nagyobb kitevőjű teljes átviteli karakterisztika, arra a következőkben adunk magyarázatot.
A gamma általánosítása
Mint láttuk, szűkebb és eredeti értelmében a gamma a képcső (a képcső „kihalásával” pedig az egyéb megjelenítő eszközök) nemlineáris átviteli karakterisztikájának natív, fizikai jellemzője. Ez a nonlinearitás torzítást (elsődlegesen gradációtorzítást) visz be a képvisszaadásba. Az előzőekben azonban a gamma fogalmát hallgatólagosan kibővítettük, azaz már megtettük azt, amit a gamma általánosításának nevezhetünk.
Ez azt jelenti, hogy a gammát a képátviteli lánc bármely szakasza nemlinearitásának (vagy éppen linearitásának) jellemzésére használjuk, és messze nem csak önmagában a képcső vagy más kijelző eszköz gammájának megjelölésére.
A továbbiakban ilyen általános értelemben beszélünk a gammáról. Így pl., ahogy már szó volt róla, a kamera gammája (a szenzor-karakterisztika nonlinearitása) alapesetben 1-es, mert a képérzékelő normál esetben nem torzítja a gradációt, az elemi érzékelő pontokra beeső fénymennyiség és a kimeneti feszültség közötti összefüggés lineáris. Általában azonban a kamera gammáján magát a gammakorrekciót értik (a szenzor és az elektronikus előtorzítás gammáját együttesen).
Az átviteli út gammája célszerűen 1-es, vagyis az átvitel lineáris, a megjelenítés gammája (display gamma) a képvisszaadó eszköz és az előtte lévő elektronika (adott esetben a beleépített LUT – lookup table) együttes gammája, ugyanakkor pusztán az eszköznek is van saját transzfer karakterisztikája, gammája – ez az, amiről írásunk első részében beszéltünk. Ez utóbbi gamma a képcsőtől eltérő megjelenítőknél a fogalom merész kiterjesztése, mert a más elven működő eszközök natív karakterisztikája a legtöbb esetben nem hatványfüggvényt követ. Pl. az LCD panel fénysűrűség-vezérlőjel karakterisztikája hozzávetőlegesen „S” alakú görbét formáz, a DLP projektorok DMD chipjének karakterisztikája viszont pl. önmagában lineáris.
Valójában, ha a kijelző eszköz nem képcső (ami ma már nagyobbrészt így van), akkor az eszközzel egybeépített elektronikával kell a kijelzőt olyanná tenni, „mintha” képcső lenne, hiszen a gammakorrekciót ebből kiindulva szabványosították – ezt a témakört korábban már érintettük.
Végül beszélünk „nézési gammáról” (viewing gamma), amit magyarul leginkább eredő gammának nevezhetnénk el. Ezt az értéket úgy kapjuk meg, hogy az egyes elemek gammáit a kamerától a kijelzőig összeszorozzuk.
A gamma a PC-knél, munkaállomásoknál is ugyanúgy megjelenik (és nem kevésbé fontos), mint a videóban, és a korrekciót ugyancsak el kell végezni, de a beavatkozás helye és egy-egy ponton a korrekció értéke más lehet (több lépésben is végezhető), mint egy hagyományos videoláncban.
Visszatérve a fenti utolsó ábránkhoz, a nézési gammát az ideálisnak gondolt 1-es érték helyett
1,1 és 1,25 közé tettük, feltételezve a tompított vagy erősen tompított környezeti megvilágítást a kép nézésekor. Most fogjuk megmagyarázni, hogy miért.
A nézési körülmények hatása
Látásunk nem magától értetődő, de alapvető egyik jellemzője, hogy különböző megvilágítású környezetben (másképpen fogalmazva világos vagy sötét háttér előtt) ugyanakkora világosság- (fénysűrűség-) különbségeket nagyobbnak, illetve kisebbnek érzékelünk.
A világos, illetve sötét háttérben (környezetben) látható három-három négyzet fénysűrűsége mindkét esetben páronként ugyanakkora, a szubjektíve érzékelt kontrasztarány azonban a négyzetek között a sötét háttérben kisebb (DeMarsh és Giorgianni)
Ebből eredően, ha ugyanazon a képernyőn/monitoron ugyanazt a képet világos, félhomályos vagy egészen sötét helyiségben nézzük, akkor a teljes átviteli láncra vonatkoztatott „ideális” 1-es gammájú (lineáris) átvitel helyett a képet ennél nagyobb érték, tehát bizonyos mértékig nem lineáris átvitel mellett érezzük „jónak”, kontrasztosnak. Pontosabban nagyon világos helyen megfelelő a lineáris átvitel (ez az állítás is csak bizonyos megszorításokkal érvényes), azonban tompított vagy erősen tompított világítású környezetben a jó nézési gamma (viewing gamma) – az átvitel eredő gammája – kb. 1,1 és 1,25 között van, egészen sötét környezetben pedig akár 1,5 is lehet. Pl. a klasszikus diavetítés képminőségét a vizsgálatok szerint teljesen sötét szobában akkor tartjuk a legjobbnak, ha a film gammája 1,5.
Ha a szokásos TV-nézési körülményeket vesszük (tompított világítás, félhomály), akkor a szabványajánlásokban feltételezett 0,45-ös gammakorrekciót a 2,5-ös CRT gammával szorozva 1,125-öt kapunk. Valójában a mai szokásos kijelzőgamma – ami éppen a nagyon változó környezeti feltételek miatt nincs kőbe vésve – konvencionálisan feltételezett, illetve a forrásoldalhoz igazított értéke (akár a LUT-tal elvégzett módosítást is beleszámítva) 2,2. Ha ezt vesszük alapul, akkor 0,45 x 2,2 kereken 1-es eredő nézési gammát ad ki. Korábban azonban már utaltunk rá, hogy a forrásoldalra vonatkozó ajánlások a gammakorrekciós görbét két szakaszra osztják: a kis jelek tartományában van egy lineáris része, azután görbül a karakterisztika 0,45-ös kitevővel (pl. a Rec. 709-es ajánlásban).
A sokat emlegetett Rec. 709-es HDTV ajánlásban a gammakorrekciós körbe két részből áll. A 0,018-as relatív fénysűrűség alatti tartományban van egy 4,5-es meredekségű lineáris szakasz, fölötte pedig a görbe a klasszikus 0,45-ös kitevőjű hatványfüggvényként folytatódik. A lenáris szakasz nélkül a görbe meredeksége az origóban végtelen nagy lenne, amit elvi és gyakorlati okokból is célszerű elkerülni
A kalibrátorok ezt a két szakaszból álló görbét a számításokban közelítőleg mintegy „helyettesítik” egy kb. 0,5-ös állandó kitevőjű függvénnyel. Így kapjuk a hozzávetőlegesen irányadónak tekintett kb. 1,1-es nézési gammát a kevéssé megvilágított környezetre vonatkoztatva. A 2,2-es kijelzőgammát és az 1,1-es nézési gammát a már említett ábrán piros színnel tüntettük fel.
Adott esetben, ha mondjuk egy fejlett projektoron vagy televízión lehetőségünk van a gamma állítására, akkor a konkrét környezethez igazíthatjuk az értékét. Sötétben a nagyobb gamma szubjektíve jobb, kontrasztosabb képet, de túl nagy gamma esetén fennáll a sötét árnyalatok összemosódásának veszélye.
A digitális kép és a gammakorrekció
A stúdiótechnikában (a videónál és a televíziónál maradva) a ’80-as években az analóg korszak lényegében véget ért, a műsorszórásban és a műsorvételben éppen napjainkban szorul ki teljesen az analóg képfeldolgozás. A házi használatban az első digitális videokamerák a ’90-es években jelentek meg, néhány év múlva követék őket a digitális fényképezőgépek. Ezekre is érvényes az, amit a kamerákról általánosságban mondtunk, nevezetesen, hogy a gammakorrekciót a kamerában végzi el az elektronika (kivéve az ún. row, azaz nyers képformátumot).
Itt jegyezzük meg, hogy a videokamerákban elvégzett gammakorrekció a gyakorlatban nem feltétlenül csak egyféle (szabványos) lehet, hanem mind a normál műsorfelvevő kamerákon, mind pl. a zárt láncban működő kamerákon (megfigyelő/biztonsági kamerák) adott esetben a normál gammakorrekció mellett plusz korrekciót lehet végezni, hogy alkalmazkodni lehessen a helyszín speciális követelményeihez, pl. ha a szélsőséges értékek miatt a kontraszt-tartományt össze kell nyomni stb.
Addicionális gammakorrekció egy pályaudvari megfigyelő kamerában (Sony). A speciális korrekciót a speciális fényviszonyok, illetve a jobb láthatóság miatt kellett alkalmazni. Ez a korrekciós görbe a kamera egyik opciója
A számítógépeken, grafikus munkaállomásokon eleve a képek digitális reprezentációjával, illetve renderelő programokkal dolgoznak. Mivel a megjelenítő eszköz itt is lehet képcsöves monitor (kiszorulóban van), vagy más típusú megjelenítő, amely azonban szintén nemlineáris átviteli karakterisztikájú (pl. LCD), vagy ha eredendően lineáris (pl. a DMD a DLP vetítőkben), akkor a szabványos jelkezelés miatt a képcsőhöz hasonló gammát „beépítik”, azaz elektronikusan állítják elő – az előzetes gammakorrekció ugyanúgy szükséges. Itt azonban már nem feltétlenül érvényes az, hogy a gammakorrekciót a kamerában kell elvégezni, tekintve, hogy gyakran nem is kamera képével dolgoznak.
Videokép számítógépes feldolgozásakor sokszor már gammakorrigált jellel van dolgunk, tehát a reszterképtároló (frame buffer) előtt már elvégzik a gammakorrekciót.
Ha azonban a képet számítógépes grafika generálja, akkor lineáris (gammakorrekció nélküli) reprezentációról van szó, és a gammakorrekció a frame buffert követő LUT (look up table) hardver segítségével történik. Kicsit más a helyzet a Macintosh számítógépeknél, de erre most nem akarunk kitérni. A megboldogult SGI (Silicon Graphics) gépei szintén két lépésben végezték a gammakorrekciót, a frame buffer előtt és után (1/1,47, illetve 1/1,7)…
Visszatérve a digitális videokamerákhoz, a képérzékelőről kapott analóg jelet kell digitalizálni, más szóval mintavételezni és kvantálni (digitálisan „kódolni”). A mintavételezés nincs kapcsolatban a gammával, annál izgalmasabb viszont a kvantálás ebből a szempontból, mivel a megfelelő nemlineáris kvantálás eleve megvalósítja a szükséges gammakorrekciót. (A jobb megértés kedvéért egyetlen, színszűrő nélküli képszenzort tételezünk fel, azaz csak a világosságjelet vizsgáljuk.)
A digitalizálás során pl. 8-bites kvantálásnál 256 szintet, más szóval „kódot” kapunk 0-tól 255-ig, illetve videónál 219 szintet, 16-tól 235-ig. (A kvantálás és kódolás fogalmakat itt szinonimaként, felváltva fogjuk használni.) Maradjunk most a teljes 8-bites, 0-255 kódolásnál. A referenciafehér abszolút értéke legyen 100 nit, ami pl. a professzionális ellenőrző videomonitoroknál szokásos érték. Ehhez rendeljük hozzá a 255-ös kódot. (Valójában a 0 és 255-ös kód a videóban eleve tiltott az SDI interfész miatt, de ezt most figyelmen kívül hagyjuk.)
Lineáris kvantálásnál pl. a 32-es kódnak (bináris alakban: 00100000) a 32/255 x 100 nit = 0,1255 x 100 = 12,55 nit fénysűrűség felel meg. A szomszédos, 33-as kódhoz tartozó fénysűrűség hasonlóan számolva 12,94 nit. A két szomszédos kódhoz rendel fényérték közötti különbség 3,1%, ami megegyezik a kódok százalékos eltérésével (hiszen lineáris kvantálásról van szó). Amennyiben mondjuk – az egyszerű számolás kedvéért – 0,5-ös kitevőjű gammakorrekciónak megfelelő nemlineáris kvantálást szeretnénk (ez négyzetgyökös összefüggésnek felel meg), a 32-es kódhoz 3,543 nit, a 33-as kódhoz pedig 3,597 nit tartozik. A két fénysűrűség eltérése 1,5%. A nemlineáris kódolás tehát lényegesen csökkentette a szomszédos kódokhoz tartozó fényértékek közötti különbséget.
Ezt a gondolatmenetet követve igazolható, hogy a gammakorrekciónak megfelelő nemlineáris kódolásnál a feketéhez közelebbi szürke tartományban két szomszédos kód jóval kisebb fénysűrűség-különbséghez fog tartozni, mintha lineáris kódolást (kvantálást) végeznénk, a fehérhez közeledve ez a hatás mérséklődik, végül a 255-ös kódnál a kettő megegyezik.
A most elmondottak messzemenő következménye, hogy egyáltalán lehetővé vált a 8-bites (illetve színes kép esetén a 3 x 8 bites) digitalizálás és jelfeldolgozás. Lineáris kódolást használva (ami persze a videós gyakorlatban nem történik meg) minimum10 vagy 11 bitre lenne szükség ahhoz, hogy ne következzen be észrevehető sávosodás a képen.
Áldás vagy átok?
Írásunk elején láttuk, hogy a megjelenítés gradációtorzítása – a sötét képtartomány összenyomódása és a világos képtartomány széthúzódása – megszüntetéséhez elkerülhetetlen volt a gammakorrekció bevezetése, célszerűen a képforrás oldalán. Ha csak ezt a szempontot nézzük, a gammakorrekciót „szükséges rossznak” kell tekintenünk, habár nyilván túlzás átoknak nevezni.
Van-e azonban áldásos hatása is a gammakorrekciónak? Éppen az imént mutattuk ki, hogy igen, de most kicsit közelebbről világítsuk meg, hogy miért. A szükségszerűen alkalmazott nemlineáris kvantálás miért teszi lehetővé, hogy 8 bit is elegendő a világosságjel (vagy egy-egy színjel) digitális kódolásához?
(Valójában 9 bit lenne igazán jó a sávosodás teljes elkerüléséhez, de ebbe most ne bonyolódjunk bele. Hozzátehetjük, hogy a digitális technika fejlődésével a 10-,12- vagy akár 14-bites digitalizálás és jelfeldolgozás ma már nem jelent gondot, és horribilis költségekkel sem jár. A digitális televízió/videó bevezetésekor azonban nem teljesen így állt a dolog.)
A „miért elég a kevesebb bit nemlineáris kódoláskor?” kérdés megválaszolásához pár szót beszélnünk kell a szemünkről, illetve a fényérzékelésről. A szem alkalmazkodó képessége, más szóval adaptációja csodálatra méltó. A tűző napfényhez éppúgy tud alkalmazkodni, mint a csillagfényes, sőt a felhős éjszakához is. Az adaptációs tartomány 9-10 nagyságrend terjedelmű, ebből az alsó három-négy dekádban a színeket nem tudjuk megkülönböztetni (csak a pálcikák érzékelik ilyenkor a fényt), kb. 0,1 nittől fölfelé van színlátás (itt már belép a csapok érzékenysége). Az adaptációban a pupilla (írisz) is részt vesz, és kb. egy nagyságrendet (tízszeres tartományt) tud átfogni. Az adaptáció ezen túlmenő része a szemben lejátszódó fotokémiai folyamat eredménye. Sötétből a világosba gyorsan alkalmazkodik a szem, fordítva viszont percekig is eltarthat az adaptáció.
Ez az ábra mutatja a szem hozzávetőleges adaptációs tartományát. Az ábra jobb oldali része mutatja a szem átfogását, amikor már egy bizonyos uralkodó legvilágosabb környezethez adaptálódott (az aktuális szint helyét fekete pöttyel jelöltük, a 100-as szám itt százalékban értendő), és a többi sötétebb szintet ehhez viszonyítja (Charles Poynton)
A következő lépésben be kell vezetnünk a kontrasztérzékenység fogalmát. Eszerint adott környezeti világossághoz, azaz adott háttérhez adaptálódott szemünk jellemzője, hogy két egymás melletti, és egymástól világosságban alig különböző képfolt között kb. 1%-os kontrasztkülönbséget tud érzékelni. Mindez kb. az 1 és 300 millilambert (közelítőleg 3 és 1000 nit) közötti tartományban áll fenn, alatta és fölötte magasabb a küszöbszint, tehát nagyobb különbségeket tudunk csak érzékelni.
Az egymás melletti szürkeárnyalatokat az adott háttérhez adaptálódott szemünk akkor tudja megkülönbözteti, ha a fénysűrűségük legalább 1%-kal különbözik (W. F. Schreiber)
Az 1%-os kontrasztérzékenység azt jelenti, hogy egy felületen az uralkodó fehérszint (csúcsfehér) fényerejének 1%-ánál kisebb fényerejű részleteket egyszerűen feketének látjuk, az ez alatti különbségeket nem tudjuk megkülönböztetni.
A kontrasztérzékenység nem tévesztendő össze a szem kontrasztarány-érzékelésével, tehát egy képen a „legfeketébb” fekete és a „legfehérebb” fehér arányának érzékelési képességével, amely elérheti a több ezres értéket. A bitmélység problematikájához azonban számunkra most a kontrasztérzékenység a lényeges.
Ha tehát egy képen a szomszédos felületek fénysűrűségének különbsége 1%-nél nagyobb, akkor ezt sávosodásként érzékeljük, ami feltűnő képhiba, különösen a folyamatosan változó átmenetéknél.
Nézzük most ismét a 8-bites lineáris kódolást (0-255), amellyel fentebb már elkezdtünk foglalkozni. Két egymás melletti kódhoz tartozó fénysűrűségek között a 100-as kódnál éppen 1% a különbség, 100 fölött 1%-nál kisebb, alatta viszont nagyobb. Pl. az 50-es és 51-es kód között 2% különbség van, és ha az 1%-os kontrasztérzékenységet vesszük alapul, akkor az ennek megfelelő fénysűrűségeket már szemünk megkülönbözteti. Ezzel szemben a 200-as kódnál csak 0,5% különbség van a szomszédos kódok között, így pl. a 201-es kód fölösleges.
A 100-as kód alatt tehát megjelenik a sávosodás, és lefelé menve egyre erősödik. Ezt nevezik a „100-as kódproblémának”, amely a 8-bites LINEÁRIS kódolásnál jelentkezik.
A "100-as kódprobléma" szemléltetése lineáris 8-bites kódolásnál (Charles Poynton). A 100 alatti kódoknál a szomszédos kódokhoz tartozó fénysűrűség-különbség nagyobb 1%-nál, ezért a folytonos tónusátmeneteknél sávosodás lép fel. A 100 fölötti kódoknál viszont fölöslegesen közel vannak egymáshoz a szomszédos kódokhoz tartozó szintek
A 8-bites lineáris kódolás tehát nem alkalmas a digitális videóhoz. Ha ragaszkodnánk a lineáris kódoláshoz, akkor a kontrasztérzékenységi küszöb miatt elkerülhetetlen lenne a sávosodás. A gammakorrekcióval amúgy is együtt járó NEMLINEÁRIS kódolás viszont „önmagától” megoldja a problémát. Ilyen értelemben „áldás” a gammakorrekció.
(Igaz, ebbe az is belesegít, hogy a feketéhez nagyon közeli tartományokban már 1%-nál nagyobb a kontrasztérzékenységi küszöb, mert valójában a 8 bit nem elég az 1% szigorúan vett betartásához a teljes világosság-tartományban, ehhez kb. 460 kód kellene, azaz 9 bit, lineáris kódolásnál viszont kb. 9900 kódra lenne szükség.)
A több mint húsz éve digitális szabványként bevezetett, színcsatornánként 8-bites kódolás gyakorlata igazolta, hogy ez a megoldás valóban megfelelő, noha más okok miatt, amelyeket itt most nem részletezünk, ma már a digitális stúdiótechnikában elterjedt a 10-bites nemlineáris kódolás és jelfeldolgozás, egyes területeken 12- és 14-bites kódolással is találkozunk.
A gammakorrekció előnyei között kötelező megemlíteni, hogy a korrekciós görbe nagyon hasonló a vizuális érzékelést jellemző világosságérzet-fénysűrűség (lightness-luminance vagy brightness-luminance) karakterisztikához. Ez utóbbit szubjektív vizsgálatokkal határozták meg, és egyértelműen kiderült, hogy szintén egy egynél kisebb kitevőjű hatványfüggvénnyel közelíthető. A vizsgálati módszertől függően a különböző kutatók eredményei eltérnek a kitevő nagyságát illetően, de a leggyakrabban az 1/3-os (0,33) kitevőt tekintik irányadónak. Ez annyit jelent, hogy a világosságérzet (amelyet csak relatív skálán tudunk ábrázolni, hiszen nem fizikai mennyiség, így nincs mértékegysége) a mérhető fénysűrűség köbgyökével arányos.
Mindenesetre jellegében nyilvánvaló a perceptuális hasonlóság a gammakorrekciós függvénnyel, ezért mondhatjuk azt is, hogy a gammakorrigált elektromos jelet kiadó kamera a szemünkhöz, illetve látásunkhoz hasonlóan viselkedik ebből a szempontból (is). Ennek azért van jelentősége, mert ha a teljes átviteli láncot nézzük, a vizuális érzékeléshez hasonló nemlineáris kódolás a lánc elején, és a megjelenítő inverz gradációtorzítása a lánc végén optimális helyzetet teremt a zaj kisebb érzékelhetősége minimalizálásában. A megjelenítő eszközt vezérlő feszültség (amely a gammakorrekcióval előtorzított) ugyanis nagy mértékben „perceptuálisan megegyező” a világosságérzékeléssel.
Összefoglalóan azt mondhatjuk, hogy bár a gradációtorzítás kompenzálásához elengedhetetlen gammakorrekciót a kényszerűség szülte, alkalmazása mind a digitalizáláshoz szükséges bitmélység, mind az átviteli láncban elkerülhetetlenül bevitt zaj érzékelhetősége szempontjából szerencsésnek bizonyult.
Nagy Árpád