[rohrpost] Bildcodierung

rohrpost-Admin rohrpost at henningziegler.de
Die Feb 22 08:56:56 CET 2005



> Von: "Kilian Hirt" <kilian.hirt at student.hu-berlin.de>
> Datum: 18. Februar 2005 17:40:29 MEZ
> An: <rohrpost at mikrolisten.de>
> Betreff: Bildcodierung
>
>
>
> Hallo Liste.
>
> Durch die Präsentation eines neuen Codecs wurde neulich mein Interesse 
> an
> der Bildkompression wiedererweckt: Die Kompression ist meiner Meinung 
> nach
> für die Ästhetik digitaler Bilder ebenso essentiell wie z.B. das 
> interlace
> fürs Fernsehen. Die Bildcodierung ist dabei nichts anderes als 
> angewandte
> Informationstheorie: (Mathemat.) Modelle trennen das Wesentliche eines
> Signals vom Redundanten und Irrelevanten. Diese Auswahl trifft jedes 
> Format
> anders und erzeugt dadurch seine spezielle Charakteristik. Um es also 
> gleich
> vorwegzunehmen: Geht es hierbei nicht um ein wichtiges mediales 
> Apriori nach
> der elektronischen, uniformen Zerlegung des Bildes in Zeilen und 
> Spalten?
>
> Die Modelle basieren auf ohnehin bekannten Eigenschaften der Bilder
> (z.B.´continuous tone´) oder den Ergebnissen von 
> empirisch-statistischen
> Untersuchungen. Ähnlich wie bei der Kryptanalyse werden Strukturen 
> gesucht,
> mehr oder weniger offen liegende Korrelationen, Regelmässigkeiten. Mit 
> deren
> Kenntnis werden dann Algorithmen modelliert, die diese Strukturen
> reproduzieren und vorhersagen können. Modelle der menschlichen 
> Wahrnehmung
> entlarven zusätzlich die Irrelevanzen im Bild. So kann eine gezielte
> Reduktion von Information dort stattfinden, wo kein Unterschied gesehen
> wird. Die grundlegenden aber leider auffälligen Artefakte von geringer
> digitaler räumlicher und farblicher Auflösung (Quantisierungstreppen) 
> werden
> in nicht sichtbare Bereiche verschoben. Das Rauschen wird so geformt, 
> dass
> es durch die Nachbarschaft prägnanter Information dominiert und 
> maskiert
> wird. Shannons mathemat. Entropie wird zur ´perceptual entropy´, zu 
> einer
> Funktion der Psychooptik.
>
> Im Idealfall ist Kompression nicht direkt sichtbar, aus ökonomischen 
> Gründen
> wird aber oft an der Grenze zum Erträglichen codiert: je weniger 
> Bandbreite
> für Information zur Verfügung steht, desto mehr tritt die 
> Rechenleistung des
> Modells in den Vordergrund. Nun sind es die dort angelegten 
> Strukturen, die
> das Bild dominieren und sich in sichtbaren Artefakten offenbaren.
>
> Die Artefakte der nächsten Generation von Video-Codern werden sich von 
> den
> typischen Klötzchen unterscheiden, die das Zeitalter der
> Transformationscodierung (JPEG, MPEG1-2) prägten. Differenz und 
> Ähnlichkeit
> aufeinanderfolgender frames erlauben nämlich nicht nur die
> Bewegungsschätzung von Pixelhaufen auf der 2-D Ebene, sondern die
> Identifikation von "Video-Objekten" oder gleich die Rekonstruktion 
> einer 3-D
> Szenerie "vor der Kamera", die dann beim Decodieren nur noch mit
> Bewegungsparametern gefüttert, "re-animiert" werden müssen. Eine
> funktionierende Objekterkennung ermöglicht eine effiziente 
> Darstellung. Die
> kompositorische und zeitliche Autorität des einzelnen frames wird dabei
> durch die sich emanzipierenden Objekte angegriffen. Innerhalb des 
> Videos
> werden Elemente adressierbar, indizierbar und manipulierbar, die sich 
> früher
> noch im Pixelsalat versteckten. Der Rahmen für eine umfangreiche 
> Erfassung
> und Anwendung von Metadaten ist bereits mit MPEG-7 geschaffen worden.
> Shannons Aussage, die Semantik einer Nachricht sei für das 
> Codierungsproblem
> irrelevant, könnte sich somit relativiert haben.
>
> Es würde mich interessieren, ob jemand etwas Interessantes dazu 
> gelesen hat,
> ich habe jenseits der einschlägigen Literatur (Informationstheorie,
> Suchbilder, IEEE, ...) nicht viel gefunden. Vielleicht gibt es ja auch
> irgendwelche Projekte, die sich mit Codierung, Datenbank-Video, 
> Indizierung,
> etc. beschäftigen, oder den einen oder anderen Experten...
>
> Grüsse an alle,
> kilian.hirt at student.hu-berlin.de
>
>
>
--
Henning Ziegler
www.henningziegler.de
www.fotomat.org