Sažimanje podataka

Izvor: Hrvatska internetska enciklopedija
Skoči na:orijentacija, traži

Sažimanje podataka[1] u računarstvu (još i stlačivanje podataka, kompresija podataka[2]) je proces smanjivanja potrebnog fizičkog prostora za pohranu podataka kroz korištenje određenih metoda za zabilježavanje podataka. Osnovna jedinica obrade je datoteka i ovisno o tipu datoteke unutar datoteke se pojavljuju određena ponavljanja koja je moguće na medij za pohranu zapisati samo jednom i onda samo zabilježiti gdje se ponavljanje još javlja. Na taj način moguće je znatno smanjiti potreban prostor za pohranu što ovisi o strukturi i vrsti datoteke. Dobitak u prostoru je najmanji kod sažimanja zvučno-slikovnih datoteka jer zvuk i pokretne slike su vrlo kaotične prirode i klasične metode sažimanja podataka (sažimanje bez gubitka informacija) ovdje ne funkcioniraju, te se koriste metode u kojima se tolerira određena količina gubitka izvornih podataka.

Načini sažimanja

Postoje dva osnovna načina sažimanja: s gubitcima i bez gubitaka. Prvi obično rezultira manjom datotekom, ali i sadržajem manje kvalitete, što ga čini idealnim za multimediju, a drugi nema gubitaka informacija, ali je i datoteka veća. Taj se način obično koristi kod kompresiranja ne-multimedijalnih podataka (npr. binarnih datoteka, tekstualnih i ostalih vrsta). Pri tome se služimo pomoćnim programima.

Povijest razvoja

Algoritmi i formati sažimanja

Sažimanje pisanih dokumenata

Kad sažimamo podatke tipa pisanih dokumenata gubitci nisu dozvoljeni, no s druge strane, obično je omjer sažimanja takvih datoteka vrlo dobar (2-10 puta), tako da pisane dokumente sažimamo samo bez gubitaka. Najpoznatiji formati su:

Ono što često ostaje iza zavjese jest da većina programa za sažimanje podržava više metoda sažimanja, od spremanja datoteka u nesažetom obliku (arhiviranje), do sažimanja različitim algoritmima s različitim brzinama i omjerima sažimanja. Tako su zip i rar datoteke obično sažete Deflate algoritmom, izvedenicom Lempel-Ziv LZ77 algoritma koji je nastao 1977. godine. S druge strane bzip2 se oslanja na svoju varijantu Burrows-Wheeler transformacije.

Sažimanje slika

Sažimanje bez gubitaka:

Sažimanje s gubitcima:

Sažimanje audio zapisa

Kod sažimanja audio zapisa omjer je obično vrlo loš (maksimalno 2), te za njihovo sažimanje postoje algoritmi sažimanja bez gubitaka:

i algoritmi sažimanja s gubitcima:

Sažimanje video zapisa

Formati:

Algoritmi:

Dijeljenu biblioteku (ili biblioteke - *.so ili *.dll) koje implementiraju određeni algoritam sažimanja audio ili video zapisa zovemo codec.

Izvori

  1. Geodetski fakultet u Zagrebu Miljenko Lapaine, Nada Vučetić, Ana Kuveždić Divjak, Martina Triplat Horvat: Hrvatski jezik u geodeziji i geoinformatici, 2. prosinca 2011.
  2. Kiš, Miroslav: Englesko-hrvatski i hrvatsko-engleski informatički rječnik, Zagreb, Naklada Ljevak, 2000., str. 268

Vanjske poveznice