Weissmanov omjer kompresije. Omjer kompresije Omjer kompresije jedinice

Osam epizoda u sezoni još uvijek nije dovoljno za takvu seriju, priča se nije imala vremena stvarno razviti, ali ipak se pitam što će se dogoditi sljedeće, što je dobro. Štoviše, druga sezona je potvrđena. Iako je finalna serija bila prilično dosadna.

Tim Pide Piper iskoristio je modrice koje je Ehrlich dobio tijekom prezentacije, neke pogodnosti. Prvo, uprava konferencije, prestrašena mogućom tužbom (zvao se gitarist-odvjetnik), pozvala je Paidea Pipera da prođe u sljedeći krug bez ikakve konkurencije, a drugo, Erlich je također nokautirao apartman za njih u hotelu.


Erlich, iako vrlo zagušen, ali od njega ima koristi. U timu bi trebala postojati takva osoba - arogantna poput traktora, prodoran, samozadovoljan optimista koji uvijek ima idiotsku ideju u pripravnosti i može prevariti ružnog dječaka. I nije svaki duh dovoljno za to.

Činilo se da je sve u redu, ali čelnici startupa otišli su pogledati Belsonovu prezentaciju, a on je predstavio ne samo opsežni projekt s hrpom različite funkcionalnosti, jer Julie ima puno usluga koje je moguće integrirati, već i određeni Weissmanov koeficijent, odnosno omjer kompresije, on ima isto što i Pide Piper. Weissmanov koeficijent izmislili su posebno za seriju dva savjetnika iz Stanforda, Weisman i Misra.

Općenito, ispada da su gadni suparnici ipak pokvarili Richardov algoritam povratnim inženjeringom. Paide Piper sutra nema što pokazati.

Erlich je pokušao dodirivati \u200b\u200bBelsona optužujući ga za sve smrtne grijehe od alkoholizma do seksualnog uznemiravanja, Jared je izgubio razum, a Dinesh i Gilfoyl pokušali su pronaći novi posao.

Do večeri, kad je Jared pušten iz policije, svi su se okupili u hotelu i počeli razmišljati što da rade. Nitko se sutra ne želi izložiti javnim pogubljenjima, osim Erlicha, naravno, koji vjeruje da su javna pogubljenja vrlo popularna i, općenito, sve je to show business. U svakom slučaju, on će pobijediti, čak i ako se osobno mora odgoditi svakom momku u dvorani. Ova je ideja prihvaćena s naletom, jer, kao što sam nedavno napisao, programeri se mogu odnijeti bilo kojim zadatkom i nije ih briga je li zlonamjerna ili glupa. Dok su izračunavali pod kojim uvjetima će Erlich svima otplatiti u najkraćem mogućem roku, Richard je imao ideju.

Ne, ovo nije Richardova ideja,

Ovo je tim tima Pide Piper koji rješava Ehrlichov problem.

Kao što možete zamisliti, sve se dobro završilo i Paid Piper dobio je 50 tisuća dolara. A Peter Gregory rekao im je da se nije uzrujao.

Najviše mi je žao što više nećemo vidjeti Petera Gregoryja. Ovo je bio najbolji lik. Ne znam hoće li sudac Paid Piper naći drugog investitora, jednako ludog.

Načela sažimanja informacija

U središtu bilo koje metode sažimanja informacija nalazi se model izvora informacija ili, točnije, model suvišnosti. Drugim riječima, neke se informacije koriste za sažimanje informacija o tome koja se vrsta komprimira - bez ikakvih podataka o njima, nemoguće je dati bilo kakve pretpostavke o tome koja će transformacija smanjiti veličinu poruke. Te se informacije upotrebljavaju za vrijeme kompresije i dekompresije. Model redundanse može se također konstruirati ili parametrizirati u fazi kompresije. Metode koje omogućuju promjenu modela suvišnosti informacija na temelju ulaznih podataka nazivaju se adaptivne. Neapativni su obično vrlo specifični algoritmi koji se koriste za rad s dobro definiranim i stalnim karakteristikama. Ogromna većina dovoljno univerzalnih algoritama su u jednom ili drugom stupnju prilagodljivi.

Bilo koja metoda sažimanja podataka uključuje dvije obrnute konverzije:

  • kompresijska pretvorba;
  • dekompresijska pretvorba.

Pretvaranje kompresije pruža komprimiranu poruku iz izvora. Istovar omogućava primati početnu poruku (ili njenu aproksimaciju) iz komprimirane.

Sve metode kompresije podijeljene su u dvije glavne klase.

  • bez gubitaka
  • s gubicima.

Temeljna razlika između njih dvojice je da kompresija bez gubitaka pruža mogućnost precizne obnove izvorne poruke. Kompresija gubitaka, s druge strane, omogućuje dobivanje samo određene aproksimacije izvorne poruke, to jest drugačije od izvorne poruke, ali u granicama nekih unaprijed određenih pogrešaka. Te bi pogreške trebalo odrediti drugi model - model primatelja, koji određuje koji su podaci i s kakvom točnošću predstavljeni podaci važni za primatelja i koje je dopušteno baciti.

Karakteristike algoritama kompresije i primjenjivost

Omjer kompresije

Omjer kompresije glavna je karakteristika algoritma kompresije koja izražava glavnu primijenjenu kvalitetu. Definira se kao omjer veličine nekomprimiranih podataka i komprimiranih, to jest:

k = S o / S c

gdje k - omjer kompresije, S o je veličina nekomprimiranih podataka i S c je veličina komprimiranog. Dakle, što je veći omjer kompresije, to je bolji algoritam. Treba napomenuti:

  • ako a k \u003d 1, tada algoritam ne stvara kompresiju, tj. Prima izlaznu poruku veličine jednake ulazu;
  • ako a k < 1, то алгоритм порождает при сжатии сообщение большего размера, нежели несжатое, то есть, совершает «вредную» работу.

Situacija sa k < 1 вполне возможна при сжатии. Невозможно получить алгоритм сжатия без потерь, который при любых данных образовывал бы на выходе данные меньшей или равной длины. Обоснование этого факта заключается в том, что количество различных сообщений длиной n Uzorak: E: bit je točno 2 n , Tada je broj različitih poruka duljine manje od ili jednake n (ako postoji barem jedna poruka kraće duljine) biti će manje od 2 n , To znači da je nemoguće nedvosmisleno usporediti sve izvorne poruke sa komprimiranim: ili neke izvorne poruke neće imati komprimirani prikaz, ili će ista komprimirana poruka odgovarati nekoliko izvornih poruka, što znači da se ne mogu razlikovati.

Koeficijent kompresije može biti ili konstantni koeficijent (neki algoritmi za komprimiranje zvuka, slike itd., Na primjer, A-zakon, μ-zakon, ADPCM) ili varijabilni. U drugom se slučaju može odrediti bilo za određenu poruku ili procijeniti prema nekim kriterijima:

  • prosjek (obično za neki testni skup podataka);
  • maksimalno (slučaj najbolje kompresije);
  • minimalno (slučaj najgore kompresije);

ili nekom drugom. Omjer kompresije gubitaka u ovom slučaju snažno ovisi o dopuštenoj grešci kompresije ili njenoj osobine, koji obično djeluje kao parametar algoritma.

Tolerancija na gubitak

Glavni kriterij razlike između algoritma kompresije je prisutnost ili odsutnost gore opisanih gubitaka. U općenitom slučaju, algoritmi kompresije bez gubitaka univerzalni su u smislu da se mogu primijeniti na podatke bilo koje vrste, dok uporaba kompresije gubitaka treba biti opravdana. Neke vrste podataka ne prihvaćaju bilo kakvu vrstu gubitka:

  • simboličke podatke, čija promjena neminovno dovodi do promjene njihove semantike: programi i njihovi izvorni tekstovi, binarni nizovi itd .;
  • vitalni podaci, čije promjene mogu dovesti do kritičnih pogrešaka: na primjer, dobivene od medicinske mjerne opreme ili upravljačkih uređaja zrakoplova, svemirskih letjelica itd.
  • podaci se opetovano podvrgavaju kompresiji i dekompresiji: radne grafičke, zvučne, video datoteke.

Međutim, kompresija gubitaka omogućava znatno veće omjere kompresije odbacivanjem neznatnih informacija koje se slabo komprimiraju. Na primjer, algoritam kompresije zvuka FLAC bez gubitka, u većini slučajeva, omogućuje komprimiranje zvuka 1,5-2,5 puta, dok se algoritam gubitka Vorbis, ovisno o postavljenom parametru, može komprimirati do 15 puta uz održavanje prihvatljive kvalitete sondiranje.

Zahtjevi za algoritam za sustav

Različiti algoritmi mogu zahtijevati različitu količinu resursa računalnog sustava na kojima se izvode:

  • rAM (za intermedijarne podatke);
  • memorija samo za čitanje (za programski kod i konstante);
  • vrijeme CPU-a.

Općenito, ovi zahtjevi ovise o složenosti i "inteligenciji" algoritma. Prema općem trendu, bolji i univerzalniji algoritam veći su zahtjevi za strojem. Međutim, u određenim slučajevima jednostavni i kompaktni algoritmi mogu funkcionirati bolje. Zahtjevi sustava određuju njihove potrošačke kvalitete: što je algoritam manje zahtjevan, to je jednostavniji, a samim tim i kompaktan, pouzdan i jeftin sustav.

Budući da algoritmi za kompresiju i dekompresiju djeluju u paru, omjer zahtjeva sustava za njih također je važan. Često, kompliciranje jednog algoritma može značajno pojednostaviti drugi. Dakle, možemo imati tri mogućnosti:

Algoritam kompresije mnogo je zahtjevniji od resursa nego algoritam kompresije. To je najčešći omjer, a primjenjiv je uglavnom u slučajevima kada će se jednom komprimirani podaci koristiti više puta. Primjer su digitalni audio i video playeri. Algoritmi za kompresiju i dekompresiju imaju približno jednake zahtjeve. Najprihvatljivija opcija za komunikacijsku liniju, kada se kompresije i dekompresije događaju jednom na svoja dva kraja. Na primjer, to može biti telefonija. Algoritam kompresije bitno je manje zahtjevan od algoritma kompresije. Prilično egzotičan slučaj. Može se koristiti u slučajevima kada je odašiljač ultra prijenosni uređaj, gdje je količina raspoloživih resursa vrlo kritična, na primjer, svemirski brod ili velika distribuirana mreža senzora, ili može otpakirati podatke koji su potrebni u vrlo malom postotku slučajeva, na primjer, snimanje nadzornih kamera.

vidi također


Zaklada Wikimedia. 2010.

Pogledajte što je "Sažimanje informacija" u drugim rječnicima:

    kompresija informacija - zbijanje informacija - [L. G. Sumenko. Engleski-Ruski rječnik informacijske tehnologije. M .: GP TSNIIS, 2003.] Teme informacijske tehnologije općenito Sažimanje podataka sinonima EN smanjenje informacija ...

    SAŽETAK INFORMACIJA - (kompresija podataka) prezentacija informacija (podataka) s manje bita u odnosu na izvornik. Na temelju uklanjanja viška. Razlikovati S. i. bez gubitka podataka i s gubitkom dijela informacija koji nisu bitni za zadatke koji se rješavaju. Za ... ... Enciklopedijski rječnik psihologije i pedagogije

    adaptivno komprimiranje podataka bez gubitaka - - [L. G. Sumenko. Engleski-Ruski rječnik informacijske tehnologije. M .: GP TSNIIS, 2003.] Teme informacijske tehnologije općenito EN adaptivno komprimiranje podataka bez gubitakaALDC ... Tehnička referenca prevoditelja

    kompresija / kompresija informacija - - [L. G. Sumenko. Engleski-Ruski rječnik informacijske tehnologije. M .: GP TSNIIS, 2003.] Teme informacijske tehnologije u cjelini sabijanje EN ... Tehnička referenca prevoditelja

    digitalna kompresija podataka - - [L. G. Sumenko. Engleski-Ruski rječnik informacijske tehnologije. M .: GP TSNIIS, 2003.] Teme informacijske tehnologije u cjelini kompresije EN ... Tehnička referenca prevoditelja

    Zvuk je jednostavan val, a digitalni signal predstavlja ovaj val. To se postiže spremanjem amplitude analognog signala više puta u jednoj sekundi. Na primjer, na običnom CD-u signal se pohranjuje 44100 puta po ... ... Wikipediji

    Proces koji smanjuje podatke smanjujući suvišnost. Kompresija podataka povezana je s kompaktnim rasporedom dijelova podataka standardne veličine. Razlikovati kompresiju s gubitkom i bez gubitka podataka. Na engleskom: Podaci ... ... Financijski rječnik

    kompresija podataka digitalnih karata - Obrada digitalnih kartografskih podataka u cilju smanjenja njezinog volumena, uključujući uklanjanje suvišnih podataka u okviru potrebne točnosti prezentacije. [GOST 28441 99] Teme digitalne kartografije. Opći pojmovi, metode i tehnologije ... ... Tehnička referenca prevoditelja

Omjer kompresije glavna je karakteristika algoritma kompresije. Definira se kao omjer volumena izvornih nekomprimiranih podataka prema količini komprimiranih, to jest:, gdje k- omjer kompresije, S o je količina izvornih podataka i S c je volumen komprimiranog. Dakle, što je veći omjer kompresije, to je algoritam učinkovitiji. Treba napomenuti:

    ako a k\u003d 1, tada algoritam ne stvara kompresiju, tj. Izlazna poruka jednaka je količini ulaza;

    ako a k< 1, то алгоритм порождает сообщение большего размера, нежели несжатое, то есть, совершает «вредную» работу.

Situacija sa k< 1 вполне возможна при сжатии. Принципиально невозможно получить алгоритм сжатия без потерь, который при любых данных образовывал бы на выходе данные меньшей или равной длины. Обоснование этого факта заключается в том, что поскольку число различных сообщений длинойnbit je točno 2 n , broj različitih poruka s duljinom manjom ili jednakom n(ako postoji barem jedna poruka kraće duljine) biti će manje od 2 n , To znači da je nemoguće nedvosmisleno usporediti sve izvorne poruke sa komprimiranim: ili neke izvorne poruke neće imati komprimirani prikaz, ili će ista komprimirana poruka odgovarati nekoliko izvornih poruka, što znači da se ne mogu razlikovati. Međutim, čak i kada algoritam kompresije povećava veličinu izvornih podataka, lako je osigurati da se njihov volumen ne može garantirano povećati za više od 1 bita. Tada će se dogoditi, čak iu najgorem slučaju, nejednakost: To se vrši na sljedeći način: ako je volumen komprimiranih podataka manji od volumena izvora, komprimirane podatke vraćamo dodavanjem "1", u suprotnom vraćamo izvorne podatke dodavanjem "0" njima. Primjer kako se to provodi u pseudo-C ++ prikazan je u nastavku:

bin_data_t __compess (ulaz bin_data_t) // bin_data_t - vrsta podataka, što znači proizvoljni slijed bitova promjenjive duljine

bin_data_t izlaz \u003d luk (ulaz); // funkcija bin_data_t luk (ulaz bin_data_t) provodi određeni algoritam kompresije podataka

ako (output.size ()

output.add_begin (1); // funkcija bin_data_t :: add_begin (bool __bit__) na početak niza dodaje malo jednako __bit__

povratni izlaz; // vratiti komprimirani niz s dodanim "1"

else // inače (ako je volumen komprimiranih podataka veći ili jednak obujmu izvornika)

input.add_begin (0); // dodajte "0" u izvorni niz

povratni ulaz; // vratiti izvornu datoteku s dodanim "0"

Koeficijent kompresije može biti ili konstantan (neki algoritmi za komprimiranje zvuka, slike itd., Na primjer, A-zakon, μ-zakon, ADPCM, kodiranje odrezanog bloka) i promjenjiv. U drugom se slučaju može odrediti za svaku određenu poruku ili procijeniti prema nekim kriterijima:

    medij (obično za neki testni skup podataka);

    maksimalno (slučaj najbolje kompresije);

    minimalno (slučaj najgore kompresije);

ili nekom drugom. Omjer kompresije gubitaka u ovom slučaju snažno ovisi o dopuštenoj grešci kompresije ili osobine, koji obično djeluje kao parametar algoritma. Općenito, samo metode kompresije gubitaka mogu pružiti konstantan omjer kompresije.

Glavni kriterij razlike između algoritma kompresije je prisutnost ili odsutnost gore opisanih gubitaka. U općenitom slučaju, algoritmi kompresije bez gubitaka univerzalni su u smislu da je njihova primjena sigurno moguća za podatke bilo koje vrste, dok bi mogućnost primjene kompresije gubitaka trebala biti opravdana. Za neke vrste podataka izobličenje u načelu nije dopušteno. Među njima

    simboličke podatke, čija promjena neminovno dovodi do promjene njihove semantike: programi i njihovi izvorni tekstovi, binarni nizovi itd .;

    vitalni podaci, čije promjene mogu dovesti do kritičnih pogrešaka: na primjer, dobivene od medicinske mjerne opreme ili upravljačkih uređaja zrakoplova, svemirskih letjelica itd.

    intermedijarni podaci koji se opetovano podvrgavaju kompresiji i oporavku tijekom višestepene obrade grafičkih, zvučnih i video podataka.

Bilo koja tvar pod utjecajem vanjskog tlaka može se saviti, to jest, oni će mijenjati svoj volumen u jednom ili drugom stupnju. Dakle, plinovi s povećanjem tlaka mogu vrlo značajno smanjiti svoj volumen. Tekućina je podložna promjenama volumena s manjim promjenama vanjskog tlaka. Kompresija je još manja za kruta tvar. Stisljivost odražava ovisnost fizičkih svojstava tvari o udaljenostima njegovih molekula (atoma). Stisljivost karakterizira koeficijent kompresije (Isto: koeficijent kompresije, koeficijent kompresije, volumen elastičnog koeficijenta ekspanzije).

Definicija

Omjer kompresije Fizička je količina jednaka relativnoj promjeni volumena podijeljenoj s promjenom tlaka koja uzrokuje promjenu volumena tvari.

Postoje različite oznake omjera kompresije, najčešće su to slova ili. U obliku formule pišemo koeficijent kompresije kao:

gdje znak minus odražava činjenicu da porast tlaka dovodi do smanjenja volumena i obrnuto. U diferencijalnom obliku koeficijent je definiran kao:

Volumen je povezan s gustoćom tvari, pa za procese promjene tlaka sa konstantnom masom možemo napisati:

Jačina koeficijenta kompresije ovisi o prirodi tvari, njezinoj temperaturi i tlaku. Uz prethodno navedeno, omjer kompresije ovisi o vrsti postupka u kojem se tlak mijenja. Dakle, u izotermnom procesu omjer kompresije razlikuje se od koeficijenta kompresije u adijabatskom procesu. Omjer izotermalne kompresije definiran je kao:

gdje je djelomična izvedenica kod T \u003d const.

Omjer adiabatske kompresije može se naći kao:

gdje je djelomični derivat s konstantnom entropijom (S). Za krute tvari, izotermni i adijabatski koeficijent kompresije razlikuje se vrlo malo, a ta se razlika često zanemaruje.

Postoji odnos između adijabatskih i izotermalnih koeficijenata stlačenosti, što se odražava jednadžbom:

gdje su i specifična toplina pri konstantnom volumenu i tlaku.

Omjer kompresije jedinice

Osnovna jedinica za mjerenje faktora stisljivosti u SI sustavu je:

Primjeri rješavanja problema

PRIMJER 1

Slični članci

Zadatak Neka čvrsta kocka s jednakim stranama doživi svestrani pritisak. Strana kocke se smanjuje za. Izrazite koeficijent kompresije kocke ako se tlak na njega promijeni u odnosu na početni tlak za
Odluka Napravimo crtež.


U skladu s definicijom omjera kompresije pišemo:

Budući da je promjena na strani kocke uzrokovana pritiskom jednaka, volumen kocke nakon kompresije () može se predstaviti kao:

Stoga se relativna promjena volumena zapisuje kao:

Količina je mala, stoga pretpostavljamo da su jednake nuli, tada možemo pretpostaviti da:

Zamjenjujemo relativnu promjenu volumena iz (1.4) u formulu (1.1), imamo:

Odgovor