Oversettelse av feil koding. Hva er ANSI-koding og hva brukes det med? Typer alkoholkoding

Innhold

Alkoholisme er en sykdom som rammer hver tredje person. Kampen mot denne fienden er ikke så lett som den ser ut ved første øyekast. Mange mennesker tilskriver alkoholisme en vanlig dårlig vane, men de tar dypt feil. Dette er det samme som narkotika - avhengighet styrer en person. Spørsmålet er bare hvordan bli kvitt alt dette.

Hvordan kode for alkoholisme

Koding av alkoholisme er undertrykkelsen av en persons ønske og tiltrekning til flasken. Alt kan skje gjennom psykologisk påvirkning på alkoholikeren eller ved hjelp av medisiner. Hvordan alkoholkoding oppstår:

  • personen må være helt enig i at det er nødvendig å bli kvitt alkoholisme, legen vil alltid forklare alle stadier og øyeblikk av koding, konsekvenser og ytterligere resultater;
  • en blodprøve er obligatorisk;
  • kodemetode og pris velges av pasienten;
  • før koding er det viktig å ikke drikke alkohol i en uke slik at kroppen renser seg for giftstoffer;
  • Etter å ha blitt kodet for alkoholisme, må pasienten observeres av den behandlende legen.

Typer alkoholkoding

De vanligste kodemetodene er psykoterapeutisk press på pasienten og medikamentell intervensjon. Slik koder du for alkohol:

  • Narkotika og medisiner. I dette tilfellet injiseres pasienten med spesielle medisiner i en vene og legges på IV som kan fjerne alkohol fra kroppen. Dette kan ikke unngås uten konsekvenser, så det kan være det bivirkninger. For eksempel er en vanlig reaksjon av kroppen en fullstendig aversjon mot alkoholholdige drikker. Alkohol vil få deg til å føle deg kvalm, ha vondt i magen - alt for å hindre personen i å drikke drinken.
  • Prinsippet om psykoterapeutisk intervensjon eller hypnose. Denne metoden anbefales for de som har bestemt seg for at de ikke vil drikke igjen og som har utviklet viljestyrke. I dette tilfellet, ved å introdusere pasienten i en transetilstand, "instruerer" legen personen om den sanne veien. Med andre ord dannes et avslag på å drikke alkohol gjennom forslag.

Kodemetoder for alkoholisme

Det er mange metoder, med rimelige priser, som brukes til å kode folk for alkoholisme. Forskjellen mellom dem er at en person oppfatter behandlingsmetoder forskjellig, hver reaksjon er individuell. I følge anmeldelser regnes alkoholkodingsprosedyren ved hjelp av Dovzhenko-metoden som den beste og mest effektive. Her er bare noen få fordeler med behandlingen:

  • dette er den mest humane og etiske metoden for å bekjempe alkoholavhengighet og drukkenskap;
  • i løpet av hele kurset innser pasienter at de virkelig trenger å gjennomgå behandling og bli kvitt alkoholisme;
  • koding bidrar til å forårsake motvilje mot effekten av en alkoholholdig drikk; ingen har en gagrefleks ved lukten av alkohol etter behandling;
  • Dovzhenkos metode anses som absolutt ufarlig, og forårsaker minimal skade på kroppen;
  • 1 økt er nok, ingen gjentatte kurs er nødvendig, det er ingen kontraindikasjoner.

Konsekvenser av alkoholkoding

Når en pasient har valgt en medisinsk vei for å løse et problem, kan det få konsekvenser av koding. For eksempel en negativ reaksjon fra kroppen på et stoff. Mange føler seg dårlig fordi det å slutte med alkohol er stressende for hele kroppen, noe som er farlig for blodårene og hjertet. Noen vanlige symptomer som kan oppstå når du slutter med alkohol inkluderer:

  • skjelving, konstant skjelving, skjelving;
  • gastrointestinale problemer: diaré, forstoppelse, oppkast, kvalme, magesmerter;
  • problemer med det kardiovaskulære systemet, alvorlige trykkstøt, rask puls, angina pectoris.

Hvor å bli kvitt alkoholisme

Pris for alkoholkoding

Kostnaden betyr noe for de som har et stort ønske om å bli kvitt vanen, men ikke har nok midler. Hvor mye koster det å bli kvitt alkohol? Alt avhenger av hvilken anti-alkoholbehandlingsmetode som er valgt, på varigheten og på klinikken hvor pasienten gikk. Omtrentlig priser varierer fra 6 000 til 30 000 rubler. Du kan kjøpe rimelige ampuller med medisin i en nettbutikk, bestille de som er foreskrevet av legen, fjerne abstinenssyndrom og bli behandlet hjemme.

Hei, kjære lesere av bloggsiden. I dag skal vi snakke med deg om hvor krakozyabrs kommer fra på en nettside og i programmer, hvilke tekstkodinger som finnes og hvilke som bør brukes. La oss se nærmere på historien til utviklingen deres, fra grunnleggende ASCII, så vel som dens utvidede versjoner CP866, KOI8-R, Windows 1251 og slutter med moderne Unicode Consortium-kodinger UTF 16 og 8.

For noen kan denne informasjonen virke unødvendig, men vil du vite hvor mange spørsmål jeg mottar spesifikt angående krakozyabrene (uleselig sett med tegn). Nå vil jeg ha muligheten til å henvise alle til teksten i denne artikkelen og finne mine egne feil. Vel, gjør deg klar til å absorbere informasjonen og prøv å følge flyten i historien.

ASCII - grunnleggende tekstkoding for det latinske alfabetet

Utviklingen av tekstkodinger skjedde samtidig med dannelsen av IT-industrien, og i løpet av denne tiden klarte de å gjennomgå ganske mange endringer. Historisk sett startet det hele med EBCDIC, som var ganske dissonant i russisk uttale, som gjorde det mulig å kode bokstaver i det latinske alfabetet, arabiske tall og skilletegn med kontrolltegn.

Men likevel bør utgangspunktet for utviklingen av moderne tekstkodinger betraktes som det berømte ASCII(American Standard Code for Information Interchange, som på russisk vanligvis uttales som "aski"). Den beskriver de første 128 tegnene som oftest brukes av engelsktalende brukere - , arabiske tall og skilletegn.

Disse 128 tegnene beskrevet i ASCII inkluderte også noen tjenestetegn som parentes, hash-merker, stjerner, etc. Faktisk kan du se dem selv:

Det er disse 128 tegnene fra den originale versjonen av ASCII som har blitt standarden, og i enhver annen koding vil du definitivt finne dem, og de vil vises i denne rekkefølgen.

Men faktum er at med en byte med informasjon kan du kode ikke 128, men så mange som 256 forskjellige verdier (to i styrken av åtte tilsvarer 256), så etter den grunnleggende versjonen av Asuka en hel serie med utvidede ASCII-kodinger, der det i tillegg til 128 grunnleggende tegn også var mulig å kode symboler for den nasjonale kodingen (for eksempel russisk).

Her er det nok verdt å si litt mer om tallsystemene som brukes i beskrivelsen. For det første, som dere alle vet, fungerer en datamaskin bare med tall i det binære systemet, nemlig med nuller og enere ("boolsk algebra", hvis noen tok det på et institutt eller skole). , som hver er en to i potensen, starter fra null, og opp til to til den syvende:

Det er ikke vanskelig å forstå at alle mulige kombinasjoner av nuller og enere i et slikt design bare kan være 256. Å konvertere et tall fra det binære systemet til desimalsystemet er ganske enkelt. Du trenger bare å legge sammen alle potensene til to med ener over dem.

I vårt eksempel viser dette seg å være 1 (2 i potensen av null) pluss 8 (to i potensen av 3), pluss 32 (to til den femte potensen), pluss 64 (til den sjette potensen), pluss 128 (til syvende potens). Totalen er 233 i desimalnotasjon. Som du kan se, er alt veldig enkelt.

Men hvis du ser nøye på tabellen med ASCII-tegn, vil du se at de er representert i heksadesimal koding. For eksempel tilsvarer "stjerne" det heksadesimale tallet 2A i Aski. Du vet sikkert at i det heksadesimale tallsystemet, i tillegg til arabiske tall, brukes også latinske bokstaver fra A (betyr ti) til F (betyr femten).

Vel da, for konvertere binært tall til heksadesimalt ty til følgende enkle og åpenbare metode. Hver byte med informasjon er delt inn i to deler av fire biter, som vist i skjermbildet ovenfor. At. I hver halvbyte kan bare seksten verdier (to til fjerde potens) kodes i binært, som enkelt kan representeres som et heksadesimalt tall.

Dessuten, i venstre halvdel av byten må gradene telles igjen fra null, og ikke som vist på skjermbildet. Som et resultat, gjennom enkle beregninger, får vi at tallet E9 er kodet i skjermbildet. Jeg håper at forløpet av resonnementet mitt og løsningen på dette puslespillet var tydelig for deg. Vel, la oss nå fortsette å snakke om tekstkodinger.

Utvidede versjoner av Asuka - CP866 og KOI8-R-kodinger med pseudografikk

Så vi begynte å snakke om ASCII, som så å si var utgangspunktet for utviklingen av alle moderne kodinger (Windows 1251, Unicode, UTF 8).

Opprinnelig inneholdt den bare 128 tegn i det latinske alfabetet, arabiske tall og noe annet, men i den utvidede versjonen ble det mulig å bruke alle 256 verdier som kan kodes i én byte med informasjon. De. Det ble mulig å legge til symboler med bokstaver på språket ditt til Aski.

Her må vi gå bort igjen for å forklare - hvorfor trenger vi kodinger i det hele tatt? tekster og hvorfor det er så viktig. Tegnene på dataskjermen din er dannet på grunnlag av to ting - sett med vektorformer (representasjoner) av forskjellige tegn (de er plassert i filer med ) og kode som lar deg trekke ut fra dette settet med vektorformer (fontfil ) akkurat tegnet som må settes inn på Rett sted.

Det er tydelig at skriftene selv er ansvarlige for vektorformene, men operativsystemet og programmene som brukes i det er ansvarlige for kodingen. De. all tekst på datamaskinen din vil være et sett med byte, som hver koder for ett enkelt tegn i denne teksten.

Programmet som viser denne teksten på skjermen (tekstredigerer, nettleser osv.), når koden analyseres, leser kodingen til neste tegn og ser etter den tilsvarende vektorformen i den nødvendige fontfilen, som er koblet til for å vise dette tekstdokument. Alt er enkelt og banalt.

Dette betyr at for å kode et hvilket som helst tegn vi trenger (for eksempel fra det nasjonale alfabetet), må to betingelser være oppfylt - vektorformen til dette tegnet må være i fonten som brukes, og dette tegnet kan kodes i utvidede ASCII-kodinger i én byte. Derfor er det en hel haug med slike alternativer. Bare for å kode russiskspråklige tegn, finnes det flere varianter av utvidet Aska.

For eksempel opprinnelig dukket opp CP866, som hadde muligheten til å bruke tegn fra det russiske alfabetet og var en utvidet versjon av ASCII.

De. dens øvre del falt fullstendig sammen med den grunnleggende versjonen av Asuka (128 latinske tegn, tall og annet dritt), som er presentert i skjermbildet rett ovenfor, men nå Nedre del tabeller med CP866-koding hadde skjemaet vist i skjermbildet rett nedenfor og tillot deg å kode ytterligere 128 tegn (russiske bokstaver og all slags pseudo-grafikk):

Du ser, i høyre kolonne begynner tallene med 8, fordi... tall fra 0 til 7 refererer til den grunnleggende delen av ASCII (se første skjermbilde). At. Den russiske bokstaven "M" i CP866 vil ha koden 9C (den ligger i skjæringspunktet mellom den tilsvarende raden med 9 og kolonne med tallet C i det heksadesimale tallsystemet), som kan skrives i en byte med informasjon, og hvis det er en passende font med russiske tegn, vil denne bokstaven uten problemer vises i teksten.

Hvor kom dette beløpet fra? pseudografikk i CP866? Hele poenget er at denne kodingen for russisk tekst ble utviklet tilbake i de lurvede årene da grafiske operativsystemer ikke var så utbredt som de er nå. Og i Dosa og lignende tekstoperativsystemer gjorde pseudografikk det mulig i det minste på en eller annen måte å diversifisere utformingen av tekster, og derfor florerer CP866 og alle dens andre jevnaldrende fra kategorien utvidede versjoner av Asuka i den.

CP866 ble distribuert av IBM, men i tillegg til dette ble det utviklet en rekke kodinger for russiskspråklige tegn, for eksempel kan samme type (utvidet ASCII) tilskrives KOI8-R:

Prinsippet for driften forblir det samme som for CP866 beskrevet litt tidligere - hvert tegn i tekst er kodet av en enkelt byte. Skjermbildet viser andre halvdel av KOI8-R-tabellen, fordi første halvdel er helt i samsvar med den grunnleggende Asuka, som vises i det første skjermbildet i denne artikkelen.

Blant funksjonene til KOI8-R-kodingen kan det bemerkes at de russiske bokstavene i tabellen ikke er i alfabetisk rekkefølge, som de for eksempel gjorde det i CP866.

Hvis du ser på det aller første skjermbildet (av den grunnleggende delen, som er inkludert i alle utvidede kodinger), vil du legge merke til at i KOI8-R er russiske bokstaver plassert i de samme cellene i tabellen som de tilsvarende bokstavene i det latinske alfabetet fra første del av tabellen. Dette ble gjort for å gjøre det lettere å bytte fra russiske til latinske tegn ved å forkaste bare én bit (to til sjuende potens eller 128).

Windows 1251 - den moderne versjonen av ASCII og hvorfor sprekkene kommer ut

Videreutviklingen av tekstkodinger skyldtes det faktum at grafiske operativsystemer ble stadig mer populære og behovet for å bruke pseudografi i dem forsvant over tid. Som et resultat oppsto det en hel gruppe som i hovedsak fortsatt var utvidede versjoner av Asuka (ett tegn med tekst er kodet med bare én byte med informasjon), men uten bruk av pseudografiske symboler.

De tilhørte de såkalte ANSI-kodingene, som ble utviklet av American Standards Institute. I vanlig språkbruk ble navnet kyrillisk også brukt for versjonen med russisk språkstøtte. Et eksempel på dette vil være.

Det skilte seg gunstig fra de tidligere brukte CP866 og KOI8-R ved at plassen til pseudografiske symboler i den ble tatt av de manglende symbolene i russisk typografi (bortsett fra aksentmerket), samt symboler brukt på slaviske språk nær ved Russisk (ukrainsk, hviterussisk, etc.). ):

På grunn av en slik overflod av russisk språkkodinger, skriftprodusenter og produsenter programvare stadig oppsto hodepine, og du og jeg, kjære lesere, kom ofte ut av de samme beryktede krakozyabry når det var forvirring med versjonen som ble brukt i teksten.

Svært ofte kom de ut når de sendte og mottok meldinger via e-post, noe som innebar opprettelsen av svært komplekse konverteringstabeller, som faktisk ikke kunne løse dette problemet fundamentalt, og brukere brukte ofte til korrespondanse for å unngå de beryktede gimmickene ved bruk Russiske kodinger som CP866, KOI8-R eller Windows 1251.

Faktisk var sprekkene som dukket opp i stedet for den russiske teksten et resultat av feil bruk av kodingen av dette språket, som ikke samsvarte med det som tekstmeldingen opprinnelig ble kodet i.

La oss si at hvis du prøver å vise tegn som er kodet ved hjelp av CP866 ved hjelp av Windows 1251-kodetabellen, vil de samme tullet (et meningsløst sett med tegn) komme ut, og erstatte teksten i meldingen fullstendig.

En lignende situasjon oppstår veldig ofte i fora eller blogger, når tekst med russiske tegn ved en feil blir lagret i feil koding som brukes på nettstedet som standard, eller i feil tekstredigerer, som legger til gags til koden som ikke er synlig for det blotte øyet.

Til slutt ble mange lei av denne situasjonen med mye kodinger og stadig snikende dritt, og forutsetningene dukket opp for å lage en ny universell variant som skulle erstatte alle de eksisterende og til slutt løse problemet med utseendet av uleselige tekster. I tillegg var det problemet med språk som kinesisk, der det var mye flere språktegn enn 256.

Unicode - universell koding UTF 8, 16 og 32

Disse tusenvis av tegn i den sørøstasiatiske språkgruppen kunne umulig beskrives i én byte med informasjon som ble tildelt for koding av tegn i utvidede versjoner av ASCII. Som et resultat ble det opprettet et konsortium kalt Unicode(Unicode - Unicode Consortium) i samarbeid med mange ledere i IT-bransjen (de som produserer programvare, som koder maskinvare, som lager fonter), som var interessert i fremveksten av en universell tekstkoding.

Den første varianten utgitt i regi av Unicode Consortium var UTF 32. Tallet i kodenavnet betyr antall biter som brukes til å kode ett tegn. 32 biter tilsvarer 4 byte med informasjon som vil være nødvendig for å kode ett enkelt tegn i den nye universelle UTF-kodingen.

Som et resultat vil den samme filen med tekst kodet i den utvidede versjonen av ASCII og i UTF-32, i sistnevnte tilfelle, ha en størrelse (veie) fire ganger større. Dette er dårlig, men nå har vi muligheten til å kode ved hjelp av YTF et antall tegn lik to til trettisekunders potens ( milliarder av tegn, som vil dekke enhver virkelig nødvendig verdi med en kolossal margin).

Men mange land med språk fra den europeiske gruppen trengte ikke å bruke et så stort antall tegn i koding i det hele tatt, men når de brukte UTF-32, fikk de uten grunn en firedobling i vekten av tekstdokumenter, og som et resultat, en økning i volumet av Internett-trafikk og volum lagret data. Dette er mye, og ingen hadde råd til slikt avfall.

Som et resultat av utviklingen av Unicode, UTF-16, som viste seg å være så vellykket at den ble tatt i bruk som standard som basisplass for alle tegnene vi bruker. Den bruker to byte for å kode ett tegn. La oss se hvordan denne tingen ser ut.

I Windows-operativsystemet kan du følge banen "Start" - "Programmer" - "Tilbehør" - "Systemverktøy" - "Tegntabell". Som et resultat vil en tabell åpnes med vektorformene til alle skriftene som er installert på systemet ditt. Hvis du velger Unicode-tegnsettet i "Avanserte alternativer", vil du kunne se for hver font separat hele utvalget av tegn som er inkludert i den.

Forresten, ved å klikke på noen av dem, kan du se to-byte kode i UTF-16-format, bestående av fire heksadesimale sifre:

Hvor mange tegn kan kodes i UTF-16 med 16 bits? 65 536 (to i potens av seksten), og dette er tallet som ble tatt i bruk som basisplass i Unicode. I tillegg er det måter å kode rundt to millioner tegn på, men de var begrenset til en utvidet plass på en million tegn med tekst.

Men selv denne vellykkede versjonen av Unicode-kodingen ga ikke mye tilfredsstillelse til de som skrev for eksempel programmer bare i engelske språk, fordi etter overgangen fra den utvidede versjonen av ASCII til UTF-16, doblet vekten av dokumenter (én byte per tegn i Aski og to byte per samme tegn i UTF-16).

Det var nettopp for å tilfredsstille alle og enhver i Unicode-konsortiet at det ble besluttet å komme opp med variabel lengdekoding. Den ble kalt UTF-8. Til tross for de åtte i navnet har den faktisk variabel lengde, d.v.s. Hvert tegn i tekst kan kodes inn i en sekvens på én til seks byte lang.

I praksis bruker UTF-8 bare området fra én til fire byte, fordi utover fire byte med kode er det ikke lenger engang teoretisk mulig å forestille seg noe. Alle latinske tegn i den er kodet til én byte, akkurat som i den gode gamle ASCII.

Det som er bemerkelsesverdig er at når det gjelder koding av bare det latinske alfabetet, vil selv de programmene som ikke forstår Unicode fortsatt lese det som er kodet i YTF-8. De. kjernedelen av Asuka ble ganske enkelt overført til denne etableringen av Unicode-konsortiet.

Kyrilliske tegn i UTF-8 er kodet i to byte, og for eksempel georgiske tegn er kodet i tre byte. Unicode-konsortiet, etter å ha opprettet UTF 16 og 8, løste hovedproblemet - nå har vi skrifter har ett enkelt koderom. Og nå kan produsentene deres bare fylle den med vektorformer av teksttegn basert på deres styrker og evner. Nå kommer de til og med i sett.

I "Tegntabellen" ovenfor kan du se at forskjellige fonter støtter forskjellige antall tegn. Noen Unicode-rike skrifter kan være ganske tunge. Men nå skiller de seg ikke i det faktum at de ble opprettet for forskjellige kodinger, men i det faktum at skriftprodusenten har fylt eller ikke helt fylt enkeltkoderommet med visse vektorformer.

Gale ord i stedet for russiske bokstaver - hvordan fikse det

La oss nå se hvordan krakozyabrs vises i stedet for tekst eller, med andre ord, hvordan riktig koding for russisk tekst er valgt. Faktisk er det satt i programmet der du oppretter eller redigerer denne selve teksten, eller koden ved hjelp av tekstfragmenter.

For å redigere og lage tekstfiler bruker jeg personlig en veldig god, etter min mening, . Den kan imidlertid fremheve syntaksen til hundrevis av andre programmerings- og markeringsspråk, og har også muligheten til å utvides ved hjelp av plugins. Lese detaljert gjennomgang dette fantastiske programmet på lenken som er gitt.

I toppmenyen til Notepad++ er det et element "Kodinger", der du vil ha muligheten til å konvertere et eksisterende alternativ til det som brukes som standard på nettstedet ditt:

Når det gjelder et nettsted på Joomla 1.5 og høyere, så vel som når det gjelder en blogg på WordPress, bør du velge alternativet for å unngå sprekker UTF 8 uten stykkliste. Hva er BOM-prefikset?

Faktum er at da de utviklet YUTF-16-kodingen, bestemte de seg av en eller annen grunn for å knytte til den noe som muligheten til å skrive tegnkoden både i direkte sekvens (for eksempel 0A15) og omvendt (150A) . Og for at programmer skal forstå nøyaktig i hvilken rekkefølge de skal lese kodene, ble den oppfunnet BOM(Byte Order Mark eller, med andre ord, signatur), som ble uttrykt ved å legge til tre ekstra byte helt i begynnelsen av dokumentene.

I UTF-8-kodingen ble det ikke gitt noen stykklister i Unicode-konsortiet, og derfor hindrer det å legge til en signatur (de beryktede ekstra tre bytene i begynnelsen av dokumentet) noen programmer fra å lese koden. Derfor, når vi lagrer filer i UTF, må vi alltid velge alternativet uten BOM (uten signatur). Så du er på forhånd beskytte deg mot krypende krakozyabrs.

Det som er bemerkelsesverdig er at noen programmer i Windows ikke kan gjøre dette (de kan ikke lagre tekst i UTF-8 uten en stykkliste), for eksempel den samme beryktede Windows Notisblokken. Den lagrer dokumentet i UTF-8, men legger likevel til signaturen (tre ekstra byte) i begynnelsen av det. Dessuten vil disse bytene alltid være de samme - les koden i direkte rekkefølge. Men på servere, på grunn av denne lille tingen, kan det oppstå et problem - skurker vil komme ut.

Derfor under ingen omstendigheter Ikke bruk vanlig Windows-notisblokk for å redigere dokumenter på nettstedet ditt hvis du ikke vil at det skal vises sprekker. Jeg anser den allerede nevnte Notepad++-editoren for å være det beste og enkleste alternativet, som praktisk talt ikke har noen ulemper og bare består av fordeler.

I Notepad++, når du velger en koding, vil du ha muligheten til å konvertere tekst til UCS-2-koding, som er svært nær Unicode-standarden. Også i Notepad vil det være mulig å kode tekst i ANSI, dvs. i forhold til det russiske språket vil dette være Windows 1251, som vi allerede har beskrevet rett ovenfor. Hvor kommer denne informasjonen fra?

Det er registrert i registeret på operasjonsstuen din Windows-systemer- hvilken koding du skal velge for ANSI, hvilken koding du skal velge for OEM (for russisk språk vil det være CP866). Hvis du installerer et annet standardspråk på datamaskinen din, vil disse kodingene bli erstattet med lignende fra ANSI- eller OEM-kategorien for det samme språket.

Etter at du har lagret dokumentet i Notepad++ i den kodingen du trenger eller åpnet dokumentet fra nettstedet for redigering, kan du se navnet i nedre høyre hjørne av redigeringsprogrammet:

For å unngå rednecks I tillegg til handlingene beskrevet ovenfor, vil det være nyttig å skrive informasjon om denne kodingen i overskriften til kildekoden på alle sidene på nettstedet, slik at det ikke er noen forvirring på serveren eller den lokale verten.

Generelt bruker alle hypertekstmarkeringsspråk unntatt HTML en spesiell xml-erklæring, som spesifiserer tekstkodingen.

Før du analyserer koden, vet nettleseren hvilken versjon som brukes og nøyaktig hvordan den må tolke tegnkodene til det språket. Men det som er bemerkelsesverdig er at hvis du lagrer dokumentet i standard Unicode, kan denne xml-erklæringen utelates (kodingen vil bli betraktet som UTF-8 hvis det ikke er stykkliste eller UTF-16 hvis det er en stykkliste).

Når det gjelder et HTML-språkdokument, brukes kodingen for å indikere Metaelement, som er skrevet mellom de innledende og avsluttende Head-taggene:

... ...

Denne oppføringen er ganske forskjellig fra den som er tatt i bruk i, men er fullstendig kompatibel med den nye HTML 5-standarden som sakte introduseres, og den vil bli fullstendig forstått riktig av alle nettlesere som brukes for øyeblikket.

I teorien ville det være bedre å plassere et Meta-element som indikerer HTML-dokumentets koding så høyt som mulig i dokumentoverskriften slik at på tidspunktet for det første tegnet i teksten som ikke er fra den grunnleggende ANSI (som alltid leses riktig og i alle varianter), bør nettleseren allerede ha informasjon om hvordan man tolker kodene til disse tegnene.

Lykke til! Vi sees snart på sidene til bloggsiden

Du kan være interessert

Hva er URL-adresser, hvordan er absolutte og relative lenker for et nettsted forskjellige?
OpenServer - en moderne lokal server og et eksempel på hvordan du bruker den til å installere WordPress på en datamaskin
Hva er Chmod, hvilke tillatelser å tildele filer og mapper (777, 755, 666) og hvordan du gjør det via PHP
Yandex søk etter nettsted og nettbutikk

Seinere ASCII ble utvidet (til å begynne med brukte den ikke alle 8 biter), så det ble mulig å bruke ikke 128, men 256 (2 til 8. potens) forskjellige tegn som kan kodes i én byte med informasjon.
Denne forbedringen gjorde det mulig å legge til kodingen ASCII symboler på nasjonale språk forskjellige land, i tillegg til det allerede eksisterende latinske alfabetet.
Utvidede kodingsalternativer ASCII Det er mange av dem på grunn av det faktum at det også er mange språk i verden. Jeg tror at mange av dere har hørt om en koding som KOI8 (Code of Information Exchange, 8 bits) - dette er også en utvidet koding ASCII. KOI8 inkluderte tall, bokstaver i det latinske og russiske alfabetet, samt skilletegn, spesialtegn og pseudografikk.

ISO-koding

Den internasjonale standardiseringsorganisasjonen har laget en rekke kodinger for forskjellige alfabeter/språk.

ISO 8859-seriekodinger

Koding Beskrivelse
ISO 8859-1 (Latin-1) Utvidet latin, inkludert tegn fra de fleste vesteuropeiske språk (engelsk, dansk, irsk, islandsk, spansk, italiensk, tysk, norsk, portugisisk, romansk, færøysk, svensk, skotsk gælisk og deler av nederlandsk, finsk, fransk), som samt noen østeuropeiske (albanske) og afrikanske språk (afrikaans, swahili). Latin-1 mangler eurotegnet og den store bokstaven Ÿ. Denne kodesiden regnes som standardkodingen for HTML-dokumenter og meldinger E-post. Dessuten tilsvarer de første 256 Unicode-tegnene denne kodesiden.
ISO 8859-2 (Latin-2) Utvidet latin, inkludert tegn fra sentral- og østeuropeiske språk (bosnisk, ungarsk, polsk, slovakisk, slovensk, kroatisk, tsjekkisk). Latin-2, som Latin-1, mangler euro-tegnet.
ISO 8859-3 (Latin-3) Utvidet latin, inkludert tegn fra søreuropeiske språk (maltesisk, tyrkisk og esperanto).
ISO 8859-4 (Latin-4) Utvidet latin, inkludert tegn fra nordeuropeiske språk (grønlandsk, estisk, latvisk, litauisk og samisk).
ISO 8859-5 (latinsk/kyrillisk) Kyrillisk, inkludert karakterer fra slaviske språk (hviterussisk, bulgarsk, makedonsk, russisk, serbisk og delvis ukrainsk).
ISO 8859-6 (latinsk/arabisk) Symboler brukt på arabisk. Tegn fra andre arabisk-baserte språk støttes ikke. Støtte for toveis skriving og kontekstsensitive tegnformer er nødvendig for å vise ISO 8859-6-tekst på riktig måte.
ISO 8859-7 (latinsk/gresk) Symboler for moderne gresk språk. Kan også brukes til å skrive antikke greske tekster i monoton ortografi.
ISO 8859-8 (latin/hebraisk) Symboler på moderne hebraisk. Den brukes i to versjoner: med en logisk rekkefølge av tegn (krever støtte for toveis skriving) og med en visuell rekkefølge av tegn.
ISO 8859-9 (Latin-5) En variant av Latin-1 som erstatter sjelden brukte islandske tegn med tyrkiske. Brukes for tyrkiske og kurdiske språk.
ISO 8859-10 (Latin-6) En latin-4-variant mer egnet for skandinaviske språk.
ISO 8859-11 (latinsk/thailandsk) Symboler på det thailandske språket.
ISO 8859-13 (Latin-7) Latin-4-variant, mer egnet for baltiske språk.
ISO 8859-14 (Latin-8) Et utvidet latinsk skrift som inkluderer karakterer fra keltiske språk som skotsk gælisk og bretonsk.
ISO 8859-15 (Latin-9) En variant av Latin-1 som erstatter sjelden brukte tegn med de som trengs for å støtte finsk, fransk og estisk fullt ut. I tillegg ble eurotegnet lagt til Latin-9.
ISO 8859-16 (Latin-10) Utvidet latin, inkludert tegn fra søreuropeiske og østeuropeiske språk (albansk, ungarsk, italiensk, polsk, rumensk, slovensk, kroatisk), samt noen vesteuropeiske språk (irsk i den nye skrivemåten, tysk, finsk, Fransk). I likhet med Latin-9, la Latin-10 til eurotegnet.

For dokumenter på engelsk og de fleste andre vesteuropeiske språk støttes koding bredt ISO-8859-1.

I HTML ISO-8859-1 er standardkodingen (i XHTML og HTML5 er standardkodingen UTF-8).
Når du bruker en annen sidekoding enn ISO-8859-1, må du angi dette i taggen .

For HTML4:

For HTML5:

Et eksempel på ANSI-koding er den velkjente Windows-1251.

Windows-1251 skiller seg gunstig fra andre 8-biters kyrilliske kodinger (som CP866 og ISO 8859-5) ved tilstedeværelsen av nesten alle tegnene som brukes i russisk typografi for ren tekst (bare aksentmerket mangler). Den inneholder også alle symbolene for andre slaviske språk: ukrainsk, hviterussisk, serbisk, makedonsk og bulgarsk.
Nedenfor er desimalverdiene til kodingstegnene Windows-1251.

For å vise tabellsymboler i et HTML-dokument, bruk følgende syntaks:

& + kode + ;

Windows-koding-1251 (CP1251)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .EN .B .C .D .E .F

8.
Ђ
402
Ѓ
403

201A
ѓ
453

201E

2026

2020

2021

20 AC

2030
Љ
409

2039
Њ
40A
Ќ
40C
Ћ
40B
Џ
40F

9.
ђ
452

2018

2019

201C

201D

2022

2013
-
2014

2122
љ
459

203A
њ
45A
ќ
45C
ћ
45B
џ
45F

EN.

A0
Ў
40E
ў
45E
Ј
408
¤
A4
Ґ
490
¦
A6
§
A7
Yo
401
©
A9
Є
404
«
AB
¬
A.C.
­
AD
®
A.E.
Ї
407

B.
°
B0
±
B1
І
406
і
456
ґ
491
µ
B5

B6
·
B7
e
451

2116
є
454
»
BB
ј
458
Ѕ
405
ѕ
455
ї
457

C.
EN
410
B
411
I
412
G
413
D
414
E
415
OG
416
Z
417
OG
418
Y
419
TIL
41A
L
41B
M
41C
N
41D
OM
41E
P
41F

D.
R
420
MED
421
T
422
U
423
F
424
X
425
C
426
H
427
Sh
428
SCH
429
Kommersant
42A
Y
42B
b
42C
E
42D
YU
42E
Jeg
42F

E.
EN
430
b
431
V
432
G
433
d
434
e
435
og
436
h
437
Og
438
th
439
Til
43A
l
43B
m
43C
n
43D
O
43E
P
43F

F.
R
440
Med
441
T
442

443
f
444
X
445
ts
446
h
447
w
448
sch
449
ъ
44A
s
44B
b
44C
eh
44D
Yu
44E
Jeg
44F

UNICODE standardkodinger

Unicode er en standard for tegnkoding som lar deg representere tegnene til nesten alle skriftspråk i verden, og spesialtegn. Tegn representert i Unicode er kodet som heltall uten fortegn. Unicode har flere former for å representere tegn på en datamaskin: UTF-8, UTF-16 (UTF-16BE, UTF-16LE) og UTF-32 (UTF-32BE, UTF-32LE). (engelsk: Unicode transformation format - UTF).
UTF-8 er en for tiden vanlig koding som er mye brukt i operativsystemer og web. Tekst som består av Unicode-tegn nummerert mindre enn 128 (kodeområde U+0000 til U+007F) inneholder angitte tegn ASCII med tilsvarende koder. Neste er områder med tegn i forskjellige skript, skilletegn og tekniske symboler. Områder med tegn med koder fra U+0400 til U+052F, fra U+2DE0 til U+2DFF, fra U+A640 til U+A69F er tildelt for kyrilliske tegn.

Koding UTF-8 er universell og har en imponerende reserve for fremtiden. Dette gjør det til den mest praktiske kodingen for bruk på Internett.

Nettstedkoding (Encoding) representerer korrespondansen mellom en tallserie og symboler (tall, bokstaver, tegn og andre spesialtegn). De vanligste kodingene er ASCII, sammen med Unicode UTF-8 og Windows-1251. I innholdet er en spesiell metakode ansvarlig for koding: , som angir en bestemt kodetype for sider. I dette tilfellet er det UTF-8 Unicode.

I enkle ord er dette standardsymboler og tall som tilsvarer en bestemt type sett med skrevne bokstaver, tall, tegn og andre elementer. Oftest bruker et nettsted én type koding, men det finnes unntak når flere kodinger kan installeres samtidig. Dette kan imidlertid føre til feil visning av hele nettressursen. Mange nettsteder bruker kodingsstandarden – UTF-8, siden denne typen kode støttes av mange kjente nettlesere, søkemotorer, servere og andre plattformer. Svært ofte er det situasjoner når kodingen spesifisert på nettstedet ikke samsvarer med den som er installert på serveren. Hovedårsaken til dette fenomenet er at leverandøren ikke støtter den angitte typen koding, som et resultat av at den sender "sin egen", noe som faktisk fører til feil visning av informasjon. En koding er en tabell som beskriver enhver samsvar mellom et spesifikt tegn og et tall. Hvert symbol som er synlig på nettstedet, representerer for datamaskinen bare et sett med biter (et visst sett med nuller og andre).

Typer nettstedkodinger

Det finnes flere typer kodinger i internettverdenen:

  • ASCII er den aller første kodingen som ble tatt i bruk av amerikaneren nasjonalt institutt verdensstandarder. Bare 7 biter ble brukt til koding, hvor for første gang 128 verdier er plassert i det engelske alfabetet, samt alle tall, tegn og symboler. Denne kodingen er ikke universell og ble oftest brukt på engelskspråklige nettsteder.
  • Kyrillisk er en virkelig innenlandsk versjon. Kodingen brukte den andre delen av hovedkodetabellen, eller rettere sagt tegn fra 129 til 256. Brukes på russiskspråklige nettsteder og blogger.
  • Encodings 1250-1258 (MS Windows- og Windows-systemer) er standard 8-bits kodinger som dukket opp umiddelbart etter utgivelsen av den berømte operativsystem Microsoft Windows. Tallene 1250 til 1258 er rettet til språket som brukes av kodingen. 1250 er språkene i Sentral-Europa, og 1251 er en variant av det kyrilliske alfabetet.
  • KOI8 – står for 8-bits informasjonsutvekslingskode. Vanligvis brukes russiske kyrilliske standarder i Unix og lignende systemer, der standardene KOI-7, KOI8-R og KOI8-U gjelder.
  • Unicode (originalt navn Unicode) er en velkjent standard for tegnkoding, som lar deg beskrive tegnene til bokstavelig talt alle verdens språk. Ofte betegnet med "U+xxxx", der "xxxx" er heksadesimale verdier. Den vanligste familien av denne kodingen er UTF (Unicode-Transformation Format), det vil si UTF-8, 16 og 32.

Hver enkelt visning kan brukes direkte på hvilken som helst nettside.

Universelle og populære kodinger

I dag er den mest populære og kjente kodingen UTF-8, og det er takket være den at det er mulig å sikre maksimal kompatibilitet med alle eldre systemer som brukte konvensjonelle 8-biters tegntyper. UTF-8-kodingen inkluderer de fleste nettsteder på Internett, og denne standarden anses som universell. UTF-8 støtter både kyrillisk og latinsk alfabet.

Hvis du får tilsendt et tekstdokument der informasjon vises i form av rare og uforståelige tegn, kan du anta at forfatteren brukte koding som ikke gjenkjennes av datamaskinen din. Det finnes spesielle dekoderprogrammer for å endre kodingen, men det er mye enklere å bruke en av nettjenestene.

I dag skal vi snakke om de mest populære og effektive nettstedene som vil hjelpe deg med å gjette kodingen og endre den til noe mer forståelig for PC-en din. Oftest har slike nettsteder en automatisk gjenkjennelsesalgoritme, men om nødvendig kan brukeren alltid velge riktig koding manuelt.

Metode 1: Universell dekoder

Dekoderen ber brukere om å kopiere en uforståelig tekstpassasje til nettstedet og konverterer automatisk kodingen til en mer forståelig. Fordelene inkluderer enkelheten til ressursen, samt tilstedeværelsen av ytterligere manuelle innstillinger som lar deg velge ønsket format uavhengig.

Du kan bare jobbe med tekst hvis størrelse ikke overstiger 100 kilobyte; i tillegg garanterer ikke skaperne av ressursen at omkodingen vil lykkes i 100 % av tilfellene. Hvis ressursen ikke hjelper, prøv bare å gjenkjenne teksten ved hjelp av andre metoder.


Vær oppmerksom på at hvis dokumentet som er sendt til deg vises «???? ?? ??????» , er det lite sannsynlig at det blir konvertert. Tegnene vises på grunn av feil fra avsenderens side, så bare be om at teksten sendes til deg på nytt.

Metode 2: Artemy Lebedev Studio

Et annet nettsted for å jobbe med koding, i motsetning til den forrige ressursen, har en mer behagelig design. Den tilbyr brukere to driftsmoduser, enkel og avansert, i det første tilfellet, etter dekoding, ser brukeren resultatet, i det andre tilfellet er den første og siste kodingen synlig.


Med nettstedet blir ethvert uforståelig rot av symboler raskt til forståelig russisk tekst. For øyeblikket fungerer ressursen med alle kjente kodinger.

Metode 3: Fox Tools

Fox Tools er designet for universell dekoding av uforståelige tegn til vanlig russisk tekst. Brukeren kan uavhengig velge start- og sluttkoding; nettstedet har også en automatisk modus.


Til tross for at nettstedet visstnok gjenkjenner kodingen automatisk, må brukeren fortsatt velge et klart resultat manuelt. På grunn av denne funksjonen er det mye enklere å bruke metodene beskrevet ovenfor.

Lignende artikler

  • Hvis du ser en kran i en drøm, hva betyr det?

    Drømmetydning: Noble Dream Book av N. Grishina Drømmetydning Crane Crane – ankomst av slektninger / fødsel av babyer / alt godt. Drømmetydning: Drømmetydning av Shereminskaya I en drøm er det en nyhet langveisfra å se en kran. Drømmetydning: Ny familiedrømmebok Hvorfor drømmer du...

  • Drømmetydningssåle: slapp av, kom av skoen i en drøm, hvorfor?

    Å se sålen - til veien, begge deler - til en lang reise. Hvis du drømte om et hull - vil du bryte et forhold til noen, og du vil bli ekstremt deprimert over det. Å sette et plaster på sålen - en drøm forutsier ditt fremtidige originale forsøk på å...

  • Hvordan gjøre chakrameditasjon?

    Chakraer er menneskelige energisentre som i stor grad påvirker hans liv, evner og forhold til mennesker. Åpningen av chakraene er ledsaget av positive endringer i helse, fysisk og spesielt følelsesmessig. Også ofte...

  • Hvorfor drømmer du om å gå i skjørt?

    Drømmetydning: langt skjørt Et langt skjørt passer ikke hver kvinne, og derfor skjuler bildet du ser sannsynligvis en slags hemmelighet. Mange drømmebøker gir sine egne tolkninger, som ikke alltid kan sammenlignes med det drømte bildet, og derfor...

  • Er Skorpion-menn sjalu Er Skorpion-menn sjalu?

    Vi spør oss ofte hvorfor en mann oppfører seg på denne måten med kvinner eller hvorfor han har en slik karakter. En manns oppførsel bestemmes av hans fødsel under et bestemt stjernetegn. Når du kjenner dette øyeblikket, kan du forstå...

  • Drømmetydning: høye hæler

    i følge Millers drømmebok Hvis skoene dine er revet og skitne i en drøm, betyr det at du risikerer å få fiender med feiende kritikk. Hvis du har på deg svarte sko i en drøm, betyr det at virksomheten din vil gå bra, og en viktig begivenhet vil gi deg...