Zum Inhalt springen

Bochstabesallaat

Uß de Wikipedia
Hee di Sigg_is_op Kölsch
(mieh kölsche Sigge)
unn jeshrivve wii_mer_t_shprish
(mieh Sigge jeshrivve wii_mer_t_shprish)

Bochstabesallat kütt en de Houpsaach zoshtand, wann enne Kompjutor, ene Kompjuto-Dröcker, odder esu jet, mem fokeehte Zëjschesaz ärbeide. Wat do ußjejovve weed, dat kam_mer dann jaa nit lässe, or nur zem Dëijl. Tüppesche Fäll bëij ons:

De Sigg övver 文字化け (Bochstabesallaat) en de Wikipedija op Japanesch ävver jezëijsh, wi wänn dat noh dä ISO-8859-1 Norrem kodeet wöhr — et eß ävver en Woohëit en UTF-8 övvermeddelt woode.
  • De Ümluute sen fott.
  • För jede Ömluut un et scharfe s stëijt jet angersch do.
  • Mer süüht nur ene exootesche Sammlong uß koomije Zëijshe.

Ene andere, selldene Fall eß, wann Ëiner op de verkeehte Taßtatuur eröm am klimpere eß, udder obb_en verkeeht enjeshtallte. Dann meint dä, hä hät dä ëijne Bochstabe jetipp, un wat eß? Ene andere kütt eruß.

Ander Bezëishnonge

[Ändere · der Quälltäx ändere]

Der janz besonöndere Kompjutojeck säät och jän änglėsch mojibake udder japaanėsch 文字化け doför, kleng beeds onjeväär ˌmɔdʒi'bake, dat eß esu äänlesch wi Mǫschibake. Dat Woot küt och uss_em Jappaaneėsche. 文字 (moji) eß Letter odder Bochshtave, un 化け (bake) bedügg Verwandelong, udder Dorjeneijn, dat küt fun 化ける (bakeru), un dat bedügg „koßtümeet opdouche“, un „sing Form verändere op …“, un „sesch noh_m Schlääshte wandelle“.

Ene andere änglesche Ußdrock unger Kompjutolück eß gibberish — mier däte Kauderwelsch sare — un dat klengk wi ˈdʒɪb.ə.ɹɪʃ.

För dat, wat uns Bochshtabesallaat sönß nochbedügge kann, han de Kompjutolück dä änglesche Ußdrock garbage, dat es mä Möll, Affall, Dreßß, ävver dat Woot weet dann och wider för e beßje mieh wi esu en Date-Onjlöcker jebruch. Et klengk wi ˈgɑːɹbɪdʒ en der USA un söns ierter ˈgɑːbɪdʒ of ˈgɑːbɪtʃ.

Ursaache för et Optredde

[Ändere · der Quälltäx ändere]

Dä Boochstabesallaht kütt et miehts zoshtand, wann de Zëijshe ier Kodeerung, dä su jennannte „character encoding“ nit reshtesh medd_ennem Dokkemänt zosamme övverdraare wood, udder wan_su_n Dokemänt ohne di Enfomazjůn obb_en annder Komputo_Süßtem jekůmme eß, un dann „jlöüv“_enne Kompjuto, oddo dä Dröcker, et wöhr et „ëije“, un dat shtemmp ävver nit. Leider jidd_et ene Houfe esu en ungerscheidlijje Kodeerunge op der Welt, un di bruch mer och, un jede Firma, wo Komputore un Zubehör jemaat wääde, hät ier_er di se Vörtrecke, ävver de Länder, de Kultuurkriese, un de Shprooche hann_er och de iere. Wann jetz ene Kompjuto nit „wëiß“, wat met esu enem Dokkemänt loß eß, es dat öff jenou esu jot, wi wann de verkeehte Zëijshesatz-Enfomazjůn medd_em jekumme es. Odder dä Kompjuto hät ëijfach nit di Zëijsche sellver, di enn_enem Zëijshesaz dren sen, sarr_ens enne Dröcker en Europpa, un dä sät: „Schineesėsch, dat kann_esch nit“ — do hät dä Kompjuto këijn Schangs, dänn zom Schinesësch_Dröcke ze krijje. Wann dä Dröcker dann di Daate trotzdämm kritt, för se ußzedröcke, dann weet uß dämm eetzte schineesesch Zëijshe, zem Bëispell et eetze latteinesch Zeijsche maache, uss_em zwëijte et zwëije, un esu, un am Eng kütt do Keu] beij_eruß.

Text en ungerscheedlijje Kodeerunge en ëijn un dersellve Shprooch odder Schreff künne och esu en Problme hann. Japaner künne e Leedshe dovun senge. Bëij dänne es dat lang uusuß, dat se hen handvoll ungerscheedlijje Kodeerůnge am bruche sėn. Zum Bëijshpell dat Woot „文字化け“ en UTF-8 weed fokeeht als „文字化け“ aanjezëijsh obb_enem PC, dä op dat su jenannte „wesslijje“ Windows-1252 enjeshtalld_eß, un fun dämm UNICODE, also och UTF-8, nix foshtëiht.

Ene Web-Brauser maach nit ungerschejde künne zwesche ene Websigg em EUC-JP Kode un en andere en Shift-JIS, wann de Kodeerůng nit ußdröcklesch en enem HTTP-eader-Enndraach jenannt eß, dä zosamme met dä Sigg zo imm jescheck woode sėn moß, un wann se nit dann winnishtdenß en enem meta tag en dämm HTML fun dä Sigg dren shtëishe deiht, wann_et övverhoup en HTML-Sigg eß, wat ävver de miihßte Websigge sin. Met dämm meta tag för de Kodeerung kam_mer sesch dröm eröm laveeere, wann sijj_ene Webßöver nit esu eshtälle löht, dat dä de reshteje HTTP headers ruß_sende dëijt. Hät mer beeds nit, kam_mer noch met heureßtesche Metoode probeere, dä Zëishesatz eruß ze krijje, ävver dat jrenz aan Rohde, un do kann nit en jedem Fall jät Joohds bëij_eruß kumme.

Mer kann och ens e beßje Bochstabesalaat krijje wann de Kodeerunge zosamme ze paase schinge. Zem Bëijshpell, Windows un Macintosh bröüshte ISO-8859-1 als dänne iere Zëishe-Kood, sare se. Shtemmp och, äver. Beeds bruche se en iere Süßteeme och noch Zëijshe, di em dä ISO-8859-1 Norrem jaa nit dren sin, un beeds künnte un donn nit drop aade, dat se di Zëijshe_Pusizjuhne nich bruche dörrve, wan ens e Dokkement up däm Kompjuto eruß jëiht. Nattöörlesch sin di Extra Zëijshe nit deselve un nit jlisch, zwesche dänne zwëij. Dröm sen Dokkemënte met dänne dren och nit kompatibel zwesche dä Systeme. Scheck mer se doch fun ëijne obb_et andere, zack, häß De för di paa Zëijshe der Bochshtabesalat.

Aanwendunge, di UTF-8 alß dänne iere Shtanndatt hann, hann en hröößer Schangß, dat se met andere zosamme könne, wëijl dä Kood enzwesche öff jebruch weed, un ußerdämm och, wëil hä met dämm älldere, un och öff jebruchte US-ASCII kampatibel eß.

De Schwireschkëijte, met däm Bochshtabesallaat ömzejonn hange dofun af, wat dat förr_en Projramm ov Jerääd_eß, woh dä opdouch, un nattörlėsh, wi dä övvohoup zeshtand küt. Drëij fun de häufijje Projramme sen Web-Brauser, e-mail-Projramme, un Projramme för et Schriivee, woh mer dä Sallaat ald ens süüht. De Brausers hückzedaach un de mihßte neuere Texprojramme ongershtötze öff en jruße Zahl Zëijshe-Kodėerunge. Brausere don öff däm Minsch de Müjjeleschkëijt jevve, dat hä de Kodeerung för_et Aanzeije ömschallde kann, wi_j_et ėmm jevällt. Esu kam_mer met Erömprobeere af un aan jät riiße. De Texprojramme un de e-mail-Projramme dun dat fö_jewöönlesch nit, di söke sesch de Kodėerung uß, wann se en Datei opmaache].

Et weet noch komplizėeter, wann_et öm en Annwendung jëijt, di fun hus uß nit esu en jruuße Zahl Koddėerunge känne dëijt, zem Bëijshpell e Kompjutoshpell, wat këijne Unicode kann. En esu Fäll kann dä Minsch aam Kompjuto noch däm singem Bedriifssüßteem singe Zëijshesatz ömschallde, dat dä met dam Shpell zosamme paß. Ävver dat weet öff jenooch en andere Projrame, di alld doför op däm Kompjuto aam loufe woore, udder och bloß enshtallėet wohe, zo Zëijshsalaat föhre. Dat hëijß, dat ëijne odder dat andere, ävver nit beeds. Et neuere Windows XP hät de Müjjeleschkëijt, de eijmål ennjeshtallte locale en ennem Projramm ze ändere. Älldere Süßteme, Windows 98 un doför, han öf jaa këij Müjjeleschkëit, ovvohoupß jät ze ändere, do hellef öff nur, wam_mer zwesche Süßteeme wääßelle dëijt, udder en ßoffwäer för Kompjuuto-Schreffte fun_ennem andere Süßtem aanzezëije.

Probleme met bestemmpte Shrooche

[Ändere · der Quälltäx ändere]

En Änglesh hät mer miihtß bloß Zëijshesalaat met dä Zäijsche, di zwesche Wööt un Sätz shtonn künne, alsu en lange (—) un koote (–) Jedangkeshtresch, en Aanföhrunge (“, ”), un esu enem Krohm. Dä Räß eß bahl emmer mem ASCII-Zëijshesatz kompatibel, met dämm me et änglesche lattëijnesche Allfabeet fun hückzerdachs schriive dëijt. För e Bëijshpell, dat Zëijshe för et änglesche Pungk „£“ süüht wi „£“ uß, wann ene Afsender dat em UTF-8 kodeet hät, un dä et kritt, zëijsh_et met CP1252 odder ISO 8859-1 aan. Wann mer dat Spell öffters määt, da kütt „£“ eruß, dann „£“, un esu wigger.

En Japanesh säät mer 文字化け (Klengk ähnlesch wi „Moschibake“, un et treff öff Lück, di met Kompjutere un Projramme ze donn krijje, di för en Japan ze verkoufe jemaat woode sen.

Op Schineesėsh saren se tradizjonäll jeschrevve 亂碼 odder en dä modernere ëijnfachere Schreff 乱码 doför, dat klengk wi „luànmǎ“, un bedügg esu jät wi „unööndlejje Koode“

Op Koreanėsh hëijs_et 외계어, klengk äänlesch wi Oigye-eo un da bedügg_esu jät, wi „en främb Shprooch“.

Ih dat dä Unicode bahl övverall opjejreffe wohdt, hät mer dä Latin-3 Kood benoz, öm däm Esperanto sing Akzentzëijshe un Ömluute daazeshtelle, dat sinn_er: ĉ, ĝ, ĥ, ĵ, ŝ, un ŭ. En mansh_enem Zosammehang, un en ahle Web-Brausere, kumme di als wi wänn se en Latin-1 wöhre aan, un mer süüht de verkėėehte Zëijshe: æ, ø, ¶, ¼, þ, un ý.


Der Wikipedija ier Logo Hee dä Atikel eß anfänglesch översatz uß de Wikipedija op Änglish