TOPlist

Pixylophone - komentáře

Komentáře (od nejstarších po nejnovější)

Komentáře k příspěvku Je kódování windows-1250 standardní?


[1] Vložil(a): Martin Kopta [web], 2003-08-21, 01:16 Solo | MuteČtenáři: ---

---> Znaková sada windows-1250 je *STANDARDIZOVANOU* znakovou sadou platně registrovanou pro použití na internetu u Internet Assigned Numbers Authority (http://www.iana.org/assignments/character-sets).

---> ISO není jedinou organizací, která vydává standardy. Například u nás vydává standardy ČSNI, v Německu DIN, v USA ANSI/NISO, v Evropě ECMA...

---> RFC 2049 je irelevantní, neboť znakovými sadami se zabývá RFC 2047:

>> A 'charset' can be any of the character set names allowed in an MIME "charset" parameter of a "text/plain" body part, or any character set name registered with IANA for use with the MIME text/plain content-type. <<

V emailu tedy může být windows-1250

BTW: Windows-1250 není kódování, ale znaková sada.

[2] Vložil(a): Michal Kubeček, 2003-08-21, 01:57 Solo | MuteČtenáři: ---

Celé RFC 2047 se zabývá pouze MIME rozšířeními v hlavičce mailu (jak plyne už z jeho názvu). Takže sice máte pravdu, windows-1250 se v mailu opravdu může vyskytnout, ale jen v hlavičce. Podstatný je ovšem závěr z článku: nikdo není (na rozdíl od ISO 8859-2) povinen mu rozumět.

Mimochodem v souvislosti se způsobem vzniku windows-1250 je zajímavá i tato citace z RFC 2046: "Implementors are discouraged from defining new character sets unless absolutely necessary." Zřejmě ta "absolutní nutnost" spočívala v absenci znaku pro trademark v ISO 8859-2. :-)

[3] Vložil(a): pixy, 2003-08-21, 02:28 Solo | MuteČtenáři: ---

Martine> Jak už z názvů plyne, ČSN jsou České normy, DIN jsou Deutsche, ANSI jsou American National, ECMA European atd. atd. Celosvětově platné jsou normy ISO. Měl jsem za to, že z článku přímo vyplývá, že mluvím o globálních standardech, nikoli těch s lokální či provinční platností.

Dále opakuji: ano, sada windows-1250 je registrována u IANA, ale není žádným standardem (registrace u IANA je oznamovací úkon, žádná standardizace z něj neplyne. V případě windows-1250 celý úkon spočíval v tomto mailu: http://www.iana.org/assignments/charset-reg/windows-1250 ). Ano, může se použít v hlavičce MIME dokumentů, ale mailový klient není povinen jej rozpoznat.

Tedy ano, máš pravdu: v e-mailu opravdu může být windows-1250, stejně jako tam můžou být použita řekněme csISO42JISC62261978 nebo JUS_I.B1.003-mac, která jsou rovněž registrována u IANA. Ale opravdu je tvůj mailer zpracuje?

BTW, IANA (Internet Assigned Numbers Authority) není žádnou standardizační organizací. Funguje pouze coby koordinátor bezkonfliktního přidělování číselníků a dalších jmenných prostorů na Internetu. Viz http://www.iana.org/numbers.html

[4] Vložil(a): met [web], 2003-08-21, 15:15 Solo | MuteČtenáři: ---

"budou považovány dokumenty RFC (Request For Comments).....Internet však jejich dodržování nevyžaduje"

pixy>Jses si tim opravdu jisty?

Rikam to hlavne proto, ze zrovna minuly mesic jsme meli rozsahlou korespondenci s jednou nemeckou firmou, ktera si za bugfix jejich programu, ktery prestal fungovaj jen proto, ze misto

Host: server.com

v HTTP hlavicce posilal:

Host: server.com/cgi

coz je spatne a Apache to od jiz cca 2 roky nepodoruje (a nezavisli provozovatele serveru holt na jare provedli nekompromisni upgrade).

A nemci za tu opravu bidaci chteli 70,000 Kc. No nakonec jsme je eReFCecka a dalsimi argumenty unavili natolik, ze nam to poslali zdarma, ale zil (a ziji) v domeni, ze RFC jsou zavazne.

[5] Vložil(a): pixy, 2003-08-21, 15:35 Solo | MuteČtenáři:  + +

met> To záleží na úhlu pohledu. RFC jsou závazná jen do té míry, chceš-li využívat/nabízet nějakou veřejnou službu; jsou zde od toho, aby všichni zúčastnění fungovali na "stejné vlně" a nemuseli se neustále domlouvat na nějakých technických specifikacích.

Pokud by ale RFC byla skutečně *závazná*, každý by je musel bezvýhradně dodržovat - nemohl by sis třeba nad TCP/IP vymyslet protokol httpx:// používající zásadně oktální kód a 5bitový přenos. To ovšem můžeš, nikdo ti v tom nebrání.

Neplatí tedy formulace: "RFC jsou závazná", ale platí: "RFC jsou závazná, pokud XXX". Kde to "XXX" je něco ve smyslu "se máme všichni navzájem domluvit", "tuhle službu bude používat i někdo jiný než my dva", atd...

[6] Vložil(a): pixy, 2003-08-21, 16:08 Solo | MuteČtenáři: ---

A ještě jedna věc: pozor na zásadní rozdíl mezi evidencí, standardem a normou.

Evidence: "Jsme firma ABC a vyrábíme šroubky M6 z hliníku o délce 15 mm (viz přiložená dokumentace). Aby se nepletly s jinými, zaregistrujte nám pro ně označení." --- "OK, k dispozici je označení ABC-M6-15, bylo zaregistrováno jako unikátní jméno pro vaše šroubky."

Standard: "Šroubky ISO M6 mají vnitřní průměr X, vnější Y, sklon závitů Z s odstupem O, délku 15 mm a vůbec všechno podle dokumentace ISO-2003-M6-015.doc. Kdokoli chce vyrábět šroubky ISO-M6, musí u nás složit atest a vyrábět je bezvýhradně přesně podle této dokumentace."

Norma: "Za takových a takových podmínek je nutné používat výhradně standardizované šroubky ISO-M6."

Z tohoto pohledu na Internetu normy vůbec neexistují (vyjma lokálních norem pro konkrétní omezené použití - např. použití Internetu ve státní správě); standardizováno není zdaleka vše; většina je pouze evidována.

Celý Internet pak funguje kdesi na pomezí evidence a standardů, kdy se většina dohodne na nějakém (evidovaném) postupu s použitím nějakých (evidovaných) prostředků a prohlásí to [RFC] za platné. Kdo se s nimi chce bavit, musí se tomu přizpůsobit - kdo ne, ať si to udělá třeba po svém, ale ať nepočítá s tím, že se s ním někdo bude bavit. Leda by byl tak silný a měl tolik zákazníků, kterým by mohl vlastní řešení vnutit, že by mu to bylo jedno...

A pro pořádek: z hlediska tohoto přirovnání je:

windows-1250 = zaregistrované šroubky ABC-M6-15

iso-8859-2 = standardní šroubky ISO-M6

RFC 2047 = každý mail musí jít přišroubovat i odšroubovat šroubkem ISO-M6

RFC 2049 = maily můžete přišroubovat jakýmkoli *zaregistrovaným* šroubkem (dle RFC2047 ale nikdo není povinen umět odšroubovat cokoli jiného než šroubky ISO).

Microsoft = ten, komu jsou nějaká RFC úplně šumafuk

[7] Vložil(a): Arthur Dent, 2003-08-21, 20:22 Solo | MuteČtenáři: ---

http://blog.maly.cz/index.php?cmt=59

[8] Vložil(a): Lukáš, 2003-08-21, 22:11 Solo | MuteČtenáři: ---

Jen bych se zamyslel nad takovou zvláštností. Nevím, jak vy, ale moje zkušenost hovoří o tom, že spousta firem a jiných institucí prahne po normě ISO na svůj výrobek nebo službu. Protože, kdo má ISO, může to vesele roztrubovat do světa jako že je to záruka kvality...

No, ale pokud se porozhlédneme po českém webu, použitá znaková sada ISO-8859-2 je určitě v menšině za windows-1250. Takže mi nezbývá než znovu "smeknout" před Mrkvosoftem, který dokázal český webový lid přesvědčit (díky Windows), že jejich znaková sada je lepší, kvalitnější - říkejme si tomu jak chceme...

Znovu je tu to Microsoftí kouzlo jednoduchosti pro obyčejného uživatele. Proč bych si měl instalovat jiný browser, když s podporovaným IE je vše tak snadné, proč bych měl vytvářet stránky podle standardů, když pomocí FrontPage je to tak snadné, proč bych měl používat ISO znakovou sadu, když je windows-1250 tak "windousovské" :-)

No a úspěch je na světě, ne?

[9] Vložil(a): Pavel Satrapa, 2003-08-21, 22:16 Solo | MuteČtenáři: ---

I v Internetu existují normy - například je povinné podporovat IP, ICMP, TCP... Také hlavní služby mají definovány své standardní protokoly (chcete-li vašemu programu říkat WWW server, musí podporovat HTTP). IANA definuje statut jednotlivých RFC od povinných až po zastaralá.

[10] Vložil(a): pixy, 2003-08-21, 22:55 Solo | MuteČtenáři: ---

Ach jistě, myslel jsem až na vyšší vrstvy nad základními přenosovými protokoly (TCP/IP atd.).

Ale jinak, to je zrovna to, co říkám: "chcete-li vašemu programu říkat WWW server, musí podporovat HTTP" - viz "RFC jsou závazná, pokud XXX" výše...

[11] Vložil(a): Pavel Satrapa, 2003-08-22, 08:31 Solo | MuteČtenáři: ---

Já ale nevidím moc velký rozdíl mezi "žárovka prodávaná v ČR musí mít takový a makový závit" a "WWW server používaný v Internetu musí podporovat HTTP". Až na oficální postavení instituce, která je vydává.

[12] Vložil(a): Petr Mikan, 2003-08-22, 08:43 Solo | MuteČtenáři: ---

Někdy mi připadá, že když není o čem psát a je třeba zvýšit přístupy do domény, vyvolává se flam tímto pseudoproblémem ;-)

Přitom argumenty obou stran jsou stále stejné a všichni víme, že ani jedna strana neustoupí :-)

A navíc stále nějak nechápu, zda to má nějaký význam pro mě jako tvůrce webu (kódován ve win-1250)?

[13] Vložil(a): pixy, 2003-08-22, 09:41 Solo | MuteČtenáři: ---

ad [12], Petr> 1. Mnozí vědí, že návštěvnost je mi celkem ukradená, psát o čem mám do zásoby (a když nemám o čem psát, tak nepíšu) a v neposlední řadě tomuhle problému se věnuju už hodně let. Nic nového, nic umělého.

2. Nedělám žádný flame (ten běží paralelně kdesi vedle). Jen jsem mu chtěl přidat faktické argumenty, aby se pořád nemlátila prázdná sláma.

3. V případě webu vás to až tak moc trápit nemusí. Už jsem říkal, že windows-1250 je korektní. Nanejvýš by vám mohlo vadit, že máte o malé procento méně čtenářů, kteří vaše stránky dokáží zobrazit (např. někteří uživatelé bez českého systému na jiných systémech než Windows). Ale ve vašem případě to bude procento velmi nevýznamné, až nulové.

Tím místem, kde se windows-1250 používat nemá, je e-mail, nikoli web.

[14] Vložil(a): pixy, 2003-08-22, 09:46 Solo | MuteČtenáři: ---

ad [11], Pavel> Jistý rozdíl v tom je - právě v té úrovni oficiality. Když budu v ČR vyrábět/prodávat/používat nestandardní a neschválené elektrické zařízení, porušuji zákon a můžu dostat přinejmenším pokutu. Když si na Internetu zprovozním WWW server na svém protokolu httxy, budu ho moct používat jen já a ti, který vysvětlím, jak na to (případně jim dodám svůj vlastní software). Jinak se nic neděje.

[15] Vložil(a): Petr Mikan, 2003-08-22, 12:52 Solo | MuteČtenáři: ---

To jste mě špatně pochopil. Měl jsem samozřejmě na mysli medvídka "DD" Pů

[16] Vložil(a): Jiří Bureš [web], 2003-08-22, 14:06 Solo | MuteČtenáři: ---

Obecně k normám ISO. Dodržování norem ISO není povinné, pokud není stanoveno jinak (třeba zákonem). Defakto ale "dobrovolné nedodržení" normy znamená, že pro daný produkt "smrt".

>Standardy vydává ISO

Před ISO mi chybí 'mj.'. Těch mezinárodních organizací, které vydávají mezinárodní normy je víc. Navíc národními organizacemi (třeba onen zmíněný DIN) vydané národní standardy mohou být vyžadovány globálně. Opovažte se říct zákazníkovi, že mu nebudete dodávat tak, jak si přeje :-)

[17] Vložil(a): ailyn [web], 2003-08-23, 19:29 Solo | MuteČtenáři: ---

přečetla jsem celý článek (dokonce 2x) a jala se předělat své stránky z win na iso. "aspoň budou čtenáři spokojení," libovala jsem si. haha. iso na webzdarma nějak protestuje. nefunguje mi pořádně ani v jednom prohlížeči :( přitom ostatní stránky (třeba tahle) s iso kódováním fungují bezvadně. může za to nastavení serveru, které může změnit jedině administrátor????

[18] Vložil(a): Ritchie [web], 2003-08-24, 02:15 Solo | MuteČtenáři: ---

Na Palma jsem si navolil lokalizaci v iso. Jenže spoustu programů je dělaná ve win1250 (např. shareware slovník, česká lokalizace pluckeru, atd.), takže se mě místo některých znaků zobrazují hrozné potvory. Přemýšlím, jestli se mám podvolit mainstreamu, nebo vydržet u kódování svého systému.

[19] Vložil(a): Jiří Bureš [web], 2003-08-24, 09:51 Solo | MuteČtenáři: ---

To ailyn: V čem všem spočívala ta změna win > iso?

[20] Vložil(a): ailyn [web], 2003-08-24, 12:13 Solo | MuteČtenáři: ---

to jiří bureš: meta http-equiv="Content-Type" content="text/html; charset=windows-1250"

-->> meta http-equiv="Content-Type" content="text/html; charset=iso-8859-2"

toť celá změna (kód v hlavičce). u některých webů jsem to viděla, ovšem na těch u wz.cz to prostě jaksi nejde. tedy jde, ale nezobrazují se znaky s háčky (ěščřž)

[21] Vložil(a): Ritchie [web], 2003-08-24, 13:09 Solo | MuteČtenáři: ---

2 allyn To jsi provedla něco podobnéno, jako kdybys dala cedulku jahody na košík s bramborama. Soubor musíš ještě *překódovat* do iso (z brambor udělat jahody). V Linuxu funguje recode 1250..l2 soubor.html. Je divné, že se některé znaky vůbec nezobrazují. Typycky se znaky jako š či ť zobrazují zpotvořeně.

[22] Vložil(a): Arthur Dent [web], 2003-08-25, 10:21 Solo | MuteČtenáři: ---

Ještě douška:

Bloguje.cz má možnost posílat vygenerované stránky via FTP na vzdálený server. Posílá ho v kódování ISO včetně 'charset=iso...'

Ale ten blbý Webpark nahradí tuhle hlavičku hlavičkou 'charset=win', takže sice dokument je správně v ISO, ale v hlavičce je špatná informace...

[23] Vložil(a): Jiří Bureš [web], 2003-08-25, 11:35 Solo | MuteČtenáři: ---

Tak ailyn, Ritchie odpověděl místo mě. Jinak řečeno to překódování znamená, že se soubor uloží v daném kódování - to musí udělat třeba použitý editor. Výsledný soubor se také může překódovat nějakým konvertorem. Přepsat hlavičku nestačí, protože problematické znaky (žšťŽŠŤ...) mají různé kódy v obou zmíněných kódováních.

[24] Vložil(a): Michal Kubeček, 2003-08-26, 02:31 Solo | MuteČtenáři: ---

...ostatně, kdyby měly všechny znaky v obou kódováních stejný kód, nejednalo by se o dvě různá kódování a bylo by jedno, který název do hlavičky napíšete... :-)

[25] Vložil(a): tit-black, 2004-09-04, 19:23 Solo | MuteČtenáři: ---

Porno spam od IP 66.98.226.51 - smazal pixy

[26] Vložil(a): nice [web], 2005-09-02, 01:32 Solo | MuteČtenáři: ---

Your blog is very interesint


Váš názor

Přidat nový komentář

Váš komentář

Přidávání komentářů k tomuto příspěvku již bylo ukončeno.

Chcete-li autorovi přesto sdělit nějakou podstatnou informaci, která se příspěvku týká, kontaktujte jej e-mailem.



 RSS 0.9x  Export  RDF  Export  RSS 0.9x  Komentáře  TXT  Komentáře  XHTML 1.0  Validate  W3C  CSS 2.1  Em-web  Resizable  W4D  90% dogmatic

Vygenerováno: [stránka generována dynamicky]