Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Et tegnsett for Norge? Ett tegnsett for Norge? Håvard Hjulstad 2005-03-14.

Liknende presentasjoner


Presentasjon om: "Et tegnsett for Norge? Ett tegnsett for Norge? Håvard Hjulstad 2005-03-14."— Utskrift av presentasjonen:

1 Et tegnsett for Norge? Ett tegnsett for Norge? Håvard Hjulstad 2005-03-14

2 Håvard Hjulstad, 2005-03-142 Sånt får en fra banken:

3 Håvard Hjulstad, 2005-03-143 Det dreier seg om •representasjon •011001011101, æ … •presentasjon •Горбачёв, Nguyễn … •tastatur •q ŵ ệ ř ţ ỷ … •gjenfinning •«Håvard», «Havard», «Haavard» …

4 Håvard Hjulstad, 2005-03-144 Standarder for tegnsett •ISO/IEC 8859 : Information technology — 8-bit single- byte coded graphic character sets •Part 1: Latin alphabet No. 1 •Part 2: Latin alphabet No. 2 •Part 3: Latin alphabet No. 3 •Part 4: Latin alphabet No. 4 •Part 5: Latin/Cyrillic alphabet •Part 6: Latin/Arabic alphabet •Part 7: Latin/Greek alphabet •Part 8: Latin/Hebrew alphabet •Part 9: Latin alphabet No. 5 •Part 10: Latin alphabet No. 6 •Part 11: Latin/Thai alphabet •Part 13: Latin alphabet No. 7 •Part 14: Latin alphabet No. 8 (Celtic) •Part 15: Latin alphabet No. 9 •Part 16: Latin alphabet No. 10

5 Håvard Hjulstad, 2005-03-145 ISO/IEC 8859-1

6 Håvard Hjulstad, 2005-03-146 ISO/IEC 8859-2

7 Håvard Hjulstad, 2005-03-147 ISO/IEC 8859-4

8 Håvard Hjulstad, 2005-03-148 ISO/IEC 8859-10

9 Håvard Hjulstad, 2005-03-149 ISO/IEC 8859-15

10 Håvard Hjulstad, 2005-03-1410 ISO/IEC 8859-16

11 Håvard Hjulstad, 2005-03-1411 Standarder for tegnsett (forts.) •ISO/IEC 6937 : Information technology ― Coded graphic character set for text communication ― Latin alphabet (3. utg. 2001)

12 Håvard Hjulstad, 2005-03-1412 ISO/IEC 6937

13 Håvard Hjulstad, 2005-03-1413 Standarder for tegnsett (forts.) •ISO/IEC 10646 : Universal Multiple-Octet Coded Character Set (UCS) •= Unicode ( http://www.unicode.org/ ) •Inneholder «all verdens tegn». •Det er ikke lenger tilgang på tegn, men restriksjoner på bruk av tegn som blir problemstillingen. •En rekke delsett er definert. •Se også Letter database: http://www.eki.ee/letter/

14 Håvard Hjulstad, 2005-03-1414 Unicode

15 Håvard Hjulstad, 2005-03-1415 Standarder for tegnsett (forts.) •CEN CWA 13873 : Information Technology ― Multilingual European Subsets in ISO/IEC 10646-1 (MES) (2000) •CEN Workshop Agreement •CEN/TS 1923 : European character repertoires and their coding ― 8-bit single-byte coding (2003) •ENV 1973 : Information technology ― European subsets of ISO/IEC 10646-1 (1994)

16 Håvard Hjulstad, 2005-03-1416 MES •MES-1: latin; basert på ISO/IEC 6937:1994 •MES-2: latin, gresk, kyrillisk; basert på ENV 1973:1996 •MES-3: de tegn som trengs for å skrive språkene i Europa og translitterere mellom dem

17 Håvard Hjulstad, 2005-03-1417 Språkdekning MES-1

18 Håvard Hjulstad, 2005-03-1418 Språkdekning MES-2 (i tillegg)

19 Håvard Hjulstad, 2005-03-1419 Standarder for tastatur •ISO/IEC 9995 : Information technology — Keyboard layouts for text and office systems •Utgitt i en rekke deler med særspråklige tilpasninger

20 Håvard Hjulstad, 2005-03-1420 Aktuelle lover • 1961-03-03 nr 4 : Lov om varemerker : §1 «… Et varemerke kan bestå av alle slags tegn …» • 1985-06-21 nr 78 : Lov om registrering av foretak : §3-8 (utenlandsk foretak) [navn skal registreres, men det gis ingen regler for skrivemåte] • 1985-06-21 nr 79 : Foretaksnavneloven : §2-1 «… Et foretaksnavn må som minimum bestå av en sammenstilling av tre bokstaver fra det norske alfabet.»

21 Håvard Hjulstad, 2005-03-1421 Aktuelle lover (forts.) • 1990-05-18 nr 11 : Lov om stadnamn : §4 «… Skrivemåten skal følgje gjeldande rettskrivingsprinsipp for norsk og samisk … [og] finsk …» • 2002-06-07 nr 19 : Lov om personnavn : §4 «… navnet har tradisjon i en kultur som …» … «… den som er adoptert [kan] ta navn etter sin biologiske slekt …»; §6 «… endring av stavemåten til bokstaver som er alminnelig kjent i utlandet.» [o.a.]

22 Håvard Hjulstad, 2005-03-1422 Fra forarbeidene til navneloven: •8 Særlig om lovforslagets forhold til navneskikker blant innvandrere, samer og nasjonale minoriteter •Mye generelt om å godta fremmedkulturelle navn. •«Også personer som ikke har en utenlandsk tilknytning bør … kunne ta navn med f.eks. utenlandsk klang eller skrivemåte» •Det står ikke noe i forarbeidene om begrensninger når det gjelder «utenlandsk skrivemåte».

23 Håvard Hjulstad, 2005-03-1423 Tegnsett på noen språk •Norsk •a b c d e f g h i j k l m n o p q r s t u v w x y z æ ø å •à é è ê ó ò ô •Nordsamisk •+ á č đ ŋ š ŧ ž •Andre samiske språk i Norge •+ ä ï ö (ń) •Andre nordiske språk •+ ð í ú ý þ

24 Håvard Hjulstad, 2005-03-1424 Et nordisk tegnsett a á à b c č d đ ð e é è ê f g h i í ï j k l m n ń ŋ o ó ò ô p q r s š t ŧ u ú v w x y ý z ž æ ä ø ö å þ

25 Håvard Hjulstad, 2005-03-1425 Tegnsett på noen flere språk •Engelsk, tysk, fransk, spansk •+ â ç ë î ñ œ ß ù û ü ÿ •Øvrige europeiske språk (med latinsk) •+ ă ã ą ā ć ċ d’ ě ė ę ē ğ ġ ģ ħ ı/İ ĩ į ī ķ ļ ł ň ņ ő õ ō ŕ ř ŗ ś ş t’ ţ ů ű ũ ų ū ẃ ẁ ŵ ẅ ỳ ŷ ź ż •Noen andre språk (med latinsk) •vietnamesisk: + ả ạ ằ ắ ẳ ẵ ặ ầ ấ ẩ ẫ ậ ẻ ẽ ẹ ề ế ể ễ ệ ỉ ị ỏ ọ ồ ố ổ ỗ ộ ơ ờ ớ ở ỡ ợ ủ ụ ư ừ ứ ử ữ ự ỷ ỹ ỵ •afrikanske språk: + f.eks. d/l/n/t med circumflex under, b/d/k med «hake»

26 Håvard Hjulstad, 2005-03-1426 Men hva med ikke-latinsk? •Σοκρατης •Путин Владимир Владимирович •محمد رضا پهلوی •Hva med de adoptivbarn fra Korea og Kina som tar sin biologiske families navn? •Min datters navn er Ida Miriam מרים חיה Skal vi registrere det?

27 Håvard Hjulstad, 2005-03-1427 Og selv med latinsk alfabet … Somali bruker det latinske alfabetet På somali heter han Cismaan Cabdi Guuleed På «europeisk» heter han Osman Guled

28 Håvard Hjulstad, 2005-03-1428 Hvor (langt) skal en gå? 1.Definert delsett (av Unicode)? 1.Delsett av latinsk? 2.Delsett av europeiske alfabeter (latinsk, gresk, kyrillisk)? •Et praktisk spørsmål vil i begge tilfeller være vietnamesisk. 2.Fullstendig registrering og regler/algoritmer for visning, søk/gjenfinning o.a.? •Sikker gjenfinning uansett skrivemåte. •Gorbatsjov, Gorbatjov, Gorbachov, Gorbatschov, Gorbatchov, Горбачов, Горбачёв •Problemene er tekniske; derfor kan de løses …

29 Håvard Hjulstad, 2005-03-1429 Hva trengs? •Prinsippbeslutning(er). •Standard(er) for tegnsett, eventuelt med ulike nivåer og for ulike anvendelser. •Standarder for visning og søk med ulike tegnsettrestriksjoner. •Standard(er) for tastatur.

30 Håvard Hjulstad, 2005-03-1430 Takk for oppmerksomheten •Håvard Hjulstad •hhj@standard.no


Laste ned ppt "Et tegnsett for Norge? Ett tegnsett for Norge? Håvard Hjulstad 2005-03-14."

Liknende presentasjoner


Annonser fra Google