Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Et tegnsett for Norge? Ett tegnsett for Norge? Håvard Hjulstad 2005-03-14.

Liknende presentasjoner


Presentasjon om: "Et tegnsett for Norge? Ett tegnsett for Norge? Håvard Hjulstad 2005-03-14."— Utskrift av presentasjonen:

1 Et tegnsett for Norge? Ett tegnsett for Norge? Håvard Hjulstad

2 Håvard Hjulstad, Sånt får en fra banken:

3 Håvard Hjulstad, Det dreier seg om •representasjon • , æ … •presentasjon •Горбачёв, Nguyễn … •tastatur •q ŵ ệ ř ţ ỷ … •gjenfinning •«Håvard», «Havard», «Haavard» …

4 Håvard Hjulstad, Standarder for tegnsett •ISO/IEC 8859 : Information technology — 8-bit single- byte coded graphic character sets •Part 1: Latin alphabet No. 1 •Part 2: Latin alphabet No. 2 •Part 3: Latin alphabet No. 3 •Part 4: Latin alphabet No. 4 •Part 5: Latin/Cyrillic alphabet •Part 6: Latin/Arabic alphabet •Part 7: Latin/Greek alphabet •Part 8: Latin/Hebrew alphabet •Part 9: Latin alphabet No. 5 •Part 10: Latin alphabet No. 6 •Part 11: Latin/Thai alphabet •Part 13: Latin alphabet No. 7 •Part 14: Latin alphabet No. 8 (Celtic) •Part 15: Latin alphabet No. 9 •Part 16: Latin alphabet No. 10

5 Håvard Hjulstad, ISO/IEC

6 Håvard Hjulstad, ISO/IEC

7 Håvard Hjulstad, ISO/IEC

8 Håvard Hjulstad, ISO/IEC

9 Håvard Hjulstad, ISO/IEC

10 Håvard Hjulstad, ISO/IEC

11 Håvard Hjulstad, Standarder for tegnsett (forts.) •ISO/IEC 6937 : Information technology ― Coded graphic character set for text communication ― Latin alphabet (3. utg. 2001)

12 Håvard Hjulstad, ISO/IEC 6937

13 Håvard Hjulstad, Standarder for tegnsett (forts.) •ISO/IEC : Universal Multiple-Octet Coded Character Set (UCS) •= Unicode ( ) •Inneholder «all verdens tegn». •Det er ikke lenger tilgang på tegn, men restriksjoner på bruk av tegn som blir problemstillingen. •En rekke delsett er definert. •Se også Letter database:

14 Håvard Hjulstad, Unicode

15 Håvard Hjulstad, Standarder for tegnsett (forts.) •CEN CWA : Information Technology ― Multilingual European Subsets in ISO/IEC (MES) (2000) •CEN Workshop Agreement •CEN/TS 1923 : European character repertoires and their coding ― 8-bit single-byte coding (2003) •ENV 1973 : Information technology ― European subsets of ISO/IEC (1994)

16 Håvard Hjulstad, MES •MES-1: latin; basert på ISO/IEC 6937:1994 •MES-2: latin, gresk, kyrillisk; basert på ENV 1973:1996 •MES-3: de tegn som trengs for å skrive språkene i Europa og translitterere mellom dem

17 Håvard Hjulstad, Språkdekning MES-1

18 Håvard Hjulstad, Språkdekning MES-2 (i tillegg)

19 Håvard Hjulstad, Standarder for tastatur •ISO/IEC 9995 : Information technology — Keyboard layouts for text and office systems •Utgitt i en rekke deler med særspråklige tilpasninger

20 Håvard Hjulstad, Aktuelle lover • nr 4 : Lov om varemerker : §1 «… Et varemerke kan bestå av alle slags tegn …» • nr 78 : Lov om registrering av foretak : §3-8 (utenlandsk foretak) [navn skal registreres, men det gis ingen regler for skrivemåte] • nr 79 : Foretaksnavneloven : §2-1 «… Et foretaksnavn må som minimum bestå av en sammenstilling av tre bokstaver fra det norske alfabet.»

21 Håvard Hjulstad, Aktuelle lover (forts.) • nr 11 : Lov om stadnamn : §4 «… Skrivemåten skal følgje gjeldande rettskrivingsprinsipp for norsk og samisk … [og] finsk …» • nr 19 : Lov om personnavn : §4 «… navnet har tradisjon i en kultur som …» … «… den som er adoptert [kan] ta navn etter sin biologiske slekt …»; §6 «… endring av stavemåten til bokstaver som er alminnelig kjent i utlandet.» [o.a.]

22 Håvard Hjulstad, Fra forarbeidene til navneloven: •8 Særlig om lovforslagets forhold til navneskikker blant innvandrere, samer og nasjonale minoriteter •Mye generelt om å godta fremmedkulturelle navn. •«Også personer som ikke har en utenlandsk tilknytning bør … kunne ta navn med f.eks. utenlandsk klang eller skrivemåte» •Det står ikke noe i forarbeidene om begrensninger når det gjelder «utenlandsk skrivemåte».

23 Håvard Hjulstad, Tegnsett på noen språk •Norsk •a b c d e f g h i j k l m n o p q r s t u v w x y z æ ø å •à é è ê ó ò ô •Nordsamisk •+ á č đ ŋ š ŧ ž •Andre samiske språk i Norge •+ ä ï ö (ń) •Andre nordiske språk •+ ð í ú ý þ

24 Håvard Hjulstad, Et nordisk tegnsett a á à b c č d đ ð e é è ê f g h i í ï j k l m n ń ŋ o ó ò ô p q r s š t ŧ u ú v w x y ý z ž æ ä ø ö å þ

25 Håvard Hjulstad, Tegnsett på noen flere språk •Engelsk, tysk, fransk, spansk •+ â ç ë î ñ œ ß ù û ü ÿ •Øvrige europeiske språk (med latinsk) •+ ă ã ą ā ć ċ d’ ě ė ę ē ğ ġ ģ ħ ı/İ ĩ į ī ķ ļ ł ň ņ ő õ ō ŕ ř ŗ ś ş t’ ţ ů ű ũ ų ū ẃ ẁ ŵ ẅ ỳ ŷ ź ż •Noen andre språk (med latinsk) •vietnamesisk: + ả ạ ằ ắ ẳ ẵ ặ ầ ấ ẩ ẫ ậ ẻ ẽ ẹ ề ế ể ễ ệ ỉ ị ỏ ọ ồ ố ổ ỗ ộ ơ ờ ớ ở ỡ ợ ủ ụ ư ừ ứ ử ữ ự ỷ ỹ ỵ •afrikanske språk: + f.eks. d/l/n/t med circumflex under, b/d/k med «hake»

26 Håvard Hjulstad, Men hva med ikke-latinsk? •Σοκρατης •Путин Владимир Владимирович •محمد رضا پهلوی •Hva med de adoptivbarn fra Korea og Kina som tar sin biologiske families navn? •Min datters navn er Ida Miriam מרים חיה Skal vi registrere det?

27 Håvard Hjulstad, Og selv med latinsk alfabet … Somali bruker det latinske alfabetet På somali heter han Cismaan Cabdi Guuleed På «europeisk» heter han Osman Guled

28 Håvard Hjulstad, Hvor (langt) skal en gå? 1.Definert delsett (av Unicode)? 1.Delsett av latinsk? 2.Delsett av europeiske alfabeter (latinsk, gresk, kyrillisk)? •Et praktisk spørsmål vil i begge tilfeller være vietnamesisk. 2.Fullstendig registrering og regler/algoritmer for visning, søk/gjenfinning o.a.? •Sikker gjenfinning uansett skrivemåte. •Gorbatsjov, Gorbatjov, Gorbachov, Gorbatschov, Gorbatchov, Горбачов, Горбачёв •Problemene er tekniske; derfor kan de løses …

29 Håvard Hjulstad, Hva trengs? •Prinsippbeslutning(er). •Standard(er) for tegnsett, eventuelt med ulike nivåer og for ulike anvendelser. •Standarder for visning og søk med ulike tegnsettrestriksjoner. •Standard(er) for tastatur.

30 Håvard Hjulstad, Takk for oppmerksomheten •Håvard Hjulstad


Laste ned ppt "Et tegnsett for Norge? Ett tegnsett for Norge? Håvard Hjulstad 2005-03-14."

Liknende presentasjoner


Annonser fra Google