Następna strona Poprzednia strona Spis treści

2. Standardy reprezentacji znaków hebrajskich

2.1 ASCII

Żeby wyjaśnić raz na zawsze jedną rzecz: nie ma czegoś takiego jak ośmiobitowe ASCII. ASCII to tylko siedem bitów. Każdy ośmiobitowy kod nie jest ASCII, ale to nie znaczy że nie jest standardem. ISO-8859-8 jest standardem, ale nie [jest równoważne] ASCII. Dziękuję!

2.2 Hebrajski w DOS

Kodowanie znaków hebrajskich zaczyna się od 128 dziesiętnie (alef). Wymaga więc ono ośmiu bitów. Jest to to co ma się na EPROMach kart wideo jako czcionkę sprzętową [w Izraelu - przyp. tłum.] Wszystkie DOSowe edytory hebrajskiego używają tej tabeli (Qtext, HED itd.)

2.3 Hebrajski w ISO

Kodowanie znaków hebrajskich zaczyna się od 224 (alef). Jest to standard internetowy, międzynarodowy i faktyczny standard MS Windows i Macintoshów (Dagesh itd.)

2.4 Stary hebrajski dla PC

Jest to kodowanie ośmiobitowe i wyparte z użytku, ponieważ zajmuje zasadniczo ten sam przedział ASCII co angielskie małe litery. Najlepiej więc jest go unikać. Niemniej kiedy hebrajski w ISO utraci ósmy bit wskutek działania jakiegoś ignoranckiego unixowego mailera (tak że otrzymasz plątaninę angielskich liter dla hebrajskiej części listu zmieszaną z normalnym angielskim, odwróconym lub nie). Jeśli w liście mieszały się hebrajski i angielski, jest to przykra sytuacja, bowiem otrzymasz albo hebrajski z bałaganem, albo angielski z bałaganem...

2.5 Konwersje

Oto kilka prostych komend do konwersji z każdego standardu na inny:

DOS - ISO:      tr '\200-\232' '\340-\372' < {dos_file} > {iso_file}
ISO - DOS:      tr '\340-\372' '\200-\232' < {iso_file} > {dos_file}
OLD - DOS:      tr -z '\200-\232' < {old_Hebrew_file} > {dos_file}

UWAGA: Numery używane przez tr są w kodzie ósemkowym!


Następna strona Poprzednia strona Spis treści