<?xml version='1.0' encoding="UTF-8"?>
<!-- $Id: utf-8.xml,v 1.6 2012/06/30 18:42:55 swift Exp $ -->
<!DOCTYPE guide SYSTEM "/dtd/guide.dtd">
<!-- sync 1.45 -->
<guide disclaimer="obsolete" lang="nl">
<title>UTF-8 Gebruiken met Gentoo Linux</title>

<author title="Author">
  <mail link="slarti@gentoo.org">Thomas Martin</mail>
</author>
<author title="Contributor">
  <mail link="devil@gentoo.org.ua">Alexander Simonov</mail>
</author>
<author title="Editor">
  <mail link="fox2mike@gentoo.org">Shyam Mani</mail>
</author>
<author title="Translator">
  <mail link="diox@gentoo.org">Dimitry Bradt</mail>
</author>

<abstract>
Deze gids toont je hoe je UTF-8 unicode karakter kunt opzetten en gebruiken met
je Gentoo Linux systeem, na het uitleggen van de voordelen en meer specifiek
UTF-8
</abstract>

<!-- The content of this document is licensed under the CC-BY-SA license -->
<!-- See http://creativecommons.org/licenses/by-sa/2.5 -->
<license />

<version>2.23</version>
<date>2006-10-06</date>

<chapter>
<title>Karakter Encodering</title>
<section>
<title>Wat is een Karakter Encodering?</title>
<body>

<p>
Computers verstaan text op zichzelf niet. Ieder karakter is heeft ook een eigen
nummer-combinatie. Origineel was elke set van nummers, gebruikt om het alfabet
en karakters te vertegenwoordigen. Dit is beter gekent als het code-systeem,
coderen of karakter set. Deze was gelimiteerd in grootte door limitaties in
computer hardware.
</p>

</body>
</section>
<section>
<title>De historiek van Karakter Encodering</title>
<body>

<p>
De meest gekende (of toch de meest wereldwijd ge-accepteerde) karakter is
<b>ASCII</b> (amerikaanse standaard codering voor informatie uitwisseling). Het
is wereldwijd gehouden voor het meest succesvol software standaard ooit. Moderne
ASCII was gestandaardiseerd in 1986 (ANSI X3.4, RFC 20, ISO/IEC 646:1991,
ECMA-6) door de amerikaanse nationale standaarden instituut.
</p>

<p>
ASCII is strict gezien een seven-bit. Dit betekend dat het bit patronenen
gebruikt met zeven tekens, die voorzien een spreiding van 0 tot 127 in
decimalen. Deze bevatten 32 niet-zichtbare controle karakters, meestal tussen 0
en 31, met ten slotte het controle karakter, DEL of delete op 127. Karkaters 32
tot 126 zijn zichtbare karakters: een spatie, leestekens, latijnse letters en
nummers.
</p>

<p>
De acht bit in ASCII was origineel gebruikt als een foute bit voor fouten te
controleren. Als dit ongewenst is, wordt het gelaten als 0. Dit betekend at, met
ASCII, elk karakter is vertegenwoordigd door een enkele byte.
</p>

<p>
Hoewel ASCII genoeg was voor communicatie in het moderne Engels, in andere
europese talen die karakters met accenten bevatten, waren dingen niet zo
makkelijk om zeggen. Het ISO 8859 standaard werd ontwikkeld om hun noden
tegemoet te komen. Ze waren omgekeerd compatibel met ASCII, maar in de plaats
van het achtste bit blanco te laten, gebruikten ze het om 127 karakters extra te
coderen. ISO 8859's limitaties kwamen vlug aan het licht, er zijn heden trouwens
15 varianten van het ISO 8859 standaard (8859-1 tot 8859-15). Buiten het
ASCII-compatiebele byte spreiding van deze karakter groepjes, is er vaak een
conflict tussen de letters vertegendwoordigd  door elke byte. Om de
interopabiliteit tussen de encodering meer gecompliceerd te maken, wordt
windows-1252 gebrukt in sommige versies van Microsoft Windows in plaats van
westerse europese talen. Dit is een supergroep van ISO 8859-1, hoewel het
verschillendis in verschillende opzichten. Deze groepen bevatten wel allemaal
ASCII compabiliteit.
</p>

<p>
De nodige ontwikkeling van compleet andere <e>single-byte</e> encoderingen voor
niet-latijnse alfabets, zoals EUC (Uitgebreide Unix Codering <e>(Extended Unix
Coding)</e>) die gebruikt wordt voor Japanse en Koreaanse (en ook in mindere
mate chinese) codering, creeerde meer verwarring terwijl andere
besturings-systemen nog altijd andere karakter-groepen gebruikt voor de zelfde
taal, bijvoorbeeld, Shift-JIS en ISO-2022-JP. Gebruikers wensten dat <e>cyrillic
glyphs</e> moest kiezen tussen KOI8-R voor russisch en bulgaars of KOI8-U voor
Oekraïens, maar ook alle andere cyrillische coderingen zoals het onsuccesvolle
ISO 8859-5 alsook het algemene Window-1251 setje. Al deze karakter sets braken
meeste compabiliteit met ASCII (hoewel KOI8 encoderingen cyrillische karakters
in latijnse orde plaatst, dus in het geval dat de achtste bit is ontdaan, de
text is nog steeds ontleedbaar op een ASCII <e>terminal</e> door omgekeerde
transcriptie.)
</p>

<p>
Dit leide tot verwarring en ook tot totale onmogelijkheid voor het voeren van
meertalige communicatie, vooral bij verschillende alfabetten Ga verder met
Unicode.</p>

</body>
</section>
<section>
<title>Wat is Unicode?</title>
<body>

<p>
Unicode gooit de traditionele enkele-byte limitaties van karakter sets weg. Het
gebruikt 17 "planes" van 65,536 code punten om maximum 1,114,112 karakters
te beschrijven. Zoals het eerste "plane" aka. "Basic MUltilingual Plane" or
BMP, bevat bijna alles wat je ooit zult gebruiken, velen hebben de verkeerde
veronderstelling gemaakt; namelijk dat Unicode een 16-bit karakter set is.
</p>

<p>
Unicode is in vele manieren in kaart gebracht, maar de twee meest gekende zijn
<b>UTF</b> (Unicode Translation Format) en <b>UCS</b> (Universal Character
Set). Het nummer na UTF wijst op het aantal bits in één eenheid, terwijl het
aantal na UCS op het aantal bytes wijst. Utf-8 is het meest wijdverspreide
middel voor de uitwisseling van Unicode tekst geworden door zijn schone aard
met slechts acht bits, en dit is ook het onderwerp van dit document.
</p>

</body>
</section>
<section>
<title>UTF-8</title>
<body>

<p>
UTF-8 is een variabele-lengte karakter encodering, die in dit geval betekent dat
het 1 tot 4 bytes per symbool gebruikt. Zodus, het eerste UTF-8 byte is gebruikt
voor het encoderen van ASCII, zodanig dat het karakter volle omgekeerde
compabiliteit met ASCII heeft. UTF-8 betekent dat ASCII en latijnse karakters
onveranderbaar zijn met een kleine verhoging in de groote van de data, omdat the
eerste bit gebruikt is voor gebruikers van oosterse alphabets zoals Japans. Die
hebben een hogere byte spreiding toegewezen gekregen, waarmee ze trouwens niet
blij zijn aangezien dit resulteerd in een 50% trager werkende data.
</p>

</body>
</section>
<section>
<title>Wat kan UTF-8 voor jou doen ?</title>
<body>

<p>
UTF-8 laat je toe te werken in meertalige omgeving die werkt op standaarden en
internationaal is geaccepteerd, met in vergelijking een lage data traagheid.
UTF-8 is de geprefereerde weg om niet-ASCII karakters te verzenden over het
internet, via Email, IRC of bijna in elk medium. Afgezien daarvan, vinden veel
mensen UTF-8 toch in online communicatie verkeerd. Het is altijd best om u
ervan bewust te maken welk gedrag UTF-8 heeft in een specifiek kanaal, mailing
list of Usenet groep vooraleer <e>niet-ASCII</e> UTF-8 te gebruiken.
</p>

</body>
</section>
</chapter>

<chapter>
<title>Instellen van UTF-8 met Gentoo Linux</title>
<section>
<title>Vinden of creëren UTF-8 Localisaties</title>
<body>

<p>
Nu dat je de principes van Unicode verstaat, ben je klaar om te starten met
UTF-8 te gebruiken op je systeem.
</p>

<p>
De vereiste voor UTF-8 is een versie van glibc geinstalleerd te hebben die
nationale talen ondersteund. De naar voor geschoven mening om dit te doen is het
</p>

<p>
<path>/etc/locale.gen</path> bestand aan te passen. Het is voorbij de
vooruitzichten van dit document om het gebruik van dit bestand uit te leggen.
Het is goed uitgelegt in de <uri
link="/doc/en/guide-localization.xml#doc_chap3_sect3">Gentoo Localisatie Gids
</uri>.
</p>

<p>
Vervolgens moeten we beslissen of een UTF-8 localisatie al besschikbaar is voor
onze taal, or als we onze eigen moeten creeeren.
</p>

<pre caption="(Controleren ofer al een bestaande UTF-8 localisatie is">
<comment>(Vervang "nl_BE" met je gewenste localisatie instelling)</comment>
# <i>locale -a | grep 'nl_BE'</i>
nl_BE
nl_BE.UTF-8
</pre>

<p>
Van de teruggave van de <e>command line</e>, moeten we een resultataat mt een
navoegsel die lijkt op <c>.UTF-8</c> nemen. Als er geen is, moeten we een UTF-8
compatibele localisatie creeeren.
</p>

<note>
Voer alleen de onderstaande <e>code listing</e> uit als je geen UTF-8
localisatie beschikbaar hebt voor je taal.
</note>

<pre caption="Creeeren van een UTF-8 localisatie">
<comment>(Vervang "nl_BE" met je eigen gewenste localisatie instelling)</comment>
# <i>localedef -i nl_BE -f UTF-8 nl_BE.UTF-8</i>
</pre>

<p>
Een andere manier om een UTF-8 localisatie toe te voegen aan
<path>/etc/locale.gen</path> bestand en genereren van de nodige localisaties is
met het <c>locale-gen</c> commando.
</p>

<pre caption="Lijn in /etc/locale.gen">
nl_BE.UTF-8 UTF-8
</pre>

</body>
</section>
<section>
<title>Instellen van een localisatie</title>
<body>

<p>
Er is een omgeving variabele die je moet instellen om onze nieuwe UTF-8
localisaties te kunnen gebruiken: <c>LC_ALL</c> (Deze variabelen schakelen het
<c>LANG</c> instelling ook uit). Hoewel er veel manier zijn om dit in te
stellen; vinden vele gebruikers het makkelijk het in te stellen in hun
<path>~/.profile</path> (als je <c>/bin/sh</c> gebruikt),
<path>~/.bash_profile</path> of <path>~/.bashrc</path> (als je <c>/bin/bash</c>
gebruikt).
</p>

<p>
Anderen vinden het dan weer makkelijkst ene localisatie in te stellen voor heel
het systeem. De schrijver van deze gids raadt dit ten sterkste aan bij het
gebruik van <path>/etc/init.d/xdm</path>. Dit init script start de display
manager en je bureaublad vooraleer enige van de voorafgaande bestanden zijn
uitgevoert, en dus voor enige variabelen in de omgeving.
</p>

<p>
De localisatie globaal instellen in het systeem zou moeten ingesteld worden in
het volgende bestand: <path>/etc/env.d/02locale</path>. Het bestand zou moeten
als volgt eruit zien:
</p>

<pre caption="Demonstratie /etc/env.d/02locale">
<comment>(Zoals altijd, pas "nl_BE.UTF-8" naar jou localisatie)</comment>
LC_ALL="nl_BE.UTF-8"
</pre>

<note>
je kunt ook <c>LC_ALL</c> vervangen met <c>LANG</c>. Deze variabele stelt je
localisatie voor alle categorieën in, waaronder numerieke- en munt-waarden. Op
enkele systemen kan het wat problemen veroorzaken. Hoewel, de meeste gebruikers
de mogelijkheid zouden hebben om <c>LC_ALL</c> te gebruiken. Voor meer
informatie over de beïnvloede categorieën door het gebruik van <c>LC_ALL</c>,
gelieve verder te lezen op de <uri
link="http://www.gnu.org/software/libc/manual/html_node/Locale-Categories.html#Locale-Categories">
GNU localisatie pagina</uri>.
</note>

<p>
Vervolgens moet het systeem worden upgedate met de verandering.
</p>

<pre caption="Updaten van de omgeving">
# <i>env-update</i>
>>> Regenerating /etc/ld.so.cache...
 * Caching service dependencies ...
# <i>source /etc/profile</i>
</pre>

<p>
start nu <c>locale</c> zonder argumenten om te zien of je variabelen correct
zijn ingesteld:
</p>

<pre caption="Checking if our new locale is in the environment">
# <i>locale</i>
LANG=
LC_CTYPE="nl_BE.UTF-8"
LC_NUMERIC="nl_BE.UTF-8"
LC_TIME="nl_BE.UTF-8"
LC_COLLATE="nl_BE.UTF-8"
LC_MONETARY="nl_BE.UTF-8"
LC_MESSAGES="nl_BE.UTF-8"
LC_PAPER="nl_BE.UTF-8"
LC_NAME="nl_BE.UTF-8"
LC_ADDRESS="nl_BE.UTF-8"
LC_TELEPHONE="nl_BE.UTF-8"
LC_MEASUREMENT="nl_BE.UTF-8"
LC_IDENTIFICATION="nl_BE.UTF-8"
LC_ALL=nl_BE.UTF-8
</pre>

<p>
Dit is alles. Je gebruikt nu UTF-8 localisatie, en de volgende stap is het
instellen van aplicaties die je van dag tot dag gebruikt.
</p>

</body>
</section>
</chapter>

<chapter>
<title>Applicatie Ondersteuning</title>
<section>
<body>

<p>
Als Unicode voor het eerst werd gestart in de software wereld, multibyte
karakter sets waren niet geschikt genoeg voor talen als C, in welk vele van de
dag-tot-dag programma's zijn geschreven. Zelfs vandaag, zijn sommige programma's
niet geschikt om UTF-8 te gebruiken. Gelukkig zijn velen dat wel!
</p>

</body>
</section>
<section>
<title>Bestandsnamen, NTFS en FAT</title>
<body>

<p>
Er zijn meerdere NLS opties in het Linux kernel configuratie menu, maar het is
belangrijk om niet verward te raken! In de meeste gevallen, is het enige dat je
moet doen UTF-8 NLS ondersteuning in je kernel bouwenn, en het veranderen van
standaard NLS ondersteuning te veranderen naar UTF-8.
</p>

<pre caption="Kernel configuratie stappen voor UTF-8 NLS">
File Systems --&gt;
  Native Language Support --&gt;
    (utf8) Default NLS Option
    &lt;*&gt; NLS UTF8
    <comment>(Also &lt;*&gt; other character sets that are in use in
    your FAT filesystems or Joilet CD-ROMs.)</comment>
</pre>

<p>
Als je van plan bent om NTFS partities te gebruiken, zou het handig kunnen zijn
om een <c>nls=</c> optie mee te geven met je mount startregel. Als je van plan
bent FAT partities the mounten, zou het handig kunnen zijn om een
<c>codepage=</c> optie met je mount-regel mee te geven. Optioneel kun je ook een
standaard codepage voor FAT in je kernel configuratie instellen. Merk op dat de
<c>codepage</c> optie met mount de kernel instellingen zullen te niet doen.
</p>

<pre caption="FAT instellingen in de kernel configuratie">
File Systems --&gt;
  DOS/FAT/NT Filesystems  --&gt;
    (437) Default codepage for fat
</pre>

<p>
Instellingen zoals <c>Default iocharset for fat</c> bij UTF-8 vermijdt je best,
aangezeien deze niet aangeraden zijn. Ter vervanging kun je wel de optie
utf8=true gebruiken als je jou FAT partitie <e>mount</e>. Voor meer informatie,
zie ook <c>man mount</c> en de kernel documentie in
<path>/usr/src/linux/Documentation/filesystems/vfat.txt</path>.
</p>

<p>
Voor het veranderen van encoderingen van bestandsnamen kan
<c>app-text/convmv</c> gebruikt worden.
</p>

<pre caption="Voorbeeld van het gebruik van convmv">
# <i>emerge --ask app-text/convmv</i>
<comment>(Commando formaat)</comment>
# <i>convmv -f &lt;huidige-encodering&gt; -t utf-8 &lt;bestandsnaam&gt;</i>
<comment>(Vervang iso-8859-1 met de karakterset die je converteerd</comment>
# <i>convmv -f iso-8859-1 -t utf-8 bestandsnaam</i>
</pre>

<p>
Voor het veranderen van de <e>inhoud</e> van bestanden, gebruik het
<c>iconv</c> hulpmiddel gebundeld met <c>glibc</c>:
</p>

<pre caption="Voorbeeld van het gebruik van iconv">
<comment>(Vervang iso-8859-1 met de karakterset die je converteerd)</comment>
<comment>(Controleer of de teruggave gezond is)</comment>
# <i>iconv -f iso-8859-1 -t utf-8 bestandsnaam</i>
<comment>(Om een bestand te converteren, moet je een ander bestand
aanmaken)</comment>
# <i>iconv -f iso-8859-1 -t utf-8 bestandsnaam > nieuw-bestand</i>
</pre>

<p>
<c>app-text/recode</c> kan ook voor dit gebruikt worden.
</p>

</body>
</section>
<section>
<title>Het Systeem Console</title>
<body>

<impo>
Je hebt >=sys-apps/baselayout-1.11.9 voor Unicode op de console.
</impo>

<p>
om UTF-8 voor de console in te schakelen, moet je <path>/etc/rc.conf</path>
aanpassen en <c>UNICODE="yes"</c> instellen. Je moet ook de commentaar lezen in
dat bestand -- Het is belangrijk dat je een font hebt dat een goede spreiding
van karakters heeft als je van plan bent unicode te gebruiken.
</p>

<p>
De <c>KEYMAP</c> variabele, ingesteld in <path>/etc/conf.d/keymaps</path>, zou
Unicode moeten bevatten.
</p>

<pre caption="Voorbeeld /etc/conf.d/keymaps snippet">
<comment>(Verander "be-latin1" naar je lokale layout)</comment>
KEYMAP="be-latin1"
</pre>

</body>
</section>
<section>
<title>Ncurses en Slang</title>
<body>

<note>
Negeer enige vermelding van Slang in deze sectie als je het niet hebt
geinstalleerd of niet gebruikt.
</note>

<p>
Het is wijs om <c>unicode</c> toe te voegen aan je globale USE flags in
<path>/etc/make.conf</path>, en daarna <c>sys-libs/ncurses</c> opnieuw te
installeren en <c>sys-libs/slang</c> indien aangewezen. Portage zal automatisch
dit updaten als je je systeem update:
</p>

<pre caption="Updaten van je systeem">
# <i>emerge --update --deep --newuse world</i>
</pre>

<p>
We moeten ook een aantal pakketten opnieuw compileren die gelinkt worden naar
deze, nu de USE veranderingen zijn toegepast. De tool die we daarvoor gebruiken
We also need to rebuild packages that link to these, now the USE changes have
(<c>revdep-rebuild</c>) is deel van het <c>gentoolkit</c> pakket.
</p>

<pre caption="Opnieuw compileren van programma's die ncursus of slang
gebruiken.">
# <i>revdep-rebuild --soname libncurses.so.5</i>
# <i>revdep-rebuild --soname libslang.so.1</i>
</pre>

</body>
</section>
<section>
<title>KDE, GNOME en Xfce</title>
<body>

<p>
Alle grote desktop omgevingen hebben volledige Unicode ondersteuning, en zal
geen extra opstelling nodig hebben dan al aangegeven was in deze gids. Dit is
omdat de onderliggende grafische toolkits (Qt of GTK+2) UTF-8 bewust zijn.
All of the major desktop environments have full Unicode support, and will
require no further setup than what has already been covered in this guide. This
is because the underlying graphical toolkits (Qt or GTK+2) are UTF-8 aware.
Later zullen alle aplicaties die boven op die hulpmiddellen runnen utf-8 bewust
zijn zonder enige instelling.
</p>

<p>
De uitzondering op deze regel komt op Xlib en GTK+1. GTK+1 heeft een
iso-10646-1 <e>FontSpec</e> nodig in ~/.gtkrc, bijvoorbeeld
<c>-misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1</c>. Ook zullen aplicaties die
Xlib of Xaw gebruiken een gelijkaardige FontSpec nodig hebben, anders zullen
die niet werken.
</p>

<note>
Als je een andere versie van het gnome1 control center gebruikt, gebruik dit in
de plaats. Kies enige iso10646-1 font vanaf daar.
</note>

<pre caption="Voorbeeld van ~/.gtkrc (for GTK+1) die een Unicode compatibele
lettertype gebruiken.">
style "user-font"
{
    fontset="-misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1"
}
widget_class "*" style "user-font"
</pre>

<p>
Als een applicatie een betere ondersteuning heeft voor Qt en GTK+2 GUI, zal de
GTK+2 GUI meestal een beter resultaat geven met Unicode.
</p>

</body>
</section>
<section>
<title>X11 en Fonts</title>
<body>

<impo>
<c>x11-base/xorg-x11</c> heeft meer en betere ondersteuning voor Unicode dan
XFree86 en is <e>streng</e> aangeraden.
</impo>

<p>
TrueType lettertypes hebben ondersteuning voor Unicode, en zijn de meeste fonts
die bij Xorg zitten hebben geweldige karakter ondersteuning, hoewel, zijn
duidelijk niet alle enkele <e>glyph</e> voor dat lettertype gecreëerd. Om
lettertypes te compileren (waaronder de Bitstream Vera set) met ondersteuning
voor Oost-Aziatische letters binnen X, controleer of je de <c>cjk</c> USE flag
hebt ingesteld. Vele andere aplicaties gebruiken deze flag, dus kan het handig
zijn deze toe te voegen aan je USE flag. </p>

<p>
Ook, kunnen veel pakketten in de portage Unicode detecteren.
</p>

<pre caption="Optioneell: Installeer enkele Unicode-bewuste lettertypes">
# <i>emerge terminus-font intlfonts freefonts cronyx-fonts corefonts</i>
</pre>

</body>
</section>
<section>
<title>Window Managers en Terminal Emulators</title>
<body>

<p>
Window managers die niet zijn gecompileerd op GTK of Qt hebben meestal een
goede Unicode ondersteuning omdat ze vaak de Xft bibliotheek gebruiken om te
werken met lettertypes. Als je window manager geen Xft gebruikt voor zijn
fonts, kan je nog altijd de FontSpec die vermeld stat in de vorige sectie
gebruiken als Unicode lettertype.
</p>

<p>
Terminal emulators die Xft gebruiken en Unicode ondersteunen zijn moeilijker om
te vinden Buiten Konsole en gnome-terminal, zijn de beste opties in de portage
<c>x11-terms/rxvt-unicode</c>, <c>xfce-extra/terminal</c>,
<c>gnustep-apps/terminal</c>, <c>x11-terms/mlterm</c>, of <e>plain</e>
<c>x11-terms/xterm</c> als die gecompileerd is met de <c>unicode</c> USE flag
en aangehaald als <c>uxterm</c>. <c>app-misc/screen</c> ondersteund ook UTF-8,
als die aangehaald is als <c>screen -U</c> of als het volgende in
<path>~/.screenrc</path> zich bevindt:
</p>

<pre caption="~/.screenrc voor UTF-8">
defutf8 on
</pre>

</body>
</section>
<section>
<title>Vim, Emacs, Xemacs en Nano</title>
<body>

<p>
Vim voorziet volledige UTF-8 ondersteuning, en heeft ook ingebouwde detectering
voor UTF-8 bestanden. Voor meer informatie over Vim, gebruik <c>:help
mbyte.txt</c>.
</p>

<p>
Emacs 22.x en hoger heeft ook volledige UTF-8 ondersteuning. Xemacs 22.x
ondersteund nog geen gecombineerde karakters.
</p>

<p>
Lagere versies van Emacs en/of Xemacs kunnen het mogelijk achten om
<c>app-emacs/mule-ucs</c> en of <c>app-xemacs/mule-ucs</c> geïnstaleerd te
hebben en de volgende code in je <path>~/.emacs</path> om ondersteuning voor
CJK talen in UTF-8 te hebben.</p>

<pre caption="Emacs CJK UTF-8 ondersteuning">
(require 'un-define)
(require 'jisx0213)
(set-language-environment "Japanese")
(set-default-coding-systems 'utf-8)
(set-terminal-coding-system 'utf-8)
</pre>

<p>
Nano bied volledige UTF-8 ondersteuning sinds versie 1.3.6.
</p>

</body>
</section>
<section>
<title>Shells</title>
<body>

<p>
<c>bash</c> bied nu volledige Unicode ondersteuning door de GNU readline
bibliotheek, Z shell gebruikers zijn in een ietwat slechtere positie -- geen
van de shell's hebben Unicode ondersteuning, hoewel er een gezamenlijke
inspanning is om multibyte karakters sets ondersteuning toe te voegen op het
moment.
</p>

<p>
De C shell, <c>tcsh</c> en <c>ksh</c> voorzien geen UTF-8 ondersteuning.
</p>

</body>
</section>
<section>
<title>Irssi</title>
<body>

<p>
Irssi heeft complete UTF-8 ondersteuning, toch moet de gebruiker een optie
instellen.
</p>

<pre caption="Inschakelen van UTF-8 in Irssi">
/set term_charset UTF-8
</pre>

<p>
Voor kanalen waar niet-ASCII karakters vaak uitgewisselt worden in niet-UTF-8
karaktersets, bied het <c>/recode</c> commando hulp waar nodig. Dit commando
kan namelijk karakters converteren. Type <c>/help recode</c> voor meer
informatie.
</p>

</body>
</section>
<section>
<title>Mutt</title>
<body>

<p>
De Mutt mail agent heeft een heel goede Unicode ondersteuning. Het gebruikt
UTF-8 met Mutt, Je hoeft niets aan te passen in je configuratie bestanden. Mutt
zal werken in een unicode omgeving zonder aanpassing als alle configuratie
bestanden (waaronder handtekeningen) UTF-8 zijn gecodeerd.
</p>

<note>
Je kunt nog steeds '?' in je mail lezen met Mutt. Dit is het resultaat van
slecht-ingestelde clienten van je gesprekspartner, die namelijk een slechte
mail-client gebruikt die geen karakterset gebruikt. Je kan hier weinig aan doen
buiten je gesprekspartner aanspreken en hem aansporen zijn client correct in te
stellen.
</note>

<p>
Further information is available from the <uri
link="http://wiki.mutt.org/index.cgi?MuttFaq/Charset">Mutt Wiki</uri>.
</p>

</body>
</section>
<section>
<title>Man</title>
<body>

<p>
Man paginas zijn integraal deel van elke Linux machine. Om te verzekeren dat
enige unicode in je man paginas correct wordt gerenderd, pas
<path>/etc/man.conf</path> aan en vervang een lijn zoals hieronder afgebeeld.
</p>

<pre caption="man.conf veranderingen voor Unicode ondersteuning">
<comment>(Dit is de oude regel)</comment>
NROFF           /usr/bin/nroff -Tascii -c -mandoc
<comment>(Vervang bovenstaande met deze regel)</comment>
NROFF           /usr/bin/nroff -mandoc -c
</pre>

</body>
</section>
<section>
<title>elinks and links</title>
<body>

<p>
Deze zijn veelvoorkomende text-gebaseerde browsers, en we zullen zien hoe we
kunnen UTF-8 ondersteuning op hen inschakelen. Op <c>elinks</c> en
<c>links</c>, er zijn twee manieren om dit te doen, de ene gebruikt de Setup
opetie van de browser, open een site met <c>elinks</c> of <c>links</c> en dan
<c>Alt+S</c> om het Setup Menu weer te geven, selecteer daarna <c>Terminal
options</c>, of druk op <c>T</c>. Scroll naar beneden en selecteer de laatste
optie <c>UTF-8 I/O</c> dor op Enter te drukken. Spaar daarna de instellingen op
en verlaat het menu. Op <c>links</c> kun je een herhaling doen van de
handelingen (<c>Alt+S</c>) en druk dan <c>S</c> om het op te sparen. De config
bestands-opties zijn hieronder afgebeeld.
</p>

<pre caption="inschakelen van UTF-8 voor elinks/links">
<comment>(Voor elinks, pas /etc/elinks/elinks.conf of ~/.elinks/elinks.conf en
voeg de volgende lijn toe)</comment>
set terminal.linux.utf_8_io = 1

<comment>(Voor links, pas ~/.links/links.cfg aan en voeg de volgende lijn
toe.)</comment>
terminal "xterm" 0 1 0 us-ascii utf-8
</pre>

</body>
</section>
<section>
<title>Samba</title>
<body>

<p>
Samba is een software reeks die het SMB (Server Message Block) protocol
implementeerd voor UNIX systemen zoals Macs, Linux en FreeBSD. Er wordt ook
soms naar het protocol is ook soms verwezen als het Common Internet File System
(CIFS). Samba bevat ook het NetBIOS systeem - gebruikt om bestanden uit te
wisselen over windows netwerken.
</p>

<pre caption="Inschakelen van UTF-8 voor Samba">
<comment>(Pas /etc/samba/smb.conf aan en de voeg het volgende onder de [global]
sectie)</comment>
dos charset = 1255
unix charset = UTF-8
display charset = UTF-8
</pre>

</body>
</section>
<section>
<title>Alles uittesten.</title>
<body>

<p>
Er zijn vele UTF-8 test websites. <c>net-www/w3m</c>, <c>net-www/links</c>,
<c>net-www/elinks</c>, <c>net-www/lynx</c> en alle Mozilla gebaseere browers
(waaronder firefox) ondersteund UTF-8. Konqueror en Opera hebben ook volledige
UTF-8 ondersteuning.
</p>

<p>
Als je een textuele web browser gebruikt, controleer dan of je een
unicode-bewuste terminal gebruikt.
</p>

<p>
Als je bepaalde karakters afgebeeld ziet met letters en nummers vanbinnen,
betekend dit dat je lettertype geen karakter voor het symbool of glyph die
UTF-8 wilt heeft. In de plaats van het goed af te beelden, beelt het een blokje
af met de hexadecimale code of het UTF-8 symbool.
</p>

<ul>
  <li>
    <uri link="http://www.w3.org/2001/06/utf-8-test/UTF-8-demo.html">A W3C
    UTF-8 Test Pagina</uri>
  </li>
  <li>
    <uri link="http://titus.uni-frankfurt.de/indexe.htm?/unicode/unitest.htm">
    A UTF-8 test pagina verstrekt door de universiteit van Frankfurt</uri>
  </li>
</ul>

</body>
</section>
<section>
<title>Invoer Methoden</title>
<body>

<p>
<e>Dead keys</e> kunnen gebruikt worden om karakters in te geven in X die niet
op je toetsenbord staan. Deze werkt door rechts op de Alt key (in sommige
landen Alt-gr) samen met een keuze key van de niet-alfabetische sectie van de
toetsenbord aan de linkerkant van de enter toets ,vrij te maken en daarna op
een letter te drukken. De <e>dead key</e> past dit zelf aan. Gegevens kunnen
verder aangepast worden door gebruik te maken van de shift toets  samen met de
Alt-gr te drukken en dan aan te passen.
</p>

<p>

Om dead keys vrij te maken in X, moet je een goede layout hebben dat dit
ondersteund. De meeste Europese layouts hebben al een dead key met een
standaart variant. Dit is niet zo bij Noord Amerikaanse layouts. Er is een
bepaalde graad van onenigheid tussen layouts, de gemakkelijkste oplossing zou
zijn door een layout  te gebruiken in de vorm van "nl_BE" liever dan "be",
alleen bijvoorbeeld. De layouts staan in <path>/etc/X11/xorg.conf</path> op
deze manier:
</p>

<pre caption="/etc/X11/xorg.conf snippet">
Section "InputDevice"
    Identifier "Keyboard0"
    Driver     "kbd"
    Option     "XkbLayout" "nl_Be" <comment># Liever dan gewoon "be"</comment>
    <comment>(ander Xkb opties hier)</comment>
EndSection
</pre>

<note>
De verdere verandering moet alleen toegepast worden als je een Noord Amerikaans
layout, of een ander layout waar dead keys niet werken. De Europese gebruikers
hebben werkende <e>dead keys</e>.
</note>

<p>
Deze verandering zal pas effectief zijn wanneer je je x-server herstart
Voor het toepassen van de verandering , gebruik de <c>setxkbmap</c>
bijvoorbeeld <c>setxkbmap nl_BE</c>.
</p>

<p>
Het is gemakkelijker dead keys te beschrijven  met voorbeelden. Al zijn de
resultaten  locaal afhankelijk,het consept blijf hetzelfde , ongeacht de
localisatie. De voorbeelden bevatten UTF-8, dus om ze te bezien moet je je
browser zeggen om de pagina te bezien als een UTF-8, of al een UTF-8 te hebben
geconfigureerd.
</p>

<p>
Wanneer ik Altgr en [ tesamen druk,en loslaat daarna a druk is ä getoond
Wanneer ik Altgr en [ tesamen druk,en loslaat daarna e druk is ë getoond
Wanneer ik Altgr en ; tesamen druk,en loslaat daarna a druk is á getoond
Wanneer ik Altgr en ; tesamen druk,en loslaat daarna e druk is é getoond
</p>

<p>
Wanneer ik Altgr,shift en [ tesamen druk,en loslaat daarna a druk is een
Scandinavische 'å' getoond. Eveneens wanneer ik Altgr,shift en [ tesamen druk
en alleen [ loslaat en herdruk is '˚' getoond. Al lijkt het erop, dit (U+02DA)
is niet dezelfde als een graden symbool (U+00B0). Dit werkt voor ander accenten
geproduceert door dead keys. Altgr en [,daarna alleen [loslaat en herdruk,
maakt '¨'.
</p>

<p>
Altgr kan gebruikt worden met alfabetische keys alleen. Bijvoorbeeld Altgr en
m, een griekse lower-case letter mu wordt getoond als 'µ'; Altgr en s maakt een
<e> scharfes s or esszet</e>:getoond als 'ß'. Zoals vele Europese gebruikers
zouden verwachten(omdat dit gemarkeerd staat op hun toetsenbord); Altgr en 4(of
E afhankelijk welk toetsenbord layout). Maakt dit een Euro teken '€'.
</p>
</body>
</section>
<section>
<title>Bronnen</title>
<body>

<ul>
  <li>
    <uri link="http://en.wikipedia.org/wiki/Unicode">Engelse documentatie van
    Wikipedia voor Unicode</uri>
  </li>
  <li>
    <uri link="http://en.wikipedia.org/wiki/UTF-8">Engelse documentatie van
    Wikipedia voor Unicode UTF-8</uri>
  </li>
  <li><uri link="http://www.unicode.org">Unicode.org</uri></li>
  <li><uri link="http://www.utf-8.com">UTF-8.com</uri></li>
  <li><uri link="http://www.ietf.org/rfc/rfc3629.txt">RFC 3629</uri></li>
  <li><uri link="http://www.ietf.org/rfc/rfc2277.txt">RFC 2277</uri></li>
  <li>
    <uri
    link="http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF">Karakters vs.
    Bytes</uri>
  </li>
</ul>

</body>
</section>
</chapter>
</guide>
