vod:
----

Toto je prv verejn vydanie podpory sloveniny pre kontrolu pravopisu aspell.
Je vsledkom mjho viac ako ronho silia o vytvorenie celkom slunej databzy
pre aspell. Vznamn as vznikla po mojom zapojen sa do revzie podpory
sloveniny programu Ispell.

V tejto verzii je 675 741 slov, o som povaoval za dostaton mnostvo, aby
bolo mon urobi prv vydanie. Pokia viem, slovnk by nemal obsahova
nesprvne slov, resp. nesprvne tvary slov, ale moja osobn sksenos 
s rznymi slovnkmi (ak komernmi) je tak, e ni nie je dokonal a chyba s
v kadej udskej prci. Preto, ak njdete chybu informujte ma o nej na
zdpo@mailbox.sk. Verm, e spolonm silm budeme mc vytvori slovnk, ktor
sa bude pribliova k dokonalosti.


renie:
-------
ASpell-slovak je ABSOLTNE BEZ ZRUKY. Ide o vone riten softvr a jeho
renie za istch podmienok je vtan; podrobnosti zskate v sboroch COPYING,
Copyright alebo gnu.sk.html (slovensk preklad Veobecnej zverejovacej
licencie - GNU General Public Licence, od Juraja Kolesra).


Cie:
----
Dlhodobm cieom pre aspell je vytvorenie dvoch zkladnch slovnkov:
prv, hlavn, by sa prsne pridriaval Pravidiel slovesnho pravopisu a druh
by bol rozirujci, ktor by pokrval asto pouvan slov, ktor nie s
zahrnut do Pravidiel. Upozorujem, e Pravidl slovanskho pravopisu pokrvaj
je as sloveniny. 


Vlastnosti:
----------

Hlavnm cieom Aspellu je lepie vyhadvanie 'ponknutch slov' pri kontrole
pravopisu. To znamen, e pokia aspell njde nesprvne slovo, tak by vm mal
ponknu to najvhodnejie (sprvne) na o najvyom mieste v ponuke.

Aspell sa tie sna ui z vaich chb - zaznamenva vae preklepy a poda
nich sa sna potom v budcnosti njs najvhodnejie slovo pri chybe.

Pokia je vytvoren osobn slovnk (.aspell.slovak.pws) tento slovnk sa
kontroluje pri chybe ako prv.

Aspell umouje vytvori pravidl, ktor mu pomhaj pri hadan spravnych
slov. Je to uiton zvlṻ ke sa slov inak vyslovuj ako pu. ia pri
prprave tohoto vydania som zistil, e tto funkcia mi spsobuje pd Aspellu pri
slovenine a preto je vypnut. Problm sa mi nepodaril zatia vyriei.

Z pouvateskho hadiska sa mi ovea lepie pracuje (hlavne k KDE
aplikcich) s aspellom ako s ispellom. Ale to je isto subjektvny dojem.

Je to jedin kontrola pravopisu, ktor mi funguje v programe LyX.

Pokia viem, ako jedin umouje pouva viac slovnkov pre jeden jazyk.
Pridanie alieho slovnka je jednoduch. Vytvorte si svoj vlastn zoznam tak,
aby jedno slovo bolo na jednom riadku. Tento zoznam usporiadajte ('sort -u -f
<vas.zoznam> usporiadany.zoznam') a potom vygenerujete nov slovnk pomocou
prkazu:
'aspell --lang=slovak create master ./slovak-moj-slovnik <usporiadany.zoznam'
Potom skoprujte 'slovak-moj-slovnik' do /usr/lib/aspell 
('cp ./slovak-moj-slovnik /usr/lib/aspell') a do sboru 
/usr/lib/aspell/slovak.multi pridajte riadok "add slovak-moj-slovnik"

Oproti Ispellu m Aspell hlavne tieto nevhody:
- je viac nronej na pam
- nem affix kompresiu a preto s slovnky tak vek (aktulny skompilovan
  slovnk m cez 17 Mb aj po kompresii je vekos vemi vek) a preto je aj
  pridvanie novch slov tak pomal (vetky tvary musia by rune vloen). Na
  druh stranu je prve posledne spomenut nevhoda vlastne vhodou voi
  slovenskej podpore ispellu - affix kompresia je tak zloit, e v istch
  prpadoch Ispell generuje vaka affix kompresi nesprvne tvary slov.
- poda niektorch reakci je aspell pomal ako Ispell (resp. je nronej na
  hardvr). V kadom prpade ja som aspell zaal pouva na pentiu 90MHz so
  40M Ram (zkladn databza asi 40 000 slov) a po upgrade na Duron 950MHz 256M 
  Ram som zaznamenal zrchlenie iba pri generovan (kompilcii slovnka), ale nie 
  pri samotnej kontrole. Take teoreticky by nemal by problm pouva ASpell 
  aj na slabom hardvre.

TIP: Pokia je aspell pomal, skste si vytvori svoj vlastn slovnk (napr.
  tak, e zmente sbory z tohoto projektu), ktor bude obsahova iba vami
  pouvan slov. Zo sksenosti viem, e lovek mlo kedy pouva viac
  ako 20 000 slov v psomnom prejave a preto slovnk o vekosti 600 tisc slov
  je pre vs zbyton resp. ho mete pouva iba obas na kontrolu vho
  zoznamu slov).

alie informcie (s anglitine) by ste mali ma v
/usr/share/doc/aspell-0.33.7.1/aspell/man-html/index.html


Intalcia:
----------

Predpoklad:
Intalan skript je dos jednoduch a predpoklad, e mte naintalovan
program aspell v /usr (t.j. nie napr v /usr/local). Pokia ste intalovali
aspell z rpm archvu alebo priamo bol naintalovan pri intalci vaej
distribcie, nemali by ste ma iadne problmy. 

Rozbate archv aspell-slovak-1.0.tar.gz a spustite skript install

tar zxfv aspell-slovak-1.0.tar.gz
cd aspell-slovak-1.0
./install

V /usr/share/doc/aspell-slovak sa nachdza ukkov konfiguran sbor
sample.aspell.conf. Pokia chcete skoprujte ho do svojho domovskho prieinku
pod nzvom ".aspell.conf". Pokia chcete, aby bol platn pre cel v operan
systm, tak ho skoprujte do /etc pod nzvom "aspell.conf". Aktulne nastavenie
aspellu zskate po zadan hotoho prkazu 'aspell dump config'

ASpell-slovak bol testovan na distribcii Mandrake 8.0, 8.1, a 8.2
Na istch potaovch zostavch aspell mi pravidelne segfaultoval (sig11 alebo
segmentation fault). V takomto prpade skste naintalova aspell a pspell z
nich verzi vaej distribcie. Tento postup mi pomohol v niektorch
prpadoch. Dovoujem si vak upozorni, e ak sa asto stretvate z varovanm o
'segmentation fault', tak na 95% mte nejak hardvrov problm (bliie
informcie s napr. na http://www.BitWizard.nl/sig11/)



Pouvanie:
----------

V KDE spustite Ovldacie centrum (kliknutm ikonu, alebo prkazom 'kcontrol').
Chote potom do Osobnch nastaven (Osobn nastavenie) -> Kontrola pravopisu.
Ako klienta si zvote "Aspell" (Pokia ho nemte v ponuke, tak mte problm z
intalciou - bu Aspellu alebo KDE), kdovanie nastavte na "ISO 8859-2" a
slovnk na "tandardne - Slovensk [slovak]" prpadne "Neznmy [slova]".
Teraz mte nastaven, aby vetky aplikcie KDE pouvali tandardne ako
kontrolu pravopisu Aspell. Samozrejme , e vina aplikcii umouje, aby ste
pre ne pouili in nastavenie.

Ak chcete pouva aspell v LyXe, tak do ~/.lyx/preferences (resp. lyxrc v
~/.lyx alebo v /usr/share/lyx/) dajte tieto riadky do sekcie "SPELLCHECKER
SECTION" (prirodzene, nezabudnite odstrni star nastavenia):
\spell_command "aspell"
\accept_compound true
\use_alt_language true
\alternate_language "slovak"
\use_escape_chars true
\escape_chars "͵عݾ"

Pouitie Aspellu na konzole je jednoduch. Pokia chcete interaktvnu kontrolu,
pouite:
'aspell -d slovak -c kontrolovany.subor'

Pre neinteraktvnu kontrolu pouite:
'aspell -d slovak -l <kontrolovany.subor >chybne.slova'

Pokia mte  nastaven  ~/.aspell.conf na sloveninu (slovak), tak prepna
'-d slovak' nemuste pouva.

Pokia mte zujem kontrolova pravopis v html, php, sgml sboroch (prpadne aj
inch sboroch, ktor 'riadiace prkazy' resp. 'tagy' dvaj do sekvencie <>,
tak pouite pre sbor koncovku '.sgml'. Vetky slov umiestnen v <> bud potom
ignorovan.


Chcete pomc?
-------------
"Slovnk slovenskho jazyka obsahuje asi 120 869 slov, Pravidl slovenskho
pravopisu asi 40 000 slov. Na to, aby sa lovek dohovoril o najnevyhnutejch
veciach, sta 500 slov. Vskumami sa zistilo, e telesne pracujcemu loveku
sta na dorozumenie ovea menej slov."

"Pasvna slovn zsoba esronho dieaa je 2000-3000 slov, trns ron
iak u pozn 20 000 slov a 24-ron lovek a 30 000 slov. Aktvne pouvaj
iaci zkladnej koly 1 500-3 000 slov, dospel udia a 10 000. Goethe pouil
vo svojich dielach spolu asi 20 000 slov a Pukin 21 197 slov."

        - Jozef Mistrk, Slovenina pre kadho, 1967

Z vyie uvedench vrokov je zrejm, e pre jednotliv oblasti pouvanie je
mon vytvori "dokonal slovnk" resp. slovnk, ktor bude pokrva vetky
pouvan slov. Zvlṻ sa to tka napr. firiem alebo radov, kde sa pouva
formalizovan psomn styk. Preto nemm zujem o prepisovanie Pravidiel, alebo
export databz slov (okrem inho, asi by ste sa pravdepodobne dostali do
konfliktu so zkonom). Navye vsledkom prepisovan s asto chyba. Radej
preferujem pomal, ale zato presn a bezchybn prcu.

Pomoc hadm hlavne v tchto oblastiach:
a) Pokia njdete chybn slovo (preklep, nesprvny tvar) - oznmte to.
b) Potrebn je tie vyselektova slov, ktor nie s v Pravidlch do zvltneho
   sboru (ak tak njdete, polite mi info: toto slovo poda ma nie je v
   Pravidlch...). Nemuste aka, km njdete vea takchto slov. Skste ich
   posla tak raz za mesiac.
c) Neznme slov sa ukladaj do domovskho prieinka do sboru
   '.aspell.slovak.pws '. Skste ho raz za mesiac skontrolova poda Pravidiel,
   rozdete tieto slov na spisovn a nespisovn (resp. odborn - Pravidl
   vemi mlo totito popisuj prve rzne odborn termny) skomprimujte ich
   (vyskajte, o vm d lep kompresn pomer: gzip alebo bzip2?). 
d) Do budcnosti by som chcel rozdeli cel slovnk na niekoko ast poda
   frekvencie pouvania - pokia mte prstup k rozsiahlejm textom v
   slovenine zistite prosm frekvenciu slov a polite mi ju. Tento prkaz by
   vm pritom mohol pomc:
   'tr "." " " <clanok_.txt | tr "?" " " |tr ":" " " |tr "\!" " " | \
   tr "(" " " | tr "," " " |tr "-" " "|tr ")" " " |tr "\"" " "| tr " " "\n" \
   | tr A-Z a-z | sort -f | uniq -i -c | sort -r -n > frekvencia_slov.txt'
   

Prkaz 'aspell -d slovak -l <kontrolovany.subor | sort -f -u >nezname.slova'
vm skontroluje sbor 'kontrolovany.subor' a vytvor zoznam slov
'nezname.slova', ktor v sbore nepoznal. Pri takejto kontrole sa neznme slova
naukladaj do '~/.aspell.slovak.pws '

Pokia nemte prstup sborom vhodnm na kontrolovanie, skste prekontrolova
slovensk preklady (sbory .po) (odporam strnku http://slovencina.linux.sk/)
alebo preklady KDE (balk kde-i18n-sk) a KOFFICE (koffice-i18n-sk) v programe
kbabel (balk kdesdk, resp kdesdk3) alebo gtranslator (www.gtranslator.org) a
informujte autora prekladu (je vdy uveden v hlavike 'po' sboru) o preklepe.
Neinformujte ho o nespisovnch slovch a podobne, lebo autori prekladov sa
asto musia uchyova k rznym slovm. Takto pome aj k zlepeniu rovne
prekladov.

Podobnm rieenm je "hacknutie" prekladov naintalovanch vo vaom systme.
Prklad:
'msgunfmt /usr/share/locale/sk/LC_MESSAGES/mc.mo >mc.sk.po'

Prosm NEPOSIELAJTE mi emaily vie ako 100kb. Radej jeden vek email
rozdete na niekoko mench.


Problmy:
--------

Pri prprave tohoto prvho vydania som zistil, e pri povolen niektorch
vlastnost aspellu, dochdza k ukoneniu Aspellu resp. dochdza k problmom.
Preto som v sbore slovak.dat (/usr/share/aspell) zakomentoval tieto
vlastnosti. Pokia zistte v om je problm, dajte mi prosm vedie na
zdpo@mailbox.sk.


Rzne informcie:
----------------

Ak je vzah medzi slovenskou podporou pre Ispell, Aspell a MySpell?
Vemi blzky a to hlavne vaka tomu, e pracuje ne vetkch troch. Dvod pre
to je nasledovn: Aspell pouvam osobne viac ako rok a v nedvnej minulosti
som potreboval slovensk podporu pre OpenOffice (MySpell). MySpell prevzal
engine z Pspell/Aspell a z Ispellu affix kompresiu. Tak som som sa zaal hra s
Ispellom a zistil som, e ma ist nedostatky. Kee nikto v tom ase (teda
pokia viem nikto okrem Jna Matisa) sa o slovensk podporu pre Ispell
nezaujmal, zaal som
robi jeho revziu. Verzia ispell-sk-0.1.7 bola vytvoren hlavne pre tch,
ktor sa zapojili/zapoja vo revzie (dos vea slov bolo odobranch, vea
preklepov opravench...). Z tejto verzie boli potom exportnut niektor
(sprvne) slov pre Aspell. Podpora pre MySpell je roben priebene.
Teda vzah medzi tmito spellmi je tak, e pokia nieo nenjde jeden z nich,
na 90% ich nenjdu ani ostatn.

Poda mjho osobnho hodnotenia je kvalita vyie spomenutch nasledovn:
Najlep je Aspell-slovak, potom MySpell-sk a posledn je Ispell.

Momentlne hlavne pracujem na Ispelle, take ten je a bude asi najastejie
vydvan. Potom nasleduje MySpell a poslednm je Aspell (predpokladm, e
do konca roka by mohla vyjs ete jedna, dve vezie Aspellu - keby sa nejak
udia
pripojili k jeho tvorbe, alebo by ho niekto chcel spravova, situcia by sa
mohla zmeni k lepiemu - potencilny zujemcovia nech mi daj vedie).

Pokia zalete slov do hociktorho projektu, po istej dobre (urite nie hne)
sa objavia vo vetkch troch a preto ich neposielajte do vetkch troch (ak by
ste ich upravili poda ispellovskej affix kompresie - uetrte mi kopu prce a
slov sa objavia aj Aspelly aj v MySpelly).

Vetky projekty s priebene obnovovan na http://ispell.hq.alert.sk


Poakovania
===========

Moja vaka patr uom zo serveru hq.sk a zvlṻ Jnovi Matisovi <matis@hq.sk>,
za to, e umiestuj tto podporu na svoj server.
Poakovanie za pomoc patr Marekovi Grcovi <xgrac@informatics.muni.cz>
ASpell-slovak-1.0, Copyright (C) 2002 Zdenko Podobn <zdpo@mailbox.sk>

