Hvordan lage og utgi ny norsk ordlistefil?

Hvordan lage og utgi ny norsk ordlistefil – oppskrift

Forutsetninger

For å kunne bygge nye ordlistepakker etter beskrivelsene nedenfor må du ha følgende installert:

aspell (>= 0.50)
debhelper (>= 4)
dictionaries-common-dev (>=0.20)
gawk
gettext (>= 0.11)
ispell
libmyspell-dev (>= 1:3.1-5)
libmythes-dev
make
perl
po-debconf
ssed
thescoder
zip

En mer detaljert gjennomgang av systemet og de ulike funksjonene finner du i dette dokumentet (pdf). For å få bare en kort veiledning, les videre.

1 Oppdater synonymordlistene

Synonymordlistene i speling.orgs database inneholder meget få ord, og de er alle lagt inn i synonymer.merg.nets database, derfor henter vi heller synonymene derfra – med følgende kommandoer:

make thesaurus-nb.txt-update

(Du henter dermed ned synonymordlistene fra http://synonymer.merg.net.)

cvs diff -u thesaurus-nb-mergnet.txt | less

(Viser endringene i synonymordlista fra synonymer.merg.net.)

cvs commit -m "Nye synonymer fra synonymer.merg.net" thesaurus-nb-mergnet.txt

(Melder inn de nye synonymene i cvs.)

NB: Synonymordlista for nynorsk er foreløpig så liten, at det kanskje er like greit å utelate den.

2 Lag ordlistepakkene

Start med å endre fila «NEWS»; skriv hvilke endringer som er gjort og det nye versjonsnummeret.

Kjør deretter kommandoene nedenfor.

make distclean distcheck

(«distclean» sletter foreløpige filer fra tidligere bygginger og «distcheck» lager nye ordlistepakker.)

Deretter:

cvs tag release_versjon

(Der versjon er f.eks. 2_0_9. Markerer i cvs hvilken ordlisteversjon vi har laget.)

En nærmere forklaring av selve byggeprosessen finner du her: http://no.speling.org/developer.html

Byggskriptet og de andre filene ligger i cvs, nærmere bestemt i /pub/Ordbok/src/spell-norwegian.

3 Test de nye pakkene

Ved hjelp av veiviseren i OpenOffice.org (OOo) skal den nye pakka kunne installere både ordlistene, ordelingene og synonymordlistene for både nynorsk og bokmål.

Ord som har synonymer kan brukes til å teste en installert synonymordbok.

Eksempler: Bokmål: «test», nynorsk: «pirrar».

4 Gjør den nye pakka tilgjengelig

4.1 Legg den ut på Alioth

Gå til http://alioth.debian.org/projects/spell-norwegian/

Når du er logget inn skal du ha fanebladet «admin», velg dette og deretter «Edit/add File Releases». Oppgi så navn osv. og bekreft.

Den nye pakka skal dermed havne her:
http://alioth.debian.org/project/showfiles.php?group_id=30577

4.2 Oppdater OOos ordliste-database

Send den ferdige fila, eller en lenke til alioth, til Daniel Naber (dnaber–alfakrøll–openoffice.org). Da havner fila i dictOOo (OOos installasjonsveiviser for ulike ordbøker, synonymordlister og orddeling).Dokumentasjon

Nødvendige filer

De eneste to filene som er nødvendige for at installasjonspakken skal virker, er selve ordliste-pakka i zip-format og fila spell.txt (se nedenfor for detaljer). Disse to pakkes sammen i en ny zip-fil som så er selve installasjonspakka.

Andre kommandoer

Skriptet:

make install-myspell DESTDIR=/en/sti

oppretter mappa
/usr/share/myspell/dicts/
inni mappa «/en/sti». I mappa «dicts» opprettes følgende filer:

Filnavn Brukes til
hyph_nb_NO.dic Orddelingsliste for bokmål
nb_NO.aff Regelfil for bokmålsordlista
nn_NO.aff Regelfil for nynorskordlista
th_nb_NO.dat Synonymordliste for bokmål
th_nn_NO.dat Synonymordliste for nynorsk
hyph_nn_NO.dic Orddelingsliste for nynorsk
nb_NO.dic Ordliste for bokmål
nn_NO.dic Ordliste for nynorsk
th_nb_NO.idx Synonymordliste for bokmål
th_nn_NO.idx Synonymordliste for nynorsk

Filoversikt

Rett mappestruktur

Rett mappestruktur er:

|-- NEWS				-> Skriv kort om de siste endringene her
|-- README				-> Behøver neppe endres
|-- hyph.txt				-> Se ovenfor
|-- hyph_nb_NO.zip
	|-- hyph_nb_NO.dic 		-> Orddelingsfila
	|-- README_hyph_nb_NO.txt 	-> Hjelpefil for orddelinga
|-- hyph_nn_NO.zip
	|-- hyph_nn_NO.dic 		-> Orddelingsfila
	|-- README_hyph_nn_NO.txt 	-> Hjelpefil for orddelinga
|-- nb_NO.zip
	|-- README_nb_NO.txt		-> Hjelpefil for bokmålsordlista
	|-- nb_NO.aff			-> Regelfil for ordlistefila for bokmål
	`-- nb_NO.dic			-> Selve ordlistefila for bokmål
|-- nn_NO.zip
	|-- README_nn_NO.txt		-> Hjelpefil for nynorskordlista
	|-- nn_NO.aff			-> Regelfil for ordlistefila for nynorsk
	`-- nn_NO.dic			-> Selve ordlistefila for nynorsk
|-- spell.txt				-> Se ovenfor
|-- thes_nb_NO.zip*
	|-- README_th_nb_NO.txt*	-> Hjelpefil for synonymordlista for bokmål, Ooo 1.x
	|-- th_nb_NO.dat*		-> Regelfil for synonymordlista for bokmål, Ooo 1.x
	`-- th_nb_NO.idx*		-> Selve synonymordlista for bokmål, Ooo 1.x
|-- thes_nb_NO_v2.zip*
	|-- README_th_nb_NO_v2.txt*	-> Hjelpefil for synonymordlista for bokmål, Ooo 2.x
	|-- th_nb_NO_v2.dat*		-> Regelfil for synonymordlista for bokmål, Ooo 2.x
	`-- th_nb_NO_v2.idx*		-> Selve synonymordlista for bokmål, Ooo 2.x
|-- thes_nn_NO.zip*
	|-- README_th_nn_NO.txt*	-> Hjelpefil for synonymordlista for nynorsk, Ooo 1.x
	|-- th_nn_NO.dat*		-> Regelfil for synonymordlista for nynorsk, Ooo 1.x
	`-- th_nn_NO.idx*		-> Selve synonymordlista for nynorsk, Ooo 1.x
|-- thes.txt*				-> Se ovenfor
`-- thes2.txt*				-> Se ovenfor

De med stjerne bak finnes også på http://synonymer.merg.net, (men bare synonymene hentes derfra), de andre ligger bare på no.speling.org.

Filer i pakkene med synonymer

Zipfila inneholder flere nye zipfiler:

For å pakke dem ut, kjør først:

unzip no_NO-pack.zip

(NB: du må stå i samme mappe.)

Du får da filene:
Filnavn Innhold
hyph.txt Oppsett for orddeling (foreløpig tom)
README.txt Hjelpefil
spell.txt Oppsett for ordlistene. NB: bruk den fra no.speling.org
thes2.txt Oppsett for stavkontrollen i OOo 2.x
thes_nb_NO_v2.zip Zippet ordliste for Ooo 2.x, med undermapper
thes_nb_NO.zip Zippet ordliste for Ooo 1.x, med undermapper
thes.txt Oppsett for stavkontrollen i OOo 1.x

NB: Hvis du pakker ut f.eks. thes_nb_NO.zip så opprettes det ikke en ny undermappe, alt havner i samme mappe. Det kan være lurt å legge zipfila i en ny mappe og pakke den ut der.

Oppsettsfilene

Selve synonymordlistene får ved å pakke ut en av disse:

Filnavn Brukes til
thes_nb_NO.zip Synonymordliste for OOo 1.x
thes_nb_NO_v2.zip Synonymordliste for OOo 2.x

Selve ordlistefilene heter *.idx, altså f.eks. th_nb_NO_v2.idx

Filene thes.txt og thes2.txt være tilstede for at synonymordlistefilene skal bli installert. Thes.txt bør inneholde (iallfall omtrent) disse to linjene:

nb,NO,th_nb_NO_v1,Norwegian bokmål (Norway),thes_nb_NO_v1.zip
nn,NO,th_nn_NO_v1,Norwegian nynorsk (Norway),thes_nn_NO_v1.zip
 1 2   3     4           5

mens thes2.txt ser slik ut, og bare inneholder en linje:

nb,NO,th_nb_NO_v2,Norwegian bokmål (Norway),thes_nb_NO_v2.zip
 1 2   3     4           5

Tilsvarende ser spell.txt slik ut:

nb,NO,nb_NO,Norwegian bokmål (Norway),nb_NO.zip
nn,NO,nn_NO,Norwegian nynorsk (Norway),nn_NO.zip
 1 2   3     4           5

Og hyph.txt slik:

nb,NO,hyph_nb_NO,Norwegian bokmål (Norway),hyph_nb_NO.zip
nn,NO,hyph_nn_NO,Norwegian nynorsk (Norway),hyph_nn_NO.zip
 1 2   3     4           5

Disse betyr, i rekkefølge:

1: Språkvariant
2: Språkkode
3: Prefiks for alle filer av denne typen, må stemme overens med navnene på filene i undermappa
4: Oppføringa som vises i dict-OOo
5: Navnet på zipfila som inneholder synonymene

En stavefeil e.l. et sted i denne fila kan føre til at stavekontrollen ikke virker, spesielt 3 og 5!
To linjer betyr altså at det finnes to ordlister, her en for nn og en for nb.

NB: Synonymene i OOo 1.x adskilles med «,», i 2.x derimot med «;».

Lenker:

http://alioth.debian.org/projects/spell-norwegian/
http://synonymer.merg.net
http://alioth.debian.org/scm/?group_id=30577

Skrevet av Axel Bojer, sist oppdatert 19.1.2009