Dicționare românești

Ce sunt „dicționarele românești”?

Dicționarele sunt opere lexicografice cuprinzând (toate) cuvintele unei limbi. Colecțiile de cuvinte (ale unui dialect, domeniu de activitate, etc.) se numesc lexicoane, iar echivalentul unui element de lexicon poate fi la rândul său o explicație sau o traducere. Expresia „dicționar românesc” se referă atât la lexicoane românești, cât și la lexicoane formate din cuvintele altor limbi, dar care au elementele traduse sau explicate în română.

Dintr-o perspectivă IT, definiția de dicționar s-ar putea vedea astfel: o bază de date cu lexiconul (doar el singur) sau o bază de date cu un lexicon și traducerea ori explicația elementelor lui. Această bază de date poate fi folosită eventual și de alte aplicații pentru a-i extinde utilitatea, astfel că împărțirea acestui subiect s-ar putea face astfel:

Aplicațiile care folosesc lexicoane pot fi foarte variate. În mare, ele se împart în două categorii:


Lexicoane și aplicații cu lexicoane proprii

DEX Online este un dicționar explicativ al limbii române, disponibil online, care conține definiții culese din diverse dicționare tipărite. Așa cum numele o arată, sursa primară pentru definiții este Dicționarul Explicativ al Limbii Române, publicat de Institutul de Lingvistică „Iorgu Iordan” la Editura Univers Enciclopedic, ediția 1998 (acronim consacrat: DEX '98). Însă cu timpul, definiții din alte dicționare românești importante s-au adăugat acestei baze de date. Astăzi DEX '98 a fost complet cules.

Sursele acceptate de proiect pentru definiții noi sunt enumerate în pagina cu informații generale. DEX Online este un proiect colaborativ, oricine poate contribui cu definiții noi (atât online, cât și offline). Codul proiectului este accesibil la GitHub, pentru instrucțiuni suplimentare despre instalarea unei cópii actualizate pe propriul calculator, vizitați pagina cu instrucțiuni de instalare.

Proiectul a fost inițiat de Cătălin Frâncu în august 2001. La început a avut o evoluție lentă și haotică, cu un fond de cuvinte destul de modest. Un efort susținut și sistematic a fost depus de membrii Federației Române de Scrabble care au reușit să dezvolte proiectul dincolo de o masă critică de cuvinte (2000 - 3000) fapt care a permis ca proiectul DEX Online să câștige o binemeritată popularitate. Odată trecut de această fază proiectul a cucerit valoroasa contribuție a multor alți voluntari care cred în această idee. Natural, în aceste condiții favorabile, proiectul a căpătat nu numai o bogăție tot mai mare a lexiconului, ci și facilități noi necesare unei operări comode cu acest instrument lingvistic (căutare folosind expresii regulare, dar și alte facilități destinate contributorilor, de exemplu formatare interactivă a definiției). Iată și câteva cifre statistice care reflectă evoluția remarcabilă a acestui proiect:

Dată Număr de cuvinte
decembrie 2001 (* 40
iunie 2003 (* 20.000
15 februarie 2004 30.000
9 mai 2004 40.000
17 februarie 2006 262.521
5 septembrie 2018 (** 851.157
(** dată aproximativă
(** la data ultimei actualizări a acestei pagini

Ispell este un corector ortografic interactiv, un utilitar ce funcționează în linia de comandă. Este un program construit după mai vechiul spell(1) care a primit denumirea ispell(1) pe sistemul de operare ITS. Felul în care operează Ispell de obicei este: ispell nume-fișier. Acestă comandă lansează aplicația, în care fiecare cuvânt din fișierul nume-fișier cu o ortografie „discutabilă” este marcat vizibil și sunt sugerate posibile variante corecte.

Aplicația face sugestiile pe baza unui lexicon. Lexiconul ispell pentru limba română a fost scris de Mihai Budiu. Evoluția acestui lexicon a rămas însă la prima încercare, eforturile fiind concentrate spre Aspell. Lexiconul românesc poate fi descărcat de la următoarele adrese:

Aspell este un utilitar care funcționează ca înlocuitor pentru comanda ispell -a, fiind o aplicație mai nouă ca precedenta și mai flexibilă. Pentru acest motiv, aspell(1) a reușit să capete statutul de „urmaș” al lui Ispell și să capteze astfel eforturile de localizare ale programatorilor români. În această direcție au continuat eforturile depuse de Mihai Budiu, la care s-au adăugat cele ale lui Mugurel Ion Ciobîcă. Lexiconul românesc pentru Aspell este foarte cuprinzător (comparativ cu cel pentru Ispell), este disponibil pe site-ul oficial GNU Aspell, mai precis pe serverul FTP GNU.org în cele două versiuni ale sale: aspell-ro-0.50 și aspell5-ro-3.1.

OpenOffice.Org este o suită de aplicații de birou cu suport de corectare ortografică pentru limba română. Suportul este compus din trei componente: corector ortografic (ro_RO.zip), dicționar de cuvinte (th_ro_RO.zip) și corector pentru despărțirea în silabe (hyph_ro_RO.zip). Dicționarul de cuvinte este la început de drum, celelalte două componente sunt remarcabile. Cele trei componente pot fi descărcate împreună, arhivat sau independent:

Glosarul este o aplicație scrisă de Dan Damian, destinată echipelor de traducere a proiectelor Free Software / Open Source. Funcționa online, pe site-ul TMLUG, grupul utilizatorilor de Linux din Timișoara. A fost mutat apoi la http://i18n.ro/glosar, iar momentan funcționează la l10n.ro, fiind glosarul de termeni către care trimite acest site.

Pentru a instala această aplicație pe calculatorul propriu este nevoie de un server web și PHP. Este un instrument de tip Wiki (editare colaborativă), de mare ajutor în păstrarea consecvenței unui proiect de traducere. Este similar cu DEX Online, însă cele două soluții se adresează unui public diferit (motiv pentru care o comparație între cele două ar fi disproporționată). În vreme ce DEX Online se adresează unui public larg și își propune să ofere un dicționar explicativ complet al limbii române, Glosarul se adresează în primul rând traducătorilor de documentații din engleză, scopul său fiind facilitarea consecvenței traducerilor diverselor proiecte IT (motiv pentru care și aria acoperită de lexiconul Glosarului este aproape exclusiv concentrată pe argoul și jargonul IT).

O remarcă: această aplicație, spre deosebire de DEX Online, nu are un mecanism de contopire a contribuțiilor offline cu versiunea oficială, de la TMLUG. Bineînțeles că acest lucru nu exclude contribuțiile independente, însă având în vedere publicul căruia i se adresează aplicația, se presupune aveți la dispoziție o conexiune la Internet care vă permite lucrul online pe versiunea oficială. Mai jos sunt fișierele necesare pentru descărcare. Lexiconul este un fișier în format text, delimitat prin taburi și are numele glosar.txt.

Mozilla este o suită de aplicații dezvoltată de Fundația Mozilla. Aplicațiile Mozilla ce folosesc un corector ortografic (spellchecker) sunt: Thunderbird, Mozilla Mail și Mozilla Composer. Dicționarul folosit de corectorul ortografic se instalează ușor ca extensie de pe site-ul addons.mozilla.org.

Wikționarul este un proiect înrudit al enciclopediei Wikipedia în română accesibil online. Proiectul fiind la început de drum este mai redus ca dimensiuni, dar merită menționat pentru că în timp ar putea deveni un reper important al proiectelor românești online.


Alte aplicații ce folosesc lexicoane

Dixit e un dicționar propriu-zis ce poate opera căutări în baza de date cu sau fără diacritice. Este un program scris de Octavian Procopiuc, disponibil sub licență GPL în pagina proiectului. Ultima versiune, 14.2.5, a fost publicată în 28 februarie 2014. Acest program rulează offline pe calculatorul propriu. Dacă aveți însă legătură la Internet, lexiconul acestei aplicații poate fi actualizat automat, utilizând ca sursă proiectul DEX Online. Aplicația este scrisă în C++ și are o interfață grafică (GUI) ce utilizează versiunea necomercială a bibliotecii grafice Qt.

ROSpell este un editor de texte cu funcție de corector ortografic, având de asemenea un site dedicat. Folosește în acest scop o colecție de lexicoane românești compusă din:

Programul folosește biblioteca Qt a firmei Trolltech. Pe lângă fișiere text neformatate (plain text), poate recunoaște toate formatele de tip HTML și XML (OpenOffice.org, AbiWord, Scribus) fără a include în corectare marcajele (tagurile) utilizate. Altă caracteristică a acestui program simplu și rapid este că, în rarele cazuri în care nu puteți configura o tastatură românească (pentru instrucțiuni vedeți pagina Tastaturi), editorul suportă nativ diacriticele. Tot nativ, editorul „știe” (practic, toate) seturile de caractere românești: UTF-8, ISO-8859-2, ISO-8859-16, CP1250. Și această aplicație permite căutarea de definiții online în dicționarul DEX Online.