Class HyphenationToolkit
- java.lang.Object
-
- outils.HyphenationToolkit
-
public class HyphenationToolkit extends java.lang.Object
Classe permettant de mettre en place et de configurer la coupure littéraire à partir de dictionnaires de patterns de coupure (basé sur l'algo de Liang)
-
-
Constructor Summary
Constructors Constructor Description HyphenationToolkit()
-
Method Summary
All Methods Static Methods Concrete Methods Deprecated Methods Modifier and Type Method Description static boolean
fabriqueDico(java.lang.String dico, java.lang.String dicoNat, java.lang.String encodage)
Construit le dictionnaire de coupure (en xsl) à partir d'un dictionnaire existant au format .dic (Tex)static boolean
fabriqueDicoNat(java.lang.String dico, java.lang.String dicoNat, java.lang.String encodage)
Construit le dictionnaire de coupure de nat (en xsl) à partir d'un dictionnaire existant au format .dic (Tex)static java.util.ArrayList<java.lang.String>
getRules(java.lang.String dico)
Renvoie une liste contenant les règles de coupures de natstatic java.util.ArrayList<java.lang.String>
getRules(java.lang.String dico, java.lang.String encodage)
Renvoie une liste contenant les règles de coupures de natstatic java.util.ArrayList<java.util.ArrayList<java.lang.String>>
getRulesOrdered(java.lang.String dicoNat)
Deprecated.a priori ne sert plus car le critère de longueur de règle ne sert pas dans les règles de coupuresstatic void
main(java.lang.String[] a)
méthode de teststatic boolean
writeRules(java.util.ArrayList<java.lang.String> rules, java.lang.String dico)
static boolean
writeRules(java.util.ArrayList<java.lang.String> rules, java.lang.String dico, java.lang.String encodage)
Ecrit les règles contenus dansrules
dans le fichierdico
en utilisant l'encodageencodage
.
-
-
-
Method Detail
-
fabriqueDico
public static boolean fabriqueDico(java.lang.String dico, java.lang.String dicoNat, java.lang.String encodage)
Construit le dictionnaire de coupure (en xsl) à partir d'un dictionnaire existant au format .dic (Tex)Adapte les patterns pour les expressions régulières en xsl:
- remplacement des . du début par ^
- remplacement des . de fin par $
- doublement des apostrophes
Fabrique le fichier hyphenation.xsl contenant les patterns de coupure
- Parameters:
dico
- l'adresse du dictionnaire existant au format .dicdicoNat
- adresse de la feuille xsl de coupureencodage
- encodage du dictionnairedico
- Returns:
- true si le dictionnaire a été créé correctement, false sinon
- Since:
- 2.0
-
fabriqueDicoNat
public static boolean fabriqueDicoNat(java.lang.String dico, java.lang.String dicoNat, java.lang.String encodage)
Construit le dictionnaire de coupure de nat (en xsl) à partir d'un dictionnaire existant au format .dic (Tex)Adapte les patterns pour les expressions régulières en xsl:
- remplacement des . du début par ^
- remplacement des . de fin par $
- doublement des apostrophes
Fabrique le fichier hyphen.xsl contenant les patterns de coupure
- Parameters:
dico
- l'adresse du dictionnaire existant au format .dicdicoNat
- adresse de la feuille xsl de coupureencodage
- encodage du dictionnairedico
- Returns:
- true si le dictionnaire a été créé correctement, false sinon
- Since:
- 2.0
-
getRulesOrdered
@Deprecated public static java.util.ArrayList<java.util.ArrayList<java.lang.String>> getRulesOrdered(java.lang.String dicoNat)
Deprecated.a priori ne sert plus car le critère de longueur de règle ne sert pas dans les règles de coupuresRenvoie une liste double contenant les règles de coupures de nat regroupées par longueur de règleLa liste renvoyée contient des sous-listes dont les règles sont de même longueur pour chaque sous-liste
- Parameters:
dicoNat
- l'adresse du dictionnaire de coupure- Returns:
- la double liste conteannt les règles de coupure
- Since:
- 1.5
-
getRules
public static java.util.ArrayList<java.lang.String> getRules(java.lang.String dico)
Renvoie une liste contenant les règles de coupures de natLa liste renvoyée est ordonnée telle que dans le fichier de règle
Adapte les patterns pour les expressions régulières en xsl:
- remplacement des . du début par ^
- remplacement des . de fin par $
- doublement des apostrophes
utilise l'encodage par défaut (
encodageDefaut
)SAUF si un encodage est précisé dans le fichier de règles- Parameters:
dico
- l'adresse du dictionnaire utilisé, au format compatible avec l'algorithme de Liang(Tex)- Returns:
- la liste contenant les règles de coupure
- Since:
- 2.0
- See Also:
getRules(String, String)
-
getRules
public static java.util.ArrayList<java.lang.String> getRules(java.lang.String dico, java.lang.String encodage)
Renvoie une liste contenant les règles de coupures de natLa liste renvoyée est ordonnée telle que dans le fichier de règles.
Adapte les patterns pour les expressions régulières en xsl:
- remplacement des . du début par ^
- remplacement des . de fin par $
- doublement des apostrophes
utilise l'encodage spécifié par
encodage
ouencodageDefaut
siencodage
vautnull
SAUF si un encodage est précisé dans le fichier de règles à la première ligne- Parameters:
dico
- l'adresse du dictionnaire utilisé, au format compatible avec l'algorithme de Liang(Tex)encodage
- l'encodage du fichier de règle. Sinull
, utilisation de l'encodage par défaut (encodageDefaut
)- Returns:
- la liste contenant les règles de coupure
- Since:
- 2.0
-
writeRules
public static boolean writeRules(java.util.ArrayList<java.lang.String> rules, java.lang.String dico)
Ecrit les règles contenus dansrules
dans le fichierdico
en utilisant l'encodageencodageDefaut
.Les règles sont sous la forme de regex compatibles avec xsl. Cette fonction remplace:
- les ^ du début par .
- les $ de fin par .
- les apostrophes doublées par une apostrophe.
- Parameters:
rules
- ArrayList des règles au format xsl-compatibledico
- L'adresse du fichier dictionnaire- Returns:
true
si l'écriture dansdico
s'est bien déroulée- Since:
- 2.0
- See Also:
writeRules(ArrayList, String, String)
-
writeRules
public static boolean writeRules(java.util.ArrayList<java.lang.String> rules, java.lang.String dico, java.lang.String encodage)
Ecrit les règles contenus dansrules
dans le fichierdico
en utilisant l'encodageencodage
.Les règles sont sous la forme de regex compatibles avec xsl. Cette fonction remplace:
- les ^ du début par .
- les $ de fin par .
- les apostrophes doublées par une apostrophe.
- Parameters:
dico
- ArrayList des règles au format xsl-compatibleencodage
- Encodage du fichierdico
rules
- L'adresse du fichier dictionnaire- Returns:
true
si l'écriture dansdico
s'est bien déroulée- Since:
- 2.0
-
main
public static void main(java.lang.String[] a)
méthode de test- Parameters:
a
- unused
-
-