src-content/lib/locales.json
{
"en": {
"word": "([^\\s/]+|[\\r\\n]+)",
"puncSplit": "(.+?\\.|.*?,|.*?—)([a-z].+\\b)",
"presuf": "^(\\W*)(anti|auto|ab|an|ax|al|as|bi|bet|be|contra|cat|cath|cir|cum|cog|col|com|con|cor|could|co|desk|de|dis|did|dif|di|eas|every|ever|extra|ex|end|en|em|epi|evi|func|fund|fin|hyst|hy|han|il|in|im|ir|just|jus|loc|lig|lit|li|mech|manu|man|mal|mis|mid|mono|multi|mem|micro|non|nano|ob|oc|of|opt|op|over|para|per|post|pre|peo|pro|retro|rea|re|rhy|should|some|semi|sen|sol|sub|suc|suf|super|sup|sur|sus|syn|sym|syl|tech|trans|tri|typo|type|uni|un|van|vert|with|would|won)?(.*?)(weens?|widths?|icals?|ables?|ings?|tions?|ions?|ies|isms?|ists?|ful|ness|ments?|ly|ify|ize|ise|ity|en|ers?|ences?|tures?|ples?|als?|phy|puts?|phies|ry|ries|cy|cies|mums?|ous|cents?)?(\\W*)$",
"punc": "[\\/\\s,.…?!¡‽:;‘’“”'’`><+=@&#~*^()[\\]{}<>«»·•¤¢$€£¥₩₪†‡°]",
"text": "[^\\/\\s,.…?!¡‽:;‘’“”'’`><+=@&#~*^()[\\]{}<>«»·•¤¢$€£¥₩₪†‡°]",
"num": "/\\d/"
},
"es": {
"word": "([^\\s/]+|[\\r\\n]+)",
"puncSplit": "(.+?\\.|.*?,|.*?—)([a-z].+\\b)",
"presuf": "^(\\W*)(génesis|contra|eñoeña|izoiza|osoosa|achon|entre|extra|fobia|hiper|inter|mente|super|able|ante|anti|ario|ción|dera|dero|hipo|post|aco|ado|bis|con|des|pos|pre|sub|an|bi|co|de|en|ex|in|or|re)?(\\W*)$",
"punc": "[\\/\\s,.…?!¡‽:;‘’“”'’`><+=@&#~*^()[\\]{}<>«»·•¤¢$€£¥₩₪†‡°]",
"text": "[^\\/\\s,.…?!¡‽:;‘’“”'’`><+=@&#~*^()[\\]{}<>«»·•¤¢$€£¥₩₪†‡°]",
"num": "/\\d/"
},
"ru": {
"word": "([^\\s/]+|[\\r\\n]+)",
"puncSplit": "(.+?\\.|.*?,|.*?—)([а-яё].+\\b)",
"presuf": "^([^ёа-яa-z0-9_]*)(электро|четырёх|четверо|противо|германо|экстра|франко|ультра|русско|псевдо|мульти|внутри|взаимо|анархо|черес|через|турбо|техно|тетра|супер|сверх|Санкт|радио|психо|прото|после|нейро|невро|много|милли|микро|между|макро|контр|кибер|квази|йокто|инфра|интер|зепто|едино|гипер|гидро|гекто|видео|благо|аудио|англо|чрез|фото|трёх|теле|себе|само|разо|пред|пост|пона|полу|подо|пере|одно|низо|недо|нано|надо|мото|мини|мета|мега|кино|кило|евро|деци|дека|двух|гига|вице|аэро|афро|архи|анти|алко|авто|авиа|экс|цис|уни|три|тре|суе|суб|сов|рос|роз|рас|раз|про|при|пре|пра|пол|под|ото|обо|нис|низ|нео|наи|над|меж|кое|изо|зоо|еже|дву|гео|все|вос|воз|вне|взо|бес|без|су|со|по|па|от|об|не|не|на|мк|мг|ко|ис|из|за|до|ди|да|вы|вс|во|вз)?(.*?)(ифицировать|изировать|ествовать|тельство|тельский|ствовать|тельный|надцать|ический|ровать|ающийся|онький|овской|овский|оватый|ничать|нибудь|ійскій|инство|инский|ильный|ийский|енький|евский|еватый|альный|онька|онный|овина|овать|ность|лявый|льщик|льник|логия|ливый|ичный|истый|илище|ийски|ивать|ество|еский|енько|енька|енный|евина|евать|ебный|бесие|ающий|астый|ануть|анный|аемый|ушки|ушка|учий|тель|таки|ство|стан|ской|ский|очка|отня|ость|онок|онка|овый|овой|овня|овна|овка|ович|овик|нуть|ница|льня|лище|либо|кать|ишка|ичка|иный|инец|имый|изна|ивый|ёный|ёнок|ёнка|ёвый|ечко|ечка|ески|енье|еный|ение|енец|евый|евой|евня|евич|евик|вать|бище|бина|ация|атый|атор|анье|аный|аной|анка|анин|ание|уха|уть|уля|тян|тие|ски|сан|ота|няк|ный|ной|ник|ний|лый|лог|лка|кун|кий|ище|ица|иха|ить|ист|иня|ина|ика|изм|знь|жды|еть|ель|дей|бес|ать|арь|аль|ун|ть|ти|ся|сь|ск|он|ок|ой|ов|ня|ль|ло|ла|ко|ка|ия|ич|ит|ин|ик|ий|ие|ёр|ёк|ёж|ёв|ец|ек|ей|ее|ед|ев|го|ба|ач|ат|ан|ак|аж)?([^ЁёА-яA-z0-9_]*)$",
"punc": "[\\/\\s,.…?!¡‽:;‘’“”'’`><+=@&#~*^()[\\]{}<>«»·•¤¢$€£¥₩₪†₽‡°]",
"text": "[^\\/\\s,.…?!¡‽:;‘’“”'’`><+=@&#~*^()[\\]{}<>«»·•¤¢$€£¥₩₪†₽‡°]",
"num": "/\\d/"
}
}