app/models/concerns/languageble.rb from znamenica/dneslov

app/models/concerns/languageble.rb
Summary

Maintainability

1 day
Test Coverage

74%
Issues
module Languageble
   extend ActiveSupport::Concern

   OLD_RUSSIAN_CAPITAL = 'А-ЬЮЄЅІЇѠѢѤѦѨѪѬѮѰѲѴѸѺꙀꙂꙆꙈꙊꙐꙒꙖ'
   OLD_RUSSIAN_STROKE = 'а-ьюєѕіїѡѣѥѧѩѫѭѯѱѳѵѹѻꙁꙃꙇꙉꙋꙑꙓꙗ'
   OLD_RUSSIAN_ACCENT = ' ҃҄҇꙼꙽́̀'
   MIDDLE_RUSSIAN_CAPITAL = 'А-ЬЮЄЅІЇѠѢѤѦѨѪѬѮѰѲѴѸѺꙀꙂꙆꙈꙊꙐꙒꙖ'
   MIDDLE_RUSSIAN_STROKE = 'а-ьюєѕіїѡѣѥѧѩѫѭѯѱѳѵѹѻꙁꙃꙇꙉꙋꙑꙓꙗ'
   MIDDLE_RUSSIAN_ACCENT = ' ҃҄҇꙼꙽́̀'
   RUSSIAN_CAPITAL = 'А-ЯЁІѢѲѴ'
   RUSSIAN_STROKE = 'а-яёіѣѳѵ'
   RUSSIAN_ACCENT = '́'
   MODERN_RUSSIAN_CAPITAL = 'А-ЯЁ'
   MODERN_RUSSIAN_STROKE = 'а-яё'
   MODERN_RUSSIAN_ACCENT = '́'
   CSLAV_CAPITAL = 'А-ЬЮЄЅІѠѢѦѮѰѲѴѶѸѺѼѾꙖꙊ'
   CSLAV_STROKE = 'а-ьюєѕіѡѣѧѯѱѳѵѷѹѻѽѿꙗꙋ'
   CSLAV_ACCENT = '̀́̑͛҅҆҆҃҄҇҈҉ⷠⷡⷢⷣⷤⷥⷦⷧⷨⷩⷪⷫⷬⷭⷮⷯⷰⷱⷲⷳⷴⷵⷶⷷⷸⷹⷺⷼⷻⷽⷾⷿ꙯꙰꙱꙲꙳ꙴꙵꙶꙷꙸꙹꙺꙻ꙼꙽꙾ꙿꚜꚝꚞꚟ︮'
   SSLAV_CAPITAL = 'А-ЬЮЅІѠѢѦѮѰѲѴѶѸѺѼѾꙖꙊѺѾҀѠѤѨѪѬꙀꙂꙄꙆꙈꙊꙌꙎꙐꙒꙔꙖꙘꙚꙜꙞ'
   SSLAV_STROKE = 'а-ьюѕіѡѣѧѯѱѳѵѷѹѻѽѿꙗꙋѻѿҁѡѥѩѫѭꙁꙃꙅꙇꙉꙋꙍꙏꙑꙓꙕꙗꙙꙛꙝꙟ'
   SSLAV_ACCENT = '̀́̑͛҅҆҆҃҄҇҈҉ⷠⷡⷢⷣⷤⷥⷦⷧⷨⷩⷪⷫⷬⷭⷮⷯⷰⷱⷲⷳⷴⷵⷶⷷⷸⷹⷺⷼⷻⷽⷾⷿ꙯꙰꙱꙲꙳ꙴꙵꙶꙷꙸꙹꙺꙻ꙼꙽꙾ꙿꚜꚝꚞꚟ︮'
   ASLAV_CAPITAL = 'А-ЯѠҨЪѪꙘѢԘԐЄѦІѴꙊꙎꙚꙈЅҐЈꙆԪ'
   ASLAV_STROKE = 'а-яѡҩъѫꙙѣԙԑєѧіѵꙋꙏꙛꙉѕґјꙇԫ'
   ASLAV_ACCENT = '̀́̓̔҃҇҈҉꙽҃҄҇꙽҃҄҇꙽'
   NCSLAV_CAPITAL = 'А-ЯѠҨЪѪꙘѢԘԐЄѦІѴꙊꙎꙚꙈЅҐЈꙆԪ'
   NCSLAV_STROKE = 'а-яѡҩъѫꙙѣԙԑєѧіѵꙋꙏꙛꙉѕґјꙇԫ'
   NCSLAV_ACCENT = '̀́̓̔҃҇҈҉꙽҃҄҇꙽҃҄҇꙽'
   HIP_CAPITAL = 'А-ЯЁA-Z'
   HIP_STROKE = 'а-яёa-z'
   SERBIAN_CAPITAL = 'ЂЈ-ЋЏА-ИК-Ш'
   SERBIAN_STROKE = 'ђј-ћа-ик-ш'
   SERBIAN_ACCENT = '̀́̋̏'
   GREEK_CAPITAL = 'Ά-ΐΑ-Ϋ'
   GREEK_STROKE = 'ά-ΰα-ώ'
   GREEK_ACCENT = '΄´'
   OLD_GREEK_CAPITAL = 'Ά-ΏΑ-ΩἈἘἨἸὈὙὨ'
   OLD_GREEK_STROKE = 'ά-ώα-ωἀἐἠἰὀὑὠό-ώἄἔἤἴὄὔὤὰ-ώ'
   OLD_GREEK_ACCENT = '᾿῎῍῝῞`´῾'
   ANCIENT_GREEK_CAPITAL = 'ͶͲΑ-ΫϏϒϓϔϘϚϜϠϞϴϷϹϺϾϿἈ-ἏἘ-ἝἨ-ἯἸ-ἿὈ-ὍὙ-ὟὨ-Ὧᾈ-ᾏᾘ-ᾟᾨ-ᾯᾸ-ᾼῈ-ῌῘ-ΊῨ-ῬῸ-ῼΩΆ-Ώ'
   ANCIENT_GREEK_STROKE = 'ά-ώϐϑϕ-ϗϙϛϝ-ϟϡ-ϳϵ-϶ϸϻϼᴦ-ᴪἀ-ἇἐ-ἕἠ-ἧἰ-ἷὀ-ὅὐ-ὗὠ-ὧὰ-ᾇᾐ-ᾗᾠ-ᾧᾰ-ᾷῂ-ῇῐ-ῗῠ-ῧῲ-ῷͻ-ͽͷΐά-ΰ'
   ANCIENT_GREEK_ACCENT = 'ͺ͵΄᾽ι᾿῀῁῍῎῏῝῞῟῭΅`´῾'
   BULGARIAN_CAPITAL = 'А-ЪЬЮЯ'
   BULGARIAN_STROKE = 'а-ъьюя'
   LATIN_CAPITAL = 'A-IK-TVX-ZÆ'
   LATIN_STROKE = 'a-ik-tvx-zæ'
   LATIN_ACCENT = '̄̏̀́̅̋'
   IRISH_CAPITAL = 'A-IL-PR-U'
   IRISH_STROKE = 'a-il-pr-u'
   CZECH_CAPITAL = 'A-PR-VX-ZÁÉĚÍÓÚŮÝČĎŇŘŠŤŽ'
   CZECH_STROKE = 'a-pr-vx-záéěíóúůýčďňřšťž'
   CZECH_ACCENT = '́̌̊'
   UKRAINIAN_CAPITAL = 'А-ЩЬЮЯЄІЇҐ'
   UKRAINIAN_STROKE = 'а-щьюяєіїґ'
   ENGLISH_CAPITAL = 'A-Z'
   ENGLISH_STROKE = 'a-z'
   ITALIAN_CAPITAL = 'A-IL-VZ'
   ITALIAN_STROKE = 'a-il-vz'
   ARMENIAN_CAPITAL = 'Ա-Ֆ'
   ARMENIAN_STROKE = 'ա-և'
   IVERIAN_CAPITAL = 'ა-ჺჽ'
   IVERIAN_STROKE = 'ა-ჺჽ'
   ROMANIAN_CAPITAL = 'A-ZĂÂÎŞŢȘȚ'
   ROMANIAN_STROKE = 'a-zăâîşţșț'
   OLD_ENGLISH_CAPITAL = 'A-IL-PR-UW-YÆÐꝽÞǷĊĠĀĒĪŌŪ'
   OLD_ENGLISH_STROKE = 'a-il-pr-uw-yæðᵹſþƿċġāēīūō'
   MIDDLE_ENGLISH_CAPITAL = 'A-ZÆ'
   MIDDLE_ENGLISH_STROKE = 'a-zæ'
   FRENCH_CAPITAL = 'A-ZŒÆÇÁÂÄÎÍÏÚÛÜÉÊËÓÖÔŸÑÀÈÌÒÙ'
   FRENCH_STROKE = 'a-zœæçáâäîíïúûüéêëóöôÿñàèìòù'
   FRENCH_ACCENT = '́'
   SPANISH_CAPITAL = 'A-ZÑÁÉÍÓÚÜÏ'
   SPANISH_STROKE = 'a-zñáéíóúüï'
   GERMAN_CAPITAL = 'A-ZÄÖÜẞ'
   GERMAN_STROKE = 'a-zäöüßſ'
   NORWEGIAN_CAPITAL = 'A-ZÆØÅ'
   NORWEGIAN_STROKE = 'a-zæøå'
   NORWEGIAN_ACCENT = '́'
   DANISH_CAPITAL = 'A-ZÆØÅÖ'
   DANISH_STROKE = 'a-zæøåö'
   DANISH_ACCENT = '́'
   SWEDISH_CAPITAL = 'A-ZÄÅÖ'
   SWEDISH_STROKE = 'a-zäåö'
   SWEDISH_ACCENT = '́'
   ISLAND_CAPITAL = 'ABD-PR-VX-ZÁÐÉÍÓÚÝÞÆÖ'
   ISLAND_STROKE = 'abd-pr-vx-záðéíóúýþæö'
   ISLAND_ACCENT = '́'
   FAROESE_CAPITAL = 'A-ZÁÐÍÓÚÝÞÆØÖÜ'
   FAROESE_STROKE = 'a-záðíóúýþæøöü'
   FAROESE_ACCENT = '́'
   DUTCH_CAPITAL = 'A-ZĲ'
   DUTCH_STROKE = 'a-zĳ'
   DUTCH_ACCENT = '́̈'
   PORTUGUESE_CAPITAL = 'A-ZÁÂÃÀÇÉÊÍÓÔÕÚ'
   PORTUGUESE_STROKE = 'a-záâãàçéêíóôõú'
   PORTUGUESE_ACCENT = '̧̀́̂̃'
   GOTHIC_STROKE = '𐌰-𐍊'
   COPTIC_CAPITAL = 'ϢϤϦϨϪϬϮⲀⲂⲄⲆⲈⲊⲌⲎⲐⲒⲔⲖⲘⲚⲜⲞⲠⲢⲤⲦⲨⲪⲬⲮⲰⳀⳈⳊ'
   COPTIC_STROKE = 'ϣϥϧϩϫϭϯⲁⲃⲅⲇⲉⲋⲍⲏⲑⲓⲕⲗⲙⲛⲝⲟⲡⲣⲥⲧⲩⲫⲭⲯⲱⳁⳉⳋ'
   FINNISH_CAPITAL = 'A-ZŠŽÅÄÖ'
   FINNISH_STROKE = 'a-zšžåäö'
   FINNISH_ACCENT = '̈̊̌'
   ESTONIAN_CAPITAL = 'A-ZŠŽÕÄÖÜ'
   ESTONIAN_STROKE = 'a-zšžõäöü'
   ESTONIAN_ACCENT = '̈́̌'
   LATVIAN_CAPITAL = 'A-ZĀČĒĢĪĶĻŅŠŪŽ'
   LATVIAN_STROKE = 'a-zāčēģīķļņšūž'
   LATVIAN_ACCENT = '̄̌'
   LITHUANIAN_CAPITAL = 'A-ZĄČĘĖĮŲŠŽŪ'
   LITHUANIAN_STROKE = 'a-ząčęėįųšžū'
   LITHUANIAN_ACCENT = '̨̇'
   UPPER_ANCIENT_GERMANIC_CAPITAL = 'A-ZÄÖÜẞ'
   UPPER_ANCIENT_GERMANIC_STROKE = 'a-zäöüßſ'
   LOWER_ANCIENT_GERMANIC_CAPITAL = 'A-ZÄÖÜẞ'
   LOWER_ANCIENT_GERMANIC_STROKE = 'a-zäöüßſ'
   OLD_HEBREW_STROKE = 'א-תשׁ-זּטּ-לּמּנּסּףּפּצּ-ﭏ'
   OLD_HEBREW_ACCENT = '׳״ׇ֑-ׇ'
   HEBREW_STROKE = '׆א-תײַ-﬩'
   HEBREW_ACCENT = '׳״ׇ֑\-ׇ'
   ARAMAIC_STROKE = 'א-תשׁ-זּטּ-לּמּנּסּףּפּצּ-ﭏ'
   ARAMAIC_ACCENT = '׳״ׇ֑\-ׇ'
   ARABIC_STROKE = 'ء-غف-ي١-٩ٮ-ہۆ-ە۱-۹ﭐ-ﮯﯓ-ﯩﯼ-ﯿ'
   PERSIAN_STROKE = 'ﺍبپﺕﺙﺝچﺡﺥﺩﺫﺭﺯژﺱﺵﺹ    ﺽﻁﻅﻉﻍﻑﻕکگﻝﻡﻥهـﻭﻯ'
   PERSIAN_ACCENT = ''
   OLD_PERSIAN_STROKE = 'a-pr-zāēōūīš'
   OLD_PERSIAN_ACCENT = '̄̅'
   OLD_PERSIAN_HIEROGLYPH = '𐭀-𐭟'
   ANCIENT_PERSIAN_STROKE = 'a-pr-vx-zθçāēōūīôš'
   ANCIENT_PERSIAN_ACCENT = '̄̅'
   ANCIENT_PERSIAN_HIEROGLYPH = '𐎠-𐏕'
   TRADITIONAL_CHINESE_STROKE = '⺀-𱍊'
   SIMPLIFIED_CHINESE_STROKE = '⺀-𱍊'
   KATAKANA_CAPITAL = 'アイウエオ-ヂツ-モヤユヨ-ロワ-ヴ'
   KATAKANA_STROKE = 'ァィゥェォッャュョヮヵヶㇰ-ㇿ'
   KATAKANA_HALFWIDTH = 'ｦ-ﾝ'
   KATAKANA_SQUARE = '㌀-㍗'
   KATAKANA_CIRCLED = '㋐-㋾'
   KATAKANA_MARK = 'ヽヾヿ'
   XIRAGANA_CAPITAL = 'あいうえお-ぢつ-もやゆよ-ろわ-ゔゟ-𛄟🈀'
   XIRAGANA_STROKE = 'ぁぃぅぇぉっゃゅょゎゕゖ𛅐-𛅒'
   XIRAGANA_MARK = 'ゝゞ'
   SANSKRIT_STROKE = 'ऄ-हक़-ॡ०-ॿꣲ-ꣾऽ'
   SANSKRIT_ACCENT = 'ऀ-ःऺ-़ा-ॗॢ-ॣ꣠-꣱ꣿ'
   HINDI_STROKE = 'ऄ-हक़-ॡ०-ॿꣲ-ꣾऽ'
   HINDI_ACCENT = 'ऀ-ःऺ-़ा-ॗॢ-ॣ꣠-꣱ꣿ'
   MARATHI_STROKE = 'ऄ-हक़-ॡ०-ॿꣲ-ꣾऽ'
   MARATHI_ACCENT = 'ऀ-ःऺ-़ा-ॗॢ-ॣ꣠-꣱ꣿ'

   OLD_RUSSIAN_SYNTAX = ' \<\>\[\]\.,:;·⁖჻᛭⁘⁙\/\-\—\–†'
   MIDDLE_RUSSIAN_SYNTAX = ' \<\>\[\]\.,:;·⁖჻᛭⁘⁙\/\-\—\–†'
   RUSSIAN_SYNTAX = ' \(\)\.,:;!\/\-«»\—\?\–№†IVXLCDM'
   MODERN_RUSSIAN_SYNTAX = ' \(\)\.,:;\!\/\-«»\—\?†IVXLCDM©–№\'\[\]&^'
   HIP_SYNTAX = ' \(\[\{\/\'\+\.\:\!"=~@#\$%\^&\*_\)\]\}\\\\`\-,;?\|'
   CSLAV_SYNTAX = ' \(\)\.,:;'
   SSLAV_SYNTAX = ' \(\)\.,:;·⁖჻᛭⁘⁙'
   ASLAV_SYNTAX = ' \(\)\.,:;·⁖჻᛭⁘⁙'
   NCSLAV_SYNTAX = ' \(\)\.,:;·⁖჻᛭⁘⁙'
   SERBIAN_SYNTAX = ' \(\)\.,\!:;“”\/'
   GREEK_SYNTAX = ' \(\)~\+\(\)\-\.,;;:.·˙\!«»\'’"`©\/' # TODO last 4 to fix and merge
   OLD_GREEK_SYNTAX = ' ~\+\-\.,;;:.·˙\!\'"\/'
   ANCIENT_GREEK_SYNTAX = ' ~\+\-\.,;;:.·˙\!\'"\/'
   BULGARIAN_SYNTAX = ' \(\)\.,'
   UKRAINIAN_SYNTAX = ' \(\)\.,—’;\/:'
   LATIN_SYNTAX = ' \(\)\.,<\>'
   IRISH_SYNTAX = ' \(\)\.,'
   CZECH_SYNTAX = ' \(\)\.,'
   ENGLISH_SYNTAX = ' \(\)\.,’\/\!\-:;\>"'
   ITALIAN_SYNTAX = ' \(\)\.,'
   ARMENIAN_SYNTAX = ' \(\)\.,'
   IVERIAN_SYNTAX = ' \(\)\.,:;\-\!'
   ROMANIAN_SYNTAX = ' \(\)\.,;:\-\!'
   OLD_ENGLISH_SYNTAX = ' \(\)\.,\/\>'
   MIDDLE_ENGLISH_SYNTAX = ' \(\)\.,;\/\!\-:;’\>'
   FRENCH_SYNTAX = ' \(\)\.,’\/\''
   SPANISH_SYNTAX = ' \(\)\.,\''
   GERMAN_SYNTAX = ' \(\)\.,'
   HEBREW_SYNTAX = ' \(\)\.,'
   OLD_HEBREW_SYNTAX = ' \(\)\.,'
   ARAMAIC_SYNTAX = ' \(\)\.,'
   COPTIC_SYNTAX = ' \(\)\.,'

   SPECIFIC_SYNTAX = '\*~`\+\-#=>\[\]\(\)\!a-zA-Z'
   DIGITS = '0-9'

   UPCHAR = RUSSIAN_CAPITAL + MODERN_RUSSIAN_CAPITAL + CSLAV_CAPITAL + SSLAV_CAPITAL + ASLAV_CAPITAL + SERBIAN_CAPITAL + GREEK_CAPITAL +
      ENGLISH_CAPITAL + LATIN_CAPITAL + CZECH_CAPITAL + ARMENIAN_CAPITAL +
      ROMANIAN_CAPITAL + OLD_ENGLISH_CAPITAL + IVERIAN_CAPITAL + GERMAN_CAPITAL + UKRAINIAN_CAPITAL + MIDDLE_ENGLISH_CAPITAL +
      OLD_RUSSIAN_CAPITAL + OLD_GREEK_CAPITAL + ANCIENT_GREEK_CAPITAL
   DOWNCHAR = RUSSIAN_STROKE + MODERN_RUSSIAN_STROKE + CSLAV_STROKE + SSLAV_STROKE + ASLAV_STROKE + SERBIAN_STROKE + GREEK_STROKE +
      ENGLISH_STROKE + LATIN_STROKE + CZECH_STROKE + ARMENIAN_STROKE +
      IVERIAN_STROKE + ROMANIAN_STROKE + OLD_ENGLISH_STROKE + GERMAN_STROKE + UKRAINIAN_STROKE + MIDDLE_ENGLISH_STROKE +
      HEBREW_STROKE + OLD_RUSSIAN_STROKE +
      OLD_GREEK_STROKE + ANCIENT_GREEK_STROKE + OLD_HEBREW_STROKE + ARABIC_STROKE
   ACCENT = GREEK_ACCENT + RUSSIAN_ACCENT + CSLAV_ACCENT + SSLAV_ACCENT + ASLAV_ACCENT + FRENCH_ACCENT + HEBREW_ACCENT +
      OLD_RUSSIAN_ACCENT + OLD_GREEK_ACCENT + ANCIENT_GREEK_ACCENT
   CHAR = DOWNCHAR + UPCHAR

   # TODO уравнять с LANGUAGE_TREE.alphabeths
   SYNTAX_TABLE = {
      :РУ => RUSSIAN_SYNTAX,
      :РО => MODERN_RUSSIAN_SYNTAX,
      :ДР => OLD_RUSSIAN_SYNTAX,
      :ЦР => HIP_SYNTAX,
      :ЦС => CSLAV_SYNTAX,
      :СС => SSLAV_SYNTAX,
      :ВС => ASLAV_SYNTAX,
      :НЦ => NCSLAV_SYNTAX,
      :СЕ => SERBIAN_SYNTAX,
      :ГР => GREEK_SYNTAX,
      :СГ => OLD_GREEK_SYNTAX,
      :ДГ => ANCIENT_GREEK_SYNTAX,
      :АН => ENGLISH_SYNTAX,
      :АА => ENGLISH_SYNTAX,
      :ЧХ => CZECH_SYNTAX,
      :ИР => IRISH_SYNTAX,
      :СИ => IRISH_SYNTAX,
      :ЛА => LATIN_SYNTAX,
      :БГ => BULGARIAN_SYNTAX,
      :УК => UKRAINIAN_SYNTAX,
      :ИТ => ITALIAN_SYNTAX,
      :АР => ARMENIAN_SYNTAX,
      :ИВ => IVERIAN_SYNTAX,
      :РМ => ROMANIAN_SYNTAX,
      :РА => OLD_ENGLISH_SYNTAX,
      :СА => MIDDLE_ENGLISH_SYNTAX,
      :ФР => FRENCH_SYNTAX,
      :ИС => SPANISH_SYNTAX,
      :НЕ => GERMAN_SYNTAX,
      :ЕВ => HEBREW_SYNTAX,
      :ДЕ => OLD_HEBREW_SYNTAX,
      :АМ => ARAMAIC_SYNTAX,
      :КП => COPTIC_SYNTAX,
#      :ПС => PERSIAN_SYNTAX,
#      :ДП => OLD_PERSIAN_SYNTAX,
#      :КИ => TRADITIONAL_CHINESE_SYNTAX,
#      :КУ => SIMPLIFIED_CHINESE_SYNTAX,
#      :ЯП => JAPANESE_SYNTAX,
#      :СК => SANSKRIT_SYNTAX,
#      :ИН => HINDI_SYNTAX,
#      :МХ => MARATHI_SYNTAX,
      :СР => MIDDLE_RUSSIAN_SYNTAX,
      # ЧИНЬ: СС, СЦ, ЦР, МК, СО, СЛ, ПО, КШ, ВЛ, НЛ, ЦУ
   }

   MATCH_TABLE = {
      :ДР => "#{OLD_RUSSIAN_CAPITAL}#{OLD_RUSSIAN_STROKE}#{OLD_RUSSIAN_ACCENT}#{OLD_RUSSIAN_SYNTAX}",
      :СР => "#{MIDDLE_RUSSIAN_CAPITAL}#{MIDDLE_RUSSIAN_STROKE}#{MIDDLE_RUSSIAN_ACCENT}#{MIDDLE_RUSSIAN_SYNTAX}",
      :РУ => "#{RUSSIAN_CAPITAL}#{RUSSIAN_STROKE}#{RUSSIAN_ACCENT}#{RUSSIAN_SYNTAX}#{DIGITS}",
      :РО => "#{MODERN_RUSSIAN_CAPITAL}#{MODERN_RUSSIAN_STROKE}#{MODERN_RUSSIAN_ACCENT}#{MODERN_RUSSIAN_SYNTAX}#{DIGITS}",
      :СС => "#{SSLAV_CAPITAL}#{SSLAV_STROKE}#{SSLAV_ACCENT}#{SSLAV_SYNTAX}",
      :ЦС => "#{CSLAV_CAPITAL}#{CSLAV_STROKE}#{CSLAV_ACCENT}#{CSLAV_SYNTAX}",
      :ВС => "#{ASLAV_CAPITAL}#{ASLAV_STROKE}#{ASLAV_ACCENT}#{ASLAV_SYNTAX}",
      :НЦ => "#{NCSLAV_CAPITAL}#{NCSLAV_STROKE}#{NCSLAV_ACCENT}#{NCSLAV_SYNTAX}",
      :СЕ => "#{SERBIAN_CAPITAL}#{SERBIAN_STROKE}#{SERBIAN_ACCENT}#{SERBIAN_SYNTAX}#{DIGITS}",
      :ЧХ => "#{CZECH_CAPITAL}#{CZECH_STROKE}#{CZECH_ACCENT}#{CZECH_SYNTAX}#{DIGITS}",
      :БГ => "#{BULGARIAN_CAPITAL}#{BULGARIAN_STROKE}#{BULGARIAN_SYNTAX}#{DIGITS}",
      :УК => "#{UKRAINIAN_CAPITAL}#{UKRAINIAN_STROKE}#{UKRAINIAN_SYNTAX}#{DIGITS}",
      :ГР => "#{GREEK_CAPITAL}#{GREEK_STROKE}#{GREEK_ACCENT}#{GREEK_SYNTAX}#{DIGITS}",
      :СГ => "#{OLD_GREEK_CAPITAL}#{OLD_GREEK_STROKE}#{OLD_GREEK_SYNTAX}#{OLD_GREEK_ACCENT}",
      :ДГ => "#{ANCIENT_GREEK_CAPITAL}#{ANCIENT_GREEK_STROKE}#{ANCIENT_GREEK_ACCENT}#{ANCIENT_GREEK_SYNTAX}",
      :АР => "#{ARMENIAN_CAPITAL}#{ARMENIAN_STROKE}#{ARMENIAN_SYNTAX}#{DIGITS}",
      :ИВ => "#{IVERIAN_STROKE}#{IVERIAN_SYNTAX}#{DIGITS}",
      :АМ => "#{ARAMAIC_STROKE}#{ARAMAIC_ACCENT}",
      :ДЕ => "#{OLD_HEBREW_STROKE}#{OLD_HEBREW_ACCENT}",
      :ЕВ => "#{HEBREW_STROKE}#{HEBREW_ACCENT}#{HEBREW_SYNTAX}#{DIGITS}",
      :АБ => "#{ARABIC_STROKE}#{DIGITS}",
      :ЛА => "#{LATIN_CAPITAL}#{LATIN_STROKE}#{LATIN_SYNTAX}",
      :АН => "#{ENGLISH_CAPITAL}#{ENGLISH_STROKE}#{ENGLISH_SYNTAX}#{DIGITS}",
      :АА => "#{ENGLISH_CAPITAL}#{ENGLISH_STROKE}#{ENGLISH_SYNTAX}#{DIGITS}",
      :СА => "#{MIDDLE_ENGLISH_CAPITAL}#{MIDDLE_ENGLISH_STROKE}#{MIDDLE_ENGLISH_SYNTAX}",
      :РА => "#{OLD_ENGLISH_CAPITAL}#{OLD_ENGLISH_STROKE}#{OLD_ENGLISH_SYNTAX}",
      :ИР => "#{IRISH_CAPITAL}#{IRISH_STROKE}#{IRISH_SYNTAX}#{DIGITS}",
      :СИ => "#{IRISH_CAPITAL}#{IRISH_STROKE}#{IRISH_SYNTAX}",
      :ИТ => "#{ITALIAN_CAPITAL}#{ITALIAN_STROKE}#{ITALIAN_SYNTAX}#{DIGITS}",
      :РМ => "#{ROMANIAN_CAPITAL}#{ROMANIAN_STROKE}#{ROMANIAN_SYNTAX}#{DIGITS}",
      :ФР => "#{FRENCH_CAPITAL}#{FRENCH_STROKE}#{FRENCH_ACCENT}#{FRENCH_SYNTAX}#{DIGITS}",
      :ИС => "#{SPANISH_CAPITAL}#{SPANISH_STROKE}#{SPANISH_SYNTAX}#{DIGITS}",
      :НЕ => "#{GERMAN_CAPITAL}#{GERMAN_STROKE}#{GERMAN_SYNTAX}#{DIGITS}",
      :НО => "#{NORWEGIAN_CAPITAL}#{NORWEGIAN_STROKE}#{NORWEGIAN_ACCENT}#{DIGITS}",
      :ДА => "#{DANISH_CAPITAL}#{DANISH_STROKE}#{DANISH_ACCENT}#{DIGITS}",
      :ШВ => "#{SWEDISH_CAPITAL}#{SWEDISH_STROKE}#{SWEDISH_ACCENT}#{DIGITS}",
      :ИЛ => "#{ISLAND_CAPITAL}#{ISLAND_STROKE}#{ISLAND_ACCENT}#{DIGITS}",
      :ФА => "#{FAROESE_CAPITAL}#{FAROESE_STROKE}#{FAROESE_ACCENT}#{DIGITS}",
      :НЗ => "#{DUTCH_CAPITAL}#{DUTCH_STROKE}#{DUTCH_ACCENT}#{DIGITS}",
      :ПГ => "#{PORTUGUESE_CAPITAL}#{PORTUGUESE_STROKE}#{PORTUGUESE_ACCENT}#{DIGITS}",
      :ГО => "#{GOTHIC_STROKE}",
      :КП => "#{COPTIC_CAPITAL}#{COPTIC_STROKE}",
      :ФИ => "#{FINNISH_CAPITAL}#{FINNISH_STROKE}#{FINNISH_ACCENT}#{DIGITS}",
      :ЕС => "#{ESTONIAN_CAPITAL}#{ESTONIAN_STROKE}#{ESTONIAN_ACCENT}",
      :ЛТ => "#{LATVIAN_CAPITAL}#{LATVIAN_STROKE}#{LATVIAN_ACCENT}#{DIGITS}",
      :ЛИ => "#{LITHUANIAN_CAPITAL}#{LITHUANIAN_STROKE}#{LITHUANIAN_ACCENT}#{DIGITS}",
      :ВН => "#{UPPER_ANCIENT_GERMANIC_CAPITAL}#{UPPER_ANCIENT_GERMANIC_STROKE}",
      :НН => "#{LOWER_ANCIENT_GERMANIC_CAPITAL}#{LOWER_ANCIENT_GERMANIC_STROKE}",
      :ПС => "#{PERSIAN_STROKE}#{PERSIAN_ACCENT}",
      :СП => "#{OLD_PERSIAN_STROKE}#{OLD_PERSIAN_ACCENT}",
      :ПФ => "#{OLD_PERSIAN_HIEROGLYPH}",
      :ДП => "#{ANCIENT_PERSIAN_STROKE}#{ANCIENT_PERSIAN_ACCENT}",
      :ДИ => "#{ANCIENT_PERSIAN_HIEROGLYPH}",
      :КИ => "#{TRADITIONAL_CHINESE_STROKE}",
      :КУ => "#{SIMPLIFIED_CHINESE_STROKE}",
      :КТ => "#{KATAKANA_CAPITAL}#{KATAKANA_STROKE}#{KATAKANA_HALFWIDTH}#{KATAKANA_SQUARE}#{KATAKANA_CIRCLED}#{KATAKANA_MARK}",
      :ХИ => "#{XIRAGANA_CAPITAL}#{XIRAGANA_STROKE}#{XIRAGANA_MARK}",
      :СК => "#{SANSKRIT_STROKE}#{SANSKRIT_ACCENT}",
      :ИН => "#{HINDI_STROKE}",
      :МХ => "#{MARATHI_STROKE}",
      # :ЦР => "#{HIP_CAPITAL}#{HIP_STROKE}", # church hip markup
   }

   # :nodoc:
   LANGUAGE_TREE = {
      ру: %i(РУ РО),
      ср: %i(СР), #старорусскій/срѣднерусскій
      др: %i(ДР), #древнерусскій
      цс: %i(ЦС РУ РО ЦР),#церковнославянскій
      сс: %i(СС ЦР), #старославянскій
      вс: %i(ВС НЦ), #всеславянскій, новоцерковнославянскій
      ан: %i(АН АА), #англійскій, американскій
      са: %i(СА), #староанглийскій
      ра: %i(РА), #древнеанглийскій
      ук: :УК, #украинскій
      бл: :БЛ, #бѣлорусскій
      мк: :МК, #македонскій
      сх: %i(СЕ ХР), #сербскій, хорватскій
      со: :СО, #словенскій
      бг: :БГ, #болгарскій
      чх: :ЧХ, #чешскій
      сл: :СЛ, #словацкій
      по: :ПО, #польскій
      кш: :КШ, #кашубскій
      вл: :ВЛ, #верхнелужицкій
      нл: :НЛ, #нижнелужицкій
      ар: :АР, #армянскій
      ив: :ИВ, #грузинскій
      рм: %i(РМ ЦУ ЦР), #румынскій: латиница, кириллица, церковная кириллица
      гр: :ГР, #грѣческій
      сг: :СГ, #старогрѣческій,церковногрѣческій
      дг: :ДГ, #древнегрѣческій
      ла: :ЛА, #латынь
      ит: :ИТ, #итальянскій
      фр: :ФР, #французскій
      ис: :ИС, #испанскій
      не: :НЕ, #нѣмецкій
      ир: :ИР, #ирландскій
      си: :СИ, #староирландскій
      аб: :АБ, #арабскій
      но: :НО, #норвежскій
      да: :ДА, #датскій
      ев: :ЕВ, #еврейскій
      де: :ДЕ, #древнееврейскій
      ам: :АМ, #арамейскій
      шв: :ШВ, #шведскій
      ил: :ИЛ, #исландскій
      фа: :ФА, #фарерскій
      нз: :НЗ, #голландскій
      пг: :ПГ, #португальскій
      го: :ГО, #готфскій
      фи: :ФИ, #финскій
      ес: :ЕС, #эстонскій
      лт: :ЛТ, #латвійскій
      ли: :ЛИ, #литовскій
      вн: :ВН, #древневерхненѣмецкій
      нн: :НН, #древненижненѣмецкій
      кп: :КП, #коптскій
      пс: :ПС, #персскій/фарси
      сп: %i(СП ПФ), #староперсскій/парфянскій/пехлевійскій: латиница, парфяница
      дп: %i(ДП ДИ), #древнеперсскій: латиница, иероглифика
      ки: %i(КИ КУ), #китайскій традиціонный, упрощённый
      яп: %i(КТ ХИ), #японскій: катакана, хирагана
      ск: :СК, #санскритъ
      ин: :ИН, #индускій/хинди
      мх: :МХ, #маратхи
   }

   # :nodoc:
   ALPHABETH_TREE = LANGUAGE_TREE.reduce({}) do |res, (lang, alph_in)|
      [alph_in].flatten.reduce(res) { |r, alph| r.merge(alph => r[alph] ? r[alph] | [lang] : [lang]) }
   end

   # :nodoc:
   OPTIONS = %i(novalidate on)

   # +language_list+ returns list of available languages.
   #
   # Example:
   #
   #     validates :language_code, inclusion: { in: Languageble.language_list }
   #
   def self.language_list
      list = Languageble::LANGUAGE_TREE.keys
      list.concat( list.map( &:to_s ) )
   end

   # +alphabeth_list+ returns list of available languages.
   #
   def self.alphabeth_list
      Languageble::LANGUAGE_TREE.values.flatten.uniq
   end

   # +alphabeth_list_for+ returns list of available alphabeths for the specified
   # list of language codes as a string or and array.
   #
   # Example:
   #
   #     validates :alphabeth_code, inclusion: { in: proc { |l|
   #        Languageble.alphabeth_list_for( l.language_code ) } } ; end
   #
   def self.alphabeth_list_for language_codes
      [ language_codes ].flatten.map do |language_code|
         Languageble::LANGUAGE_TREE[ language_code.to_s.to_sym ]
      end.flatten.uniq.map( &:to_s )
   end

   # +language_list_for+ returns the language list for the specified alphabeth
   # code.
   #
   # Example:
   #
   #     validates :language_code, inclusion: { in: proc { |l|
   #        Languageble.language_list_for( l.alphabeth_code ) } } ; end
   #
   def self.language_list_for alphabeth_code
      language_codes =
      Languageble::LANGUAGE_TREE.invert.map do |(alphs, lang)|
         [ alphs ].flatten.map do |a|
            [a, lang]
         end
      end.flatten(1).reduce({}) do |h, (alph, lang)|
         case h[alph]
         when NilClass
            h[alph] = lang
         when Array
            h[alph] << lang
         else
            h[alph] = [ h[alph], lang ]
         end

         h
      end.[](alphabeth_code.to_sym)

      [ language_codes ].flatten.compact.map( &:to_s )
   end

   module ClassMethods
      def self.extended base
         base.has_one :language, primary_key: :language_code, foreign_key: :key, class_name: :Subject
         base.has_one :alphabeth, primary_key: :alphabeth_code, foreign_key: :key, class_name: :Subject
      end

      # +has_alphabeth+ sets up alphabeth feature on a column or itself model,
      # i.e. generally +alphabeth_code+, and +language_code+ fields to match text
      # of the specified columns if any.
      #
      # Examples:
      #
      #     has_alphabeth on: name: true
      #     has_alphabeth on: { text: [:nosyntax, allow: " ‑" ] }
      #     has_alphabeth on: [ :name, :text ]
      #     has_alphabeth novalidate: true
      #
      def has_alphabeth options = {}
         OPTIONS.each do |o|
            self.send( "setup_#{o}", options[ o ] )
         end
      end

      protected

      # +setup_on+ accepts options :on for validation on a specified field
      #
      # Examples:
      #
      #     has_alphabeth on: name: true
      #     has_alphabeth on: { text: [:nosyntax, allow: " ‑" ] }
      #     has_alphabeth on: [ :name, :text ]
      #
      def setup_on option_on
         on = [ option_on ].map do |o|
            case o
            when Hash
               o.map { |(k, v)| { k => v } }
            when String, Symbol
               { o => true }
            when Array
               o.map { |x| { x => true } }
            when NilClass
               []
            else
               raise "Target of kind #{o.class} is unsupported"
            end
         end.flatten.map { |x| [ x.keys.first, x.values.first ] }.to_h

         on.each do |target, options|
            self.class_eval <<-RUBY
               validates :#{target}, alphabeth: #{options.inspect}
            RUBY
         end
      end

      # +setup_novalidate+ accepts boolean option :novalidate to skip validation on
      # +:language_code+, and +:alphabeth_code+ fields.
      #
      # Examples:
      #
      #     has_alphabeth novalidate: true
      #
      def setup_novalidate novalidate
         unless novalidate
            self.class_eval <<-RUBY
               validates :language_code, inclusion: { in: Languageble.language_list }
               validates :alphabeth_code, inclusion: {
                  in: proc { |l| Languageble.alphabeth_list_for( l.language_code ) } }
               RUBY
         end
      end
   end


   def language_for locales
      language&.names&.for(locales)
   end

   def alphabeth_for locales
      alphabeth&.names&.for(locales)
   end

   class << self
      def included base
         base.extend(ClassMethods)

         base.class_eval do
            validates :language_code, inclusion: { in: Languageble.language_list }
            validates :alphabeth_code, inclusion: { in: proc { |l| Languageble.alphabeth_list_for(l.language_code)}}
         end
      end

      # detect language/alphabeth pair for the string
      def la_for_string string
         scores =
            MATCH_TABLE.map do |(alphabeth, restr)|
               #binding.pry
               [string.split(%r{[^#{restr}]+}).join, alphabeth]
            end.group_by do |(string, _alphabeth)|
               string.size
            end.sort_by do |(weight, _)|
               weight
            end

         alphabeths = scores.last.last.transpose.last
         language = alphabeths.map {|a| ALPHABETH_TREE[a] }.flatten.compact.sort_by {|l| LANGUAGE_TREE.keys.index(l) }.first
         # binding.pry

         [language, (alphabeths & [LANGUAGE_TREE[language]].flatten).first ]
      end
   end
end