KanjiPad и KanjiDic — инструменты для работы с японскими иероглифами в Linux

В Linux Mint по умолчанию подключены репозитории Ubuntu. И именно в этих репозиториях я нашёл пару полезных инструментов.

KanjiPad

Свободный инструмент для рукописного ввода кандзи. Интересно, что он не добавляется в меню запуска программ в различных графических средах, а запускается из консоли командой kanjipad, но только в графическом режиме.

Скриншот KanjiPad

Окно KanjiPad состоит из рабочей области, панели меню, вертикальной панели с иероглифами и двух кнопок. Рабочая область предназначена для начертания иероглифов (необходимо соблюдать порядок черт, иначе KanjiPad не распознаст иероглиф, который Вы хотите написать). Ластика или чего-либо подобного не предусмотрено, только полное очищение рабочей области. Для очищения нажмите Ctrl+X на клавиатуре, нижнюю кнопку в правом-нижнем углу окна либо CharacterClear. Для распознания рукописного ввода нажмите Ctrl+L на клавиатуре, верхнюю кнопку в правом-нижнем углу окна либо CharacterLookup. Список найденных иероглифов выводится на панели справа. Чтобы перенести его в буфер обмена, нажмите Ctrl+C или EditCopy.

Если в меню Character включить функцию Annotate, то около черт иероглифа будут отображаться цифры, показывающие, в какой последовательности они были написаны.

Достоинства KanjiPad:

  1. Хоть какое-то средство для ввода кандзи без IME

Недостатки KanjiPad

  1. Не распознаёт некоторые иероглифы даже при правильном их написании (например, ни в какую не распознаёт иероглифы 私, 女, хотя более сложный для написания 愛 распознаёт нормально)
  2. Не добавляется в меню запуска
  3. Непонятно, зачем три меню, хотя на мой взгляд было бы достаточно одного
  4. Нет ластика, при любой ошибке приходится писать иероглиф заново
  5. Неудобно при написании предложений с большим количеством кандзи, проще использовать хирагану либо словари вроде Denshi Jisho или KanjiDic

KanjiDic

Японский иероглифический словарь в текстовом формате (хотя есть версия в xml). Чтобы скачать, установите пакет kanjidic, после чего зайдите в /var/cache/apt/archives, найдите там файл kanjidic_2012.05.09-1_all.deb и откройте его как архив. Сам словарь будет находиться в ./usr/share/edict под именем kanjidic.

После иероглифа даётся информация о нём в следующем формате:

  • B(число), C(число) — номера ключей, не уточнял, подробнее в документации
  • F(число) — частота употребления иероглифа
  • G(число) — дзёё-кандзи: G1G6 обозначают кёику-кандзи (иероглифы, которые изучаются в японской школе), G8 — общеупотребительные иероглифы, G9 — дзиммэйё-кандзи (иероглифы, которые используются в японских именах,)
  • S(число) — количество черт в иероглифе
  • U(код) — шестнадцатеричный код иероглифа в Unicode
  • W(чтение), Y(чтение) — чтение иероглифа в корейском и китайском соответственно

Приведены далеко не все обозначения KanjiDic.

После «закодированной» информации об иероглифе даются его чтения, записанные японскими слоговыми азбуками: сначала записывается он-ёми при помощи катаканы, после — кун-ёми, записанные хираганой. Знак дефиса используется для описания различных префиксов и суффиксов, в качестве которых может выступать тот или иной иероглиф, а знак точки — для описания возможных суффиксов, которые могут добавляться к самому описываемому иероглифу (подробнее см. в Википедии). Перед записью нанори-чтения ставится обозначение T1, а перед названием иероглифа как радикала (такое название не всегда является чтением) ставится обозначение T2. После чтений даётся значение иероглифа на английском. Каждое значение записывается в фигурных скобках.