Пакет: icu-devel
- Версия
- 77.1
- Релиз
- 1.niceos5
- Архитектура
- x86_64
- Хэш GOST
- 01908f8ab1229661756278dcc8465d47d0515c7af154a6b32a4c253a0798e2ec
- Хэш MD5
- 1185a05eb7c5ab11b5b854f1dd14f606
- Хэш SHA256
- 152d18c2dac81a34c29eefd69f972be796dedb6b31c8e3e59090dbb7fd585503
- Лицензия
- MIT и UCD и Public Domain
- Дата сборки
- 12 мая 2025 г.
- Размер
- 4,875 ГиБ
- Совместимые ОС
- rpm файл:
- icu-devel-77.1-1.niceos5.x86_64.rpm
Основной пакет
Этот подпакет входит в состав основного пакета: icu
Зависимости
| Имя | Тип | Версия |
|---|---|---|
| /bin/sh | runtime | - |
| icu | runtime | - |
| pkgconfig(icu-i18n) | runtime | - |
| pkgconfig(icu-uc) | runtime | - |
Граф зависимостей
Файлы пакета
-
-
- /usr/include/unicode 0 Б
-
-
- /usr/lib/libicudata.so 18 Б
- /usr/lib/libicui18n.so 18 Б
- /usr/lib/libicuio.so 16 Б
- /usr/lib/libicutest.so 18 Б
- /usr/lib/libicutu.so 16 Б
- /usr/lib/libicuuc.so 16 Б
-
- /usr/lib/pkgconfig/icu-i18n.pc 1,18 КиБ
- /usr/lib/pkgconfig/icu-io.pc 1,172 КиБ
- /usr/lib/pkgconfig/icu-uc.pc 1,184 КиБ
-
-
-
- /usr/share/icu 0 Б
- /usr/share/man 0 Б
-
-
Документация (man-страницы)
PKGDATA(1) ICU 77.1 Manual PKGDATA(1)
NAME
pkgdata - упаковка данных для использования в ICU
SYNOPSIS
pkgdata [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright | -C,
--comment comment ] [ -m, --mode mode ] -p, --name name -O, --bldopt
options [ -e, --entrypoint name ] [ -r, --revision version ] [ -F,
--rebuild ] [ -I, --install ] [ -s, --sourcedir source ] [ -d, --dest‐
dir destination ] [ -T, --tempdir directory ] [ file ... ]
DESCRIPTION
pkgdata берёт набор файлов данных и упаковывает их для использова‐
ния в ICU или приложениями, которые используют ICU. Типичная причина
для упаковки файлов с помощью pkgdata — упростить их распространение
и ускорить загрузку в ICU, а также снизить потребление ограниченных си‐
стемных ресурсов, таких как дескрипторы файлов. Упакованные данные так‐
же позволяют приложениям распространяться с меньшим количеством ре‐
сурсных файлов, или даже без них, если они напрямую связаны с упа‐
кованными данными.
pkgdata поддерживает несколько различных методов упаковки данных, ко‐
торые служат разным целям.
Режим упаковки по умолчанию — common, или archive. В этом режиме раз‐
личные файлы данных объединяются в файл, зависящий от архитектуры,
который позже может быть отображён в память для использования в ICU.
Данные, упакованные с помощью этого режима, будут искаться в ка‐
талоге данных ICU. Такая упаковка удобна для приложений, использующих
наборы ресурсов, например, при условии, что приложение может уста‐
новить упакованный файл в каталог данных ICU.
Другой режим упаковки — dll, или library, где файлы данных компилиру‐
ются в разделяемую библиотеку. ICU ранее могла динамически загру‐
жать эти разделяемые библиотеки, но начиная с ICU 2.0 такая поддержка
была удалена. Этот режим всё ещё полезен для двух основных целей: для
сборки ICU, так как данные ICU по умолчанию упаковываются как разде‐
ляемая библиотека; и для сборки наборов ресурсов, которые связа‐
ны с приложением, которое их использует. Такие наборы ресурсов могут
быть размещены в любом месте, где системный динамический линкер будет
искать разделяемые библиотеки, вместо того, чтобы быть ограниченными
каталогом данных ICU.
Режим статической упаковки похож на режим разделяемой библиотеки,
кроме того, что он производит статическую библиотеку.
Наконец, pkgdata поддерживает режим files, который просто копирует фа‐
йлы данных, вместо того, чтобы упаковывать их в один файл или
библиотеку. Этот режим в основном предназначен для предоставления под‐
держки сборки ICU до её упаковки в отдельные небольшие пакеты для
распространения с операционными системами, такими как Debian GNU/Linux,
например. Для дополнительной информации о использовании этого режима
обратитесь к документации по упаковке в исходной дистрибуции ICU.
pkgdata собирает, упаковывает, устанавливает или очищает соответ‐
ствующие данные на основе указанных опций, без необходимости вызова
GNU make.
OPTIONS
-h, -?, --help
Вывести справку по использованию и выйти.
-v, --verbose
Выводить дополнительные информационные сообщения во время вы‐
полнения.
-c, --copyright
Включить уведомление об авторском праве в двоичные данные.
-C, --comment comment
Включить указанный комментарий в результирующие данные вместо
уведомления об авторском праве ICU.
-m, --mode mode
Установить режим упаковки для использования pkgdata. Различные
режимы и их значения объяснены в разделе DESCRIPTION выше. Допу‐
стимые имена режимов: common (или archive), dll (или library)
и files.
-O, --bldopt options
Указать опции для сборщика. Сборщик используется внутренне в
pkgdata для генерации правильного упакованного файла. Такие
опции включают, но не ограничиваются, установкой переменных,
используемых make(1) во время сборки упакованного файла. При‐
мечание: Если icu-config доступен, то эта опция не нужна.
-p, --name name
Установить имя упакованного файла как name. Это имя также ис‐
пользуется как имя точки входа по умолчанию после преобразо‐
вания в допустимый идентификатор C.
-e, --entrypoint name
Установить точку входа данных (используется для связывания с
данными в форме разделяемой библиотеки) как name. Имя точки
входа по умолчанию — имя, установленное опцией -n, --name.
-r, --revision version
Включить версионирование разделяемой библиотеки, произведённой
в режиме dll или library. Номер версии имеет формат major.mi‐
nor.patchlevel, и все части, кроме major, являются опциональны‐
ми. Если указан только major, то версия считается major.0 для
целей версионирования.
-F, --rebuild
Принудительно перестроить все данные и их повторную упаковку.
-I, --install
Установить упакованный файл (или все файлы в режиме files). Ес‐
ли переменная DESTDIR установлена, она будет использована для
установки.
-s, --sourcedir source
Установить исходный каталог как source. Исходный каталог по умол‐
чанию — текущий каталог.
-d, --destdir destination
Установить целевой каталог как destination. Целевой каталог
по умолчанию — текущий каталог.
-T, --tempdir directory
Установить каталог для генерации временных файлов как directory.
Каталог для временных файлов по умолчанию — тот же, что и
целевой каталог, установленный опцией -d, --destdir.
AUTHORS
Steven Loomis
Yves Arrouye
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2009 IBM, Inc. и другие.
ICU MANPAGE 6 февраля 2009 PKGDATA(1)
PKGDATA(1) ICU 77.1 Manual PKGDATA(1)
NAME
pkgdata - package data for use by ICU
SYNOPSIS
pkgdata [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright | -C,
--comment comment ] [ -m, --mode mode ] -p, --name name -O, --bldopt
options [ -e, --entrypoint name ] [ -r, --revision version ] [ -F,
--rebuild ] [ -I, --install ] [ -s, --sourcedir source ] [ -d, --dest‐
dir destination ] [ -T, --tempdir directory ] [ file ... ]
DESCRIPTION
pkgdata takes a set of data files and packages them for use by ICU or
applications that use ICU. The typical reason to package files using
pkgdata is to make their distribution easier and their loading by ICU
faster and less consuming of limited system resources such as file de‐
scriptors. Packaged data also allow applications to be distributed
with fewer resource files, or even with none at all if they link
against the packaged data directly.
pkgdata supports a few different methods of packaging data that serve
different purposes.
The default packaging mode is common, or archive. In this mode, the
different data files are bundled together as an architecture-dependent
file that can later be memory mapped for use by ICU. Data packaged us‐
ing this mode will be looked up under the ICU data directory. Such
packaging is easy to use for applications resource bundles, for exam‐
ple, as long as the application can install the packaged file in the
ICU data directory.
Another packaging mode is the dll, or library, mode, where the data
files are compiled into a shared library. ICU used to be able to dynam‐
ically load these shared libraries, but as of ICU 2.0, such support has
been removed. This mode is still useful for two main purposes: to build
ICU itself, as the ICU data is packaged as a shared library by default;
and to build resource bundles that are linked to the application that
uses them. Such resource bundles can then be placed anywhere where the
system's dynamic linker will be looking for shared libraries, instead
of being forced to live inside the ICU data directory.
The static packaging mode is similar to the shared library one except
that it produces a static library.
Finally, pkgdata supports a files mode which simply copies the data
files instead of packaging them as a single file or library. This mode
is mainly intended to provide support for building ICU before it is
packaged as separate small packages for distribution with operating
systems such as Debian GNU/Linux for example. Please refer to the pack‐
aging documentation in the ICU source distribution for further informa‐
tion on the use of this mode.
pkgdata builds, packages, installs, or cleans the appropriate data
based on the options given without the need to call GNU make anymore.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-v, --verbose
Display extra informative messages during execution.
-c, --copyright
Include a copyright notice in the binary data.
-C, --comment comment
Includes the specified comment in the resulting data instead of
the ICU copyright notice.
-m, --mode mode
Set the packaging mode to be used by pkgdata. The different
modes and their meaning are explained in the DESCRIPTION section
above. The valid mode names are common (or archive), dll (or li‐
brary), and files.
-O, --bldopt options
Specify options for the builder. The builder is used internally
by pkgdata to generate the correct packaged file. Such options
include, but are not limited to, setting variables used by
make(1) during the build of the packaged file. Note: If icu-con‐
fig is available, then this option is not needed.
-p, --name name
Set the packaged file name to name. This name is also used as
the default entry point name after having been turned into a
valid C identifier.
-e, --entrypoint name
Set the data entry point (used for linking against the data in a
shared library form) to name. The default entry point name is
the name set by the -n, --name option.
-r, --revision version
Enable versioning of the shared library produced in dll, or li‐
brary, mode. The version number has the format major.mi‐
nor.patchlevel and all parts except for major are optional. If
only major is supplied then the version is assumed to be major.0
for versioning purposes.
-F, --rebuild
Force the rebuilding of all data and their repackaging.
-I, --install
Install the packaged file (or all the files in the files mode).
If the variable DESTDIR is set it will be used for installation.
-s, --sourcedir source
Set the source directory to source. The default source direc‐
tory is the current directory.
-d, --destdir destination
Set the destination directory to destination. The default des‐
tination directory is the current directory.
-T, --tempdir directory
Set the directory used to generate temporary files to directory.
The default temporary directory is the same as the destination
directory as set by the -d, --destdir option.
AUTHORS
Steven Loomis
Yves Arrouye
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2009 IBM, Inc. and others.
ICU MANPAGE 6 February 2009 PKGDATA(1)
GENCFU(1) ICU 77.1 Manual GENCFU(1)
NAME
gencfu - Генерирует файлы данных Unicode Confusable
SYNOPSIS
gencfu [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v,
--verbose ] [ -d, --destdir destination ] [ -i, --icudatadir directory
] -r, --rules rule-file -w, --wsrules whole-script-rule-file -o, --out
output-file
DESCRIPTION
gencfu читает определения запутанных символов в входном файле, которые
являются простыми текстовыми файлами, содержащими определения запутан‐
ных символов в формате ввода, определенном Unicode UAX39 для файлов confusables.txt и
confusablesWholeScript.txt. Этот исходный (.txt) формат также принимается
детекторами спуфинга ICU. Файлы должны быть закодированы в формате utf-8,
с BOM или без него. Нормально выходной файл данных имеет расширение .cfu.
OPTIONS
-h, -?, --help
Выводит справку по использованию и выходит.
-V, --version
Выводит версию gencfu и выходит.
-c, --copyright
Встраивает стандартный авторский текст ICU в выходной файл.
-v, --verbose
Отображает дополнительные информационные сообщения во время выполнения.
-d, --destdir destination
Устанавливает каталог назначения выходного файла в destination.
-i, --icudatadir directory
Ищет любые необходимые файлы данных ICU в каталоге. Например,
файл pnames.icu должен быть расположен, когда данные ICU не
построены как разделяемая библиотека. Каталог данных ICU по умолчанию
указывается переменной окружения ICU_DATA. Большинство конфигураций
ICU не требуют этого аргумента.
-r, --rules rule-file
Исходный файл для чтения.
-w, --wsrules whole-script-rule-file
Исходный файл для всего скрипта для чтения.
-o, --out output-file
Выходной файл данных для записи.
VERSION
1.0
COPYRIGHT
Авторские права (C) 2009 International Business Machines Corporation и
другие
ICU MANPAGE 24 May 2009 GENCFU(1)
GENCFU(1) ICU 77.1 Manual GENCFU(1)
NAME
gencfu - Generates Unicode Confusable data files
SYNOPSIS
gencfu [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v,
--verbose ] [ -d, --destdir destination ] [ -i, --icudatadir directory
] -r, --rules rule-file -w, --wsrules whole-script-rule-file -o, --out
output-file
DESCRIPTION
gencfu reads confusable character definitions in the input file, which
are plain text files containing confusable character definitions in the
input format defined by Unicode UAX39 for the files confusables.txt and
confusablesWholeScript.txt. This source (.txt) format is also accepted
by ICU spoof detectors. The files must be encoded in utf-8 format,
with or without a BOM. Normally the output data file has the .cfu ex‐
tension.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-V, --version
Print the version of gencfu and exit.
-c, --copyright
Embeds the standard ICU copyright into the output-file.
-v, --verbose
Display extra informative messages during execution.
-d, --destdir destination
Set the destination directory of the output-file to destination.
-i, --icudatadir directory
Look for any necessary ICU data files in directory. For exam‐
ple, the file pnames.icu must be located when ICU's data is not
built as a shared library. The default ICU data directory is
specified by the environment variable ICU_DATA. Most configura‐
tions of ICU do not require this argument.
-r, --rules rule-file
The source file to read.
-w, --wsrules whole-script-rule-file
The whole script source file to read.
-o, --out output-file
The output data file to write.
VERSION
1.0
COPYRIGHT
Copyright (C) 2009 International Business Machines Corporation and oth‐
ers
ICU MANPAGE 24 May 2009 GENCFU(1)
GENCNVAL(1) ICU 77.1 Manual GENCNVAL(1)
NAME
gencnval - компилировать файл псевдонимов преобразователей
SYNOPSIS
gencnval [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright ] [ -s,
--sourcedir source ] [ -d, --destdir destination ] [ converterfile ]
DESCRIPTION
gencnval преобразует файл псевдонимов ICU converterfile в двоичный файл
cnvalias.icu. Этот двоичный файл затем может быть прочитан напрямую ICU,
или использован pkgdata(1) для включения в больший архив или библиотеку.
Если converterfile не указан, используется файл convrtrs.txt по умолчанию
из ICU.
OPTIONS
-h, -?, --help
Вывести справку по использованию и выйти.
-v, --verbose
Выводить подробный вывод. Эта информация может включать
информацию о конфликтующих псевдонимах и преобразователях,
к которым разрешаются псевдонимы.
-c, --copyright
Включить уведомление об авторских правах в двоичные данные.
-s, --sourcedir source
Установить исходный каталог в source. Каталог по умолчанию
определяется переменной среды ICU_DATA.
-d, --destdir destination
Установить целевой каталог в destination. Каталог по умолчанию
определяется переменной среды ICU_DATA.
ENVIRONMENT
ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию
/usr/share/icu/77.1/. Некоторые инструменты в ICU зависят от
наличия завершающего слеша. Поэтому важно убедиться, что он
присутствует, если ICU_DATA задана.
FILES
icu/source/data/mappings/convrtrs.txt Описание преобразователей ICU
и их псевдонимов. Этот файл данных
обычно не устанавливается и
доступен как часть исходного кода
ICU.
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2004 IBM, Inc. и другие.
SEE ALSO
pkgdata(1)
РУКОВОДСТВО ICU 11 марта 2004 GENCNVAL(1)
GENCNVAL(1) ICU 77.1 Manual GENCNVAL(1)
NAME
gencnval - compile the converters aliases file
SYNOPSIS
gencnval [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright ] [ -s,
--sourcedir source ] [ -d, --destdir destination ] [ converterfile ]
DESCRIPTION
gencnval converts the ICU aliases file converterfile into the binary
file cnvalias.icu. This binary file can then be read directly by ICU,
or used by pkgdata(1) for incorporation into a larger archive or li‐
brary.
If converterfile is not provided, the default ICU convrtrs.txt file is
used.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-v, --verbose
Display verbose output. This information can include information
about conflicting aliases and the converters the aliases resolve
to.
-c, --copyright
Include a copyright notice in the binary data.
-s, --sourcedir source
Set the source directory to source. The default source direc‐
tory is specified by the environment variable ICU_DATA.
-d, --destdir destination
Set the destination directory to destination. The default des‐
tination directory is specified by the environment variable
ICU_DATA.
ENVIRONMENT
ICU_DATA Specifies the directory containing ICU data. Defaults to
/usr/share/icu/77.1/. Some tools in ICU depend on the pres‐
ence of the trailing slash. It is thus important to make sure
that it is present if ICU_DATA is set.
FILES
icu/source/data/mappings/convrtrs.txt Description of ICU's converters
and their aliases. This data
file is not normally installed,
and it is available as a part
of ICU source code.
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2004 IBM, Inc. and others.
SEE ALSO
pkgdata(1)
ICU MANPAGE 11 March 2004 GENCNVAL(1)
GENRB(1) ICU 77.1 Manual GENRB(1)
NAME
genrb - компилировать пакет ресурсов
SYNOPSIS
genrb [ -h, -?, --help ] [ -V, --version ] [ -v, --verbose ] [ -e,
--encoding encoding ] [ -j, --write-java [ encoding ] ] [ -s,
--sourcedir source ] [ -d, --destdir destination ] [ -i, --icudatadir
directory ] bundle ...
DESCRIPTION
genrb преобразует исходные файлы пакетов ресурсов, указанные в командной
строке, в их двоичный формат или в файл исходного кода Java для использования
с ICU4J. Полученные двоичные файлы имеют расширение .res, в то время как
исходные файлы пакетов ресурсов обычно имеют расширение .txt. Файлы
исходного кода Java имеют расширение .java и следуют соглашениям об именовании
ICU4J.
Традиционно пакеты ресурсов называют по имени локали, т. е. используют
идентификатор локали для имени файла пакета, например ja_JP.txt для данных
на японском языке (Япония) или root.txt для корневого пакета. В любом случае,
genrb создаст файл, базовое имя которого соответствует имени локали, найденной
в файле ресурсов, а не базовому имени самого файла ресурсов.
Двоичные файлы могут быть прочитаны напрямую ICU или использованы с pkgdata(1)
для включения в больший архив или библиотеку.
OPTIONS
-h, -?, --help
Вывести справку по использованию и выйти.
-V, --version
Вывести версию genrb и выйти.
-v, --verbose
Отобразить дополнительные информационные сообщения во время выполнения.
-e, --encoding encoding
Установить кодировку для чтения входных файлов как encoding. Кодировка
по умолчанию — инвариантная (подмножество ASCII или EBCDIC) кодовая
страница системы (см. раздел INVARIANT CHARACTERS). Кодировки UTF-8,
UTF-16BE и UTF-16LE определяются автоматически, если присутствует
метка порядка байтов (BOM).
-j, --write-java [ encoding ]
Создать исходный код Java для использования с ICU4J. Можно указать
необязательную кодировку для файла Java.
-s, --sourcedir source
Установить исходный каталог как source. Исходный каталог по умолчанию
задается переменной окружения ICU_DATA или местоположением, установленным
при сборке ICU, если ICU_DATA не задана.
-d, --destdir destination
Установить каталог назначения как destination. Каталог назначения по
умолчанию задается переменной окружения ICU_DATA или местоположением,
установленным при сборке ICU, если ICU_DATA не задана.
-i, --icudatadir directory
Искать необходимые файлы данных ICU в каталоге directory. Например,
при обработке переопределений сортировки файл ucadata.dat должен быть
расположен. Каталог данных ICU по умолчанию задается переменной
окружения ICU_DATA.
INVARIANT CHARACTERS
Инвариантный набор символов состоит из следующих символов, выраженных как
стандартное POSIX-регулярное выражение: [a-z]|[A-Z]|[0-9]|_| |+|-|*|/ .
Это набор, который гарантированно доступен независимо от кодовой страницы.
ENVIRONMENT
ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию —
/usr/share/icu/77.1/. Некоторые инструменты ICU зависят от
наличия завершающего слеша. Поэтому важно убедиться, что он
присутствует, если задана ICU_DATA.
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2002 IBM, Inc. and others.
SEE ALSO
derb(1)
pkgdata(1)
ICU MANPAGE 16 April 2002 GENRB(1)
GENRB(1) ICU 77.1 Manual GENRB(1)
NAME
genrb - compile a resource bundle
SYNOPSIS
genrb [ -h, -?, --help ] [ -V, --version ] [ -v, --verbose ] [ -e,
--encoding encoding ] [ -j, --write-java [ encoding ] ] [ -s,
--sourcedir source ] [ -d, --destdir destination ] [ -i, --icudatadir
directory ] bundle ...
DESCRIPTION
genrb converts the resource bundle source files passed on the command
line to their binary form or to a Java source file for use with ICU4J.
The resulting binary files have a .res extension while resource bundle
source files typically have a .txt extension. Java source files have a
java extension and follow the ICU4J naming conventions.
It is customary to name the resource bundles by their locale name, i.e.
to use a local identifier for the bundle filename, e.g. ja_JP.txt for
Japanese (Japan) data, or root.txt for the root bundle. In any case,
genrb will produce a file whose base name is the name of the locale
found in the resource file, not the base name of the resource file it‐
self.
The binary files can be read directly by ICU, or used by pkgdata(1) for
incorporation into a larger archive or library.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-V, --version
Print the version of genrb and exit.
-v, --verbose
Display extra informative messages during execution.
-e, --encoding encoding
Set the encoding used to read input files to encoding. The de‐
fault encoding is the invariant (subset of ASCII or EBCDIC)
codepage for the system (see section INVARIANT CHARACTERS). The
encodings UTF-8, UTF-16BE, and UTF-16LE are automatically de‐
tected if a byte order mark (BOM) is present.
-j, --write-java [ encoding ]
Generate a Java source code for use with ICU4J. An optional en‐
coding for the Java file can be given.
-s, --sourcedir source
Set the source directory to source. The default source direc‐
tory is specified by the environment variable ICU_DATA, or the
location set when ICU was built if ICU_DATA is not set.
-d, --destdir destination
Set the destination directory to destination. The default des‐
tination directory is specified by the environment variable
ICU_DATA or is the location set when ICU was built if ICU_DATA
is not set.
-i, --icudatadir directory
Look for any necessary ICU data files in directory. For exam‐
ple, when processing collation overrides, the file ucadata.dat
must be located. The default ICU data directory is specified by
the environment variable ICU_DATA.
INVARIANT CHARACTERS
The invariant character set consists of the following set of charac‐
ters, expressed as a standard POSIX regular expression: [a-z]|[A-
Z]|[0-9]|_| |+|-|*|/. This is the set which is guaranteed to be avail‐
able regardless of code page.
ENVIRONMENT
ICU_DATA Specifies the directory containing ICU data. Defaults to
/usr/share/icu/77.1/. Some tools in ICU depend on the pres‐
ence of the trailing slash. It is thus important to make sure
that it is present if ICU_DATA is set.
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2002 IBM, Inc. and others.
SEE ALSO
derb(1)
pkgdata(1)
ICU MANPAGE 16 April 2002 GENRB(1)
MAKECONV(1) ICU 77.1 Manual MAKECONV(1)
NAME
icuexportdata - Записывает текстовые файлы с данными свойств Unicode из
ICU.
ICU MANPAGE 12 June 2021 MAKECONV(1)
MAKECONV(1) ICU 77.1 Manual MAKECONV(1)
NAME
icuexportdata - Writes text files with Unicode properties data from
ICU.
ICU MANPAGE 12 June 2021 MAKECONV(1)
DERB(1) ICU 77.1 Manual DERB(1)
NAME
derb - разобрать resource bundle
SYNOPSIS
derb [ -h, -?, --help ] [ -V, --version ] [ -v, --verbose ] [ -e, --en‐
coding encoding ] [ --bom ] [ -t, --truncate [ size ] ] [ -s,
--sourcedir source ] [ -d, --destdir destination ] [ -i, --icudatadir
directory ] [ -c, --to-stdout ] bundle ...
DESCRIPTION
derb читает скомпилированные файлы resource bundle, переданные в командной
строке, и записывает их обратно в текстовую форму. Полученные текстовые
файлы имеют расширение .txt, в то время как исходные файлы скомпилированных
resource bundle обычно имеют расширение .res.
Принято называть resource bundle по имени локали, то есть использовать
идентификатор локали для имени файла пакета, например ja_JP.res для
данных на японском языке (Япония) или root.res для корневого пакета. Это
особенно важно для derb, поскольку имя локали недоступно напрямую из
скомпилированного resource bundle, и для того, чтобы знать, какую локаль
запрашивать при открытии пакета. derb создаст файл, базовое имя которого
совпадает с базовым именем скомпилированного файла resource. Если
используется опция --to-stdout или -c, то текст будет записан в стандартный
вывод.
OPTIONS
-h, -?, --help
Вывести справку по использованию и выйти.
-V, --version
Вывести версию derb и выйти.
-v, --verbose
Выводить дополнительные информационные сообщения во время
выполнения.
-A, --suppressAliases
Не следовать за алиасами при формировании вывода.
-e, --encoding encoding
Установить кодировку, используемую для записи выходных файлов,
равной encoding. Кодировка по умолчанию — инвариантная
(подмножество ASCII или EBCDIC) кодовая страница системы (см.
раздел INVARIANT CHARACTERS). Выбор кодировки не влияет на
данные, а только на их представление. Символы, которые нельзя
представить в кодировке, будут представлены с помощью последовательностей
\uhhhh.
--bom Записать метку порядка байтов (BOM) в начале файла.
-l, --locale locale
Установить локаль для resource bundle, которая используется как
в генерируемом тексте, так и в качестве базового имени выходного
файла.
-t, --truncate [ size ]
Обрезать индивидуальные ресурсы (строки или бинарные данные) до
size байтов. Значение по умолчанию, если size не указано, — 80
байтов.
-s, --sourcedir source
Установить исходный каталог на source. Исходный каталог по
умолчанию — текущий каталог. Если для source передано -, то
пакет будет искаться в его расположении по умолчанию, указанном
переменной окружения ICU_DATA (или в расположении, установленном
при сборке ICU, если ICU_DATA не установлена).
-d, --destdir destination
Установить целевой каталог на destination. Целевой каталог по
умолчанию указывается переменной окружения ICU_DATA или
расположением, установленным при сборке ICU, если ICU_DATA не
установлена.
-i, --icudatadir directory
Искать необходимые файлы данных ICU в каталоге directory. Например,
при обработке переопределений сортировки файл ucadata.dat должен
быть расположен. Каталог данных ICU по умолчанию указывается
переменной окружения ICU_DATA.
-c, --to-stdout
Записать разобранный пакет в стандартный вывод вместо файла.
CAVEATS
При использовании опции --bom символ U+FEFF записывается в кодировке
назначения независимо от того, является ли это форматом преобразования
Unicode (UTF) или нет. Эта опция должна использоваться только с
кодировкой UTF, поскольку метки порядка байтов не имеют смысла для других
кодировок.
INVARIANT CHARACTERS
Множество инвариантных символов состоит из следующего набора символов,
выраженного как стандартное регулярное выражение POSIX: [a-z]|[A-
Z]|[0-9]|_| |+|-|*|. Это набор, который гарантированно доступен
независимо от кодовой страницы.
ENVIRONMENT
ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию —
/usr/share/icu/77.1/. Некоторые инструменты в ICU зависят от
наличия завершающего слеша. Поэтому важно убедиться, что он
присутствует, если ICU_DATA установлена.
AUTHORS
Vladimir Weinstein
Yves Arrouye
VERSION
1.0
COPYRIGHT
Copyright (C) 2002 IBM, Inc. and others.
SEE ALSO
genrb(1)
ICU Страница руководства 7 Mar 2014 DERB(1)
DERB(1) ICU 77.1 Manual DERB(1)
NAME
derb - disassemble a resource bundle
SYNOPSIS
derb [ -h, -?, --help ] [ -V, --version ] [ -v, --verbose ] [ -e, --en‐
coding encoding ] [ --bom ] [ -t, --truncate [ size ] ] [ -s,
--sourcedir source ] [ -d, --destdir destination ] [ -i, --icudatadir
directory ] [ -c, --to-stdout ] bundle ...
DESCRIPTION
derb reads the compiled resource bundle files passed on the command
line and write them back in text form. The resulting text files have a
.txt extension while compiled resource bundle source files typically
have a .res extension.
It is customary to name the resource bundles by their locale name, i.e.
to use a local identifier for the bundle filename, e.g. ja_JP.res for
Japanese (Japan) data, or root.res for the root bundle. This is espe‐
cially important for derb since the locale name is not accessible di‐
rectly from the compiled resource bundle, and to know which locale to
ask for when opening the bundle. derb will produce a file whose base
name is the base name of the compiled resource file itself. If the
--to-stdout, -c option is used, however, the text will be written on
the standard output.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-V, --version
Print the version of derb and exit.
-v, --verbose
Display extra informative messages during execution.
-A, --suppressAliases
Don't follow aliases when producing output.
-e, --encoding encoding
Set the encoding used to write output files to encoding. The
default encoding is the invariant (subset of ASCII or EBCDIC)
codepage for the system (see section INVARIANT CHARACTERS). The
choice of the encoding does not affect the data, just their rep‐
resentation. Characters that cannot be represented in the encod‐
ing will be represented using \uhhhh escape sequences.
--bom Write a byte order mark (BOM) at the beginning of the file.
-l, --locale locale
Set the locale for the resource bundle, which is used both in
the generated text and as the base name of the output file.
-t, --truncate [ size ]
Truncate individual resources (strings or binary data) to size
bytes. The default if size is not specified is 80 bytes.
-s, --sourcedir source
Set the source directory to source. The default source direc‐
tory is the current directory. If - is passed for source, then
the bundle will be looked for in its default location, specified
by the ICU_DATA environment variable (or defaulting to the loca‐
tion set when ICU was built if ICU_DATA is not set).
-d, --destdir destination
Set the destination directory to destination. The default des‐
tination directory is specified by the environment variable
ICU_DATA or is the location set when ICU was built if ICU_DATA
is not set.
-i, --icudatadir directory
Look for any necessary ICU data files in directory. For exam‐
ple, when processing collation overrides, the file ucadata.dat
must be located. The default ICU data directory is specified by
the environment variable ICU_DATA.
-c, --to-stdout
Write the disassembled bundle on standard output instead of into
a file.
CAVEATS
When the option --bom is used, the character U+FEFF is written in the
destination encoding regardless of whether it is a Unicode transforma‐
tion format (UTF) or not. This option should only be used with an UTF
encoding, as byte order marks are not meaningful for other encodings.
INVARIANT CHARACTERS
The invariant character set consists of the following set of charac‐
ters, expressed as a standard POSIX regular expression: [a-z]|[A-
Z]|[0-9]|_| |+|-|*|/. This is the set which is guaranteed to be avail‐
able regardless of code page.
ENVIRONMENT
ICU_DATA Specifies the directory containing ICU data. Defaults to
/usr/share/icu/77.1/. Some tools in ICU depend on the pres‐
ence of the trailing slash. It is thus important to make sure
that it is present if ICU_DATA is set.
AUTHORS
Vladimir Weinstein
Yves Arrouye
VERSION
1.0
COPYRIGHT
Copyright (C) 2002 IBM, Inc. and others.
SEE ALSO
genrb(1)
ICU MANPAGE 7 Mar 2014 DERB(1)
MAKECONV(1) ICU 77.1 Manual MAKECONV(1)
NAME
makeconv - компилировать таблицу конвертера
SYNOPSIS
makeconv [ -h, -?, --help ] [ -c, --copyright ] [ -v, --verbose ] [ -d,
--destdir destination ] convertertable ...
DESCRIPTION
makeconv преобразует таблицу конвертера ICU convertertable в двоичный
файл. Двоичный файл имеет то же базовое имя, что и convertertable, но с
расширением .cnv (вместо типичного расширения .ucm файла convert‐
ertable). Этот двоичный файл затем может быть прочитан напрямую ICU или
использован pkgdata(1) для включения в больший архив или библиотеку.
Таблица convertertable должна быть в формате ICU ucm (Unicode Codepage
Mapping), чтобы makeconv могла её понять. Формат ICU ucm похож на
файлы IBM NLTC upmap/tpmap/rpmap. Комментарии в таблице convertertable
обрабатываются следующим образом. Если комментарий (начинающийся с
символа `#') после какого-то текста содержит индикатор отката `|', то
игнорируется только текст, начинающийся с символа `#', и заканчивающийся
перед символом `|'. В противном случае, или если комментарий является
первым элементом на строке, комментарий идёт до конца строки. Эта
особая обработка комментариев предназначена для поддержки практики
размещения информации об откате в комментариях в строгом формате IBM
NLTC ucmap.
Обратите внимание, что новые конвертеры будут автоматически найдены ICU
после их установки в каталог данных ICU. Им не нужно перечислять в
файле convrtrs.txt(5) с алиасами конвертеров, чтобы они были доступны
приложениям, использующим ICU. Однако, если нужно присвоить им
алиасы или теги, то их следует перечислить там.
OPTIONS
-h, -?, --help
Вывести справку по использованию и выйти.
-c, --copyright
Включить уведомление об авторских правах в двоичные данные.
-v, --verbose
Выводить дополнительные информационные сообщения во время
выполнения.
-d, --destdir destination
Установить каталог назначения в destination. Каталог
назначения по умолчанию указывается переменной окружения
ICU_DATA.
CAVEATS
Если существующая таблица конвертера изменена и перекомпилирована с
помощью makeconv, полученный двоичный файл должен быть упакован так же,
как он был упакован изначально. Например, если конвертеры были сгруппированы
вместе в архиве или библиотеке с помощью pkgdata(1), то архив или
библиотека должны быть перестроены с новым двоичным файлом. Отдельный
двоичный файл конвертера не будет иметь приоритета над упакованным.
ENVIRONMENT
ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию
это /usr/share/icu/77.1/. Некоторые инструменты в ICU
зависят от наличия завершающего слеша. Поэтому важно
убедиться, что он присутствует, если ICU_DATA задана.
VERSION
77.1
COPYRIGHT
Copyright (C) 2000 IBM, Inc. and others.
SEE ALSO
convrtrs.txt(5)
pkgdata(1)
ICU MANPAGE 16 April 2002 MAKECONV(1)
MAKECONV(1) ICU 77.1 Manual MAKECONV(1)
NAME
makeconv - compile a converter table
SYNOPSIS
makeconv [ -h, -?, --help ] [ -c, --copyright ] [ -v, --verbose ] [ -d,
--destdir destination ] convertertable ...
DESCRIPTION
makeconv converts the ICU converter table convertertable into a binary
file. The binary file has the same base name as convertertable but has
a .cnv extension (instead of the typical .ucm extension of the convert‐
ertable file). This binary file can then be read directly by ICU, or
used by pkgdata(1) for incorporation into a larger archive or library.
The convertertable must be in the ICU ucm (Unicode Codepage Mapping)
format in order to be understood by makeconv. The ICU ucm format is
similar to the IBM NLTC upmap/tpmap/rpmap files. Comments in the con‐
vertertable are handled as follows. If a comment (starting with a `#'
sign) that is after some text does contain the fallback indicator `|'
then only the text starting with the `#' sign, and ending before the
`|' sign, is ignored. Otherwise, or if the comment is the first thing
on the line, the comment runs up to the end of the line. This special
handling of comments is to accommodate the practice of putting fallback
information in comments in the strict IBM NLTC ucmap format.
Note that new converters will be automatically found by ICU after their
installation in ICU's data directory. They do not need to be listed in
the convrtrs.txt(5) converters aliases file in order to be available to
applications using ICU. They do need to be listed there if one wants
to give them aliases, or tags, though.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-c, --copyright
Include a copyright notice in the binary data.
-v, --verbose
Display extra informative messages during execution.
-d, --destdir destination
Set the destination directory to destination. The default des‐
tination directory is specified by the environment variable
ICU_DATA.
CAVEATS
If an existing converter table is changed and recompiled using make‐
conv, the resulting binary file must be packaged in the same way that
it was packaged initially. For example, if converters were grouped to‐
gether in an archive or a library with pkgdata(1), then the archive or
library must be rebuilt with the new binary file. A standalone binary
converter file will not take precedence over a packaged one.
ENVIRONMENT
ICU_DATA Specifies the directory containing ICU data. Defaults to
/usr/share/icu/77.1/. Some tools in ICU depend on the pres‐
ence of the trailing slash. It is thus important to make sure
that it is present if ICU_DATA is set.
VERSION
77.1
COPYRIGHT
Copyright (C) 2000 IBM, Inc. and others.
SEE ALSO
convrtrs.txt(5)
pkgdata(1)
ICU MANPAGE 16 April 2002 MAKECONV(1)
gensprep(8) Руководство ICU 77.1 gensprep(8)
NAME
gensprep - компилирует данные StringPrep из файлов, отфильтрованных
filter-RFC3454.pl
SYNOPSIS
gensprep [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright ] [ -s,
--sourcedir source ] [ -d, --destdir destination ]
DESCRIPTION
gensprep читает отфильтрованные файлы RFC 3454 и компилирует их информацию
в бинарную форму. Полученный файл, <name>.icu, может быть прочитан
напрямую ICU или использован pkgdata(8) для включения в больший архив или
библиотеку.
Файлы, читаемые gensprep, описаны в разделе FILES.
OPTIONS
-h, -?, --help
Выводит справку по использованию и выходит.
-v, --verbose
Выводит дополнительные информационные сообщения во время
выполнения.
-c, --copyright
Включает уведомление об авторских правах в бинарные данные.
-s, --sourcedir source
Устанавливает исходный каталог в source. Каталог по умолчанию
указывается переменной среды ICU_DATA.
-d, --destdir destination
Устанавливает каталог назначения в destination. Каталог
назначения по умолчанию указывается переменной среды ICU_DATA.
ENVIRONMENT
ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию
/usr/share/icu/77.1/. Некоторые инструменты в ICU зависят от
наличия завершающего слеша. Поэтому важно убедиться, что он
присутствует, если ICU_DATA установлена.
FILES
Следующие файлы читаются gensprep и ищутся в каталоге source /misc для
файлов rfc3454_*.txt и в source /unidata для NormalizationCorrections.txt.
rfc3453_A_1.txt Содержит список неподанных кодовых точек в версии
Unicode 3.2.0....
rfc3454_B_1.txt Содержит список кодовых точек, которые обычно
отображаются как ничего....
rfc3454_B_2.txt Содержит список отображений для преобразования
регистра кодовых точек при указании нормализации
формы NFKC....
rfc3454_C_X.txt Содержит список кодовых точек, которые запрещены
для IDNA.
NormalizationCorrections.txt
Содержит список кодовых точек, нормализация которых
изменилась с версии Unicode 3.2.0.
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2002 IBM, Inc. и другие.
SEE ALSO
pkgdata(8)
РУКОВОДСТВО ICU 18 марта 2003 gensprep(8)
gensprep(8) ICU 77.1 Manual gensprep(8)
NAME
gensprep - compile StringPrep data from files filtered by filter‐
RFC3454.pl
SYNOPSIS
gensprep [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright ] [ -s,
--sourcedir source ] [ -d, --destdir destination ]
DESCRIPTION
gensprep reads filtered RFC 3454 files and compiles their information
into a binary form. The resulting file, <name>.icu, can then be read
directly by ICU, or used by pkgdata(8) for incorporation into a larger
archive or library.
The files read by gensprep are described in the FILES section.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-v, --verbose
Display extra informative messages during execution.
-c, --copyright
Include a copyright notice into the binary data.
-s, --sourcedir source
Set the source directory to source. The default source direc‐
tory is specified by the environment variable ICU_DATA.
-d, --destdir destination
Set the destination directory to destination. The default des‐
tination directory is specified by the environment variable
ICU_DATA.
ENVIRONMENT
ICU_DATA Specifies the directory containing ICU data. Defaults to
/usr/share/icu/77.1/. Some tools in ICU depend on the pres‐
ence of the trailing slash. It is thus important to make sure
that it is present if ICU_DATA is set.
FILES
The following files are read by gensprep and are looked for in the
source /misc for rfc3454_*.txt files and in source /unidata for Normal‐
izationCorrections.txt.
rfc3453_A_1.txt Contains the list of unassigned codepoints in Uni‐
code version 3.2.0....
rfc3454_B_1.txt Contains the list of code points that are commonly
mapped to nothing....
rfc3454_B_2.txt Contains the list of mappings for casefolding of
code points when Normalization form NFKC is speci‐
fied....
rfc3454_C_X.txt Contains the list of code points that are prohib‐
ited for IDNA.
NormalizationCorrections.txt
Contains the list of code points whose normaliza‐
tion has changed since Unicode Version 3.2.0.
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2002 IBM, Inc. and others.
SEE ALSO
pkgdata(8)
ICU MANPAGE 18 March 2003 gensprep(8)
GENCCODE(8) ICU 77.1 Manual GENCCODE(8)
NAME
genccode - генерировать C-код или платформо-специфичный код
ассемблера из файла данных ICU.
SYNOPSIS
genccode [ -h, -?, --help ] [ -a, --assembly name ] [ -d, --destdir
destination ] [ -n, --name name ] [ -e, --entrypoint name ] [ -f,
--filename name ] [ filename ... ]
DESCRIPTION
genccode читает каждый из предоставленных файлов и выводит C-файл,
содержащий компилируемое определение данных из файла данных. Имя
C-файла формируется путём взятия базового имени файла данных,
замены точек на подчёркивания и добавления расширения .c.
Если используется опция -a, генерируется платформо-специфичный код
ассемблера вместо C-кода. Большинство компиляторов C принимают как
файлы C, так и файлы ассемблера. Вместо записи файла с расширением .c
будет записан файл с расширением .s.
Если genccode вызывается без указания файла, он завершает работу
корректно.
OPTIONS
-h, -?, --help
Вывести справку по использованию и выйти.
-a, --assembly name
Выводить код ассемблера вместо C-кода. Используйте -h, чтобы
увидеть список доступных типов ассемблера для генерации и
указать для этой опции.
-d, --destdir destination
Установить каталог назначения на destination. Каталог
назначения по умолчанию — текущий каталог.
-n, --name name
Установить имя данных на name вместо значения по умолчанию.
Это имя также используется в качестве базового имени вывода.
Имя по умолчанию состоит из префикса icudt, за которым следует
двухзначный номер версии, соответствующий текущей версии релиза
ICU, и одной буквы, указывающей эндянность данных (буква b
обозначает big endian, а буква l — little endian).
-f, --filename name
Обычно файл данных ICU, например mydata.icu, преобразуется в
mydata_icu.c и mydata_icu.o. Однако, если этот параметр
установлен на "somedata", выходные файлы будут somedata.o и
somedata.c соответственно.
-e, --entrypoint name
Установить точку входа данных (используется для связывания с
данными в форме разделяемой библиотеки) на name. Имя точки
входа по умолчанию состоит из имени данных (установленного
опцией -n, --name) за которым следует подчёркивание и тип
данных (установленный опцией -t, --type).
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2004 IBM, Inc. and others.
ICU MANPAGE 11 March 2004 GENCCODE(8)
GENCCODE(8) ICU 77.1 Manual GENCCODE(8)
NAME
genccode - generate C or platform specific assembly code from an ICU
data file.
SYNOPSIS
genccode [ -h, -?, --help ] [ -a, --assembly name ] [ -d, --destdir
destination ] [ -n, --name name ] [ -e, --entrypoint name ] [ -f,
--filename name ] [ filename ... ]
DESCRIPTION
genccode reads each of the supplied filename and writes out a C file
containing a compilable definition of the data in the data file. The C
file name is made by taking the base name of the data filename, replac‐
ing dots by underscores, and adding a .c file extension.
If the -a option is used, platform specific assembly code is generated
instead of C code. Most C compilers will accept both C and assembly
files. Instead of writing a filename with a .c file extension, a file‐
name with a .s will be written instead.
If genccode is called with no filename it terminates gracefully.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-a, --assembly name
Output assembly code instead of C code. Use -h to see the list
of available types of assembly to generate and to specify for
this option.
-d, --destdir destination
Set the destination directory to destination. The default des‐
tination directory is the current directory.
-n, --name name
Set the data name to name instead of the default. This name is
also used as the base name of the output. The default name is
made of the icudt prefix, followed by a two-digit version number
corresponding to the current version of the ICU release, and a
single letter indicating the endianness of the data (the letter
b indicated big endian data, and the letter l indicates little
endian ones).
-f, --filename name
Normally, an ICU data file such as mydata.icu will be turned
into mydata_icu.c and mydata_icu.o. However, if this parameter
was set to "somedata", the output files will be somedata.o and
somedata.c, respectively.
-e, --entrypoint name
Set the data entry point (used for linking against the data in a
shared library form) to name. The default entry point name is
made of the data (set by the -n, --name option) followed by an
underscore and the type of the data (set by the -t, --type op‐
tion).
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2004 IBM, Inc. and others.
ICU MANPAGE 11 March 2004 GENCCODE(8)
GENCMN(8) ICU 77.1 Manual GENCMN(8)
NAME
gencmn - сгенерировать файл данных ICU, который можно отобразить в память
SYNOPSIS
gencmn [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright | -C,
--comment comment ] [ -d, --destdir destination ] [ -n, --name name ] [
-t, --type fileext ] [ -S, --source ] [ -e, --entrypoint name ] maxsize
[ listfilename ]
DESCRIPTION
gencmn принимает набор файлов и упаковывает их в файл данных ICU, который
можно отобразить в память. Полученный файл данных затем может быть
использован напрямую ICU.
gencmn читает список файлов для упаковки либо из указанного файла
listfilename, либо из стандартного вывода. Он упаковывает все файлы
из списка, которые не превышают maxsize байт, за исключением случая,
когда maxsize равно 0, что указывает на отсутствие ограничения по размеру
файлов.
OPTIONS
-h, -?, --help
Вывести справку по использованию и выйти.
-v, --verbose
Выводить дополнительные информационные сообщения во время
выполнения.
-c,--copyright
Включить уведомление об авторских правах ICU в результирующие
данные.
-C, --comment comment
Включить указанный комментарий в результирующие данные вместо
уведомления об авторских правах ICU.
-d, --destdir destination
Установить каталог назначения на destination. Каталог
назначения по умолчанию указывается переменной окружения
ICU_DATA.
-n, --name name
Установить имя данных как name вместо значения по умолчанию.
Это имя также используется в качестве базового имени вывода.
Имя по умолчанию состоит из префикса icudt, за которым следует
двухзначный номер версии, соответствующий текущей версии релиза
ICU, и одиночная буква, указывающая эндянность данных (буква b
указывает на big endian данные, а буква l — на little endian).
-t, --type type
Использовать type в качестве типа данных. Этот тип также
используется в качестве расширения для сгенерированного файла
данных. Тип по умолчанию — dat.
-S, --source
Записать файл исходного кода C с таблицей содержимого данных.
-e, --entrypoint name
Установить точку входа данных (используется для связывания с
данными в форме разделяемой библиотеки) как name. Имя точки
входа по умолчанию состоит из имени данных (установленного
опцией -n, --name), за которым следует подчеркивание и тип
данных (установленный опцией -t, --type).
ENVIRONMENT
ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию
/usr/share/icu/77.1/. Некоторые инструменты в ICU зависят от
наличия завершающего слеша. Поэтому важно убедиться, что он
присутствует, если ICU_DATA задана.
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2001 IBM, Inc. and others.
SEE ALSO
decmn(8)
ICU MANPAGE 5 November 2001 GENCMN(8)
GENCMN(8) ICU 77.1 Manual GENCMN(8)
NAME
gencmn - generate an ICU memory-mappable data file
SYNOPSIS
gencmn [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright | -C,
--comment comment ] [ -d, --destdir destination ] [ -n, --name name ] [
-t, --type fileext ] [ -S, --source ] [ -e, --entrypoint name ] maxsize
[ listfilename ]
DESCRIPTION
gencmn takes a set of files and packages them as an ICU memory-mappable
data file. The resulting data file can then be used directly by ICU.
gencmn reads a list of files to be packaged from either the supplied
listfilename file, or from its standard output. It packages all the
files from the list that are not bigger than maxsize bytes, except if
maxsize is 0, which indicates that there is no size limit on files.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-v, --verbose
Display extra informative messages during execution.
-c,--copyright
Include the ICU copyright notice in the resulting data.
-C, --comment comment
Include the specified comment in the resulting data instead of
the ICU copyright notice.
-d, --destdir destination
Set the destination directory to destination. The default des‐
tination directory is specified by the environment variable
ICU_DATA.
-n, --name name
Set the data name to name instead of the default. This name is
also used as the base name of the output. The default name is
made of the icudt prefix, followed by a two-digit version number
corresponding to the current version of the ICU release, and a
single letter indicating the endianness of the data (the letter
b indicated big endian data, and the letter l indicates little
endian ones).
-t, --type type
Use type as the type of the data. This type is also used as the
extension of the generated data file. The default type ie dat.
-S, --source
Write a C source file with the table of contents of the data.
-e, --entrypoint name
Set the data entry point (used for linking against the data in a
shared library form) to name. The default entry point name is
made of the data (set by the -n, --name option) followed by an
underscore and the type of the data (set by the -t, --type op‐
tion).
ENVIRONMENT
ICU_DATA Specifies the directory containing ICU data. Defaults to
/usr/share/icu/77.1/. Some tools in ICU depend on the pres‐
ence of the trailing slash. It is thus important to make sure
that it is present if ICU_DATA is set.
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2001 IBM, Inc. and others.
SEE ALSO
decmn(8)
ICU MANPAGE 5 November 2001 GENCMN(8)
UCONV(1) ICU 77.1 Manual UCONV(1)
NAME
uconv - преобразование данных из одной кодировки в другую
SYNOPSIS
uconv [ -h, -?, --help ] [ -V, --version ] [ -s, --silent ] [ -v,
--verbose ] [ -l, --list | -l, --list-code code | --default-code | -L,
--list-transliterators ] [ --canon ] [ -x transliteration ] [
--to-callback callback | -c ] [ --from-callback callback | -i ] [
--callback callback ] [ --fallback | --no-fallback ] [ -b, --block-size
size ] [ -f, --from-code encoding ] [ -t, --to-code encoding ] [
--add-signature ] [ --remove-signature ] [ -o, --output file ] [
file... ]
DESCRIPTION
uconv преобразует, или транскодирует, каждый указанный файл (или стандартный
ввод, если файл не указан) из одной кодировки в другую. Транскодирование
выполняется с использованием Unicode в качестве промежуточной кодировки (т.е.
данные сначала транскодируются из исходной кодировки в Unicode, а затем из
Unicode в целевую кодировку).
Если кодировка не указана или указана как -, используется кодировка по
умолчанию. Таким образом, вызов uconv без указания кодировки предоставляет
простой способ проверки и очистки файлов данных для дальнейшего использования
инструментами, требующими данных в кодировке по умолчанию.
При вызове uconv можно указать обратные вызовы (callbacks), которые
используются для обработки недопустимых символов во входных данных или
символов, которые нельзя транскодировать в целевую кодировку. Некоторые
кодировки, например, предлагают символ замены по умолчанию, который может
использоваться для представления таких символов во входных данных. Другие
обратные вызовы предоставляют полезное визуальное представление недопустимых
данных.
uconv также может применить указанную транслитерацию к транскодированным
данным, в этом случае транслитерация произойдет как промежуточный шаг, после
транскодирования данных в Unicode. Транслитерация может быть либо списком
имен транслитераторов, разделенных точкой с запятой, либо произвольным
сложным набором правил в формате правил транслитерации ICU.
Для целей транскодирования опции uconv совместимы с опциями iconv(1), что
облегчает замену iconv в сценариях. Однако имена кодировок, используемые
uconv и ICU, не обязательно совпадают с именами, используемыми iconv(1).
Кроме того, опции, предоставляющие информационные данные, такие как -l,
--list, в некоторых вариантах iconv(1), таких как GNU, выводят данные в
немного другом и более удобном для разбора формате.
OPTIONS
-h, -?, --help
Вывести справку по использованию и выйти.
-V, --version
Вывести версию uconv и выйти.
-s, --silent
Подавить сообщения во время выполнения.
-v, --verbose
Выводить дополнительные информационные сообщения во время
выполнения.
-l, --list
Вывести список всех доступных кодировок и выйти.
-l, --list-code code
Вывести только кодировку code и выйти. Если code не является
правильной кодировкой, выйти с ошибкой.
--default-code
Вывести только имя кодировки по умолчанию и выйти.
-L, --list-transliterators
Вывести список всех доступных транслитераторов и выйти.
--canon
Если используется с -l, --list или --default-code, список
кодировок выводится в формате, совместимом с convrtrs.txt(5).
Если используется с -L, --list-transliterators, выводить только
одно имя транслитератора на строку.
-x transliteration
Применить указанную транслитерацию к транскодированным данным в
Unicode и использовать транслитерированные данные в качестве
входных для транскодирования в целевую кодировку.
--to-callback callback
Использовать callback для обработки символов, которые нельзя
транскодировать в целевую кодировку. См. раздел CALLBACKS для
деталей о допустимых callback.
-c Исключить недопустимые символы из вывода. То же, что и
--to-callback skip.
--from-callback callback
Использовать callback для обработки символов, которые нельзя
транскодировать из исходной кодировки. См. раздел CALLBACKS для
деталей о допустимых callback.
-i Игнорировать недопустимые последовательности во входных данных. То
же, что и --from-callback skip.
--callback callback
Использовать callback для обработки как символов, которые нельзя
транскодировать из исходной кодировки, так и символов, которые
нельзя транскодировать в целевую кодировку. См. раздел CALLBACKS
для деталей о допустимых callback.
--fallback
Использовать сопоставление по умолчанию при транскодировании из
Unicode в целевую кодировку.
--no-fallback
Не использовать сопоставление по умолчанию при транскодировании
из Unicode в целевую кодировку. Это значение по умолчанию.
-b, --block-size size
Читать входные данные блоками по size байт за раз. Размер блока
по умолчанию — 4096.
-f, --from-code encoding
Установить исходную кодировку данных как encoding.
-t, --to-code encoding
Транскодировать данные в encoding.
--add-signature
Добавить символ сигнатуры Unicode U+FEFF (BOM), если выходная
кодировка поддерживает его и не добавляет его автоматически.
--remove-signature
Удалить символ сигнатуры Unicode U+FEFF (BOM).
-o, --output file
Записать транскодированные данные в file.
CALLBACKS
uconv поддерживает указание обратных вызовов (callbacks) для обработки
недопустимых данных. Обратные вызовы можно установить для обоих направлений
транскодирования: из исходной кодировки в Unicode с опцией --from-callback и
из Unicode в целевую кодировку с опцией --to-callback.
Ниже приведен список допустимых имен обратных вызовов вместе с описанием их
поведения. Список обратных вызовов, фактически поддерживаемых uconv,
отображается при вызове с -h, --help.
substitute Записать последовательность замены кодировки или символ
замены Unicode U+FFFD при транскодировании в Unicode.
skip Игнорировать недопустимые данные.
stop Остановить выполнение с ошибкой при обнаружении
недопустимых данных. Это обратный вызов по умолчанию.
escape То же, что и escape-icu.
escape-icu Заменить отсутствующие символы строкой формата %Uhhhh для
символов плоскости 0 и %Uhhhh%Uhhhh для символов
плоскостей 1 и выше, где hhhh — шестнадцатеричное
значение одного из кодовых единиц UTF-16, представляющих
символ. Символы из плоскостей 1 и выше записываются как
пара кодовых единиц суррогат UTF-16.
escape-java Заменить отсутствующие символы строкой формата \uhhhh для
символов плоскости 0 и \uhhhh\uhhhh для символов
плоскостей 1 и выше, где hhhh — шестнадцатеричное
значение одного из кодовых единиц UTF-16, представляющих
символ. Символы из плоскостей 1 и выше записываются как
пара кодовых единиц суррогат UTF-16.
escape-c Заменить отсутствующие символы строкой формата \uhhhh для
символов плоскости 0 и \Uhhhhhhhh для символов
плоскостей 1 и выше, где hhhh и hhhhhhhh — шестнадцатеричные
значения кодовой точки Unicode.
escape-xml См. escape-xml-hex.
escape-xml-hex Заменить отсутствующие символы строкой формата &#xhhhh;,
где hhhh — шестнадцатеричное значение кодовой точки
Unicode.
escape-xml-dec Заменить отсутствующие символы строкой формата &#nnnn;,
где nnnn — десятичное значение кодовой точки Unicode.
escape-unicode Заменить отсутствующие символы строкой формата {U+hhhh},
где hhhh — шестнадцатеричное значение кодовой точки
Unicode. Эта шестнадцатеричная строка имеет переменную
длину и может использовать от 4 до 6 цифр. Это формат,
универсально используемый для обозначения кодовой точки
Unicode в литературе, ограниченный фигурными скобками для
легкого распознавания этих замен в выводе.
EXAMPLES
Преобразовать данные из заданной кодировки в кодировку платформы:
$ uconv -f encoding
Проверить, содержит ли файл допустимые данные для заданной кодировки:
$ uconv -f encoding -c file >/dev/null
Преобразовать файл в UTF-8 в заданную кодировку и убедиться, что
результирующий текст подходит для любой версии HTML:
$ uconv -f utf-8 -t encoding \
--callback escape-xml-dec file
Вывести имена кодовых точек Unicode в файле UTF:
$ uconv -f utf-8 -x any-name file
Вывести имя кодовой точки Unicode, значение которой известно (U+30AB в
этом примере):
$ echo '\u30ab' | uconv -x 'hex-any; any-name'; echo
{KATAKANA LETTER KA}{LINE FEED}
$
(Имена ограничены фигурными скобками. Также выводится имя разделителя
строк.)
Нормализовать данные в UTF-8 с использованием Unicode NFKC, удалить все
управляющие символы и преобразовать Катакану в Хирагану:
$ uconv -f utf-8 -t utf-8 \
-x '::nfkc; [:Cc:] >; ::katakana-hiragana;'
CAVEATS AND BUGS
uconv сообщает об ошибках как о происходящих на первом недопустимом байте.
Это может запутать пользователей GNU iconv(1), который сообщает об ошибках
как о происходящих на первом байте недопустимой последовательности. Для
многобайтовых наборов символов или кодировок это означает, что позиции
ошибок в uconv могут быть на более позднем смещении в потоке ввода, чем в
случае с GNU iconv(1).
Сообщение о позициях ошибок при использовании транслитератора может быть
неточным или недоступным, в этом случае uconv сообщит смещение в потоке
вывода, где произошла ошибка.
AUTHORS
Jonas Utterstroem
Yves Arrouye
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2005 IBM, Inc. and others.
SEE ALSO
iconv(1)
ICU MANPAGE 2005-jul-1 UCONV(1)
UCONV(1) ICU 77.1 Manual UCONV(1)
NAME
uconv - convert data from one encoding to another
SYNOPSIS
uconv [ -h, -?, --help ] [ -V, --version ] [ -s, --silent ] [ -v,
--verbose ] [ -l, --list | -l, --list-code code | --default-code | -L,
--list-transliterators ] [ --canon ] [ -x transliteration ] [
--to-callback callback | -c ] [ --from-callback callback | -i ] [
--callback callback ] [ --fallback | --no-fallback ] [ -b, --block-size
size ] [ -f, --from-code encoding ] [ -t, --to-code encoding ] [
--add-signature ] [ --remove-signature ] [ -o, --output file ] [
file... ]
DESCRIPTION
uconv converts, or transcodes, each given file (or its standard input
if no file is specified) from one encoding to another. The transcoding
is done using Unicode as a pivot encoding (i.e. the data are first
transcoded from their original encoding to Unicode, and then from Uni‐
code to the destination encoding).
If an encoding is not specified or is -, the default encoding is used.
Thus, calling uconv with no encoding provides an easy way to validate
and sanitize data files for further consumption by tools requiring data
in the default encoding.
When calling uconv, it is possible to specify callbacks that are used
to handle invalid characters in the input, or characters that cannot be
transcoded to the destination encoding. Some encodings, for example,
offer a default substitution character that can be used to represent
the occurrence of such characters in the input. Other callbacks offer a
useful visual representation of the invalid data.
uconv can also run the specified transliteration on the transcoded
data, in which case transliteration will happen as an intermediate
step, after the data have been transcoded to Unicode. The translitera‐
tion can be either a list of semicolon-separated transliterator names,
or an arbitrarily complex set of rules in the ICU transliteration rules
format.
For transcoding purposes, uconv options are compatible with those of
iconv(1), making it easy to replace it in scripts. It is not necessar‐
ily the case, however, that the encoding names used by uconv and ICU
are the same as the ones used by iconv(1). Also, options that provide
informational data, such as the -l, --list one offered by some iconv(1)
variants such as GNU's, produce data in a slightly different and easier
to parse format.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-V, --version
Print the version of uconv and exit.
-s, --silent
Suppress messages during execution.
-v, --verbose
Display extra informative messages during execution.
-l, --list
List all the available encodings and exit.
-l, --list-code code
List only the code encoding and exit. If code is not a proper
encoding, exit with an error.
--default-code
List only the name of the default encoding and exit.
-L, --list-transliterators
List all the available transliterators and exit.
--canon
If used with -l, --list or --default-code, the list of encodings
is produced in a format compatible with convrtrs.txt(5). If
used with -L, --list-transliterators, print only one transliter‐
ator name per line.
-x transliteration
Run the given transliteration on the transcoded Unicode data,
and use the transliterated data as input for the transcoding to
the destination encoding.
--to-callback callback
Use callback to handle characters that cannot be transcoded to
the destination encoding. See section CALLBACKS for details on
valid callbacks.
-c Omit invalid characters from the output. Same as --to-callback
skip.
--from-callback callback
Use callback to handle characters that cannot be transcoded from
the original encoding. See section CALLBACKS for details on
valid callbacks.
-i Ignore invalid sequences in the input. Same as --from-callback
skip.
--callback callback
Use callback to handle both characters that cannot be transcoded
from the original encoding and characters that cannot be
transcoded to the destination encoding. See section CALLBACKS
for details on valid callbacks.
--fallback
Use the fallback mapping when transcoding from Unicode to the
destination encoding.
--no-fallback
Do not use the fallback mapping when transcoding from Unicode to
the destination encoding. This is the default.
-b, --block-size size
Read input in blocks of size bytes at a time. The default block
size is 4096.
-f, --from-code encoding
Set the original encoding of the data to encoding.
-t, --to-code encoding
Transcode the data to encoding.
--add-signature
Add a U+FEFF Unicode signature character (BOM) if the output
charset supports it and does not add one anyway.
--remove-signature
Remove a U+FEFF Unicode signature character (BOM).
-o, --output file
Write the transcoded data to file.
CALLBACKS
uconv supports specifying callbacks to handle invalid data. Callbacks
can be set for both directions of transcoding: from the original encod‐
ing to Unicode, with the --from-callback option, and from Unicode to
the destination encoding, with the --to-callback option.
The following is a list of valid callback names, along with a descrip‐
tion of their behavior. The list of callbacks actually supported by
uconv is displayed when it is called with -h, --help.
substitute Write the encoding's substitute sequence, or the Uni‐
code replacement character U+FFFD when transcoding to
Unicode.
skip Ignore the invalid data.
stop Stop with an error when encountering invalid data.
This is the default callback.
escape Same as escape-icu.
escape-icu Replace the missing characters with a string of the
format %Uhhhh for plane 0 characters, and %Uhhhh%Uhhhh
for planes 1 and above characters, where hhhh is the
hexadecimal value of one of the UTF-16 code units rep‐
resenting the character. Characters from planes 1 and
above are written as a pair of UTF-16 surrogate code
units.
escape-java Replace the missing characters with a string of the
format \uhhhh for plane 0 characters, and \uhhhh\uhhhh
for planes 1 and above characters, where hhhh is the
hexadecimal value of one of the UTF-16 code units rep‐
resenting the character. Characters from planes 1 and
above are written as a pair of UTF-16 surrogate code
units.
escape-c Replace the missing characters with a string of the
format \uhhhh for plane 0 characters, and \Uhhhhhhhh
for planes 1 and above characters, where hhhh and hhh‐
hhhhh are the hexadecimal values of the Unicode code‐
point.
escape-xml Same as escape-xml-hex.
escape-xml-hex Replace the missing characters with a string of the
format &#xhhhh;, where hhhh is the hexadecimal value
of the Unicode codepoint.
escape-xml-dec Replace the missing characters with a string of the
format &#nnnn;, where nnnn is the decimal value of the
Unicode codepoint.
escape-unicode Replace the missing characters with a string of the
format {U+hhhh}, where hhhh is the hexadecimal value
of the Unicode codepoint. That hexadecimal string is
of variable length and can use from 4 to 6 digits.
This is the format universally used to denote a Uni‐
code codepoint in the literature, delimited by curly
braces for easy recognition of those substitutions in
the output.
EXAMPLES
Convert data from a given encoding to the platform encoding:
$ uconv -f encoding
Check if a file contains valid data for a given encoding:
$ uconv -f encoding -c file >/dev/null
Convert a UTF-8 file to a given encoding and ensure that the resulting
text is good for any version of HTML:
$ uconv -f utf-8 -t encoding \
--callback escape-xml-dec file
Display the names of the Unicode code points in a UTF-file:
$ uconv -f utf-8 -x any-name file
Print the name of a Unicode code point whose value is known (U+30AB in
this example):
$ echo '\u30ab' | uconv -x 'hex-any; any-name'; echo
{KATAKANA LETTER KA}{LINE FEED}
$
(The names are delimited by curly braces. Also, the name of the line
terminator is also displayed.)
Normalize UTF-8 data using Unicode NFKC, remove all control characters,
and map Katakana to Hiragana:
$ uconv -f utf-8 -t utf-8 \
-x '::nfkc; [:Cc:] >; ::katakana-hiragana;'
CAVEATS AND BUGS
uconv does report errors as occurring at the first invalid byte encoun‐
tered. This may be confusing to users of GNU iconv(1), which reports
errors as occurring at the first byte of an invalid sequence. For
multi-byte character sets or encodings, this means that uconv error po‐
sitions may be at a later offset in the input stream than would be the
case with GNU iconv(1).
The reporting of error positions when a transliterator is used may be
inaccurate or unavailable, in which case uconv will report the offset
in the output stream at which the error occurred.
AUTHORS
Jonas Utterstroem
Yves Arrouye
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2005 IBM, Inc. and others.
SEE ALSO
iconv(1)
ICU MANPAGE 2005-jul-1 UCONV(1)
GENDICT(1) ICU 77.1 Manual GENDICT(1)
NAME
gendict - Компилирует список слов в словарь ICU в виде строки трие
SYNOPSIS
gendict [ --uchars | --bytes --transform transform ] [ -h, -?, --help ]
[ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -i, --icud‐
atadir directory ] input-file output-file
DESCRIPTION
gendict читает список слов из файла словаря и создаёт файл словаря
строки трие. Обычно этот файл данных имеет расширение .dict.
Слова начинаются в начале строки и заканчиваются первым пробелом.
Строки, начинающиеся с пробела, игнорируются.
OPTIONS
-h, -?, --help
Вывести справку по использованию и выйти.
-V, --version
Вывести версию gendict и выйти.
-c, --copyright
Внедрить стандартное авторское право ICU в output-file.
-v, --verbose
Выводить дополнительные информационные сообщения во время
выполнения.
-i, --icudatadir directory
Искать необходимые файлы данных ICU в указанном каталоге. Например,
файл pnames.icu должен быть доступен, если данные ICU не собраны как
разделяемая библиотека. Каталог данных ICU по умолчанию указывается
переменной среды ICU_DATA. Большинство конфигураций ICU не требуют
этого аргумента.
--uchars
Установить тип выходного трие на UChar. Взаимоисключаемо с --bytes.
--bytes
Установить тип выходного трие на Bytes. Взаимоисключаемо с
--uchars.
--transform
Установить тип преобразования. Должно указываться только с --bytes.
В настоящее время поддерживаемые преобразования: offset-<шестнадцатеричное-число>,
которое указывает смещение для вычитания из всех входных символов. Следует
отметить, что преобразование offset также отображает U+200D в 0xFF
и U+200C в 0xFE, чтобы обеспечить совместимость с языками, требующими
этих символов. Преобразование должно быть указано для трие bytes, и
при применении к неценовым символам в input-file оно должно
производить вывод между 0x00 и 0xFF.
input-file
Исходный файл для чтения.
output-file
Файл, в который будет записан выходной словарь.
CAVEATS
Предполагается, что input-file закодирован в UTF-8. Целые числа в
input-file, используемые в качестве значений, должны состоять из цифр
ASCII. Они могут быть указаны либо в шестнадцатеричном формате с
префиксом 0x, либо в десятичном. Должен быть указан либо --bytes,
либо --uchars.
ENVIRONMENT
ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию
/usr/share/icu/77.1/. Некоторые инструменты ICU зависят от
наличия завершающего слеша. Поэтому важно убедиться, что он
присутствует, если задана ICU_DATA.
AUTHORS
Maxime Serrano
VERSION
1.0
COPYRIGHT
Copyright (C) 2012 International Business Machines Corporation and
others
SEE ALSO
http://www.icu-project.org/userguide/boundaryAnalysis.html
ICU MANPAGE 1 June 2012 GENDICT(1)
GENDICT(1) ICU 77.1 Manual GENDICT(1)
NAME
gendict - Compiles word list into ICU string trie dictionary
SYNOPSIS
gendict [ --uchars | --bytes --transform transform ] [ -h, -?, --help ]
[ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -i, --icud‐
atadir directory ] input-file output-file
DESCRIPTION
gendict reads the word list from dictionary-file and creates a string
trie dictionary file. Normally this data file has the .dict extension.
Words begin at the beginning of a line and are terminated by the first
whitespace. Lines that begin with whitespace are ignored.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-V, --version
Print the version of gendict and exit.
-c, --copyright
Embeds the standard ICU copyright into the output-file.
-v, --verbose
Display extra informative messages during execution.
-i, --icudatadir directory
Look for any necessary ICU data files in directory. For exam‐
ple, the file pnames.icu must be located when ICU's data is not
built as a shared library. The default ICU data directory is
specified by the environment variable ICU_DATA. Most configura‐
tions of ICU do not require this argument.
--uchars
Set the output trie type to UChar. Mutually exclusive with
--bytes.
--bytes
Set the output trie type to Bytes. Mutually exclusive with
--uchars.
--transform
Set the transform type. Should only be specified with --bytes.
Currently supported transforms are: offset-<hex-number>, which
specifies an offset to subtract from all input characters. It
should be noted that the offset transform also maps U+200D to
0xFF and U+200C to 0xFE, in order to offer compatibility to lan‐
guages that require these characters. A transform must be spec‐
ified for a bytes trie, and when applied to the non-value char‐
acters in the input-file must produce output between 0x00 and
0xFF.
input-file
The source file to read.
output-file
The file to write the output dictionary to.
CAVEATS
The input-file is assumed to be encoded in UTF-8. The integers in the
input-file that are used as values must be made up of ASCII digits.
They may be specified either in hex, by using a 0x prefix, or in deci‐
mal. Either --bytes or --uchars must be specified.
ENVIRONMENT
ICU_DATA Specifies the directory containing ICU data. Defaults to
/usr/share/icu/77.1/. Some tools in ICU depend on the pres‐
ence of the trailing slash. It is thus important to make sure
that it is present if ICU_DATA is set.
AUTHORS
Maxime Serrano
VERSION
1.0
COPYRIGHT
Copyright (C) 2012 International Business Machines Corporation and oth‐
ers
SEE ALSO
http://www.icu-project.org/userguide/boundaryAnalysis.html
ICU MANPAGE 1 June 2012 GENDICT(1)
ICU-CONFIG(1) ICU 77.1 Manual ICU-CONFIG(1)
NAME
icu-config - вывод параметров сборки ICU
SYNOPSIS
icu-config [ --bindir ] [ --cc ] [ --cflags ] [ --cppflags ] [
--cppflags-searchpath ] [ --cxx ] [ --cxxflags ] [ --detect-prefix ] [
--exec-prefix ] [ --exists ] [ --help, -?, --usage ] [ --icudata ] [
--icudata-install-dir ] [ --icudata-mode ] [ --icudatadir ] [ --invoke
] [ --invoke=prog ] [ --ldflags ] [ --ldflags-libsonly ] [ --ld‐
flags-searchpath ] [ --ldflags-system ] [ --ldflags-icuio ] [ --mandir
] [ --prefix ] [ --prefix=prefix ] [ --sbindir ] [ --shared-datadir ] [
--sysconfdir ] [ --unicode-version ] [ --version ] [ --incfile ]
DESCRIPTION
icu-config упрощает задачу сборки и связывания с ICU по сравнению с ручной
настройкой пользовательских makefile или эквивалентных. Поскольку
icu-config является исполняемым скриптом, он также решает проблему
поиска библиотек и заголовков ICU, позволяя системе PATH находить его.
EXAMPLES
icu-config можно использовать без makefile. Следующая команда
строки достаточно для сборки однолинейной программы на C++ с ICU. (Например,
icu/source/samples/props/props.cpp)
`icu-config --cxx --cxxflags --cppflags --ldflags` -o props
props.cpp
Чаще icu-config вызывается из makefile и используется для установки
переменных. В следующем примере также собирается пример props.
CC=$(shell icu-config --cc)
CXX=$(shell icu-config --cxx)
CPPFLAGS=$(shell icu-config --cppflags)
CXXFLAGS=$(shell icu-config --cxxflags)
LDFLAGS =$(shell icu-config --ldflags)
all: props
props.o: props.cpp
make(1) автоматически использует указанные выше переменные.
OPTIONS
--bindir
Выводит путь к каталогу бинарных (исполняемых) файлов. Обычно эквивалентно
'bin'. Приложения и скрипты ICU, исполняемые пользователем, находятся
здесь.
--cc Выводит используемый компилятор C. Эквивалентно переменной $(CC) Makefile.
--cflags
Выводит флаги компилятора C. Эквивалентно переменной $(CFLAGS) Makefile.
Не включает директивы препроцессора, такие как пути include или
определенные символы. Примеры включают флаги отладки (-g)
и оптимизации.
--cppflags
Выводит флаги препроцессора C. Эквивалентно переменной $(CPPFLAGS)
Makefile. Примеры: -I пути include и -D директивы определения.
--cppflags-searchpath
Выводит флаги препроцессора C, как выше, но только -I пути поиска.
--cxx Выводит компилятор C++. Эквивалентно переменной $(CXX) Makefile.
--cxxflags
Выводит флаги компилятора C++. Эквивалентно переменной $(CXXFLAGS)
Makefile.
--detect-prefix
Если ICU был перемещен из места установки, добавление
этого флага к другим вызовам icu-config попытается найти ICU
относительно расположения скрипта icu-config. Можно использовать
как последнюю попытку, если установка ICU повреждена.
--exec-prefix
Выводит префикс, используемый для каталогов исполняемых программ
(таких как bin, sbin и т.д.). Обычно совпадает с префиксом.
--exists
Скрипт вернет успешный (0) статус, если ICU кажется установленным
и расположенным правильно, в противном случае будет выведено
сообщение об ошибке и ненулевой статус.
--help, -?,--usage
Выводит сообщение помощи и использования.
--icudata
Выводит короткое имя файла данных ICU. Это не включает
суффиксы, такие как .dat, .dll, .so, .lib, .a и т.д., ни префиксы, такие как 'lib'.
Может быть в форме icudt21b.
--icudata-install-dir
Выводит каталог, куда должны быть установлены упакованные данные ICU.
Можно использовать как опцию --install для pkgdata(1).
--icudata-mode
Выводит режим данных ICU по умолчанию, такой как dll или common.
Можно использовать как опцию --mode для pkgdata(1).
--icudatadir
Выводит путь к упакованным архивным данным. (Должен быть там,
куда указывает $ICU_DATA или эквивалентный путь по умолчанию.) Не будет указывать
на libdir.
--invoke
Если ICU не установлен в месте, где операционная система
найдет его общие библиотеки, эта опция выведет команды
для установки соответствующих переменных окружения для загрузки
общих библиотек ICU. Например, на многих системах переменная
с именем LD_LIBRARY_PATH или эквивалентная должна быть установлена.
--invoke=prog
То же, что и опция --invoke, кроме того, включает опции для вызова
программы с именем prog. Если prog — имя инструмента ICU,
такого как genrb(1), то icu-config также включит полный
путь к этому инструменту.
--ldflags
Выводит любые флаги, которые должны быть переданы линковщику. Они могут
включать -L для путей поиска библиотек и -l для включения библиотек
ICU. По умолчанию эта опция попытается связать библиотеки
"common" (libicuuc) и "i18n" (libicui18n), а также библиотеку данных. Если требуются
дополнительные библиотеки, любые из следующих двух флагов могут быть добавлены
в сочетании с этим, например "--ldflags --ldflags-icuio", если библиотека icuio
требуется в дополнение к стандартным библиотекам ICU.
Эквивалентно переменной $(LDFLAGS) Makefile.
--ldflags-layout
Выводит опцию связи для библиотеки макета ICU.
--ldflags-icuio
Выводит опцию связи для добавления пакета ICU I/O.
--ldflags-libsonly
Похоже на --ldflags, но включает только опции -l.
--ldflags-searchpath
Похоже на --ldflags, но включает только опции -L путей поиска.
--ldflags-system
Похоже на --ldflags, но включает только системные библиотеки (такие как
pthreads). --mandir Выводит расположение установленных страниц руководства ICU.
Обычно (man)
--prefix
Выводит префикс (базовый каталог), под которым установлен ICU.
--prefix=prefix
Устанавливает префикс ICU на prefix для остатка этой командной
строки. Не проверяет, действителен ли новый префикс.
--sbindir
Выводит расположение системных бинарных файлов ICU, обычно (sbin)
--shared-datadir
Выводит расположение общих данных ICU, обычно (share)
--sysconfdir
Выводит расположение системных конфигурационных данных ICU, обычно
(etc)
--unicode-version
Выводит версию стандарта Unicode, который использует текущий ICU.
--version
Выводит текущую версию ICU.
--incfile
Выводит путь к 'Makefile.inc', подходящий для использования с опцией -O
pkgdata(1).
AUTHORS
Steven Loomis
VERSION
77.1
COPYRIGHT
Copyright (C) 2002-2004 IBM, Inc. and others.
ICU MANPAGE 17 мая 2004 ICU-CONFIG(1)
ICU-CONFIG(1) ICU 77.1 Manual ICU-CONFIG(1)
NAME
icu-config - output ICU build options
SYNOPSIS
icu-config [ --bindir ] [ --cc ] [ --cflags ] [ --cppflags ] [
--cppflags-searchpath ] [ --cxx ] [ --cxxflags ] [ --detect-prefix ] [
--exec-prefix ] [ --exists ] [ --help, -?, --usage ] [ --icudata ] [
--icudata-install-dir ] [ --icudata-mode ] [ --icudatadir ] [ --invoke
] [ --invoke=prog ] [ --ldflags ] [ --ldflags-libsonly ] [ --ld‐
flags-searchpath ] [ --ldflags-system ] [ --ldflags-icuio ] [ --mandir
] [ --prefix ] [ --prefix=prefix ] [ --sbindir ] [ --shared-datadir ] [
--sysconfdir ] [ --unicode-version ] [ --version ] [ --incfile ]
DESCRIPTION
icu-config simplifies the task of building and linking against ICU as
compared to manually configuring user makefiles or equivalent. Because
icu-config is an executable script, it also solves the problem of lo‐
cating the ICU libraries and headers, by allowing the system PATH to
locate it.
EXAMPLES
icu-config can be used without a makefile. The command line below is
sufficient for building a single-file c++ program against ICU. (For ex‐
ample, icu/source/samples/props/props.cpp)
`icu-config --cxx --cxxflags --cppflags --ldflags` -o props
props.cpp
More commonly, icu-config will be called from within a makefile, and
used to set up variables. The following example also builds the props
example.
CC=$(shell icu-config --cc)
CXX=$(shell icu-config --cxx)
CPPFLAGS=$(shell icu-config --cppflags)
CXXFLAGS=$(shell icu-config --cxxflags)
LDFLAGS =$(shell icu-config --ldflags)
all: props
props.o: props.cpp
make(1) will automatically use the above variables.
OPTIONS
--bindir
Prints the binary (executable) directory path. Normally equiva‐
lent to 'bin'. ICU user-executable applications and scripts are
found here.
--cc Print the C compiler used. Equivalent to the $(CC) Makefile
variable.
--cflags
Print the C compiler flags. Equivalent to the $(CFLAGS) Makefile
variable. Does NOT include preprocessor directives such as in‐
clude path or defined symbols. Examples include debugging (-g)
and optimization flags
--cppflags
Print the C preprocessor flags. Equivalent to the $(CPPFLAGS)
Makefile variable. Examples are -I include paths and -D define
directives.
--cppflags-searchpath
Print the C preprocessor flags, as above but only -I search
paths.
--cxx Print the C++ compiler. Equivalent to the $(CXX) Makefile vari‐
able.
--cxxflags
Print the C++ compiler flags. Equivalent to the $(CXXFLAGS)
Makefile variable.
--detect-prefix
If ICU has been moved from its installed location, prepending
this flag to other icu-config calls will attempt to locate ICU
relative to where the icu-config script has been located. Can be
used as a last-chance effort if the ICU install has been dam‐
aged.
--exec-prefix
Print the prefix used for executable program directories (such
as bin, sbin, etc). Normally the same as the prefix.
--exists
Script will return with a successful (0) status if ICU seems to
be installed and located correctly, otherwise an error message
and nonzero status will be displayed.
--help, -?,--usage
Print a help and usage message.
--icudata
Print the shortname of the ICU data file. This does not include
any suffix such as .dat, .dll, .so, .lib, .a, etc nor does it
include prefixes such as 'lib'. It may be in the form icudt21b
--icudata-install-dir
Print the directory where ICU packaged data should be installed.
Can use as pkgdata(1)'s --install option.
--icudata-mode
Print the default ICU pkgdata mode, such as dll or common. Can
use as pkgdata(1)'s --mode option.
--icudatadir
Print the path to packaged archive data. (should be where
$ICU_DATA or equivalent default path points.) Will NOT point to
the libdir.
--invoke
If ICU is not installed in a location where the operating system
will locate its shared libraries, this option will print out
commands so as to set the appropriate environment variables to
load ICU's shared libraries. For example, on many systems a
variable named LD_LIBRARY_PATH or equivalent must be set.
--invoke=prog
Same as the --invoke option, except includes options for invok‐
ing a program named prog. If prog is the name of an ICU tool,
such as genrb(1), then icu-config will also include the full
path to that tool.
--ldflags
Print any flags which should be passed to the linker. These may
include -L for library search paths, and -l for including ICU
libraries. By default, this option will attempt to link in the
"common" (libicuuc) and "i18n" (libicui18n) libraries, as well
as the data library. If additional libraries are required, any
of the following two flags may be added in conjunction with this
one, for example "--ldflags --ldflags-icuio" if the icuio li‐
brary is required in addition to the standard ICU libraries.
Equivalent to the $(LDFLAGS) Makefile variable.
--ldflags-layout
Prints the link option for the ICU layout library.
--ldflags-icuio
Prints the link option to add the ICU I/O package
--ldflags-libsonly
Similar to --ldflags but only includes the -l options.
--ldflags-searchpath
Similar to --ldflags but only includes the -L search path op‐
tions.
--ldflags-system
Similar to --ldflags but only includes system libraries (such as
pthreads) --mandir Prints the location of the installed ICU man
pages. Normally (man)
--prefix
Prints the prefix (base directory) under which the installed ICU
resides.
--prefix=prefix
Sets the ICU prefix to prefix for the remainder of this command
line. Does test whether the new prefix is valid.
--sbindir
Prints the location of ICU system binaries, normally (sbin)
--shared-datadir
Prints the location of ICU shared data, normally (share)
--sysconfdir
Prints the location of ICU system configuration data, normally
(etc)
--unicode-version
Prints the Version of the Unicode Standard which the current ICU
uses.
--version
Prints the current version of ICU.
--incfile
Prints the 'Makefile.inc' path, suitable for use with pkg‐
data(1)'s -O option.
AUTHORS
Steven Loomis
VERSION
77.1
COPYRIGHT
Copyright (C) 2002-2004 IBM, Inc. and others.
ICU MANPAGE 17 May 2004 ICU-CONFIG(1)
ICUPKG(8) ICU 77.1 Manual ICUPKG(8)
NAME
icupkg - извлечение или модификация архива ICU .dat
SYNOPSIS
icupkg [ -h, -?, --help ] [ -tl, --type l | -tb, --type b | -te, --type
e ] [ -c, --copyright | -C, --comment comment ] [ -a, --add list ] [
-r, --remove list ] [ -x, --extract list ] [ -l, --list ] [ -s,
--sourcedir source ] [ -d, --destdir destination ] [ -w, --writepkg ] [
-m, --matchmode mode ] infilename [ outfilename ]
DESCRIPTION
icupkg читает входной файл пакета ICU .dat, модифицирует его в соответствии
с опциями, преобразует его в свойства целевой платформы (кодировка и
порядок байтов), и, при необходимости, записывает результирующий пакет
ICU .dat в выходной файл. Элементы удаляются, затем добавляются, затем
извлекаются и перечисляются. Пакет ICU .dat записывается, если элементы
удалены или добавлены, или если входное и выходное имена файлов отличаются,
или если установлена опция -w, --writepkg.
Если входное имя файла — "new", то создаётся пустой пакет. Если выходное
имя файла отсутствует, то оно автоматически генерируется на основе
входного имени файла. Если входное имя файла заканчивается на l, b или e,
соответствующее свойствам платформы, то выходное имя файла будет содержать
букву из опции -t, --type.
Этот инструмент также можно использовать для простого преобразования
одного файла данных ICU, заменяя бывший инструмент icuswap. В этом режиме
укажите infilename (и необязательное outfilename) для файла данных ICU,
который не является пакетом. Допустимые опции включают -t, -w, -s и -d.
Имена файлов могут быть абсолютными или относительными по отношению к
путям source/dest dir. Другие опции в этом режиме не допускаются.
OPTIONS
-h, -?, --help
Вывести справку по использованию и выйти.
-tl, --type l
Вывод для little-endian/семейства кодировок ASCII. Тип вывода
по умолчанию соответствует типу входных данных.
-tb, --type b
Вывод для big-endian/семейства кодировок ASCII. Тип вывода
по умолчанию соответствует типу входных данных.
-te, --type e
Вывод для big-endian/семейства кодировок EBCDIC. Тип вывода
по умолчанию соответствует типу входных данных.
-c,--copyright
Включить уведомление об авторских правах ICU в результирующие
данные.
-C, --comment comment
Включить указанный комментарий в результирующие данные вместо
уведомления об авторских правах ICU.
-a, --add list
Добавить элементы из списка в пакет. Список может быть одним
именем файла с расширением .txt, содержащим список имён элементов,
или именем файла пакета ICU .dat.
-r, --remove list
Удалить элементы из списка из пакета. Список может быть одним
именем файла с расширением .txt, содержащим список имён элементов,
или именем файла пакета ICU .dat.
-x, --extract list
Извлечь элементы из списка из пакета. Список может быть одним
именем файла с расширением .txt, содержащим список имён элементов,
или именем файла пакета ICU .dat.
-m, --matchmode mode
Установить режим сопоставления для имён элементов с использованием
подстановочных знаков.
-s, --sourcedir source
Установить исходный каталог на source. Каталог по умолчанию —
текущий каталог.
-d, --destdir destination
Установить каталог назначения на destination. Каталог по умолчанию —
текущий каталог.
-l, --list
Вывести элементы пакета в stdout (после модификации пакета).
LIST FILE SYNTAX
Элементы перечислены в одной или нескольких строках и разделены пробелами
(пробел+табуляция). Комментарии начинаются с # и игнорируются. Пустые
строки игнорируются. Строки, в которых первый непробельный символ —
один из "%&'()*+,-./:;<=>?_", также игнорируются для резерва под будущий
синтаксис.
Элементы для удаления или извлечения могут содержать один подстановочный
знак *. Символ * соответствует нулю или более символам. Если установлен
-m, --matchmode noslash, то символ * не соответствует символу /.
Элементы должны быть перечислены относительно пакета, и путь --sourcedir
или --destdir будет добавлен в начало. Пути добавляются только к именам
файлов элементов при добавлении или извлечении элементов, а не к именам
файлов пакетов ICU .dat или списков.
Пути могут содержать / вместо разделителя файлов платформы и преобразуются
соответственно.
AUTHORS
Markus Scherer
George Rhoten
VERSION
1.0
COPYRIGHT
Copyright (C) 2006 IBM, Inc. and others.
SEE ALSO
pkgdata(1) genrb(1)
ICU MANPAGE 18 августа 2006 ICUPKG(8)
ICUPKG(8) ICU 77.1 Manual ICUPKG(8)
NAME
icupkg - extract or modify an ICU .dat archive
SYNOPSIS
icupkg [ -h, -?, --help ] [ -tl, --type l | -tb, --type b | -te, --type
e ] [ -c, --copyright | -C, --comment comment ] [ -a, --add list ] [
-r, --remove list ] [ -x, --extract list ] [ -l, --list ] [ -s,
--sourcedir source ] [ -d, --destdir destination ] [ -w, --writepkg ] [
-m, --matchmode mode ] infilename [ outfilename ]
DESCRIPTION
icupkg reads the input ICU .dat package file, modify it according to
the options, swap it to the desired platform properties (charset & en‐
dianness), and optionally write the resulting ICU .dat package to the
output file. Items are removed, then added, then extracted and listed.
An ICU .dat package is written if items are removed or added, or if the
input and output filenames differ, or if the -w, --writepkg option is
set.
If the input filename is "new" then an empty package is created. If
the output filename is missing, then it is automatically generated from
the input filename. If the input filename ends with an l, b, or e
matching its platform properties, then the output filename will contain
the letter from the -t, --type option.
This tool can also be used to just swap a single ICU data file, replac‐
ing the former icuswap tool. For this mode, provide the infilename (and
optional outfilename) for a non-package ICU data file. Allowed options
include -t, -w, -s and -d The filenames can be absolute, or relative to
the source/dest dir paths. Other options are not allowed in this mode.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-tl, --type l
Output for little-endian/ASCII charset family. The output type
defaults to the input type.
-tb, --type b
Output for big-endian/ASCII charset family. The output type de‐
faults to the input type.
-te, --type e
Output for big-endian/EBCDIC charset family. The output type
defaults to the input type.
-c,--copyright
Include the ICU copyright notice in the resulting data.
-C, --comment comment
Include the specified comment in the resulting data instead of
the ICU copyright notice.
-a, --add list
Add items from the list to the package. The list can be a single
filename with a .txt file extension containing a list of item
filenames, or an ICU .dat package filename.
-r, --remove list
Remove items from the list from the package. The list can be a
single filename with a .txt file extension containing a list of
item filenames, or an ICU .dat package filename.
-x, --extract list
Extract items from the list from the package. The list can be a
single filename with a .txt file extension containing a list of
item filenames, or an ICU .dat package filename.
-m, --matchmode mode
Set the matching mode for item names with wildcards.
-s, --sourcedir source
Set the source directory to source. The default source direc‐
tory is the current directory.
-d, --destdir destination
Set the destination directory to destination. The default des‐
tination directory is the current directory.
-l, --list
List the package items to stdout (after modifying the package).
LIST FILE SYNTAX
Items are listed on one or more lines and separated by whitespace
(space+tab). Comments begin with # and are ignored. Empty lines are
ignored. Lines where the first non-whitespace character is one of
"%&'()*+,-./:;<=>?_ are also ignored to reserve for future syntax.
Items for removal or extraction may contain a single * wildcard charac‐
ter. The * matches zero or more characters. If -m, --matchmode noslash
is set, then the * character does not match the / character.
Items must be listed relative to the package, and the --sourcedir or
the --destdir path will be prepended. The paths are only prepended to
item filenames while adding or extracting items, not to ICU .dat pack‐
age or list filenames.
Paths may contain / instead of the platform's file separator character
and are converted as appropriate.
AUTHORS
Markus Scherer
George Rhoten
VERSION
1.0
COPYRIGHT
Copyright (C) 2006 IBM, Inc. and others.
SEE ALSO
pkgdata(1) genrb(1)
ICU MANPAGE 18 August 2006 ICUPKG(8)
GENBRK(1) ICU 77.1 Manual GENBRK(1)
NAME
genbrk - Компилирует исходные файлы правил разрыва ICU в бинарные
файлы данных
SYNOPSIS
genbrk [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v,
--verbose ] [ -d, --destdir destination ] [ -i, --icudatadir directory
] -r, --rules rule-file -o, --out output-file
DESCRIPTION
genbrk читает исходный код правил разрыва (границы) из rule-file и
создает файл данных для итерации разрыва. Обычно этот файл данных имеет
расширение .brk.
Подробности синтаксиса правил можно найти в Руководстве пользователя
ICU.
OPTIONS
-h, -?, --help
Выводит справку по использованию и выходит.
-V, --version
Выводит версию genbrk и выходит.
-c, --copyright
Встраивает стандартное авторское право ICU в output-file.
-v, --verbose
Выводит дополнительные информационные сообщения во время
выполнения.
-d, --destdir destination
Устанавливает каталог назначения для output-file как
destination.
-i, --icudatadir directory
Ищет необходимые файлы данных ICU в каталоге directory. Например,
файл pnames.icu должен быть расположен, когда данные ICU не
построены как разделяемая библиотека. Каталог данных ICU по умолчанию
указывается переменной окружения ICU_DATA. Большинство
конфигураций ICU не требуют этого аргумента.
-r, --rules rule-file
Исходный файл для чтения.
-o, --out output-file
Выходной файл данных для записи.
CAVEATS
Если rule-file содержит метку порядка байтов (BOM) в начале файла, которая
является символом Unicode U+FEFF, то rule-file интерпретируется как
Unicode. Без BOM файл интерпретируется в текущей кодовой странице
операционной системы по умолчанию. Чтобы устранить всякую неоднозначность
кодировки, с которой был записан rule-file, рекомендуется писать этот файл
в UTF-8 с BOM.
ENVIRONMENT
ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию
/usr/share/icu/77.1/. Некоторые инструменты в ICU зависят от
наличия завершающего слеша. Поэтому важно убедиться, что он
присутствует, если ICU_DATA задана.
AUTHORS
George Rhoten
Andy Heninger
VERSION
1.0
COPYRIGHT
Copyright (C) 2005 International Business Machines Corporation and
others
SEE ALSO
http://www.icu-project.org/userguide/boundaryAnalysis.html
ICU MANPAGE 2 December 2005 GENBRK(1)
GENBRK(1) ICU 77.1 Manual GENBRK(1)
NAME
genbrk - Compiles ICU break iteration rules source files into binary
data files
SYNOPSIS
genbrk [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v,
--verbose ] [ -d, --destdir destination ] [ -i, --icudatadir directory
] -r, --rules rule-file -o, --out output-file
DESCRIPTION
genbrk reads the break (boundary) rule source code from rule-file and
creates a break iteration data file. Normally this data file has the
.brk extension.
The details of the rule syntax can be found in ICU's User Guide.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-V, --version
Print the version of genbrk and exit.
-c, --copyright
Embeds the standard ICU copyright into the output-file.
-v, --verbose
Display extra informative messages during execution.
-d, --destdir destination
Set the destination directory of the output-file to destination.
-i, --icudatadir directory
Look for any necessary ICU data files in directory. For exam‐
ple, the file pnames.icu must be located when ICU's data is not
built as a shared library. The default ICU data directory is
specified by the environment variable ICU_DATA. Most configura‐
tions of ICU do not require this argument.
-r, --rules rule-file
The source file to read.
-o, --out output-file
The output data file to write.
CAVEATS
When the rule-file contains a byte order mark (BOM) at the beginning of
the file, which is the Unicode character U+FEFF, then the rule-file is
interpreted as Unicode. Without the BOM, the file is interpreted in the
current operating system default codepage. In order to eliminate any
ambiguity of the encoding for how the rule-file was written, it is rec‐
ommended that you write this file in UTF-8 with the BOM.
ENVIRONMENT
ICU_DATA Specifies the directory containing ICU data. Defaults to
/usr/share/icu/77.1/. Some tools in ICU depend on the pres‐
ence of the trailing slash. It is thus important to make sure
that it is present if ICU_DATA is set.
AUTHORS
George Rhoten
Andy Heninger
VERSION
1.0
COPYRIGHT
Copyright (C) 2005 International Business Machines Corporation and oth‐
ers
SEE ALSO
http://www.icu-project.org/userguide/boundaryAnalysis.html
ICU MANPAGE 2 December 2005 GENBRK(1)