Пакет: icu
- Версия
- 77.1
- Релиз
- 1.niceos5
- Архитектура
- x86_64
- Хэш GOST
- ff559f7be8abaa05ae89ea914348a0c62bb16bd2f91f0341a66f24fa20802124
- Хэш MD5
- 246dbeb933479e167a3b2f8af29c2b10
- Хэш SHA256
- 9ce6688c9e9b14c89e1fe4c138667d6869d95fff3467a63f865c48d8cc793970
- Лицензия
- MIT и UCD и Public Domain
- Дата сборки
- 12 мая 2025 г.
- Размер
- 38,846 ГиБ
- Совместимые ОС
- rpm файл:
- icu-77.1-1.niceos5.x86_64.rpm
Зависимости
| Имя | Тип | Версия |
|---|---|---|
| /bin/sh | runtime | - |
| ld-linux-x86-64.so.2()(64bit) | runtime | - |
| ld-linux-x86-64.so.2(GLIBC_2.3)(64bit) | runtime | - |
| libc.so.6()(64bit) | runtime | - |
| libc.so.6(GLIBC_2.14)(64bit) | runtime | - |
| libc.so.6(GLIBC_2.2.5)(64bit) | runtime | - |
| libc.so.6(GLIBC_2.3)(64bit) | runtime | - |
| libc.so.6(GLIBC_2.33)(64bit) | runtime | - |
| libc.so.6(GLIBC_2.34)(64bit) | runtime | - |
| libc.so.6(GLIBC_2.38)(64bit) | runtime | - |
| libc.so.6(GLIBC_2.4)(64bit) | runtime | - |
| libgcc_s.so.1()(64bit) | runtime | - |
| libgcc_s.so.1(GCC_3.0)(64bit) | runtime | - |
| libicudata.so.77()(64bit) | runtime | - |
| libicui18n.so.77()(64bit) | runtime | - |
| libicuio.so.77()(64bit) | runtime | - |
| libicutu.so.77()(64bit) | runtime | - |
| libicuuc.so.77()(64bit) | runtime | - |
| libm.so.6()(64bit) | runtime | - |
| libm.so.6(GLIBC_2.2.5)(64bit) | runtime | - |
| libm.so.6(GLIBC_2.27)(64bit) | runtime | - |
| libm.so.6(GLIBC_2.29)(64bit) | runtime | - |
| libm.so.6(GLIBC_2.38)(64bit) | runtime | - |
| libstdc++.so.6()(64bit) | runtime | - |
| libstdc++.so.6(CXXABI_1.3)(64bit) | runtime | - |
| libstdc++.so.6(CXXABI_1.3.15)(64bit) | runtime | - |
| libstdc++.so.6(CXXABI_1.3.8)(64bit) | runtime | - |
| libstdc++.so.6(CXXABI_1.3.9)(64bit) | runtime | - |
| libstdc++.so.6(GLIBCXX_3.4)(64bit) | runtime | - |
| libstdc++.so.6(GLIBCXX_3.4.11)(64bit) | runtime | - |
| libstdc++.so.6(GLIBCXX_3.4.14)(64bit) | runtime | - |
| libstdc++.so.6(GLIBCXX_3.4.15)(64bit) | runtime | - |
| libstdc++.so.6(GLIBCXX_3.4.20)(64bit) | runtime | - |
| libstdc++.so.6(GLIBCXX_3.4.21)(64bit) | runtime | - |
| libstdc++.so.6(GLIBCXX_3.4.29)(64bit) | runtime | - |
| libstdc++.so.6(GLIBCXX_3.4.30)(64bit) | runtime | - |
| libstdc++.so.6(GLIBCXX_3.4.32)(64bit) | runtime | - |
| libstdc++.so.6(GLIBCXX_3.4.9)(64bit) | runtime | - |
| rtld(GNU_HASH) | runtime | - |
Граф зависимостей
История изменений
| Дата | Автор | Сообщение |
|---|---|---|
| 31 мар. 2025 г. | Stanislav Belikov <sbelikov@ncsgp.ru> | Первая сборка для icu |
Файлы пакета
-
-
- /usr/bin/derb 34,453 КиБ
- /usr/bin/genbrk 21,867 КиБ
- /usr/bin/gencfu 17,242 КиБ
- /usr/bin/gencnval 30,398 КиБ
- /usr/bin/gendict 41,32 КиБ
- /usr/bin/genrb 217,055 КиБ
- /usr/bin/icu-config 21,702 КиБ
- /usr/bin/icuexportdata 74,703 КиБ
- /usr/bin/icuinfo 16,742 КиБ
- /usr/bin/makeconv 58,344 КиБ
- /usr/bin/pkgdata 54,336 КиБ
- /usr/bin/uconv 62,898 КиБ
-
-
- /usr/lib/libicudata.so.77 18 Б
- /usr/lib/libicudata.so.77.1 30,427 МиБ
- /usr/lib/libicui18n.so.77 18 Б
- /usr/lib/libicui18n.so.77.1 4,638 МиБ
- /usr/lib/libicuio.so.77 16 Б
- /usr/lib/libicuio.so.77.1 71,492 КиБ
- /usr/lib/libicutest.so.77 18 Б
- /usr/lib/libicutest.so.77.1 95,906 КиБ
- /usr/lib/libicutu.so.77 16 Б
- /usr/lib/libicutu.so.77.1 267,211 КиБ
- /usr/lib/libicuuc.so.77 16 Б
- /usr/lib/libicuuc.so.77.1 2,504 МиБ
-
-
- /usr/sbin/escapesrc 29,242 КиБ
- /usr/sbin/genccode 16,516 КиБ
- /usr/sbin/gencmn 16,234 КиБ
- /usr/sbin/gennorm2 84,289 КиБ
- /usr/sbin/gensprep 30,93 КиБ
- /usr/sbin/icupkg 26,336 КиБ
-
-
-
-
- /usr/share/man/man1/derb.1.gz 2,016 КиБ
- /usr/share/man/man1/genbrk.1.gz 1,322 КиБ
- /usr/share/man/man1/gencfu.1.gz 1,012 КиБ
- /usr/share/man/man1/gencnval.1.gz 1,034 КиБ
- /usr/share/man/man1/gendict.1.gz 1,517 КиБ
- /usr/share/man/man1/genrb.1.gz 1,627 КиБ
- /usr/share/man/man1/icu-config.1.gz 2,693 КиБ
- /usr/share/man/man1/icuexportdata.1.gz 317 Б
- /usr/share/man/man1/makeconv.1.gz 1,515 КиБ
- /usr/share/man/man1/pkgdata.1.gz 2,679 КиБ
- /usr/share/man/man1/uconv.1.gz 3,324 КиБ
-
-
-
-
Документация (man-страницы)
PKGDATA(1) ICU 77.1 Manual PKGDATA(1)
NAME
pkgdata - упаковка данных для использования с ICU
SYNOPSIS
pkgdata [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright | -C,
--comment comment ] [ -m, --mode mode ] -p, --name name -O, --bldopt
options [ -e, --entrypoint name ] [ -r, --revision version ] [ -F,
--rebuild ] [ -I, --install ] [ -s, --sourcedir source ] [ -d, --dest‐
dir destination ] [ -T, --tempdir directory ] [ file ... ]
DESCRIPTION
pkgdata берет набор файлов данных и упаковывает их для использования с
ICU или приложениями, которые используют ICU. Основная причина упаковки
файлов с помощью pkgdata — упрощение их распространения и ускорение их
загрузки ICU, а также уменьшение потребления ограниченных системных ре‐
сурсов, таких как дескрипторы файлов. Упакованные данные также позволяют
приложениям распространяться с меньшим количеством файлов ресурсов или
даже без них, если они напрямую связаны с упакованными данными.
pkgdata поддерживает несколько различных методов упаковки данных, кото‐
рые служат разным целям.
Режим упаковки по умолчанию — common, или archive. В этом режиме раз‐
личные файлы данных объединяются в архитектурно-зависимый файл, который
позже может быть отображен в память для использования ICU. Данные, упа‐
кованные с помощью этого режима, будут искаться в каталоге данных ICU.
Такая упаковка удобна для приложений с пакетами ресурсов, например, по‐
скольку приложение может установить упакованный файл в каталог данных
ICU.
Другой режим упаковки — dll, или library, где файлы данных компилиру‐
ются в разделяемую библиотеку. ICU ранее могла динамически загружать
эти разделяемые библиотеки, но начиная с ICU 2.0 такая поддержка была
удалена. Этот режим все равно полезен для двух основных целей: для
сборки ICU самой по себе, поскольку данные ICU по умолчанию упаковыва‐
ются в разделяемую библиотеку; и для сборки пакетов ресурсов, которые
связаны с приложением, использующим их. Такие пакеты ресурсов могут
размещаться в любом месте, где системный динамический линкер будет
искать разделяемые библиотеки, вместо того чтобы быть вынужденными на‐
ходиться внутри каталога данных ICU.
Статический режим упаковки похож на режим разделяемой библиотеки, кро‐
ме того, что он производит статическую библиотеку.
Наконец, pkgdata поддерживает режим files, который просто копирует фай‐
лы данных вместо их упаковки в единый файл или библиотеку. Этот режим
в основном предназначен для обеспечения поддержки сборки ICU до ее упа‐
ковки в отдельные небольшие пакеты для распространения с операционны‐
ми системами, такими как Debian GNU/Linux. Для получения дополнитель‐
ной информации о использовании этого режима обратитесь к документации
по упаковке в дистрибутиве исходного кода ICU.
pkgdata строит, упаковывает, устанавливает или очищает соответствующие
данные на основе заданных опций, без необходимости вызова GNU make.
OPTIONS
-h, -?, --help
Вывести справку по использованию и выйти.
-v, --verbose
Выводить дополнительные информационные сообщения во время вы‐
полнения.
-c, --copyright
Включить уведомление об авторских правах в двоичные данные.
-C, --comment comment
Включить указанный комментарий в результирующие данные вместо
уведомления об авторских правах ICU.
-m, --mode mode
Установить режим упаковки, используемый pkgdata. Разные режимы
и их значения объяснены в разделе DESCRIPTION выше. Допустимые
имена режимов — common (или archive), dll (или library) и files.
-O, --bldopt options
Указать опции для сборщика. Сборщик используется внутренне
pkgdata для генерации правильного упакованного файла. Такие оп‐
ции включают, но не ограничиваются, установкой переменных, ис‐
пользуемых make(1) во время сборки упакованного файла. Приме‐
чание: Если icu-config доступен, то эта опция не нужна.
-p, --name name
Установить имя упакованного файла как name. Это имя также ис‐
пользуется в качестве имени точки входа по умолчанию после пре‐
образования в допустимый идентификатор C.
-e, --entrypoint name
Установить точку входа данных (используется для связывания с да‐
ними в форме разделяемой библиотеки) как name. Имя точки входа
по умолчанию — имя, установленное опцией -n, --name.
-r, --revision version
Включить версионность разделяемой библиотеки, произведенной в
режиме dll или library. Номер версии имеет формат major.mi‐
nor.patchlevel, и все части, кроме major, являются необязатель‐
ными. Если указано только major, то версия считается major.0
для целей версионности.
-F, --rebuild
Принудительно перестроить все данные и их повторную упаковку.
-I, --install
Установить упакованный файл (или все файлы в режиме files).
Если переменная DESTDIR задана, она будет использована для ус‐
тановки.
-s, --sourcedir source
Установить исходный каталог как source. Каталог по умолчанию —
текущий каталог.
-d, --destdir destination
Установить каталог назначения как destination. Каталог назна‐
чения по умолчанию — текущий каталог.
-T, --tempdir directory
Установить каталог для генерации временных файлов как directory.
Каталог временных файлов по умолчанию — тот же, что и каталог
назначения, установленный опцией -d, --destdir.
AUTHORS
Steven Loomis
Yves Arrouye
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2009 IBM, Inc. и другие.
ICU MANPAGE 6 февраля 2009 PKGDATA(1)
PKGDATA(1) ICU 77.1 Manual PKGDATA(1)
NAME
pkgdata - package data for use by ICU
SYNOPSIS
pkgdata [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright | -C,
--comment comment ] [ -m, --mode mode ] -p, --name name -O, --bldopt
options [ -e, --entrypoint name ] [ -r, --revision version ] [ -F,
--rebuild ] [ -I, --install ] [ -s, --sourcedir source ] [ -d, --dest‐
dir destination ] [ -T, --tempdir directory ] [ file ... ]
DESCRIPTION
pkgdata takes a set of data files and packages them for use by ICU or
applications that use ICU. The typical reason to package files using
pkgdata is to make their distribution easier and their loading by ICU
faster and less consuming of limited system resources such as file de‐
scriptors. Packaged data also allow applications to be distributed
with fewer resource files, or even with none at all if they link
against the packaged data directly.
pkgdata supports a few different methods of packaging data that serve
different purposes.
The default packaging mode is common, or archive. In this mode, the
different data files are bundled together as an architecture-dependent
file that can later be memory mapped for use by ICU. Data packaged us‐
ing this mode will be looked up under the ICU data directory. Such
packaging is easy to use for applications resource bundles, for exam‐
ple, as long as the application can install the packaged file in the
ICU data directory.
Another packaging mode is the dll, or library, mode, where the data
files are compiled into a shared library. ICU used to be able to dynam‐
ically load these shared libraries, but as of ICU 2.0, such support has
been removed. This mode is still useful for two main purposes: to build
ICU itself, as the ICU data is packaged as a shared library by default;
and to build resource bundles that are linked to the application that
uses them. Such resource bundles can then be placed anywhere where the
system's dynamic linker will be looking for shared libraries, instead
of being forced to live inside the ICU data directory.
The static packaging mode is similar to the shared library one except
that it produces a static library.
Finally, pkgdata supports a files mode which simply copies the data
files instead of packaging them as a single file or library. This mode
is mainly intended to provide support for building ICU before it is
packaged as separate small packages for distribution with operating
systems such as Debian GNU/Linux for example. Please refer to the pack‐
aging documentation in the ICU source distribution for further informa‐
tion on the use of this mode.
pkgdata builds, packages, installs, or cleans the appropriate data
based on the options given without the need to call GNU make anymore.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-v, --verbose
Display extra informative messages during execution.
-c, --copyright
Include a copyright notice in the binary data.
-C, --comment comment
Includes the specified comment in the resulting data instead of
the ICU copyright notice.
-m, --mode mode
Set the packaging mode to be used by pkgdata. The different
modes and their meaning are explained in the DESCRIPTION section
above. The valid mode names are common (or archive), dll (or li‐
brary), and files.
-O, --bldopt options
Specify options for the builder. The builder is used internally
by pkgdata to generate the correct packaged file. Such options
include, but are not limited to, setting variables used by
make(1) during the build of the packaged file. Note: If icu-con‐
fig is available, then this option is not needed.
-p, --name name
Set the packaged file name to name. This name is also used as
the default entry point name after having been turned into a
valid C identifier.
-e, --entrypoint name
Set the data entry point (used for linking against the data in a
shared library form) to name. The default entry point name is
the name set by the -n, --name option.
-r, --revision version
Enable versioning of the shared library produced in dll, or li‐
brary, mode. The version number has the format major.mi‐
nor.patchlevel and all parts except for major are optional. If
only major is supplied then the version is assumed to be major.0
for versioning purposes.
-F, --rebuild
Force the rebuilding of all data and their repackaging.
-I, --install
Install the packaged file (or all the files in the files mode).
If the variable DESTDIR is set it will be used for installation.
-s, --sourcedir source
Set the source directory to source. The default source direc‐
tory is the current directory.
-d, --destdir destination
Set the destination directory to destination. The default des‐
tination directory is the current directory.
-T, --tempdir directory
Set the directory used to generate temporary files to directory.
The default temporary directory is the same as the destination
directory as set by the -d, --destdir option.
AUTHORS
Steven Loomis
Yves Arrouye
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2009 IBM, Inc. and others.
ICU MANPAGE 6 February 2009 PKGDATA(1)
GENCFU(1) ICU 77.1 Руководство GENCFU(1)
NAME
gencfu - Генерирует файлы данных Unicode Confusable
SYNOPSIS
gencfu [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v,
--verbose ] [ -d, --destdir destination ] [ -i, --icudatadir directory
] -r, --rules rule-file -w, --wsrules whole-script-rule-file -o, --out
output-file
DESCRIPTION
gencfu читает определения путаемых символов в файле ввода, которые
представляют собой простые текстовые файлы, содержащие определения
путаемых символов в формате ввода, определённом Unicode UAX39 для фи‐
лов confusables.txt и confusablesWholeScript.txt. Этот исходный (.txt)
формат также принимается детекторами подделок ICU. Файлы должны быть
закодированы в формате utf-8, с BOM или без него. Обычно выходной файл
данных имеет расширение .cfu.
OPTIONS
-h, -?, --help
Вывести справку по использованию и выйти.
-V, --version
Вывести версию gencfu и выйти.
-c, --copyright
Внедрить стандартный авторский текст ICU в выходной файл.
-v, --verbose
Выводить дополнительные информационные сообщения во время вы‐
полнения.
-d, --destdir destination
Установить каталог назначения для выходного файла как destina‐
tion.
-i, --icudatadir directory
Искать необходимые файлы данных ICU в каталоге directory. На
пример, файл pnames.icu должен быть найден, когда данные
ICU не построены как разделяемая библиотека. Каталог данных ICU
по умолчанию указывается переменной среды ICU_DATA. Большин‐
ство конфигураций ICU не требует этого аргумента.
-r, --rules rule-file
Исходный файл для чтения.
-w, --wsrules whole-script-rule-file
Исходный файл для всего скрипта для чтения.
-o, --out output-file
Выходной файл данных для записи.
VERSION
1.0
COPYRIGHT
Copyright (C) 2009 International Business Machines Corporation и дру‐
гие
ICU MANPAGE 24 May 2009 GENCFU(1)
GENCFU(1) ICU 77.1 Manual GENCFU(1)
NAME
gencfu - Generates Unicode Confusable data files
SYNOPSIS
gencfu [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v,
--verbose ] [ -d, --destdir destination ] [ -i, --icudatadir directory
] -r, --rules rule-file -w, --wsrules whole-script-rule-file -o, --out
output-file
DESCRIPTION
gencfu reads confusable character definitions in the input file, which
are plain text files containing confusable character definitions in the
input format defined by Unicode UAX39 for the files confusables.txt and
confusablesWholeScript.txt. This source (.txt) format is also accepted
by ICU spoof detectors. The files must be encoded in utf-8 format,
with or without a BOM. Normally the output data file has the .cfu ex‐
tension.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-V, --version
Print the version of gencfu and exit.
-c, --copyright
Embeds the standard ICU copyright into the output-file.
-v, --verbose
Display extra informative messages during execution.
-d, --destdir destination
Set the destination directory of the output-file to destination.
-i, --icudatadir directory
Look for any necessary ICU data files in directory. For exam‐
ple, the file pnames.icu must be located when ICU's data is not
built as a shared library. The default ICU data directory is
specified by the environment variable ICU_DATA. Most configura‐
tions of ICU do not require this argument.
-r, --rules rule-file
The source file to read.
-w, --wsrules whole-script-rule-file
The whole script source file to read.
-o, --out output-file
The output data file to write.
VERSION
1.0
COPYRIGHT
Copyright (C) 2009 International Business Machines Corporation and oth‐
ers
ICU MANPAGE 24 May 2009 GENCFU(1)
GENCNVAL(1) ICU 77.1 Manual GENCNVAL(1)
NAME
gencnval - компилировать файл псевдонимов преобразователей
SYNOPSIS
gencnval [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright ] [ -s,
--sourcedir source ] [ -d, --destdir destination ] [ converterfile ]
DESCRIPTION
gencnval преобразует файл псевдонимов ICU converterfile в двоичный файл
cnvalias.icu. Этот двоичный файл может быть прочитан напрямую ICU,
или использован pkgdata(1) для включения в больший архив или
библиотеку.
Если converterfile не указан, используется файл convrtrs.txt по
умолчанию для ICU.
OPTIONS
-h, -?, --help
Вывести справку по использованию и выйти.
-v, --verbose
Выводить подробный вывод. Эта информация может включать
информацию о конфликтующих псевдонимах и преобразователях,
к которым они приводят.
-c, --copyright
Включить уведомление об авторских правах в двоичные данные.
-s, --sourcedir source
Установить исходный каталог на source. Каталог по умолчанию
указывается переменной окружения ICU_DATA.
-d, --destdir destination
Установить каталог назначения на destination. Каталог
назначения по умолчанию указывается переменной окружения
ICU_DATA.
ENVIRONMENT
ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию
/usr/share/icu/77.1/. Некоторые инструменты в ICU зависят от
наличия завершающего слеша. Поэтому важно убедиться, что он
присутствует, если ICU_DATA задана.
FILES
icu/source/data/mappings/convrtrs.txt Описание преобразователей ICU
и их псевдонимов. Этот файл
данных обычно не устанавливается
и доступен как часть исходного
кода ICU.
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2004 IBM, Inc. and others.
SEE ALSO
pkgdata(1)
ICU MANPAGE 11 March 2004 GENCNVAL(1)
GENCNVAL(1) ICU 77.1 Manual GENCNVAL(1)
NAME
gencnval - compile the converters aliases file
SYNOPSIS
gencnval [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright ] [ -s,
--sourcedir source ] [ -d, --destdir destination ] [ converterfile ]
DESCRIPTION
gencnval converts the ICU aliases file converterfile into the binary
file cnvalias.icu. This binary file can then be read directly by ICU,
or used by pkgdata(1) for incorporation into a larger archive or li‐
brary.
If converterfile is not provided, the default ICU convrtrs.txt file is
used.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-v, --verbose
Display verbose output. This information can include information
about conflicting aliases and the converters the aliases resolve
to.
-c, --copyright
Include a copyright notice in the binary data.
-s, --sourcedir source
Set the source directory to source. The default source direc‐
tory is specified by the environment variable ICU_DATA.
-d, --destdir destination
Set the destination directory to destination. The default des‐
tination directory is specified by the environment variable
ICU_DATA.
ENVIRONMENT
ICU_DATA Specifies the directory containing ICU data. Defaults to
/usr/share/icu/77.1/. Some tools in ICU depend on the pres‐
ence of the trailing slash. It is thus important to make sure
that it is present if ICU_DATA is set.
FILES
icu/source/data/mappings/convrtrs.txt Description of ICU's converters
and their aliases. This data
file is not normally installed,
and it is available as a part
of ICU source code.
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2004 IBM, Inc. and others.
SEE ALSO
pkgdata(1)
ICU MANPAGE 11 March 2004 GENCNVAL(1)
GENRB(1) ICU 77.1 Manual GENRB(1)
NAME
genrb - компилировать ресурсный пакет
SYNOPSIS
genrb [ -h, -?, --help ] [ -V, --version ] [ -v, --verbose ] [ -e,
--encoding encoding ] [ -j, --write-java [ encoding ] ] [ -s,
--sourcedir source ] [ -d, --destdir destination ] [ -i, --icudatadir
directory ] bundle ...
DESCRIPTION
genrb преобразует исходные файлы ресурсных пакетов, переданные в ком‐
андной строке, в их бинарную форму или в файл исходного кода Java
для использования с ICU4J. Результирующие бинарные файлы имеют расш‐
ирение .res, в то время как исходные файлы ресурсных пакетов об‐
ично имеют расширение .txt. Файлы исходного кода Java имеют расш‐
ирение java и следуют соглашениям именования ICU4J.
Принято называть ресурсные пакеты по имени локали, то есть исполь‐
зовать идентификатор локали для имени файла пакета, например ja_JP.txt
для данных японского языка (Япония) или root.txt для корневого па‐
кета. В любом случае, genrb создаст файл, базовое имя которого
будет именем локали, найденной в файле ресурса, а не базовым именем
самого файла ресурса.
Бинарные файлы могут быть прочитаны напрямую ICU или использованы с
pkgdata(1) для включения в больший архив или библиотеку.
OPTIONS
-h, -?, --help
Вывести справку по использованию и выйти.
-V, --version
Вывести версию genrb и выйти.
-v, --verbose
Выводить дополнительные информационные сообщения во время вып‐
олнения.
-e, --encoding encoding
Установить кодировку для чтения входных файлов как encoding. По
умолчанию используется инвариантная (подмножество ASCII или
EBCDIC) кодовая страница системы (см. раздел INVARIANT CHARAC‐
TERS). Кодировки UTF-8, UTF-16BE и UTF-16LE определяются авто‐
матически, если присутствует метка порядка байтов (BOM).
-j, --write-java [ encoding ]
Сгенерировать исходный код Java для использования с ICU4J. Мо‐
жно указать необязательную кодировку для файла Java.
-s, --sourcedir source
Установить каталог исходных файлов как source. Каталог по
умолчанию указывается в переменной среды ICU_DATA или в
расположении, установленном при сборке ICU, если ICU_DATA не ука‐
зана.
-d, --destdir destination
Установить каталог назначения как destination. Каталог по
умолчанию указывается в переменной среды ICU_DATA или в
расположении, установленном при сборке ICU, если ICU_DATA не ука‐
зана.
-i, --icudatadir directory
Искать необходимые файлы данных ICU в каталоге directory.
Например, при обработке переопределений сортировки файл ucadata.dat
должен быть расположен. Каталог данных ICU по умолчанию ука‐
зывается в переменной среды ICU_DATA.
INVARIANT CHARACTERS
Инвариантный набор символов включает следующий набор символов,
выраженный как стандартное POSIX-выражение: [a-z]|[A-Z]|[0-9]|_| |+|-|*|/.
Это набор, который гарантированно доступен независимо от кодовой ст‐
раницы.
ENVIRONMENT
ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию
это /usr/share/icu/77.1/. Некоторые инструменты в ICU зависят
от наличия завершающего слеша. Поэтому важно убедиться,
что он присутствует, если ICU_DATA установлена.
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2002 IBM, Inc. и другие.
SEE ALSO
derb(1)
pkgdata(1)
ICU MANPAGE 16 апреля 2002 GENRB(1)
GENRB(1) ICU 77.1 Manual GENRB(1)
NAME
genrb - compile a resource bundle
SYNOPSIS
genrb [ -h, -?, --help ] [ -V, --version ] [ -v, --verbose ] [ -e,
--encoding encoding ] [ -j, --write-java [ encoding ] ] [ -s,
--sourcedir source ] [ -d, --destdir destination ] [ -i, --icudatadir
directory ] bundle ...
DESCRIPTION
genrb converts the resource bundle source files passed on the command
line to their binary form or to a Java source file for use with ICU4J.
The resulting binary files have a .res extension while resource bundle
source files typically have a .txt extension. Java source files have a
java extension and follow the ICU4J naming conventions.
It is customary to name the resource bundles by their locale name, i.e.
to use a local identifier for the bundle filename, e.g. ja_JP.txt for
Japanese (Japan) data, or root.txt for the root bundle. In any case,
genrb will produce a file whose base name is the name of the locale
found in the resource file, not the base name of the resource file it‐
self.
The binary files can be read directly by ICU, or used by pkgdata(1) for
incorporation into a larger archive or library.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-V, --version
Print the version of genrb and exit.
-v, --verbose
Display extra informative messages during execution.
-e, --encoding encoding
Set the encoding used to read input files to encoding. The de‐
fault encoding is the invariant (subset of ASCII or EBCDIC)
codepage for the system (see section INVARIANT CHARACTERS). The
encodings UTF-8, UTF-16BE, and UTF-16LE are automatically de‐
tected if a byte order mark (BOM) is present.
-j, --write-java [ encoding ]
Generate a Java source code for use with ICU4J. An optional en‐
coding for the Java file can be given.
-s, --sourcedir source
Set the source directory to source. The default source direc‐
tory is specified by the environment variable ICU_DATA, or the
location set when ICU was built if ICU_DATA is not set.
-d, --destdir destination
Set the destination directory to destination. The default des‐
tination directory is specified by the environment variable
ICU_DATA or is the location set when ICU was built if ICU_DATA
is not set.
-i, --icudatadir directory
Look for any necessary ICU data files in directory. For exam‐
ple, when processing collation overrides, the file ucadata.dat
must be located. The default ICU data directory is specified by
the environment variable ICU_DATA.
INVARIANT CHARACTERS
The invariant character set consists of the following set of charac‐
ters, expressed as a standard POSIX regular expression: [a-z]|[A-
Z]|[0-9]|_| |+|-|*|/. This is the set which is guaranteed to be avail‐
able regardless of code page.
ENVIRONMENT
ICU_DATA Specifies the directory containing ICU data. Defaults to
/usr/share/icu/77.1/. Some tools in ICU depend on the pres‐
ence of the trailing slash. It is thus important to make sure
that it is present if ICU_DATA is set.
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2002 IBM, Inc. and others.
SEE ALSO
derb(1)
pkgdata(1)
ICU MANPAGE 16 April 2002 GENRB(1)
MAKECONV(1) ICU 77.1 Manual MAKECONV(1)
НАЗВАНИЕ
icuexportdata - Записывает текстовые файлы с данными свойств Unicode из
ICU.
ICU РУКОВОДСТВО 12 июня 2021 MAKECONV(1)
MAKECONV(1) ICU 77.1 Manual MAKECONV(1)
NAME
icuexportdata - Writes text files with Unicode properties data from
ICU.
ICU MANPAGE 12 June 2021 MAKECONV(1)
DERB(1) ICU 77.1 Manual DERB(1)
NAME
derb - разбирает resource bundle
SYNOPSIS
derb [ -h, -?, --help ] [ -V, --version ] [ -v, --verbose ] [ -e, --en‐
coding encoding ] [ --bom ] [ -t, --truncate [ size ] ] [ -s,
--sourcedir source ] [ -d, --destdir destination ] [ -i, --icudatadir
directory ] [ -c, --to-stdout ] bundle ...
DESCRIPTION
derb читает скомпилированные файлы resource bundle, переданные в коман‐
дной строке, и записывает их обратно в текстовом виде. Результирую‐
щие текстовые файлы имеют расширение .txt, в то время как исходные фай‐
лы скомпилированных resource bundle обычно имеют расширение .res.
Принято называть resource bundle по имени локали, то есть использо‐
вать идентификатор локали для имени файла, например, ja_JP.res для дан‐
ных на японском языке (Япония) или root.res для корневого пакета. Это
особенно важно для derb, поскольку имя локали недоступно напрямую из
скомпилированного resource bundle, и для определения, какую локаль зап‐
рашивать при открытии пакета. derb создаст файл, базовое имя которого
совпадает с базовым именем скомпилированного файла resource. Если опция
--to-stdout, -c используется, то текст будет записан в стандартный вы‐
ход.
OPTIONS
-h, -?, --help
Вывести справку по использованию и выйти.
-V, --version
Вывести версию derb и выйти.
-v, --verbose
Выводить дополнительные информационные сообщения во время вы‐
полнения.
-A, --suppressAliases
Не следовать за алиасами при формировании вывода.
-e, --encoding encoding
Установить кодировку, используемую для записи выходных файлов,
в encoding. Кодировка по умолчанию — инвариантная (подмноже‐
ство ASCII или EBCDIC) кодовая страница системы (см. раздел IN‐
VARIANT CHARACTERS). Выбор кодировки не влияет на данные, а то‐
лько на их представление. Символы, которые нельзя предста‐
вить в кодировке, будут представлены с помощью последовательнос‐
тей \uhhhh.
--bom Записать метку порядка байтов (BOM) в начале файла.
-l, --locale locale
Установить локаль для resource bundle, которая используется как
в сгенерированном тексте, так и в качестве базового имени вы‐
ходного файла.
-t, --truncate [ size ]
Обрезать индивидуальные ресурсы (строки или бинарные данные) до
size байт. Значение по умолчанию, если size не указано, — 80
байт.
-s, --sourcedir source
Установить исходный каталог в source. Исходный каталог по умол‐
чанию — текущий каталог. Если передан -, то bundle будет ис‐
кан в его расположении по умолчанию, указанном переменной ок‐
ружения ICU_DATA (или по умолчанию в месте, установленном при
сборке ICU, если ICU_DATA не задана).
-d, --destdir destination
Установить целевой каталог в destination. Целевой каталог по
умолчанию указывается переменной окружения ICU_DATA или местом,
установленным при сборке ICU, если ICU_DATA не задана.
-i, --icudatadir directory
Искать необходимые файлы данных ICU в directory. Например, при
обработке переопределений сортировки файл ucadata.dat должени
быть найден. Каталог данных ICU по умолчанию указывается пе‐
ременной окружения ICU_DATA.
-c, --to-stdout
Записать разобранный bundle в стандартный вывод вместо файла.
CAVEATS
При использовании опции --bom символ U+FEFF записывается в кодировке
назначения независимо от того, является ли это форматом преобразования
Unicode (UTF) или нет. Эта опция должна использоваться только с UTF-
кодировкой, так как метки порядка байтов не имеют смысла для других ко‐
дировок.
INVARIANT CHARACTERS
Множество инвариантных символов состоит из следующих символов, выражен‐
ных как стандартное регулярное выражение POSIX: [a-z]|[A-Z]|[0-9]|_|
|+|-|*|/ . Это множество, которое гарантированно доступно независимо от
кодовой страницы.
ENVIRONMENT
ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию это
/usr/share/icu/77.1/. Некоторые инструменты в ICU зависят от
наличия завершающего слеша. Поэтому важно убедиться, что он
присутствует, если задана ICU_DATA.
AUTHORS
Vladimir Weinstein
Yves Arrouye
VERSION
1.0
COPYRIGHT
Copyright (C) 2002 IBM, Inc. and others.
SEE ALSO
genrb(1)
ICU MANPAGE 7 Mar 2014 DERB(1)
DERB(1) ICU 77.1 Manual DERB(1)
NAME
derb - disassemble a resource bundle
SYNOPSIS
derb [ -h, -?, --help ] [ -V, --version ] [ -v, --verbose ] [ -e, --en‐
coding encoding ] [ --bom ] [ -t, --truncate [ size ] ] [ -s,
--sourcedir source ] [ -d, --destdir destination ] [ -i, --icudatadir
directory ] [ -c, --to-stdout ] bundle ...
DESCRIPTION
derb reads the compiled resource bundle files passed on the command
line and write them back in text form. The resulting text files have a
.txt extension while compiled resource bundle source files typically
have a .res extension.
It is customary to name the resource bundles by their locale name, i.e.
to use a local identifier for the bundle filename, e.g. ja_JP.res for
Japanese (Japan) data, or root.res for the root bundle. This is espe‐
cially important for derb since the locale name is not accessible di‐
rectly from the compiled resource bundle, and to know which locale to
ask for when opening the bundle. derb will produce a file whose base
name is the base name of the compiled resource file itself. If the
--to-stdout, -c option is used, however, the text will be written on
the standard output.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-V, --version
Print the version of derb and exit.
-v, --verbose
Display extra informative messages during execution.
-A, --suppressAliases
Don't follow aliases when producing output.
-e, --encoding encoding
Set the encoding used to write output files to encoding. The
default encoding is the invariant (subset of ASCII or EBCDIC)
codepage for the system (see section INVARIANT CHARACTERS). The
choice of the encoding does not affect the data, just their rep‐
resentation. Characters that cannot be represented in the encod‐
ing will be represented using \uhhhh escape sequences.
--bom Write a byte order mark (BOM) at the beginning of the file.
-l, --locale locale
Set the locale for the resource bundle, which is used both in
the generated text and as the base name of the output file.
-t, --truncate [ size ]
Truncate individual resources (strings or binary data) to size
bytes. The default if size is not specified is 80 bytes.
-s, --sourcedir source
Set the source directory to source. The default source direc‐
tory is the current directory. If - is passed for source, then
the bundle will be looked for in its default location, specified
by the ICU_DATA environment variable (or defaulting to the loca‐
tion set when ICU was built if ICU_DATA is not set).
-d, --destdir destination
Set the destination directory to destination. The default des‐
tination directory is specified by the environment variable
ICU_DATA or is the location set when ICU was built if ICU_DATA
is not set.
-i, --icudatadir directory
Look for any necessary ICU data files in directory. For exam‐
ple, when processing collation overrides, the file ucadata.dat
must be located. The default ICU data directory is specified by
the environment variable ICU_DATA.
-c, --to-stdout
Write the disassembled bundle on standard output instead of into
a file.
CAVEATS
When the option --bom is used, the character U+FEFF is written in the
destination encoding regardless of whether it is a Unicode transforma‐
tion format (UTF) or not. This option should only be used with an UTF
encoding, as byte order marks are not meaningful for other encodings.
INVARIANT CHARACTERS
The invariant character set consists of the following set of charac‐
ters, expressed as a standard POSIX regular expression: [a-z]|[A-
Z]|[0-9]|_| |+|-|*|/. This is the set which is guaranteed to be avail‐
able regardless of code page.
ENVIRONMENT
ICU_DATA Specifies the directory containing ICU data. Defaults to
/usr/share/icu/77.1/. Some tools in ICU depend on the pres‐
ence of the trailing slash. It is thus important to make sure
that it is present if ICU_DATA is set.
AUTHORS
Vladimir Weinstein
Yves Arrouye
VERSION
1.0
COPYRIGHT
Copyright (C) 2002 IBM, Inc. and others.
SEE ALSO
genrb(1)
ICU MANPAGE 7 Mar 2014 DERB(1)
MAKECONV(1) Руководство ICU 77.1 MAKECONV(1)
NAME
makeconv - скомпилировать таблицу конвертера
SYNOPSIS
makeconv [ -h, -?, --help ] [ -c, --copyright ] [ -v, --verbose ] [ -d,
--destdir destination ] convertertable ...
DESCRIPTION
makeconv преобразует таблицу конвертера ICU convertertable в двоичный
файл. Бинарный файл имеет то же базовое имя, что и convertertable, но с
расширением .cnv (вместо типичного расширения .ucm файла convertertable).
Этот бинарный файл затем может быть прочитан напрямую ICU или использован
pkgdata(1) для включения в больший архив или библиотеку.
Таблица convertertable должна быть в формате ICU ucm (Unicode Codepage
Mapping), чтобы быть понятой makeconv. Формат ICU ucm похож на файлы
IBM NLTC upmap/tpmap/rpmap. Комментарии в convertertable обрабатываются
следующим образом. Если комментарий (начинающийся с символа '#'), который
следует за каким-то текстом, содержит индикатор отката '|', то только
текст, начинающийся с символа '#', и заканчивающийся перед символом '|',
игнорируется. В противном случае, или если комментарий является первым на
строке, комментарий продолжается до конца строки. Эта специальная
обработка комментариев предназначена для учета практики размещения
информации об откате в комментариях в строгом формате IBM NLTC ucmap.
Обратите внимание, что новые конвертеры будут автоматически найдены ICU
после их установки в каталог данных ICU. Им не нужно перечислять в
convrtrs.txt(5) файл псевдонимов конвертеров, чтобы быть доступными
приложениям, использующим ICU. Им нужно перечислять там, если кто-то
хочет дать им псевдонимы или теги.
OPTIONS
-h, -?, --help
Вывести справку по использованию и выйти.
-c, --copyright
Включить уведомление об авторском праве в бинарные данные.
-v, --verbose
Отобразить дополнительные информационные сообщения во время выполнения.
-d, --destdir destination
Установить каталог назначения в destination. Каталог назначения по
умолчанию указывается переменной окружения ICU_DATA.
CAVEATS
Если существующая таблица конвертера изменена и перекомпилирована с
помощью makeconv, результирующий бинарный файл должен быть упакован так
же, как он был упакован изначально. Например, если конвертеры были
сгруппированы вместе в архиве или библиотеке с pkgdata(1), то архив или
библиотека должны быть перестроены с новым бинарным файлом. Самостоятельный
бинарный файл конвертера не будет иметь приоритета над упакованным.
ENVIRONMENT
ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию
/usr/share/icu/77.1/. Некоторые инструлы в ICU зависят от
наличия конечного слеша. Поэтому важно убедиться, что он
присутствует, если ICU_DATA установлена.
VERSION
77.1
COPYRIGHT
Copyright (C) 2000 IBM, Inc. and others.
SEE ALSO
convrtrs.txt(5)
pkgdata(1)
РУКОВОДСТВО ICU 16 апреля 2002 MAKECONV(1)
MAKECONV(1) ICU 77.1 Manual MAKECONV(1)
NAME
makeconv - compile a converter table
SYNOPSIS
makeconv [ -h, -?, --help ] [ -c, --copyright ] [ -v, --verbose ] [ -d,
--destdir destination ] convertertable ...
DESCRIPTION
makeconv converts the ICU converter table convertertable into a binary
file. The binary file has the same base name as convertertable but has
a .cnv extension (instead of the typical .ucm extension of the convert‐
ertable file). This binary file can then be read directly by ICU, or
used by pkgdata(1) for incorporation into a larger archive or library.
The convertertable must be in the ICU ucm (Unicode Codepage Mapping)
format in order to be understood by makeconv. The ICU ucm format is
similar to the IBM NLTC upmap/tpmap/rpmap files. Comments in the con‐
vertertable are handled as follows. If a comment (starting with a `#'
sign) that is after some text does contain the fallback indicator `|'
then only the text starting with the `#' sign, and ending before the
`|' sign, is ignored. Otherwise, or if the comment is the first thing
on the line, the comment runs up to the end of the line. This special
handling of comments is to accommodate the practice of putting fallback
information in comments in the strict IBM NLTC ucmap format.
Note that new converters will be automatically found by ICU after their
installation in ICU's data directory. They do not need to be listed in
the convrtrs.txt(5) converters aliases file in order to be available to
applications using ICU. They do need to be listed there if one wants
to give them aliases, or tags, though.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-c, --copyright
Include a copyright notice in the binary data.
-v, --verbose
Display extra informative messages during execution.
-d, --destdir destination
Set the destination directory to destination. The default des‐
tination directory is specified by the environment variable
ICU_DATA.
CAVEATS
If an existing converter table is changed and recompiled using make‐
conv, the resulting binary file must be packaged in the same way that
it was packaged initially. For example, if converters were grouped to‐
gether in an archive or a library with pkgdata(1), then the archive or
library must be rebuilt with the new binary file. A standalone binary
converter file will not take precedence over a packaged one.
ENVIRONMENT
ICU_DATA Specifies the directory containing ICU data. Defaults to
/usr/share/icu/77.1/. Some tools in ICU depend on the pres‐
ence of the trailing slash. It is thus important to make sure
that it is present if ICU_DATA is set.
VERSION
77.1
COPYRIGHT
Copyright (C) 2000 IBM, Inc. and others.
SEE ALSO
convrtrs.txt(5)
pkgdata(1)
ICU MANPAGE 16 April 2002 MAKECONV(1)
UCONV(1) ICU 77.1 Manual UCONV(1)
NAME
uconv - преобразовать данные из одного encoding в другое
SYNOPSIS
uconv [ -h, -?, --help ] [ -V, --version ] [ -s, --silent ] [ -v,
--verbose ] [ -l, --list | -l, --list-code code | --default-code | -L,
--list-transliterators ] [ --canon ] [ -x transliteration ] [
--to-callback callback | -c ] [ --from-callback callback | -i ] [
--callback callback ] [ --fallback | --no-fallback ] [ -b, --block-size
size ] [ -f, --from-code encoding ] [ -t, --to-code encoding ] [
--add-signature ] [ --remove-signature ] [ -o, --output file ] [
file... ]
DESCRIPTION
uconv преобразует, или транскодирует, каждый указанный файл (или стандартный ввод, если файл не указан) из одного encoding в другое. Транскодирование выполняется с использованием Unicode в качестве промежуточного encoding (т.е. данные сначала транскодируются из исходного encoding в Unicode, а затем из Unicode в целевое encoding).
Если encoding не указано или указано как -, используется encoding по умолчанию. Таким образом, вызов uconv без указания encoding предоставляет простой способ проверки и очистки файлов данных для дальнейшего использования инструментами, требующими данных в encoding по умолчанию.
При вызове uconv можно указать callbacks, которые используются для обработки недопустимых символов во входных данных или символов, которые нельзя транскодировать в целевое encoding. Некоторые encoding, например, предлагают символ замены по умолчанию, который может быть использован для представления таких символов во входных данных. Другие callbacks предоставляют полезное визуальное представление недопустимых данных.
uconv также может выполнять указанную transliteration на транскодированных данных, в этом случае transliteration происходит как промежуточный шаг после транскодирования данных в Unicode. Transliteration может быть либо списком имен transliterator'ов, разделенных точкой с запятой, либо произвольным сложным набором правил в формате правил transliteration ICU.
Для целей транскодирования опции uconv совместимы с опциями iconv(1), что облегчает его замену в скриптах. Однако имена encoding, используемые uconv и ICU, не обязательно совпадают с теми, что используются iconv(1). Кроме того, опции, предоставляющие информационные данные, такие как -l, --list, предлагаемые некоторыми вариантами iconv(1), такими как GNU's, выдают данные в слегка отличающемся и более простом для разбора формате.
OPTIONS
-h, -?, --help
Вывести справку по использованию и выйти.
-V, --version
Вывести версию uconv и выйти.
-s, --silent
Подавить сообщения во время выполнения.
-v, --verbose
Выводить дополнительные информационные сообщения во время выполнения.
-l, --list
Вывести список всех доступных encoding и выйти.
-l, --list-code code
Вывести только encoding code и выйти. Если code не является правильным encoding, выйти с ошибкой.
--default-code
Вывести только имя encoding по умолчанию и выйти.
-L, --list-transliterators
Вывести список всех доступных transliterator'ов и выйти.
--canon
Если используется с -l, --list или --default-code, список encoding выводится в формате, совместимом с convrtrs.txt(5). Если используется с -L, --list-transliterators, выводить только одно имя transliterator на строку.
-x transliteration
Выполнить указанную transliteration на транскодированных Unicode-данных и использовать transliterated данные как вход для транскодирования в целевое encoding.
--to-callback callback
Использовать callback для обработки символов, которые нельзя транскодировать в целевое encoding. См. раздел CALLBACKS для деталей о допустимых callbacks.
-c Исключить недопустимые символы из вывода. То же, что и --to-callback skip.
--from-callback callback
Использовать callback для обработки символов, которые нельзя транскодировать из исходного encoding. См. раздел CALLBACKS для деталей о допустимых callbacks.
-i Игнорировать недопустимые последовательности во входных данных. То же, что и --from-callback skip.
--callback callback
Использовать callback для обработки символов, которые нельзя транскодировать из исходного encoding и символов, которые нельзя транскодировать в целевое encoding. См. раздел CALLBACKS для деталей о допустимых callbacks.
--fallback
Использовать fallback mapping при транскодировании из Unicode в целевое encoding.
--no-fallback
Не использовать fallback mapping при транскодировании из Unicode в целевое encoding. Это значение по умолчанию.
-b, --block-size size
Чтение входных данных блоками по size байт за раз. Значение block-size по умолчанию — 4096.
-f, --from-code encoding
Установить исходное encoding данных как encoding.
-t, --to-code encoding
Транскодировать данные в encoding.
--add-signature
Добавить символ сигнатуры Unicode U+FEFF (BOM), если output charset поддерживает его и не добавляет автоматически.
--remove-signature
Удалить символ сигнатуры Unicode U+FEFF (BOM).
-o, --output file
Записать транскодированные данные в file.
CALLBACKS
uconv поддерживает указание callbacks для обработки недопустимых данных. Callbacks можно установить для обоих направлений транскодирования: из исходного encoding в Unicode с опцией --from-callback и из Unicode в целевое encoding с опцией --to-callback.
Ниже приведен список допустимых имен callbacks с описанием их поведения. Список callbacks, фактически поддерживаемых uconv, отображается при вызове с -h, --help.
substitute Записать последовательность замены encoding или символ замены Unicode U+FFFD при транскодировании в Unicode.
skip Игнорировать недопустимые данные.
stop Остановить выполнение с ошибкой при обнаружении недопустимых данных. Это callback по умолчанию.
escape То же, что и escape-icu.
escape-icu Заменить отсутствующие символы на строку формата %Uhhhh для символов плоскости 0 и %Uhhhh%Uhhhh для символов плоскостей 1 и выше, где hhhh — шестнадцатеричное значение одного из кодовых единиц UTF-16, представляющих символ. Символы из плоскостей 1 и выше записываются как пара кодовых единиц UTF-16 суррогатов.
escape-java Заменить отсутствующие символы на строку формата \uhhhh для символов плоскости 0 и \uhhhh\uhhhh для символов плоскостей 1 и выше, где hhhh — шестнадцатеричное значение одного из кодовых единиц UTF-16, представляющих символ. Символы из плоскостей 1 и выше записываются как пара кодовых единиц UTF-16 суррогатов.
escape-c Заменить отсутствующие символы на строку формата \uhhhh для символов плоскости 0 и \Uhhhhhhhh для символов плоскостей 1 и выше, где hhhh и hhhhhhhh — шестнадцатеричные значения кодовой точки Unicode.
escape-xml См. escape-xml-hex.
escape-xml-hex Заменить отсутствующие символы на строку формата &#xhhhh;, где hhhh — шестнадцатеричное значение кодовой точки Unicode.
escape-xml-dec Заменить отсутствующие символы на строку формата &#nnnn;, где nnnn — десятичное значение кодовой точки Unicode.
escape-unicode Заменить отсутствующие символы на строку формата {U+hhhh}, где hhhh — шестнадцатеричное значение кодовой точки Unicode. Эта шестнадцатеричная строка имеет переменную длину и может использовать от 4 до 6 цифр. Это формат, универсально используемый для обозначения кодовой точки Unicode в литературе, ограниченный фигурными скобками для легкого распознавания этих замен в выводе.
EXAMPLES
Преобразовать данные из указанного encoding в encoding платформы:
$ uconv -f encoding
Проверить, содержит ли файл допустимые данные для указанного encoding:
$ uconv -f encoding -c file >/dev/null
Преобразовать файл в UTF-8 в указанное encoding и убедиться, что результирующий текст подходит для любой версии HTML:
$ uconv -f utf-8 -t encoding \
--callback escape-xml-dec file
Вывести имена кодовых точек Unicode в файле UTF:
$ uconv -f utf-8 -x any-name file
Вывести имя кодовой точки Unicode, значение которой известно (U+30AB в этом примере):
$ echo '\u30ab' | uconv -x 'hex-any; any-name'; echo
{KATAKANA LETTER KA}{LINE FEED}
$
(Имена ограничены фигурными скобками. Также выводится имя разделителя строк.)
Нормализовать данные в UTF-8 с использованием Unicode NFKC, удалить все управляющие символы и преобразовать Katakana в Hiragana:
$ uconv -f utf-8 -t utf-8 \
-x '::nfkc; [:Cc:] >; ::katakana-hiragana;'
CAVEATS AND BUGS
uconv сообщает об ошибках как о происходящих на первом недопустимом байте. Это может запутать пользователей GNU iconv(1), который сообщает об ошибках как о происходящих на первом байте недопустимой последовательности. Для multi-byte character sets или encoding это означает, что позиции ошибок в uconv могут быть на более позднем смещении в потоке входных данных, чем в случае с GNU iconv(1).
Сообщение о позициях ошибок при использовании transliterator может быть неточным или недоступным, в этом случае uconv сообщит смещение в потоке вывода, где произошла ошибка.
AUTHORS
Jonas Utterstroem
Yves Arrouye
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2005 IBM, Inc. and others.
SEE ALSO
iconv(1)
ICU MANPAGE 2005-jul-1 UCONV(1)
UCONV(1) ICU 77.1 Manual UCONV(1)
NAME
uconv - convert data from one encoding to another
SYNOPSIS
uconv [ -h, -?, --help ] [ -V, --version ] [ -s, --silent ] [ -v,
--verbose ] [ -l, --list | -l, --list-code code | --default-code | -L,
--list-transliterators ] [ --canon ] [ -x transliteration ] [
--to-callback callback | -c ] [ --from-callback callback | -i ] [
--callback callback ] [ --fallback | --no-fallback ] [ -b, --block-size
size ] [ -f, --from-code encoding ] [ -t, --to-code encoding ] [
--add-signature ] [ --remove-signature ] [ -o, --output file ] [
file... ]
DESCRIPTION
uconv converts, or transcodes, each given file (or its standard input
if no file is specified) from one encoding to another. The transcoding
is done using Unicode as a pivot encoding (i.e. the data are first
transcoded from their original encoding to Unicode, and then from Uni‐
code to the destination encoding).
If an encoding is not specified or is -, the default encoding is used.
Thus, calling uconv with no encoding provides an easy way to validate
and sanitize data files for further consumption by tools requiring data
in the default encoding.
When calling uconv, it is possible to specify callbacks that are used
to handle invalid characters in the input, or characters that cannot be
transcoded to the destination encoding. Some encodings, for example,
offer a default substitution character that can be used to represent
the occurrence of such characters in the input. Other callbacks offer a
useful visual representation of the invalid data.
uconv can also run the specified transliteration on the transcoded
data, in which case transliteration will happen as an intermediate
step, after the data have been transcoded to Unicode. The translitera‐
tion can be either a list of semicolon-separated transliterator names,
or an arbitrarily complex set of rules in the ICU transliteration rules
format.
For transcoding purposes, uconv options are compatible with those of
iconv(1), making it easy to replace it in scripts. It is not necessar‐
ily the case, however, that the encoding names used by uconv and ICU
are the same as the ones used by iconv(1). Also, options that provide
informational data, such as the -l, --list one offered by some iconv(1)
variants such as GNU's, produce data in a slightly different and easier
to parse format.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-V, --version
Print the version of uconv and exit.
-s, --silent
Suppress messages during execution.
-v, --verbose
Display extra informative messages during execution.
-l, --list
List all the available encodings and exit.
-l, --list-code code
List only the code encoding and exit. If code is not a proper
encoding, exit with an error.
--default-code
List only the name of the default encoding and exit.
-L, --list-transliterators
List all the available transliterators and exit.
--canon
If used with -l, --list or --default-code, the list of encodings
is produced in a format compatible with convrtrs.txt(5). If
used with -L, --list-transliterators, print only one transliter‐
ator name per line.
-x transliteration
Run the given transliteration on the transcoded Unicode data,
and use the transliterated data as input for the transcoding to
the destination encoding.
--to-callback callback
Use callback to handle characters that cannot be transcoded to
the destination encoding. See section CALLBACKS for details on
valid callbacks.
-c Omit invalid characters from the output. Same as --to-callback
skip.
--from-callback callback
Use callback to handle characters that cannot be transcoded from
the original encoding. See section CALLBACKS for details on
valid callbacks.
-i Ignore invalid sequences in the input. Same as --from-callback
skip.
--callback callback
Use callback to handle both characters that cannot be transcoded
from the original encoding and characters that cannot be
transcoded to the destination encoding. See section CALLBACKS
for details on valid callbacks.
--fallback
Use the fallback mapping when transcoding from Unicode to the
destination encoding.
--no-fallback
Do not use the fallback mapping when transcoding from Unicode to
the destination encoding. This is the default.
-b, --block-size size
Read input in blocks of size bytes at a time. The default block
size is 4096.
-f, --from-code encoding
Set the original encoding of the data to encoding.
-t, --to-code encoding
Transcode the data to encoding.
--add-signature
Add a U+FEFF Unicode signature character (BOM) if the output
charset supports it and does not add one anyway.
--remove-signature
Remove a U+FEFF Unicode signature character (BOM).
-o, --output file
Write the transcoded data to file.
CALLBACKS
uconv supports specifying callbacks to handle invalid data. Callbacks
can be set for both directions of transcoding: from the original encod‐
ing to Unicode, with the --from-callback option, and from Unicode to
the destination encoding, with the --to-callback option.
The following is a list of valid callback names, along with a descrip‐
tion of their behavior. The list of callbacks actually supported by
uconv is displayed when it is called with -h, --help.
substitute Write the encoding's substitute sequence, or the Uni‐
code replacement character U+FFFD when transcoding to
Unicode.
skip Ignore the invalid data.
stop Stop with an error when encountering invalid data.
This is the default callback.
escape Same as escape-icu.
escape-icu Replace the missing characters with a string of the
format %Uhhhh for plane 0 characters, and %Uhhhh%Uhhhh
for planes 1 and above characters, where hhhh is the
hexadecimal value of one of the UTF-16 code units rep‐
resenting the character. Characters from planes 1 and
above are written as a pair of UTF-16 surrogate code
units.
escape-java Replace the missing characters with a string of the
format \uhhhh for plane 0 characters, and \uhhhh\uhhhh
for planes 1 and above characters, where hhhh is the
hexadecimal value of one of the UTF-16 code units rep‐
resenting the character. Characters from planes 1 and
above are written as a pair of UTF-16 surrogate code
units.
escape-c Replace the missing characters with a string of the
format \uhhhh for plane 0 characters, and \Uhhhhhhhh
for planes 1 and above characters, where hhhh and hhh‐
hhhhh are the hexadecimal values of the Unicode code‐
point.
escape-xml Same as escape-xml-hex.
escape-xml-hex Replace the missing characters with a string of the
format &#xhhhh;, where hhhh is the hexadecimal value
of the Unicode codepoint.
escape-xml-dec Replace the missing characters with a string of the
format &#nnnn;, where nnnn is the decimal value of the
Unicode codepoint.
escape-unicode Replace the missing characters with a string of the
format {U+hhhh}, where hhhh is the hexadecimal value
of the Unicode codepoint. That hexadecimal string is
of variable length and can use from 4 to 6 digits.
This is the format universally used to denote a Uni‐
code codepoint in the literature, delimited by curly
braces for easy recognition of those substitutions in
the output.
EXAMPLES
Convert data from a given encoding to the platform encoding:
$ uconv -f encoding
Check if a file contains valid data for a given encoding:
$ uconv -f encoding -c file >/dev/null
Convert a UTF-8 file to a given encoding and ensure that the resulting
text is good for any version of HTML:
$ uconv -f utf-8 -t encoding \
--callback escape-xml-dec file
Display the names of the Unicode code points in a UTF-file:
$ uconv -f utf-8 -x any-name file
Print the name of a Unicode code point whose value is known (U+30AB in
this example):
$ echo '\u30ab' | uconv -x 'hex-any; any-name'; echo
{KATAKANA LETTER KA}{LINE FEED}
$
(The names are delimited by curly braces. Also, the name of the line
terminator is also displayed.)
Normalize UTF-8 data using Unicode NFKC, remove all control characters,
and map Katakana to Hiragana:
$ uconv -f utf-8 -t utf-8 \
-x '::nfkc; [:Cc:] >; ::katakana-hiragana;'
CAVEATS AND BUGS
uconv does report errors as occurring at the first invalid byte encoun‐
tered. This may be confusing to users of GNU iconv(1), which reports
errors as occurring at the first byte of an invalid sequence. For
multi-byte character sets or encodings, this means that uconv error po‐
sitions may be at a later offset in the input stream than would be the
case with GNU iconv(1).
The reporting of error positions when a transliterator is used may be
inaccurate or unavailable, in which case uconv will report the offset
in the output stream at which the error occurred.
AUTHORS
Jonas Utterstroem
Yves Arrouye
VERSION
77.1
COPYRIGHT
Copyright (C) 2000-2005 IBM, Inc. and others.
SEE ALSO
iconv(1)
ICU MANPAGE 2005-jul-1 UCONV(1)
GENDICT(1) Руководство ICU 77.1 GENDICT(1)
НАЗВАНИЕ
gendict - Компилирует список слов в словарь ICU string trie
СИНОПСИС
gendict [ --uchars | --bytes --transform transform ] [ -h, -?, --help ]
[ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -i, --icud‐
atadir directory ] input-file output-file
ОПИСАНИЕ
gendict читает список слов из файла input-file и создаёт файл словаря
string trie. Обычно этот файл данных имеет расширение .dict.
Слова начинаются с начала строки и заканчиваются первым пробельным
символом. Строки, начинающиеся с пробельного символа, игнорируются.
ОПЦИИ
-h, -?, --help
Выводит справку по использованию и выходит.
-V, --version
Выводит версию gendict и выходит.
-c, --copyright
Встраивает стандартный текст авторских прав ICU в output-file.
-v, --verbose
Выводит дополнительные информационные сообщения во время
выполнения.
-i, --icudatadir directory
Ищет необходимые файлы данных ICU в указанном каталоге. Например,
файл pnames.icu должен быть доступен, если данные ICU не собраны в
виде общей библиотеки. Каталог данных ICU по умолчанию задаётся
переменной окружения ICU_DATA. Большинство конфигураций ICU не
требуют этой опции.
--uchars
Устанавливает тип выходного трие на UChar. Взаимоисключаемо с
--bytes.
--bytes
Устанавливает тип выходного трие на Bytes. Взаимоисключаемо с
--uchars.
--transform
Устанавливает тип преобразования. Должно указываться только с
--bytes. Поддерживаемые преобразования: offset-<шестнадцатеричное-число>,
которое задаёт смещение для вычитания из всех входных символов. Обратите
внимание, что преобразование offset также отображает U+200D в 0xFF и
U+200C в 0xFE для обеспечения совместимости с языками, требующими эти
символы. Преобразование должно быть указано для трие bytes, и при
применении к неценовым символам в input-file оно должно производить
вывод в диапазоне от 0x00 до 0xFF.
input-file
Исходный файл для чтения.
output-file
Файл, в который будет записан выходной словарь.
ПРЕДУПРЕЖДЕНИЯ
Предполагается, что input-file закодирован в UTF-8. Целые числа в
input-file, используемые в качестве значений, должны состоять из цифр
ASCII. Они могут быть указаны либо в шестнадцатеричном формате с
префиксом 0x, либо в десятичном. Должна быть указана либо опция
--bytes, либо --uchars.
ОКРУЖЕНИЕ
ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию
/usr/share/icu/77.1/. Некоторые инструменты ICU зависят от
наличия завершающего слеша. Поэтому важно убедиться, что он
присутствует, если задана ICU_DATA.
АВТОРЫ
Maxime Serrano
ВЕРСИЯ
1.0
АВТОРСКИЕ ПРАВА
Copyright (C) 2012 International Business Machines Corporation and
others
СМ. ТАКЖЕ
http://www.icu-project.org/userguide/boundaryAnalysis.html
РУКОВОДСТВО ICU 1 июня 2012 GENDICT(1)
GENDICT(1) ICU 77.1 Manual GENDICT(1)
NAME
gendict - Compiles word list into ICU string trie dictionary
SYNOPSIS
gendict [ --uchars | --bytes --transform transform ] [ -h, -?, --help ]
[ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -i, --icud‐
atadir directory ] input-file output-file
DESCRIPTION
gendict reads the word list from dictionary-file and creates a string
trie dictionary file. Normally this data file has the .dict extension.
Words begin at the beginning of a line and are terminated by the first
whitespace. Lines that begin with whitespace are ignored.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-V, --version
Print the version of gendict and exit.
-c, --copyright
Embeds the standard ICU copyright into the output-file.
-v, --verbose
Display extra informative messages during execution.
-i, --icudatadir directory
Look for any necessary ICU data files in directory. For exam‐
ple, the file pnames.icu must be located when ICU's data is not
built as a shared library. The default ICU data directory is
specified by the environment variable ICU_DATA. Most configura‐
tions of ICU do not require this argument.
--uchars
Set the output trie type to UChar. Mutually exclusive with
--bytes.
--bytes
Set the output trie type to Bytes. Mutually exclusive with
--uchars.
--transform
Set the transform type. Should only be specified with --bytes.
Currently supported transforms are: offset-<hex-number>, which
specifies an offset to subtract from all input characters. It
should be noted that the offset transform also maps U+200D to
0xFF and U+200C to 0xFE, in order to offer compatibility to lan‐
guages that require these characters. A transform must be spec‐
ified for a bytes trie, and when applied to the non-value char‐
acters in the input-file must produce output between 0x00 and
0xFF.
input-file
The source file to read.
output-file
The file to write the output dictionary to.
CAVEATS
The input-file is assumed to be encoded in UTF-8. The integers in the
input-file that are used as values must be made up of ASCII digits.
They may be specified either in hex, by using a 0x prefix, or in deci‐
mal. Either --bytes or --uchars must be specified.
ENVIRONMENT
ICU_DATA Specifies the directory containing ICU data. Defaults to
/usr/share/icu/77.1/. Some tools in ICU depend on the pres‐
ence of the trailing slash. It is thus important to make sure
that it is present if ICU_DATA is set.
AUTHORS
Maxime Serrano
VERSION
1.0
COPYRIGHT
Copyright (C) 2012 International Business Machines Corporation and oth‐
ers
SEE ALSO
http://www.icu-project.org/userguide/boundaryAnalysis.html
ICU MANPAGE 1 June 2012 GENDICT(1)
ICU-CONFIG(1) ICU 77.1 Manual ICU-CONFIG(1)
NAME
icu-config - вывод опций сборки ICU
SYNOPSIS
icu-config [ --bindir ] [ --cc ] [ --cflags ] [ --cppflags ] [
--cppflags-searchpath ] [ --cxx ] [ --cxxflags ] [ --detect-prefix ] [
--exec-prefix ] [ --exists ] [ --help, -?, --usage ] [ --icudata ] [
--icudata-install-dir ] [ --icudata-mode ] [ --icudatadir ] [ --invoke
] [ --invoke=prog ] [ --ldflags ] [ --ldflags-libsonly ] [ --ld‐
flags-searchpath ] [ --ldflags-system ] [ --ldflags-icuio ] [ --mandir
] [ --prefix ] [ --prefix=prefix ] [ --sbindir ] [ --shared-datadir ] [
--sysconfdir ] [ --unicode-version ] [ --version ] [ --incfile ]
DESCRIPTION
icu-config упрощает задачу сборки и связывания с ICU по сравнению с ручной
конфигурацией пользовательских makefile или эквивалентных. Поскольку
icu-config является исполняемым скриптом, он также решает проблему
локализации библиотек и заголовков ICU, позволяя системе PATH найти его.
EXAMPLES
icu-config можно использовать без makefile. Команда ниже достаточна для
сборки одноблочного C++-программы с ICU. (Например, icu/source/samples/props/props.cpp)
`icu-config --cxx --cxxflags --cppflags --ldflags` -o props
props.cpp
Чаще icu-config вызывается из makefile и используется для установки
переменных. В следующем примере также строится пример props.
CC=$(shell icu-config --cc)
CXX=$(shell icu-config --cxx)
CPPFLAGS=$(shell icu-config --cppflags)
CXXFLAGS=$(shell icu-config --cxxflags)
LDFLAGS =$(shell icu-config --ldflags)
all: props
props.o: props.cpp
make(1) автоматически использует указанные выше переменные.
OPTIONS
--bindir
Выводит путь к каталогу с двоичными (исполняемыми) файлами. Обычно
эквивалентно 'bin'. Приложения и скрипты ICU, предназначенные для
пользователей, находятся здесь.
--cc Выводит используемый C-компилятор. Эквивалентно переменной $(CC) в Makefile.
--cflags
Выводит флаги C-компилятора. Эквивалентно переменной $(CFLAGS) в Makefile.
Не включает директивы препроцессора, такие как пути include или определённые
символы. Примеры: флаги отладки (-g) и оптимизации.
--cppflags
Выводит флаги препроцессора C. Эквивалентно переменной $(CPPFLAGS) в Makefile.
Примеры: -I пути include и -D директивы определения.
--cppflags-searchpath
Выводит флаги препроцессора C, как выше, но только -I пути поиска.
--cxx Выводит C++-компилятор. Эквивалентно переменной $(CXX) в Makefile.
--cxxflags
Выводит флаги C++-компилятора. Эквивалентно переменной $(CXXFLAGS) в Makefile.
--detect-prefix
Если ICU был перемещён из места установки, добавление этого флага к другим
вызовам icu-config попытается локализовать ICU относительно места, где
находится скрипт icu-config. Можно использовать как последнюю попытку, если
установка ICU повреждена.
--exec-prefix
Выводит префикс, используемый для каталогов с исполняемыми программами
(такими как bin, sbin и т.д.). Обычно совпадает с префиксом.
--exists
Скрипт вернёт успешный (0) статус, если ICU установлен и локализован
правильно, в противном случае будет выведено сообщение об ошибке и ненулевой
статус.
--help, -?,--usage
Выводит сообщение помощи и использования.
--icudata
Выводит короткое имя файла данных ICU. Это не включает суффиксы, такие как
.dat, .dll, .so, .lib, .a и т.д., а также префиксы, такие как 'lib'. Может
быть в форме icudt21b.
--icudata-install-dir
Выводит каталог, куда должны быть установлены упакованные данные ICU.
Можно использовать как опцию --install в pkgdata(1).
--icudata-mode
Выводит режим данных ICU по умолчанию, такой как dll или common. Можно
использовать как опцию --mode в pkgdata(1).
--icudatadir
Выводит путь к упакованным архивным данным. (Должен быть там, куда указывает
$ICU_DATA или эквивалентный путь по умолчанию.) Не указывает на libdir.
--invoke
Если ICU не установлен в месте, где операционная система найдёт его
разделяемые библиотеки, эта опция выведет команды для установки
соответствующих переменных окружения для загрузки разделяемых библиотек ICU.
Например, на многих системах нужно установить переменную, такую как
LD_LIBRARY_PATH или эквивалентную.
--invoke=prog
То же, что и опция --invoke, но включает опции для вызова программы с именем
prog. Если prog — имя инструмента ICU, такого как genrb(1), то icu-config
также включит полный путь к этому инструменту.
--ldflags
Выводит любые флаги, которые должны быть переданы линковщику. Они могут
включать -L для путей поиска библиотек и -l для включения библиотек ICU.
По умолчанию эта опция попытается связать библиотеки "common" (libicuuc) и
"i18n" (libicui18n), а также библиотеку данных. Если требуются дополнительные
библиотеки, можно добавить любой из следующих двух флагов в сочетании с этим,
например "--ldflags --ldflags-icuio", если требуется библиотека icuio помимо
стандартных библиотек ICU. Эквивалентно переменной $(LDFLAGS) в Makefile.
--ldflags-layout
Выводит опцию связи для библиотеки макета ICU.
--ldflags-icuio
Выводит опцию связи для добавления пакета ICU I/O.
--ldflags-libsonly
Похоже на --ldflags, но включает только опции -l.
--ldflags-searchpath
Похоже на --ldflags, но включает только опции -L путей поиска.
--ldflags-system
Похоже на --ldflags, но включает только системные библиотеки (такие как
pthreads). --mandir Выводит расположение установленных страниц руководства ICU.
Обычно (man)
--prefix
Выводит префикс (базовый каталог), под которым установлен ICU.
--prefix=prefix
Устанавливает префикс ICU на prefix для остальной части этой командной строки.
Не проверяет, действителен ли новый префикс.
--sbindir
Выводит расположение системных двоичных файлов ICU, обычно (sbin)
--shared-datadir
Выводит расположение общих данных ICU, обычно (share)
--sysconfdir
Выводит расположение системных конфигурационных данных ICU, обычно (etc)
--unicode-version
Выводит версию стандарта Unicode, который использует текущий ICU.
--version
Выводит текущую версию ICU.
--incfile
Выводит путь к 'Makefile.inc', подходящий для использования с опцией -O в
pkgdata(1).
AUTHORS
Steven Loomis
VERSION
77.1
COPYRIGHT
Copyright (C) 2002-2004 IBM, Inc. and others.
ICU MANPAGE 17 May 2004 ICU-CONFIG(1)
ICU-CONFIG(1) ICU 77.1 Manual ICU-CONFIG(1)
NAME
icu-config - output ICU build options
SYNOPSIS
icu-config [ --bindir ] [ --cc ] [ --cflags ] [ --cppflags ] [
--cppflags-searchpath ] [ --cxx ] [ --cxxflags ] [ --detect-prefix ] [
--exec-prefix ] [ --exists ] [ --help, -?, --usage ] [ --icudata ] [
--icudata-install-dir ] [ --icudata-mode ] [ --icudatadir ] [ --invoke
] [ --invoke=prog ] [ --ldflags ] [ --ldflags-libsonly ] [ --ld‐
flags-searchpath ] [ --ldflags-system ] [ --ldflags-icuio ] [ --mandir
] [ --prefix ] [ --prefix=prefix ] [ --sbindir ] [ --shared-datadir ] [
--sysconfdir ] [ --unicode-version ] [ --version ] [ --incfile ]
DESCRIPTION
icu-config simplifies the task of building and linking against ICU as
compared to manually configuring user makefiles or equivalent. Because
icu-config is an executable script, it also solves the problem of lo‐
cating the ICU libraries and headers, by allowing the system PATH to
locate it.
EXAMPLES
icu-config can be used without a makefile. The command line below is
sufficient for building a single-file c++ program against ICU. (For ex‐
ample, icu/source/samples/props/props.cpp)
`icu-config --cxx --cxxflags --cppflags --ldflags` -o props
props.cpp
More commonly, icu-config will be called from within a makefile, and
used to set up variables. The following example also builds the props
example.
CC=$(shell icu-config --cc)
CXX=$(shell icu-config --cxx)
CPPFLAGS=$(shell icu-config --cppflags)
CXXFLAGS=$(shell icu-config --cxxflags)
LDFLAGS =$(shell icu-config --ldflags)
all: props
props.o: props.cpp
make(1) will automatically use the above variables.
OPTIONS
--bindir
Prints the binary (executable) directory path. Normally equiva‐
lent to 'bin'. ICU user-executable applications and scripts are
found here.
--cc Print the C compiler used. Equivalent to the $(CC) Makefile
variable.
--cflags
Print the C compiler flags. Equivalent to the $(CFLAGS) Makefile
variable. Does NOT include preprocessor directives such as in‐
clude path or defined symbols. Examples include debugging (-g)
and optimization flags
--cppflags
Print the C preprocessor flags. Equivalent to the $(CPPFLAGS)
Makefile variable. Examples are -I include paths and -D define
directives.
--cppflags-searchpath
Print the C preprocessor flags, as above but only -I search
paths.
--cxx Print the C++ compiler. Equivalent to the $(CXX) Makefile vari‐
able.
--cxxflags
Print the C++ compiler flags. Equivalent to the $(CXXFLAGS)
Makefile variable.
--detect-prefix
If ICU has been moved from its installed location, prepending
this flag to other icu-config calls will attempt to locate ICU
relative to where the icu-config script has been located. Can be
used as a last-chance effort if the ICU install has been dam‐
aged.
--exec-prefix
Print the prefix used for executable program directories (such
as bin, sbin, etc). Normally the same as the prefix.
--exists
Script will return with a successful (0) status if ICU seems to
be installed and located correctly, otherwise an error message
and nonzero status will be displayed.
--help, -?,--usage
Print a help and usage message.
--icudata
Print the shortname of the ICU data file. This does not include
any suffix such as .dat, .dll, .so, .lib, .a, etc nor does it
include prefixes such as 'lib'. It may be in the form icudt21b
--icudata-install-dir
Print the directory where ICU packaged data should be installed.
Can use as pkgdata(1)'s --install option.
--icudata-mode
Print the default ICU pkgdata mode, such as dll or common. Can
use as pkgdata(1)'s --mode option.
--icudatadir
Print the path to packaged archive data. (should be where
$ICU_DATA or equivalent default path points.) Will NOT point to
the libdir.
--invoke
If ICU is not installed in a location where the operating system
will locate its shared libraries, this option will print out
commands so as to set the appropriate environment variables to
load ICU's shared libraries. For example, on many systems a
variable named LD_LIBRARY_PATH or equivalent must be set.
--invoke=prog
Same as the --invoke option, except includes options for invok‐
ing a program named prog. If prog is the name of an ICU tool,
such as genrb(1), then icu-config will also include the full
path to that tool.
--ldflags
Print any flags which should be passed to the linker. These may
include -L for library search paths, and -l for including ICU
libraries. By default, this option will attempt to link in the
"common" (libicuuc) and "i18n" (libicui18n) libraries, as well
as the data library. If additional libraries are required, any
of the following two flags may be added in conjunction with this
one, for example "--ldflags --ldflags-icuio" if the icuio li‐
brary is required in addition to the standard ICU libraries.
Equivalent to the $(LDFLAGS) Makefile variable.
--ldflags-layout
Prints the link option for the ICU layout library.
--ldflags-icuio
Prints the link option to add the ICU I/O package
--ldflags-libsonly
Similar to --ldflags but only includes the -l options.
--ldflags-searchpath
Similar to --ldflags but only includes the -L search path op‐
tions.
--ldflags-system
Similar to --ldflags but only includes system libraries (such as
pthreads) --mandir Prints the location of the installed ICU man
pages. Normally (man)
--prefix
Prints the prefix (base directory) under which the installed ICU
resides.
--prefix=prefix
Sets the ICU prefix to prefix for the remainder of this command
line. Does test whether the new prefix is valid.
--sbindir
Prints the location of ICU system binaries, normally (sbin)
--shared-datadir
Prints the location of ICU shared data, normally (share)
--sysconfdir
Prints the location of ICU system configuration data, normally
(etc)
--unicode-version
Prints the Version of the Unicode Standard which the current ICU
uses.
--version
Prints the current version of ICU.
--incfile
Prints the 'Makefile.inc' path, suitable for use with pkg‐
data(1)'s -O option.
AUTHORS
Steven Loomis
VERSION
77.1
COPYRIGHT
Copyright (C) 2002-2004 IBM, Inc. and others.
ICU MANPAGE 17 May 2004 ICU-CONFIG(1)
GENBRK(1) ICU 77.1 Manual GENBRK(1)
NAME
genbrk - Компилирует исходные файлы правил итерации разрывов ICU в бинарные файлы данных
SYNOPSIS
genbrk [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v,
--verbose ] [ -d, --destdir destination ] [ -i, --icudatadir directory
] -r, --rules rule-file -o, --out output-file
DESCRIPTION
genbrk читает исходный код правил разрывов (границ) из rule-file и создаёт
файл данных итерации разрывов. Обычно этот файл данных имеет расширение
.brk.
Подробности синтаксиса правил можно найти в Руководстве пользователя ICU.
OPTIONS
-h, -?, --help
Выводит справку по использованию и выходит.
-V, --version
Выводит версию genbrk и выходит.
-c, --copyright
Встраивает стандартный текст авторских прав ICU в output-file.
-v, --verbose
Выводит дополнительные информационные сообщения во время выполнения.
-d, --destdir destination
Устанавливает каталог назначения для output-file как destination.
-i, --icudatadir directory
Ищет необходимые файлы данных ICU в каталоге directory. Например,
файл pnames.icu должен быть доступен, если данные ICU не собраны как
разделяемая библиотека. Каталог данных ICU по умолчанию указывается
переменной окружения ICU_DATA. Большинство конфигураций ICU не требуют
этого аргумента.
-r, --rules rule-file
Исходный файл для чтения.
-o, --out output-file
Выходной файл данных для записи.
CAVEATS
Если rule-file содержит метку порядка байтов (BOM) в начале файла, которая
является Юникод-символом U+FEFF, то rule-file интерпретируется как
Юникод. Без BOM файл интерпретируется в кодовой странице по умолчанию
операционной системы. Чтобы избежать неоднозначности кодировки, с которой
был записан rule-file, рекомендуется писать этот файл в UTF-8 с BOM.
ENVIRONMENT
ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию это
/usr/share/icu/77.1/. Некоторые инструменты ICU зависят от наличия
завершающего слеша. Важно убедиться, что он присутствует, если
ICU_DATA задана.
AUTHORS
George Rhoten
Andy Heninger
VERSION
1.0
COPYRIGHT
Copyright (C) 2005 International Business Machines Corporation и другие
SEE ALSO
http://www.icu-project.org/userguide/boundaryAnalysis.html
ICU MANPAGE 2 December 2005 GENBRK(1)
GENBRK(1) ICU 77.1 Manual GENBRK(1)
NAME
genbrk - Compiles ICU break iteration rules source files into binary
data files
SYNOPSIS
genbrk [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v,
--verbose ] [ -d, --destdir destination ] [ -i, --icudatadir directory
] -r, --rules rule-file -o, --out output-file
DESCRIPTION
genbrk reads the break (boundary) rule source code from rule-file and
creates a break iteration data file. Normally this data file has the
.brk extension.
The details of the rule syntax can be found in ICU's User Guide.
OPTIONS
-h, -?, --help
Print help about usage and exit.
-V, --version
Print the version of genbrk and exit.
-c, --copyright
Embeds the standard ICU copyright into the output-file.
-v, --verbose
Display extra informative messages during execution.
-d, --destdir destination
Set the destination directory of the output-file to destination.
-i, --icudatadir directory
Look for any necessary ICU data files in directory. For exam‐
ple, the file pnames.icu must be located when ICU's data is not
built as a shared library. The default ICU data directory is
specified by the environment variable ICU_DATA. Most configura‐
tions of ICU do not require this argument.
-r, --rules rule-file
The source file to read.
-o, --out output-file
The output data file to write.
CAVEATS
When the rule-file contains a byte order mark (BOM) at the beginning of
the file, which is the Unicode character U+FEFF, then the rule-file is
interpreted as Unicode. Without the BOM, the file is interpreted in the
current operating system default codepage. In order to eliminate any
ambiguity of the encoding for how the rule-file was written, it is rec‐
ommended that you write this file in UTF-8 with the BOM.
ENVIRONMENT
ICU_DATA Specifies the directory containing ICU data. Defaults to
/usr/share/icu/77.1/. Some tools in ICU depend on the pres‐
ence of the trailing slash. It is thus important to make sure
that it is present if ICU_DATA is set.
AUTHORS
George Rhoten
Andy Heninger
VERSION
1.0
COPYRIGHT
Copyright (C) 2005 International Business Machines Corporation and oth‐
ers
SEE ALSO
http://www.icu-project.org/userguide/boundaryAnalysis.html
ICU MANPAGE 2 December 2005 GENBRK(1)