Пакет: icu-devel
- Версия
- 77.1
- Релиз
- 1.niceos5
- Архитектура
- x86_64
- Хэш GOST
- 01908f8ab1229661756278dcc8465d47d0515c7af154a6b32a4c253a0798e2ec
- Хэш MD5
- 1185a05eb7c5ab11b5b854f1dd14f606
- Хэш SHA256
- 152d18c2dac81a34c29eefd69f972be796dedb6b31c8e3e59090dbb7fd585503
- Лицензия
- MIT и UCD и Public Domain
- Дата сборки
- 12 мая 2025 г.
- Размер
- 4,875 ГиБ
- Совместимые ОС
- rpm файл:
- icu-devel-77.1-1.niceos5.x86_64.rpm
Основной пакет
Этот подпакет входит в состав основного пакета: icu
Зависимости
Имя | Тип | Версия |
---|---|---|
/bin/sh | runtime | - |
icu | runtime | - |
pkgconfig(icu-i18n) | runtime | - |
pkgconfig(icu-uc) | runtime | - |
Граф зависимостей
Файлы пакета
-
-
- /usr/include/unicode 0 Б
-
-
- /usr/lib/libicudata.so 18 Б
- /usr/lib/libicui18n.so 18 Б
- /usr/lib/libicuio.so 16 Б
- /usr/lib/libicutest.so 18 Б
- /usr/lib/libicutu.so 16 Б
- /usr/lib/libicuuc.so 16 Б
-
- /usr/lib/pkgconfig/icu-i18n.pc 1,18 КиБ
- /usr/lib/pkgconfig/icu-io.pc 1,172 КиБ
- /usr/lib/pkgconfig/icu-uc.pc 1,184 КиБ
-
-
-
- /usr/share/icu 0 Б
- /usr/share/man 0 Б
-
-
Документация (man-страницы)
PKGDATA(1) ICU 77.1 Manual PKGDATA(1) NAME pkgdata - упаковка данных для использования в ICU SYNOPSIS pkgdata [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright | -C, --comment comment ] [ -m, --mode mode ] -p, --name name -O, --bldopt options [ -e, --entrypoint name ] [ -r, --revision version ] [ -F, --rebuild ] [ -I, --install ] [ -s, --sourcedir source ] [ -d, --dest‐ dir destination ] [ -T, --tempdir directory ] [ file ... ] DESCRIPTION pkgdata берёт набор файлов данных и упаковывает их для использова‐ ния в ICU или приложениями, которые используют ICU. Типичная причина для упаковки файлов с помощью pkgdata — упростить их распространение и ускорить загрузку в ICU, а также снизить потребление ограниченных си‐ стемных ресурсов, таких как дескрипторы файлов. Упакованные данные так‐ же позволяют приложениям распространяться с меньшим количеством ре‐ сурсных файлов, или даже без них, если они напрямую связаны с упа‐ кованными данными. pkgdata поддерживает несколько различных методов упаковки данных, ко‐ торые служат разным целям. Режим упаковки по умолчанию — common, или archive. В этом режиме раз‐ личные файлы данных объединяются в файл, зависящий от архитектуры, который позже может быть отображён в память для использования в ICU. Данные, упакованные с помощью этого режима, будут искаться в ка‐ талоге данных ICU. Такая упаковка удобна для приложений, использующих наборы ресурсов, например, при условии, что приложение может уста‐ новить упакованный файл в каталог данных ICU. Другой режим упаковки — dll, или library, где файлы данных компилиру‐ ются в разделяемую библиотеку. ICU ранее могла динамически загру‐ жать эти разделяемые библиотеки, но начиная с ICU 2.0 такая поддержка была удалена. Этот режим всё ещё полезен для двух основных целей: для сборки ICU, так как данные ICU по умолчанию упаковываются как разде‐ ляемая библиотека; и для сборки наборов ресурсов, которые связа‐ ны с приложением, которое их использует. Такие наборы ресурсов могут быть размещены в любом месте, где системный динамический линкер будет искать разделяемые библиотеки, вместо того, чтобы быть ограниченными каталогом данных ICU. Режим статической упаковки похож на режим разделяемой библиотеки, кроме того, что он производит статическую библиотеку. Наконец, pkgdata поддерживает режим files, который просто копирует фа‐ йлы данных, вместо того, чтобы упаковывать их в один файл или библиотеку. Этот режим в основном предназначен для предоставления под‐ держки сборки ICU до её упаковки в отдельные небольшие пакеты для распространения с операционными системами, такими как Debian GNU/Linux, например. Для дополнительной информации о использовании этого режима обратитесь к документации по упаковке в исходной дистрибуции ICU. pkgdata собирает, упаковывает, устанавливает или очищает соответ‐ ствующие данные на основе указанных опций, без необходимости вызова GNU make. OPTIONS -h, -?, --help Вывести справку по использованию и выйти. -v, --verbose Выводить дополнительные информационные сообщения во время вы‐ полнения. -c, --copyright Включить уведомление об авторском праве в двоичные данные. -C, --comment comment Включить указанный комментарий в результирующие данные вместо уведомления об авторском праве ICU. -m, --mode mode Установить режим упаковки для использования pkgdata. Различные режимы и их значения объяснены в разделе DESCRIPTION выше. Допу‐ стимые имена режимов: common (или archive), dll (или library) и files. -O, --bldopt options Указать опции для сборщика. Сборщик используется внутренне в pkgdata для генерации правильного упакованного файла. Такие опции включают, но не ограничиваются, установкой переменных, используемых make(1) во время сборки упакованного файла. При‐ мечание: Если icu-config доступен, то эта опция не нужна. -p, --name name Установить имя упакованного файла как name. Это имя также ис‐ пользуется как имя точки входа по умолчанию после преобразо‐ вания в допустимый идентификатор C. -e, --entrypoint name Установить точку входа данных (используется для связывания с данными в форме разделяемой библиотеки) как name. Имя точки входа по умолчанию — имя, установленное опцией -n, --name. -r, --revision version Включить версионирование разделяемой библиотеки, произведённой в режиме dll или library. Номер версии имеет формат major.mi‐ nor.patchlevel, и все части, кроме major, являются опциональны‐ ми. Если указан только major, то версия считается major.0 для целей версионирования. -F, --rebuild Принудительно перестроить все данные и их повторную упаковку. -I, --install Установить упакованный файл (или все файлы в режиме files). Ес‐ ли переменная DESTDIR установлена, она будет использована для установки. -s, --sourcedir source Установить исходный каталог как source. Исходный каталог по умол‐ чанию — текущий каталог. -d, --destdir destination Установить целевой каталог как destination. Целевой каталог по умолчанию — текущий каталог. -T, --tempdir directory Установить каталог для генерации временных файлов как directory. Каталог для временных файлов по умолчанию — тот же, что и целевой каталог, установленный опцией -d, --destdir. AUTHORS Steven Loomis Yves Arrouye VERSION 77.1 COPYRIGHT Copyright (C) 2000-2009 IBM, Inc. и другие. ICU MANPAGE 6 февраля 2009 PKGDATA(1)
PKGDATA(1) ICU 77.1 Manual PKGDATA(1) NAME pkgdata - package data for use by ICU SYNOPSIS pkgdata [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright | -C, --comment comment ] [ -m, --mode mode ] -p, --name name -O, --bldopt options [ -e, --entrypoint name ] [ -r, --revision version ] [ -F, --rebuild ] [ -I, --install ] [ -s, --sourcedir source ] [ -d, --dest‐ dir destination ] [ -T, --tempdir directory ] [ file ... ] DESCRIPTION pkgdata takes a set of data files and packages them for use by ICU or applications that use ICU. The typical reason to package files using pkgdata is to make their distribution easier and their loading by ICU faster and less consuming of limited system resources such as file de‐ scriptors. Packaged data also allow applications to be distributed with fewer resource files, or even with none at all if they link against the packaged data directly. pkgdata supports a few different methods of packaging data that serve different purposes. The default packaging mode is common, or archive. In this mode, the different data files are bundled together as an architecture-dependent file that can later be memory mapped for use by ICU. Data packaged us‐ ing this mode will be looked up under the ICU data directory. Such packaging is easy to use for applications resource bundles, for exam‐ ple, as long as the application can install the packaged file in the ICU data directory. Another packaging mode is the dll, or library, mode, where the data files are compiled into a shared library. ICU used to be able to dynam‐ ically load these shared libraries, but as of ICU 2.0, such support has been removed. This mode is still useful for two main purposes: to build ICU itself, as the ICU data is packaged as a shared library by default; and to build resource bundles that are linked to the application that uses them. Such resource bundles can then be placed anywhere where the system's dynamic linker will be looking for shared libraries, instead of being forced to live inside the ICU data directory. The static packaging mode is similar to the shared library one except that it produces a static library. Finally, pkgdata supports a files mode which simply copies the data files instead of packaging them as a single file or library. This mode is mainly intended to provide support for building ICU before it is packaged as separate small packages for distribution with operating systems such as Debian GNU/Linux for example. Please refer to the pack‐ aging documentation in the ICU source distribution for further informa‐ tion on the use of this mode. pkgdata builds, packages, installs, or cleans the appropriate data based on the options given without the need to call GNU make anymore. OPTIONS -h, -?, --help Print help about usage and exit. -v, --verbose Display extra informative messages during execution. -c, --copyright Include a copyright notice in the binary data. -C, --comment comment Includes the specified comment in the resulting data instead of the ICU copyright notice. -m, --mode mode Set the packaging mode to be used by pkgdata. The different modes and their meaning are explained in the DESCRIPTION section above. The valid mode names are common (or archive), dll (or li‐ brary), and files. -O, --bldopt options Specify options for the builder. The builder is used internally by pkgdata to generate the correct packaged file. Such options include, but are not limited to, setting variables used by make(1) during the build of the packaged file. Note: If icu-con‐ fig is available, then this option is not needed. -p, --name name Set the packaged file name to name. This name is also used as the default entry point name after having been turned into a valid C identifier. -e, --entrypoint name Set the data entry point (used for linking against the data in a shared library form) to name. The default entry point name is the name set by the -n, --name option. -r, --revision version Enable versioning of the shared library produced in dll, or li‐ brary, mode. The version number has the format major.mi‐ nor.patchlevel and all parts except for major are optional. If only major is supplied then the version is assumed to be major.0 for versioning purposes. -F, --rebuild Force the rebuilding of all data and their repackaging. -I, --install Install the packaged file (or all the files in the files mode). If the variable DESTDIR is set it will be used for installation. -s, --sourcedir source Set the source directory to source. The default source direc‐ tory is the current directory. -d, --destdir destination Set the destination directory to destination. The default des‐ tination directory is the current directory. -T, --tempdir directory Set the directory used to generate temporary files to directory. The default temporary directory is the same as the destination directory as set by the -d, --destdir option. AUTHORS Steven Loomis Yves Arrouye VERSION 77.1 COPYRIGHT Copyright (C) 2000-2009 IBM, Inc. and others. ICU MANPAGE 6 February 2009 PKGDATA(1)
GENCFU(1) ICU 77.1 Manual GENCFU(1) NAME gencfu - Генерирует файлы данных Unicode Confusable SYNOPSIS gencfu [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -d, --destdir destination ] [ -i, --icudatadir directory ] -r, --rules rule-file -w, --wsrules whole-script-rule-file -o, --out output-file DESCRIPTION gencfu читает определения запутанных символов в входном файле, которые являются простыми текстовыми файлами, содержащими определения запутан‐ ных символов в формате ввода, определенном Unicode UAX39 для файлов confusables.txt и confusablesWholeScript.txt. Этот исходный (.txt) формат также принимается детекторами спуфинга ICU. Файлы должны быть закодированы в формате utf-8, с BOM или без него. Нормально выходной файл данных имеет расширение .cfu. OPTIONS -h, -?, --help Выводит справку по использованию и выходит. -V, --version Выводит версию gencfu и выходит. -c, --copyright Встраивает стандартный авторский текст ICU в выходной файл. -v, --verbose Отображает дополнительные информационные сообщения во время выполнения. -d, --destdir destination Устанавливает каталог назначения выходного файла в destination. -i, --icudatadir directory Ищет любые необходимые файлы данных ICU в каталоге. Например, файл pnames.icu должен быть расположен, когда данные ICU не построены как разделяемая библиотека. Каталог данных ICU по умолчанию указывается переменной окружения ICU_DATA. Большинство конфигураций ICU не требуют этого аргумента. -r, --rules rule-file Исходный файл для чтения. -w, --wsrules whole-script-rule-file Исходный файл для всего скрипта для чтения. -o, --out output-file Выходной файл данных для записи. VERSION 1.0 COPYRIGHT Авторские права (C) 2009 International Business Machines Corporation и другие ICU MANPAGE 24 May 2009 GENCFU(1)
GENCFU(1) ICU 77.1 Manual GENCFU(1) NAME gencfu - Generates Unicode Confusable data files SYNOPSIS gencfu [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -d, --destdir destination ] [ -i, --icudatadir directory ] -r, --rules rule-file -w, --wsrules whole-script-rule-file -o, --out output-file DESCRIPTION gencfu reads confusable character definitions in the input file, which are plain text files containing confusable character definitions in the input format defined by Unicode UAX39 for the files confusables.txt and confusablesWholeScript.txt. This source (.txt) format is also accepted by ICU spoof detectors. The files must be encoded in utf-8 format, with or without a BOM. Normally the output data file has the .cfu ex‐ tension. OPTIONS -h, -?, --help Print help about usage and exit. -V, --version Print the version of gencfu and exit. -c, --copyright Embeds the standard ICU copyright into the output-file. -v, --verbose Display extra informative messages during execution. -d, --destdir destination Set the destination directory of the output-file to destination. -i, --icudatadir directory Look for any necessary ICU data files in directory. For exam‐ ple, the file pnames.icu must be located when ICU's data is not built as a shared library. The default ICU data directory is specified by the environment variable ICU_DATA. Most configura‐ tions of ICU do not require this argument. -r, --rules rule-file The source file to read. -w, --wsrules whole-script-rule-file The whole script source file to read. -o, --out output-file The output data file to write. VERSION 1.0 COPYRIGHT Copyright (C) 2009 International Business Machines Corporation and oth‐ ers ICU MANPAGE 24 May 2009 GENCFU(1)
GENCNVAL(1) ICU 77.1 Manual GENCNVAL(1) NAME gencnval - компилировать файл псевдонимов преобразователей SYNOPSIS gencnval [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright ] [ -s, --sourcedir source ] [ -d, --destdir destination ] [ converterfile ] DESCRIPTION gencnval преобразует файл псевдонимов ICU converterfile в двоичный файл cnvalias.icu. Этот двоичный файл затем может быть прочитан напрямую ICU, или использован pkgdata(1) для включения в больший архив или библиотеку. Если converterfile не указан, используется файл convrtrs.txt по умолчанию из ICU. OPTIONS -h, -?, --help Вывести справку по использованию и выйти. -v, --verbose Выводить подробный вывод. Эта информация может включать информацию о конфликтующих псевдонимах и преобразователях, к которым разрешаются псевдонимы. -c, --copyright Включить уведомление об авторских правах в двоичные данные. -s, --sourcedir source Установить исходный каталог в source. Каталог по умолчанию определяется переменной среды ICU_DATA. -d, --destdir destination Установить целевой каталог в destination. Каталог по умолчанию определяется переменной среды ICU_DATA. ENVIRONMENT ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию /usr/share/icu/77.1/. Некоторые инструменты в ICU зависят от наличия завершающего слеша. Поэтому важно убедиться, что он присутствует, если ICU_DATA задана. FILES icu/source/data/mappings/convrtrs.txt Описание преобразователей ICU и их псевдонимов. Этот файл данных обычно не устанавливается и доступен как часть исходного кода ICU. VERSION 77.1 COPYRIGHT Copyright (C) 2000-2004 IBM, Inc. и другие. SEE ALSO pkgdata(1) РУКОВОДСТВО ICU 11 марта 2004 GENCNVAL(1)
GENCNVAL(1) ICU 77.1 Manual GENCNVAL(1) NAME gencnval - compile the converters aliases file SYNOPSIS gencnval [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright ] [ -s, --sourcedir source ] [ -d, --destdir destination ] [ converterfile ] DESCRIPTION gencnval converts the ICU aliases file converterfile into the binary file cnvalias.icu. This binary file can then be read directly by ICU, or used by pkgdata(1) for incorporation into a larger archive or li‐ brary. If converterfile is not provided, the default ICU convrtrs.txt file is used. OPTIONS -h, -?, --help Print help about usage and exit. -v, --verbose Display verbose output. This information can include information about conflicting aliases and the converters the aliases resolve to. -c, --copyright Include a copyright notice in the binary data. -s, --sourcedir source Set the source directory to source. The default source direc‐ tory is specified by the environment variable ICU_DATA. -d, --destdir destination Set the destination directory to destination. The default des‐ tination directory is specified by the environment variable ICU_DATA. ENVIRONMENT ICU_DATA Specifies the directory containing ICU data. Defaults to /usr/share/icu/77.1/. Some tools in ICU depend on the pres‐ ence of the trailing slash. It is thus important to make sure that it is present if ICU_DATA is set. FILES icu/source/data/mappings/convrtrs.txt Description of ICU's converters and their aliases. This data file is not normally installed, and it is available as a part of ICU source code. VERSION 77.1 COPYRIGHT Copyright (C) 2000-2004 IBM, Inc. and others. SEE ALSO pkgdata(1) ICU MANPAGE 11 March 2004 GENCNVAL(1)
GENRB(1) ICU 77.1 Manual GENRB(1) NAME genrb - компилировать пакет ресурсов SYNOPSIS genrb [ -h, -?, --help ] [ -V, --version ] [ -v, --verbose ] [ -e, --encoding encoding ] [ -j, --write-java [ encoding ] ] [ -s, --sourcedir source ] [ -d, --destdir destination ] [ -i, --icudatadir directory ] bundle ... DESCRIPTION genrb преобразует исходные файлы пакетов ресурсов, указанные в командной строке, в их двоичный формат или в файл исходного кода Java для использования с ICU4J. Полученные двоичные файлы имеют расширение .res, в то время как исходные файлы пакетов ресурсов обычно имеют расширение .txt. Файлы исходного кода Java имеют расширение .java и следуют соглашениям об именовании ICU4J. Традиционно пакеты ресурсов называют по имени локали, т. е. используют идентификатор локали для имени файла пакета, например ja_JP.txt для данных на японском языке (Япония) или root.txt для корневого пакета. В любом случае, genrb создаст файл, базовое имя которого соответствует имени локали, найденной в файле ресурсов, а не базовому имени самого файла ресурсов. Двоичные файлы могут быть прочитаны напрямую ICU или использованы с pkgdata(1) для включения в больший архив или библиотеку. OPTIONS -h, -?, --help Вывести справку по использованию и выйти. -V, --version Вывести версию genrb и выйти. -v, --verbose Отобразить дополнительные информационные сообщения во время выполнения. -e, --encoding encoding Установить кодировку для чтения входных файлов как encoding. Кодировка по умолчанию — инвариантная (подмножество ASCII или EBCDIC) кодовая страница системы (см. раздел INVARIANT CHARACTERS). Кодировки UTF-8, UTF-16BE и UTF-16LE определяются автоматически, если присутствует метка порядка байтов (BOM). -j, --write-java [ encoding ] Создать исходный код Java для использования с ICU4J. Можно указать необязательную кодировку для файла Java. -s, --sourcedir source Установить исходный каталог как source. Исходный каталог по умолчанию задается переменной окружения ICU_DATA или местоположением, установленным при сборке ICU, если ICU_DATA не задана. -d, --destdir destination Установить каталог назначения как destination. Каталог назначения по умолчанию задается переменной окружения ICU_DATA или местоположением, установленным при сборке ICU, если ICU_DATA не задана. -i, --icudatadir directory Искать необходимые файлы данных ICU в каталоге directory. Например, при обработке переопределений сортировки файл ucadata.dat должен быть расположен. Каталог данных ICU по умолчанию задается переменной окружения ICU_DATA. INVARIANT CHARACTERS Инвариантный набор символов состоит из следующих символов, выраженных как стандартное POSIX-регулярное выражение: [a-z]|[A-Z]|[0-9]|_| |+|-|*|/ . Это набор, который гарантированно доступен независимо от кодовой страницы. ENVIRONMENT ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию — /usr/share/icu/77.1/. Некоторые инструменты ICU зависят от наличия завершающего слеша. Поэтому важно убедиться, что он присутствует, если задана ICU_DATA. VERSION 77.1 COPYRIGHT Copyright (C) 2000-2002 IBM, Inc. and others. SEE ALSO derb(1) pkgdata(1) ICU MANPAGE 16 April 2002 GENRB(1)
GENRB(1) ICU 77.1 Manual GENRB(1) NAME genrb - compile a resource bundle SYNOPSIS genrb [ -h, -?, --help ] [ -V, --version ] [ -v, --verbose ] [ -e, --encoding encoding ] [ -j, --write-java [ encoding ] ] [ -s, --sourcedir source ] [ -d, --destdir destination ] [ -i, --icudatadir directory ] bundle ... DESCRIPTION genrb converts the resource bundle source files passed on the command line to their binary form or to a Java source file for use with ICU4J. The resulting binary files have a .res extension while resource bundle source files typically have a .txt extension. Java source files have a java extension and follow the ICU4J naming conventions. It is customary to name the resource bundles by their locale name, i.e. to use a local identifier for the bundle filename, e.g. ja_JP.txt for Japanese (Japan) data, or root.txt for the root bundle. In any case, genrb will produce a file whose base name is the name of the locale found in the resource file, not the base name of the resource file it‐ self. The binary files can be read directly by ICU, or used by pkgdata(1) for incorporation into a larger archive or library. OPTIONS -h, -?, --help Print help about usage and exit. -V, --version Print the version of genrb and exit. -v, --verbose Display extra informative messages during execution. -e, --encoding encoding Set the encoding used to read input files to encoding. The de‐ fault encoding is the invariant (subset of ASCII or EBCDIC) codepage for the system (see section INVARIANT CHARACTERS). The encodings UTF-8, UTF-16BE, and UTF-16LE are automatically de‐ tected if a byte order mark (BOM) is present. -j, --write-java [ encoding ] Generate a Java source code for use with ICU4J. An optional en‐ coding for the Java file can be given. -s, --sourcedir source Set the source directory to source. The default source direc‐ tory is specified by the environment variable ICU_DATA, or the location set when ICU was built if ICU_DATA is not set. -d, --destdir destination Set the destination directory to destination. The default des‐ tination directory is specified by the environment variable ICU_DATA or is the location set when ICU was built if ICU_DATA is not set. -i, --icudatadir directory Look for any necessary ICU data files in directory. For exam‐ ple, when processing collation overrides, the file ucadata.dat must be located. The default ICU data directory is specified by the environment variable ICU_DATA. INVARIANT CHARACTERS The invariant character set consists of the following set of charac‐ ters, expressed as a standard POSIX regular expression: [a-z]|[A- Z]|[0-9]|_| |+|-|*|/. This is the set which is guaranteed to be avail‐ able regardless of code page. ENVIRONMENT ICU_DATA Specifies the directory containing ICU data. Defaults to /usr/share/icu/77.1/. Some tools in ICU depend on the pres‐ ence of the trailing slash. It is thus important to make sure that it is present if ICU_DATA is set. VERSION 77.1 COPYRIGHT Copyright (C) 2000-2002 IBM, Inc. and others. SEE ALSO derb(1) pkgdata(1) ICU MANPAGE 16 April 2002 GENRB(1)
MAKECONV(1) ICU 77.1 Manual MAKECONV(1) NAME icuexportdata - Записывает текстовые файлы с данными свойств Unicode из ICU. ICU MANPAGE 12 June 2021 MAKECONV(1)
MAKECONV(1) ICU 77.1 Manual MAKECONV(1) NAME icuexportdata - Writes text files with Unicode properties data from ICU. ICU MANPAGE 12 June 2021 MAKECONV(1)
DERB(1) ICU 77.1 Manual DERB(1) NAME derb - разобрать resource bundle SYNOPSIS derb [ -h, -?, --help ] [ -V, --version ] [ -v, --verbose ] [ -e, --en‐ coding encoding ] [ --bom ] [ -t, --truncate [ size ] ] [ -s, --sourcedir source ] [ -d, --destdir destination ] [ -i, --icudatadir directory ] [ -c, --to-stdout ] bundle ... DESCRIPTION derb читает скомпилированные файлы resource bundle, переданные в командной строке, и записывает их обратно в текстовую форму. Полученные текстовые файлы имеют расширение .txt, в то время как исходные файлы скомпилированных resource bundle обычно имеют расширение .res. Принято называть resource bundle по имени локали, то есть использовать идентификатор локали для имени файла пакета, например ja_JP.res для данных на японском языке (Япония) или root.res для корневого пакета. Это особенно важно для derb, поскольку имя локали недоступно напрямую из скомпилированного resource bundle, и для того, чтобы знать, какую локаль запрашивать при открытии пакета. derb создаст файл, базовое имя которого совпадает с базовым именем скомпилированного файла resource. Если используется опция --to-stdout или -c, то текст будет записан в стандартный вывод. OPTIONS -h, -?, --help Вывести справку по использованию и выйти. -V, --version Вывести версию derb и выйти. -v, --verbose Выводить дополнительные информационные сообщения во время выполнения. -A, --suppressAliases Не следовать за алиасами при формировании вывода. -e, --encoding encoding Установить кодировку, используемую для записи выходных файлов, равной encoding. Кодировка по умолчанию — инвариантная (подмножество ASCII или EBCDIC) кодовая страница системы (см. раздел INVARIANT CHARACTERS). Выбор кодировки не влияет на данные, а только на их представление. Символы, которые нельзя представить в кодировке, будут представлены с помощью последовательностей \uhhhh. --bom Записать метку порядка байтов (BOM) в начале файла. -l, --locale locale Установить локаль для resource bundle, которая используется как в генерируемом тексте, так и в качестве базового имени выходного файла. -t, --truncate [ size ] Обрезать индивидуальные ресурсы (строки или бинарные данные) до size байтов. Значение по умолчанию, если size не указано, — 80 байтов. -s, --sourcedir source Установить исходный каталог на source. Исходный каталог по умолчанию — текущий каталог. Если для source передано -, то пакет будет искаться в его расположении по умолчанию, указанном переменной окружения ICU_DATA (или в расположении, установленном при сборке ICU, если ICU_DATA не установлена). -d, --destdir destination Установить целевой каталог на destination. Целевой каталог по умолчанию указывается переменной окружения ICU_DATA или расположением, установленным при сборке ICU, если ICU_DATA не установлена. -i, --icudatadir directory Искать необходимые файлы данных ICU в каталоге directory. Например, при обработке переопределений сортировки файл ucadata.dat должен быть расположен. Каталог данных ICU по умолчанию указывается переменной окружения ICU_DATA. -c, --to-stdout Записать разобранный пакет в стандартный вывод вместо файла. CAVEATS При использовании опции --bom символ U+FEFF записывается в кодировке назначения независимо от того, является ли это форматом преобразования Unicode (UTF) или нет. Эта опция должна использоваться только с кодировкой UTF, поскольку метки порядка байтов не имеют смысла для других кодировок. INVARIANT CHARACTERS Множество инвариантных символов состоит из следующего набора символов, выраженного как стандартное регулярное выражение POSIX: [a-z]|[A- Z]|[0-9]|_| |+|-|*|. Это набор, который гарантированно доступен независимо от кодовой страницы. ENVIRONMENT ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию — /usr/share/icu/77.1/. Некоторые инструменты в ICU зависят от наличия завершающего слеша. Поэтому важно убедиться, что он присутствует, если ICU_DATA установлена. AUTHORS Vladimir Weinstein Yves Arrouye VERSION 1.0 COPYRIGHT Copyright (C) 2002 IBM, Inc. and others. SEE ALSO genrb(1) ICU Страница руководства 7 Mar 2014 DERB(1)
DERB(1) ICU 77.1 Manual DERB(1) NAME derb - disassemble a resource bundle SYNOPSIS derb [ -h, -?, --help ] [ -V, --version ] [ -v, --verbose ] [ -e, --en‐ coding encoding ] [ --bom ] [ -t, --truncate [ size ] ] [ -s, --sourcedir source ] [ -d, --destdir destination ] [ -i, --icudatadir directory ] [ -c, --to-stdout ] bundle ... DESCRIPTION derb reads the compiled resource bundle files passed on the command line and write them back in text form. The resulting text files have a .txt extension while compiled resource bundle source files typically have a .res extension. It is customary to name the resource bundles by their locale name, i.e. to use a local identifier for the bundle filename, e.g. ja_JP.res for Japanese (Japan) data, or root.res for the root bundle. This is espe‐ cially important for derb since the locale name is not accessible di‐ rectly from the compiled resource bundle, and to know which locale to ask for when opening the bundle. derb will produce a file whose base name is the base name of the compiled resource file itself. If the --to-stdout, -c option is used, however, the text will be written on the standard output. OPTIONS -h, -?, --help Print help about usage and exit. -V, --version Print the version of derb and exit. -v, --verbose Display extra informative messages during execution. -A, --suppressAliases Don't follow aliases when producing output. -e, --encoding encoding Set the encoding used to write output files to encoding. The default encoding is the invariant (subset of ASCII or EBCDIC) codepage for the system (see section INVARIANT CHARACTERS). The choice of the encoding does not affect the data, just their rep‐ resentation. Characters that cannot be represented in the encod‐ ing will be represented using \uhhhh escape sequences. --bom Write a byte order mark (BOM) at the beginning of the file. -l, --locale locale Set the locale for the resource bundle, which is used both in the generated text and as the base name of the output file. -t, --truncate [ size ] Truncate individual resources (strings or binary data) to size bytes. The default if size is not specified is 80 bytes. -s, --sourcedir source Set the source directory to source. The default source direc‐ tory is the current directory. If - is passed for source, then the bundle will be looked for in its default location, specified by the ICU_DATA environment variable (or defaulting to the loca‐ tion set when ICU was built if ICU_DATA is not set). -d, --destdir destination Set the destination directory to destination. The default des‐ tination directory is specified by the environment variable ICU_DATA or is the location set when ICU was built if ICU_DATA is not set. -i, --icudatadir directory Look for any necessary ICU data files in directory. For exam‐ ple, when processing collation overrides, the file ucadata.dat must be located. The default ICU data directory is specified by the environment variable ICU_DATA. -c, --to-stdout Write the disassembled bundle on standard output instead of into a file. CAVEATS When the option --bom is used, the character U+FEFF is written in the destination encoding regardless of whether it is a Unicode transforma‐ tion format (UTF) or not. This option should only be used with an UTF encoding, as byte order marks are not meaningful for other encodings. INVARIANT CHARACTERS The invariant character set consists of the following set of charac‐ ters, expressed as a standard POSIX regular expression: [a-z]|[A- Z]|[0-9]|_| |+|-|*|/. This is the set which is guaranteed to be avail‐ able regardless of code page. ENVIRONMENT ICU_DATA Specifies the directory containing ICU data. Defaults to /usr/share/icu/77.1/. Some tools in ICU depend on the pres‐ ence of the trailing slash. It is thus important to make sure that it is present if ICU_DATA is set. AUTHORS Vladimir Weinstein Yves Arrouye VERSION 1.0 COPYRIGHT Copyright (C) 2002 IBM, Inc. and others. SEE ALSO genrb(1) ICU MANPAGE 7 Mar 2014 DERB(1)
MAKECONV(1) ICU 77.1 Manual MAKECONV(1) NAME makeconv - компилировать таблицу конвертера SYNOPSIS makeconv [ -h, -?, --help ] [ -c, --copyright ] [ -v, --verbose ] [ -d, --destdir destination ] convertertable ... DESCRIPTION makeconv преобразует таблицу конвертера ICU convertertable в двоичный файл. Двоичный файл имеет то же базовое имя, что и convertertable, но с расширением .cnv (вместо типичного расширения .ucm файла convert‐ ertable). Этот двоичный файл затем может быть прочитан напрямую ICU или использован pkgdata(1) для включения в больший архив или библиотеку. Таблица convertertable должна быть в формате ICU ucm (Unicode Codepage Mapping), чтобы makeconv могла её понять. Формат ICU ucm похож на файлы IBM NLTC upmap/tpmap/rpmap. Комментарии в таблице convertertable обрабатываются следующим образом. Если комментарий (начинающийся с символа `#') после какого-то текста содержит индикатор отката `|', то игнорируется только текст, начинающийся с символа `#', и заканчивающийся перед символом `|'. В противном случае, или если комментарий является первым элементом на строке, комментарий идёт до конца строки. Эта особая обработка комментариев предназначена для поддержки практики размещения информации об откате в комментариях в строгом формате IBM NLTC ucmap. Обратите внимание, что новые конвертеры будут автоматически найдены ICU после их установки в каталог данных ICU. Им не нужно перечислять в файле convrtrs.txt(5) с алиасами конвертеров, чтобы они были доступны приложениям, использующим ICU. Однако, если нужно присвоить им алиасы или теги, то их следует перечислить там. OPTIONS -h, -?, --help Вывести справку по использованию и выйти. -c, --copyright Включить уведомление об авторских правах в двоичные данные. -v, --verbose Выводить дополнительные информационные сообщения во время выполнения. -d, --destdir destination Установить каталог назначения в destination. Каталог назначения по умолчанию указывается переменной окружения ICU_DATA. CAVEATS Если существующая таблица конвертера изменена и перекомпилирована с помощью makeconv, полученный двоичный файл должен быть упакован так же, как он был упакован изначально. Например, если конвертеры были сгруппированы вместе в архиве или библиотеке с помощью pkgdata(1), то архив или библиотека должны быть перестроены с новым двоичным файлом. Отдельный двоичный файл конвертера не будет иметь приоритета над упакованным. ENVIRONMENT ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию это /usr/share/icu/77.1/. Некоторые инструменты в ICU зависят от наличия завершающего слеша. Поэтому важно убедиться, что он присутствует, если ICU_DATA задана. VERSION 77.1 COPYRIGHT Copyright (C) 2000 IBM, Inc. and others. SEE ALSO convrtrs.txt(5) pkgdata(1) ICU MANPAGE 16 April 2002 MAKECONV(1)
MAKECONV(1) ICU 77.1 Manual MAKECONV(1) NAME makeconv - compile a converter table SYNOPSIS makeconv [ -h, -?, --help ] [ -c, --copyright ] [ -v, --verbose ] [ -d, --destdir destination ] convertertable ... DESCRIPTION makeconv converts the ICU converter table convertertable into a binary file. The binary file has the same base name as convertertable but has a .cnv extension (instead of the typical .ucm extension of the convert‐ ertable file). This binary file can then be read directly by ICU, or used by pkgdata(1) for incorporation into a larger archive or library. The convertertable must be in the ICU ucm (Unicode Codepage Mapping) format in order to be understood by makeconv. The ICU ucm format is similar to the IBM NLTC upmap/tpmap/rpmap files. Comments in the con‐ vertertable are handled as follows. If a comment (starting with a `#' sign) that is after some text does contain the fallback indicator `|' then only the text starting with the `#' sign, and ending before the `|' sign, is ignored. Otherwise, or if the comment is the first thing on the line, the comment runs up to the end of the line. This special handling of comments is to accommodate the practice of putting fallback information in comments in the strict IBM NLTC ucmap format. Note that new converters will be automatically found by ICU after their installation in ICU's data directory. They do not need to be listed in the convrtrs.txt(5) converters aliases file in order to be available to applications using ICU. They do need to be listed there if one wants to give them aliases, or tags, though. OPTIONS -h, -?, --help Print help about usage and exit. -c, --copyright Include a copyright notice in the binary data. -v, --verbose Display extra informative messages during execution. -d, --destdir destination Set the destination directory to destination. The default des‐ tination directory is specified by the environment variable ICU_DATA. CAVEATS If an existing converter table is changed and recompiled using make‐ conv, the resulting binary file must be packaged in the same way that it was packaged initially. For example, if converters were grouped to‐ gether in an archive or a library with pkgdata(1), then the archive or library must be rebuilt with the new binary file. A standalone binary converter file will not take precedence over a packaged one. ENVIRONMENT ICU_DATA Specifies the directory containing ICU data. Defaults to /usr/share/icu/77.1/. Some tools in ICU depend on the pres‐ ence of the trailing slash. It is thus important to make sure that it is present if ICU_DATA is set. VERSION 77.1 COPYRIGHT Copyright (C) 2000 IBM, Inc. and others. SEE ALSO convrtrs.txt(5) pkgdata(1) ICU MANPAGE 16 April 2002 MAKECONV(1)
gensprep(8) Руководство ICU 77.1 gensprep(8) NAME gensprep - компилирует данные StringPrep из файлов, отфильтрованных filter-RFC3454.pl SYNOPSIS gensprep [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright ] [ -s, --sourcedir source ] [ -d, --destdir destination ] DESCRIPTION gensprep читает отфильтрованные файлы RFC 3454 и компилирует их информацию в бинарную форму. Полученный файл, <name>.icu, может быть прочитан напрямую ICU или использован pkgdata(8) для включения в больший архив или библиотеку. Файлы, читаемые gensprep, описаны в разделе FILES. OPTIONS -h, -?, --help Выводит справку по использованию и выходит. -v, --verbose Выводит дополнительные информационные сообщения во время выполнения. -c, --copyright Включает уведомление об авторских правах в бинарные данные. -s, --sourcedir source Устанавливает исходный каталог в source. Каталог по умолчанию указывается переменной среды ICU_DATA. -d, --destdir destination Устанавливает каталог назначения в destination. Каталог назначения по умолчанию указывается переменной среды ICU_DATA. ENVIRONMENT ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию /usr/share/icu/77.1/. Некоторые инструменты в ICU зависят от наличия завершающего слеша. Поэтому важно убедиться, что он присутствует, если ICU_DATA установлена. FILES Следующие файлы читаются gensprep и ищутся в каталоге source /misc для файлов rfc3454_*.txt и в source /unidata для NormalizationCorrections.txt. rfc3453_A_1.txt Содержит список неподанных кодовых точек в версии Unicode 3.2.0.... rfc3454_B_1.txt Содержит список кодовых точек, которые обычно отображаются как ничего.... rfc3454_B_2.txt Содержит список отображений для преобразования регистра кодовых точек при указании нормализации формы NFKC.... rfc3454_C_X.txt Содержит список кодовых точек, которые запрещены для IDNA. NormalizationCorrections.txt Содержит список кодовых точек, нормализация которых изменилась с версии Unicode 3.2.0. VERSION 77.1 COPYRIGHT Copyright (C) 2000-2002 IBM, Inc. и другие. SEE ALSO pkgdata(8) РУКОВОДСТВО ICU 18 марта 2003 gensprep(8)
gensprep(8) ICU 77.1 Manual gensprep(8) NAME gensprep - compile StringPrep data from files filtered by filter‐ RFC3454.pl SYNOPSIS gensprep [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright ] [ -s, --sourcedir source ] [ -d, --destdir destination ] DESCRIPTION gensprep reads filtered RFC 3454 files and compiles their information into a binary form. The resulting file, <name>.icu, can then be read directly by ICU, or used by pkgdata(8) for incorporation into a larger archive or library. The files read by gensprep are described in the FILES section. OPTIONS -h, -?, --help Print help about usage and exit. -v, --verbose Display extra informative messages during execution. -c, --copyright Include a copyright notice into the binary data. -s, --sourcedir source Set the source directory to source. The default source direc‐ tory is specified by the environment variable ICU_DATA. -d, --destdir destination Set the destination directory to destination. The default des‐ tination directory is specified by the environment variable ICU_DATA. ENVIRONMENT ICU_DATA Specifies the directory containing ICU data. Defaults to /usr/share/icu/77.1/. Some tools in ICU depend on the pres‐ ence of the trailing slash. It is thus important to make sure that it is present if ICU_DATA is set. FILES The following files are read by gensprep and are looked for in the source /misc for rfc3454_*.txt files and in source /unidata for Normal‐ izationCorrections.txt. rfc3453_A_1.txt Contains the list of unassigned codepoints in Uni‐ code version 3.2.0.... rfc3454_B_1.txt Contains the list of code points that are commonly mapped to nothing.... rfc3454_B_2.txt Contains the list of mappings for casefolding of code points when Normalization form NFKC is speci‐ fied.... rfc3454_C_X.txt Contains the list of code points that are prohib‐ ited for IDNA. NormalizationCorrections.txt Contains the list of code points whose normaliza‐ tion has changed since Unicode Version 3.2.0. VERSION 77.1 COPYRIGHT Copyright (C) 2000-2002 IBM, Inc. and others. SEE ALSO pkgdata(8) ICU MANPAGE 18 March 2003 gensprep(8)
GENCCODE(8) ICU 77.1 Manual GENCCODE(8) NAME genccode - генерировать C-код или платформо-специфичный код ассемблера из файла данных ICU. SYNOPSIS genccode [ -h, -?, --help ] [ -a, --assembly name ] [ -d, --destdir destination ] [ -n, --name name ] [ -e, --entrypoint name ] [ -f, --filename name ] [ filename ... ] DESCRIPTION genccode читает каждый из предоставленных файлов и выводит C-файл, содержащий компилируемое определение данных из файла данных. Имя C-файла формируется путём взятия базового имени файла данных, замены точек на подчёркивания и добавления расширения .c. Если используется опция -a, генерируется платформо-специфичный код ассемблера вместо C-кода. Большинство компиляторов C принимают как файлы C, так и файлы ассемблера. Вместо записи файла с расширением .c будет записан файл с расширением .s. Если genccode вызывается без указания файла, он завершает работу корректно. OPTIONS -h, -?, --help Вывести справку по использованию и выйти. -a, --assembly name Выводить код ассемблера вместо C-кода. Используйте -h, чтобы увидеть список доступных типов ассемблера для генерации и указать для этой опции. -d, --destdir destination Установить каталог назначения на destination. Каталог назначения по умолчанию — текущий каталог. -n, --name name Установить имя данных на name вместо значения по умолчанию. Это имя также используется в качестве базового имени вывода. Имя по умолчанию состоит из префикса icudt, за которым следует двухзначный номер версии, соответствующий текущей версии релиза ICU, и одной буквы, указывающей эндянность данных (буква b обозначает big endian, а буква l — little endian). -f, --filename name Обычно файл данных ICU, например mydata.icu, преобразуется в mydata_icu.c и mydata_icu.o. Однако, если этот параметр установлен на "somedata", выходные файлы будут somedata.o и somedata.c соответственно. -e, --entrypoint name Установить точку входа данных (используется для связывания с данными в форме разделяемой библиотеки) на name. Имя точки входа по умолчанию состоит из имени данных (установленного опцией -n, --name) за которым следует подчёркивание и тип данных (установленный опцией -t, --type). VERSION 77.1 COPYRIGHT Copyright (C) 2000-2004 IBM, Inc. and others. ICU MANPAGE 11 March 2004 GENCCODE(8)
GENCCODE(8) ICU 77.1 Manual GENCCODE(8) NAME genccode - generate C or platform specific assembly code from an ICU data file. SYNOPSIS genccode [ -h, -?, --help ] [ -a, --assembly name ] [ -d, --destdir destination ] [ -n, --name name ] [ -e, --entrypoint name ] [ -f, --filename name ] [ filename ... ] DESCRIPTION genccode reads each of the supplied filename and writes out a C file containing a compilable definition of the data in the data file. The C file name is made by taking the base name of the data filename, replac‐ ing dots by underscores, and adding a .c file extension. If the -a option is used, platform specific assembly code is generated instead of C code. Most C compilers will accept both C and assembly files. Instead of writing a filename with a .c file extension, a file‐ name with a .s will be written instead. If genccode is called with no filename it terminates gracefully. OPTIONS -h, -?, --help Print help about usage and exit. -a, --assembly name Output assembly code instead of C code. Use -h to see the list of available types of assembly to generate and to specify for this option. -d, --destdir destination Set the destination directory to destination. The default des‐ tination directory is the current directory. -n, --name name Set the data name to name instead of the default. This name is also used as the base name of the output. The default name is made of the icudt prefix, followed by a two-digit version number corresponding to the current version of the ICU release, and a single letter indicating the endianness of the data (the letter b indicated big endian data, and the letter l indicates little endian ones). -f, --filename name Normally, an ICU data file such as mydata.icu will be turned into mydata_icu.c and mydata_icu.o. However, if this parameter was set to "somedata", the output files will be somedata.o and somedata.c, respectively. -e, --entrypoint name Set the data entry point (used for linking against the data in a shared library form) to name. The default entry point name is made of the data (set by the -n, --name option) followed by an underscore and the type of the data (set by the -t, --type op‐ tion). VERSION 77.1 COPYRIGHT Copyright (C) 2000-2004 IBM, Inc. and others. ICU MANPAGE 11 March 2004 GENCCODE(8)
GENCMN(8) ICU 77.1 Manual GENCMN(8) NAME gencmn - сгенерировать файл данных ICU, который можно отобразить в память SYNOPSIS gencmn [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright | -C, --comment comment ] [ -d, --destdir destination ] [ -n, --name name ] [ -t, --type fileext ] [ -S, --source ] [ -e, --entrypoint name ] maxsize [ listfilename ] DESCRIPTION gencmn принимает набор файлов и упаковывает их в файл данных ICU, который можно отобразить в память. Полученный файл данных затем может быть использован напрямую ICU. gencmn читает список файлов для упаковки либо из указанного файла listfilename, либо из стандартного вывода. Он упаковывает все файлы из списка, которые не превышают maxsize байт, за исключением случая, когда maxsize равно 0, что указывает на отсутствие ограничения по размеру файлов. OPTIONS -h, -?, --help Вывести справку по использованию и выйти. -v, --verbose Выводить дополнительные информационные сообщения во время выполнения. -c,--copyright Включить уведомление об авторских правах ICU в результирующие данные. -C, --comment comment Включить указанный комментарий в результирующие данные вместо уведомления об авторских правах ICU. -d, --destdir destination Установить каталог назначения на destination. Каталог назначения по умолчанию указывается переменной окружения ICU_DATA. -n, --name name Установить имя данных как name вместо значения по умолчанию. Это имя также используется в качестве базового имени вывода. Имя по умолчанию состоит из префикса icudt, за которым следует двухзначный номер версии, соответствующий текущей версии релиза ICU, и одиночная буква, указывающая эндянность данных (буква b указывает на big endian данные, а буква l — на little endian). -t, --type type Использовать type в качестве типа данных. Этот тип также используется в качестве расширения для сгенерированного файла данных. Тип по умолчанию — dat. -S, --source Записать файл исходного кода C с таблицей содержимого данных. -e, --entrypoint name Установить точку входа данных (используется для связывания с данными в форме разделяемой библиотеки) как name. Имя точки входа по умолчанию состоит из имени данных (установленного опцией -n, --name), за которым следует подчеркивание и тип данных (установленный опцией -t, --type). ENVIRONMENT ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию /usr/share/icu/77.1/. Некоторые инструменты в ICU зависят от наличия завершающего слеша. Поэтому важно убедиться, что он присутствует, если ICU_DATA задана. VERSION 77.1 COPYRIGHT Copyright (C) 2000-2001 IBM, Inc. and others. SEE ALSO decmn(8) ICU MANPAGE 5 November 2001 GENCMN(8)
GENCMN(8) ICU 77.1 Manual GENCMN(8) NAME gencmn - generate an ICU memory-mappable data file SYNOPSIS gencmn [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright | -C, --comment comment ] [ -d, --destdir destination ] [ -n, --name name ] [ -t, --type fileext ] [ -S, --source ] [ -e, --entrypoint name ] maxsize [ listfilename ] DESCRIPTION gencmn takes a set of files and packages them as an ICU memory-mappable data file. The resulting data file can then be used directly by ICU. gencmn reads a list of files to be packaged from either the supplied listfilename file, or from its standard output. It packages all the files from the list that are not bigger than maxsize bytes, except if maxsize is 0, which indicates that there is no size limit on files. OPTIONS -h, -?, --help Print help about usage and exit. -v, --verbose Display extra informative messages during execution. -c,--copyright Include the ICU copyright notice in the resulting data. -C, --comment comment Include the specified comment in the resulting data instead of the ICU copyright notice. -d, --destdir destination Set the destination directory to destination. The default des‐ tination directory is specified by the environment variable ICU_DATA. -n, --name name Set the data name to name instead of the default. This name is also used as the base name of the output. The default name is made of the icudt prefix, followed by a two-digit version number corresponding to the current version of the ICU release, and a single letter indicating the endianness of the data (the letter b indicated big endian data, and the letter l indicates little endian ones). -t, --type type Use type as the type of the data. This type is also used as the extension of the generated data file. The default type ie dat. -S, --source Write a C source file with the table of contents of the data. -e, --entrypoint name Set the data entry point (used for linking against the data in a shared library form) to name. The default entry point name is made of the data (set by the -n, --name option) followed by an underscore and the type of the data (set by the -t, --type op‐ tion). ENVIRONMENT ICU_DATA Specifies the directory containing ICU data. Defaults to /usr/share/icu/77.1/. Some tools in ICU depend on the pres‐ ence of the trailing slash. It is thus important to make sure that it is present if ICU_DATA is set. VERSION 77.1 COPYRIGHT Copyright (C) 2000-2001 IBM, Inc. and others. SEE ALSO decmn(8) ICU MANPAGE 5 November 2001 GENCMN(8)
UCONV(1) ICU 77.1 Manual UCONV(1) NAME uconv - преобразование данных из одной кодировки в другую SYNOPSIS uconv [ -h, -?, --help ] [ -V, --version ] [ -s, --silent ] [ -v, --verbose ] [ -l, --list | -l, --list-code code | --default-code | -L, --list-transliterators ] [ --canon ] [ -x transliteration ] [ --to-callback callback | -c ] [ --from-callback callback | -i ] [ --callback callback ] [ --fallback | --no-fallback ] [ -b, --block-size size ] [ -f, --from-code encoding ] [ -t, --to-code encoding ] [ --add-signature ] [ --remove-signature ] [ -o, --output file ] [ file... ] DESCRIPTION uconv преобразует, или транскодирует, каждый указанный файл (или стандартный ввод, если файл не указан) из одной кодировки в другую. Транскодирование выполняется с использованием Unicode в качестве промежуточной кодировки (т.е. данные сначала транскодируются из исходной кодировки в Unicode, а затем из Unicode в целевую кодировку). Если кодировка не указана или указана как -, используется кодировка по умолчанию. Таким образом, вызов uconv без указания кодировки предоставляет простой способ проверки и очистки файлов данных для дальнейшего использования инструментами, требующими данных в кодировке по умолчанию. При вызове uconv можно указать обратные вызовы (callbacks), которые используются для обработки недопустимых символов во входных данных или символов, которые нельзя транскодировать в целевую кодировку. Некоторые кодировки, например, предлагают символ замены по умолчанию, который может использоваться для представления таких символов во входных данных. Другие обратные вызовы предоставляют полезное визуальное представление недопустимых данных. uconv также может применить указанную транслитерацию к транскодированным данным, в этом случае транслитерация произойдет как промежуточный шаг, после транскодирования данных в Unicode. Транслитерация может быть либо списком имен транслитераторов, разделенных точкой с запятой, либо произвольным сложным набором правил в формате правил транслитерации ICU. Для целей транскодирования опции uconv совместимы с опциями iconv(1), что облегчает замену iconv в сценариях. Однако имена кодировок, используемые uconv и ICU, не обязательно совпадают с именами, используемыми iconv(1). Кроме того, опции, предоставляющие информационные данные, такие как -l, --list, в некоторых вариантах iconv(1), таких как GNU, выводят данные в немного другом и более удобном для разбора формате. OPTIONS -h, -?, --help Вывести справку по использованию и выйти. -V, --version Вывести версию uconv и выйти. -s, --silent Подавить сообщения во время выполнения. -v, --verbose Выводить дополнительные информационные сообщения во время выполнения. -l, --list Вывести список всех доступных кодировок и выйти. -l, --list-code code Вывести только кодировку code и выйти. Если code не является правильной кодировкой, выйти с ошибкой. --default-code Вывести только имя кодировки по умолчанию и выйти. -L, --list-transliterators Вывести список всех доступных транслитераторов и выйти. --canon Если используется с -l, --list или --default-code, список кодировок выводится в формате, совместимом с convrtrs.txt(5). Если используется с -L, --list-transliterators, выводить только одно имя транслитератора на строку. -x transliteration Применить указанную транслитерацию к транскодированным данным в Unicode и использовать транслитерированные данные в качестве входных для транскодирования в целевую кодировку. --to-callback callback Использовать callback для обработки символов, которые нельзя транскодировать в целевую кодировку. См. раздел CALLBACKS для деталей о допустимых callback. -c Исключить недопустимые символы из вывода. То же, что и --to-callback skip. --from-callback callback Использовать callback для обработки символов, которые нельзя транскодировать из исходной кодировки. См. раздел CALLBACKS для деталей о допустимых callback. -i Игнорировать недопустимые последовательности во входных данных. То же, что и --from-callback skip. --callback callback Использовать callback для обработки как символов, которые нельзя транскодировать из исходной кодировки, так и символов, которые нельзя транскодировать в целевую кодировку. См. раздел CALLBACKS для деталей о допустимых callback. --fallback Использовать сопоставление по умолчанию при транскодировании из Unicode в целевую кодировку. --no-fallback Не использовать сопоставление по умолчанию при транскодировании из Unicode в целевую кодировку. Это значение по умолчанию. -b, --block-size size Читать входные данные блоками по size байт за раз. Размер блока по умолчанию — 4096. -f, --from-code encoding Установить исходную кодировку данных как encoding. -t, --to-code encoding Транскодировать данные в encoding. --add-signature Добавить символ сигнатуры Unicode U+FEFF (BOM), если выходная кодировка поддерживает его и не добавляет его автоматически. --remove-signature Удалить символ сигнатуры Unicode U+FEFF (BOM). -o, --output file Записать транскодированные данные в file. CALLBACKS uconv поддерживает указание обратных вызовов (callbacks) для обработки недопустимых данных. Обратные вызовы можно установить для обоих направлений транскодирования: из исходной кодировки в Unicode с опцией --from-callback и из Unicode в целевую кодировку с опцией --to-callback. Ниже приведен список допустимых имен обратных вызовов вместе с описанием их поведения. Список обратных вызовов, фактически поддерживаемых uconv, отображается при вызове с -h, --help. substitute Записать последовательность замены кодировки или символ замены Unicode U+FFFD при транскодировании в Unicode. skip Игнорировать недопустимые данные. stop Остановить выполнение с ошибкой при обнаружении недопустимых данных. Это обратный вызов по умолчанию. escape То же, что и escape-icu. escape-icu Заменить отсутствующие символы строкой формата %Uhhhh для символов плоскости 0 и %Uhhhh%Uhhhh для символов плоскостей 1 и выше, где hhhh — шестнадцатеричное значение одного из кодовых единиц UTF-16, представляющих символ. Символы из плоскостей 1 и выше записываются как пара кодовых единиц суррогат UTF-16. escape-java Заменить отсутствующие символы строкой формата \uhhhh для символов плоскости 0 и \uhhhh\uhhhh для символов плоскостей 1 и выше, где hhhh — шестнадцатеричное значение одного из кодовых единиц UTF-16, представляющих символ. Символы из плоскостей 1 и выше записываются как пара кодовых единиц суррогат UTF-16. escape-c Заменить отсутствующие символы строкой формата \uhhhh для символов плоскости 0 и \Uhhhhhhhh для символов плоскостей 1 и выше, где hhhh и hhhhhhhh — шестнадцатеричные значения кодовой точки Unicode. escape-xml См. escape-xml-hex. escape-xml-hex Заменить отсутствующие символы строкой формата &#xhhhh;, где hhhh — шестнадцатеричное значение кодовой точки Unicode. escape-xml-dec Заменить отсутствующие символы строкой формата &#nnnn;, где nnnn — десятичное значение кодовой точки Unicode. escape-unicode Заменить отсутствующие символы строкой формата {U+hhhh}, где hhhh — шестнадцатеричное значение кодовой точки Unicode. Эта шестнадцатеричная строка имеет переменную длину и может использовать от 4 до 6 цифр. Это формат, универсально используемый для обозначения кодовой точки Unicode в литературе, ограниченный фигурными скобками для легкого распознавания этих замен в выводе. EXAMPLES Преобразовать данные из заданной кодировки в кодировку платформы: $ uconv -f encoding Проверить, содержит ли файл допустимые данные для заданной кодировки: $ uconv -f encoding -c file >/dev/null Преобразовать файл в UTF-8 в заданную кодировку и убедиться, что результирующий текст подходит для любой версии HTML: $ uconv -f utf-8 -t encoding \ --callback escape-xml-dec file Вывести имена кодовых точек Unicode в файле UTF: $ uconv -f utf-8 -x any-name file Вывести имя кодовой точки Unicode, значение которой известно (U+30AB в этом примере): $ echo '\u30ab' | uconv -x 'hex-any; any-name'; echo {KATAKANA LETTER KA}{LINE FEED} $ (Имена ограничены фигурными скобками. Также выводится имя разделителя строк.) Нормализовать данные в UTF-8 с использованием Unicode NFKC, удалить все управляющие символы и преобразовать Катакану в Хирагану: $ uconv -f utf-8 -t utf-8 \ -x '::nfkc; [:Cc:] >; ::katakana-hiragana;' CAVEATS AND BUGS uconv сообщает об ошибках как о происходящих на первом недопустимом байте. Это может запутать пользователей GNU iconv(1), который сообщает об ошибках как о происходящих на первом байте недопустимой последовательности. Для многобайтовых наборов символов или кодировок это означает, что позиции ошибок в uconv могут быть на более позднем смещении в потоке ввода, чем в случае с GNU iconv(1). Сообщение о позициях ошибок при использовании транслитератора может быть неточным или недоступным, в этом случае uconv сообщит смещение в потоке вывода, где произошла ошибка. AUTHORS Jonas Utterstroem Yves Arrouye VERSION 77.1 COPYRIGHT Copyright (C) 2000-2005 IBM, Inc. and others. SEE ALSO iconv(1) ICU MANPAGE 2005-jul-1 UCONV(1)
UCONV(1) ICU 77.1 Manual UCONV(1) NAME uconv - convert data from one encoding to another SYNOPSIS uconv [ -h, -?, --help ] [ -V, --version ] [ -s, --silent ] [ -v, --verbose ] [ -l, --list | -l, --list-code code | --default-code | -L, --list-transliterators ] [ --canon ] [ -x transliteration ] [ --to-callback callback | -c ] [ --from-callback callback | -i ] [ --callback callback ] [ --fallback | --no-fallback ] [ -b, --block-size size ] [ -f, --from-code encoding ] [ -t, --to-code encoding ] [ --add-signature ] [ --remove-signature ] [ -o, --output file ] [ file... ] DESCRIPTION uconv converts, or transcodes, each given file (or its standard input if no file is specified) from one encoding to another. The transcoding is done using Unicode as a pivot encoding (i.e. the data are first transcoded from their original encoding to Unicode, and then from Uni‐ code to the destination encoding). If an encoding is not specified or is -, the default encoding is used. Thus, calling uconv with no encoding provides an easy way to validate and sanitize data files for further consumption by tools requiring data in the default encoding. When calling uconv, it is possible to specify callbacks that are used to handle invalid characters in the input, or characters that cannot be transcoded to the destination encoding. Some encodings, for example, offer a default substitution character that can be used to represent the occurrence of such characters in the input. Other callbacks offer a useful visual representation of the invalid data. uconv can also run the specified transliteration on the transcoded data, in which case transliteration will happen as an intermediate step, after the data have been transcoded to Unicode. The translitera‐ tion can be either a list of semicolon-separated transliterator names, or an arbitrarily complex set of rules in the ICU transliteration rules format. For transcoding purposes, uconv options are compatible with those of iconv(1), making it easy to replace it in scripts. It is not necessar‐ ily the case, however, that the encoding names used by uconv and ICU are the same as the ones used by iconv(1). Also, options that provide informational data, such as the -l, --list one offered by some iconv(1) variants such as GNU's, produce data in a slightly different and easier to parse format. OPTIONS -h, -?, --help Print help about usage and exit. -V, --version Print the version of uconv and exit. -s, --silent Suppress messages during execution. -v, --verbose Display extra informative messages during execution. -l, --list List all the available encodings and exit. -l, --list-code code List only the code encoding and exit. If code is not a proper encoding, exit with an error. --default-code List only the name of the default encoding and exit. -L, --list-transliterators List all the available transliterators and exit. --canon If used with -l, --list or --default-code, the list of encodings is produced in a format compatible with convrtrs.txt(5). If used with -L, --list-transliterators, print only one transliter‐ ator name per line. -x transliteration Run the given transliteration on the transcoded Unicode data, and use the transliterated data as input for the transcoding to the destination encoding. --to-callback callback Use callback to handle characters that cannot be transcoded to the destination encoding. See section CALLBACKS for details on valid callbacks. -c Omit invalid characters from the output. Same as --to-callback skip. --from-callback callback Use callback to handle characters that cannot be transcoded from the original encoding. See section CALLBACKS for details on valid callbacks. -i Ignore invalid sequences in the input. Same as --from-callback skip. --callback callback Use callback to handle both characters that cannot be transcoded from the original encoding and characters that cannot be transcoded to the destination encoding. See section CALLBACKS for details on valid callbacks. --fallback Use the fallback mapping when transcoding from Unicode to the destination encoding. --no-fallback Do not use the fallback mapping when transcoding from Unicode to the destination encoding. This is the default. -b, --block-size size Read input in blocks of size bytes at a time. The default block size is 4096. -f, --from-code encoding Set the original encoding of the data to encoding. -t, --to-code encoding Transcode the data to encoding. --add-signature Add a U+FEFF Unicode signature character (BOM) if the output charset supports it and does not add one anyway. --remove-signature Remove a U+FEFF Unicode signature character (BOM). -o, --output file Write the transcoded data to file. CALLBACKS uconv supports specifying callbacks to handle invalid data. Callbacks can be set for both directions of transcoding: from the original encod‐ ing to Unicode, with the --from-callback option, and from Unicode to the destination encoding, with the --to-callback option. The following is a list of valid callback names, along with a descrip‐ tion of their behavior. The list of callbacks actually supported by uconv is displayed when it is called with -h, --help. substitute Write the encoding's substitute sequence, or the Uni‐ code replacement character U+FFFD when transcoding to Unicode. skip Ignore the invalid data. stop Stop with an error when encountering invalid data. This is the default callback. escape Same as escape-icu. escape-icu Replace the missing characters with a string of the format %Uhhhh for plane 0 characters, and %Uhhhh%Uhhhh for planes 1 and above characters, where hhhh is the hexadecimal value of one of the UTF-16 code units rep‐ resenting the character. Characters from planes 1 and above are written as a pair of UTF-16 surrogate code units. escape-java Replace the missing characters with a string of the format \uhhhh for plane 0 characters, and \uhhhh\uhhhh for planes 1 and above characters, where hhhh is the hexadecimal value of one of the UTF-16 code units rep‐ resenting the character. Characters from planes 1 and above are written as a pair of UTF-16 surrogate code units. escape-c Replace the missing characters with a string of the format \uhhhh for plane 0 characters, and \Uhhhhhhhh for planes 1 and above characters, where hhhh and hhh‐ hhhhh are the hexadecimal values of the Unicode code‐ point. escape-xml Same as escape-xml-hex. escape-xml-hex Replace the missing characters with a string of the format &#xhhhh;, where hhhh is the hexadecimal value of the Unicode codepoint. escape-xml-dec Replace the missing characters with a string of the format &#nnnn;, where nnnn is the decimal value of the Unicode codepoint. escape-unicode Replace the missing characters with a string of the format {U+hhhh}, where hhhh is the hexadecimal value of the Unicode codepoint. That hexadecimal string is of variable length and can use from 4 to 6 digits. This is the format universally used to denote a Uni‐ code codepoint in the literature, delimited by curly braces for easy recognition of those substitutions in the output. EXAMPLES Convert data from a given encoding to the platform encoding: $ uconv -f encoding Check if a file contains valid data for a given encoding: $ uconv -f encoding -c file >/dev/null Convert a UTF-8 file to a given encoding and ensure that the resulting text is good for any version of HTML: $ uconv -f utf-8 -t encoding \ --callback escape-xml-dec file Display the names of the Unicode code points in a UTF-file: $ uconv -f utf-8 -x any-name file Print the name of a Unicode code point whose value is known (U+30AB in this example): $ echo '\u30ab' | uconv -x 'hex-any; any-name'; echo {KATAKANA LETTER KA}{LINE FEED} $ (The names are delimited by curly braces. Also, the name of the line terminator is also displayed.) Normalize UTF-8 data using Unicode NFKC, remove all control characters, and map Katakana to Hiragana: $ uconv -f utf-8 -t utf-8 \ -x '::nfkc; [:Cc:] >; ::katakana-hiragana;' CAVEATS AND BUGS uconv does report errors as occurring at the first invalid byte encoun‐ tered. This may be confusing to users of GNU iconv(1), which reports errors as occurring at the first byte of an invalid sequence. For multi-byte character sets or encodings, this means that uconv error po‐ sitions may be at a later offset in the input stream than would be the case with GNU iconv(1). The reporting of error positions when a transliterator is used may be inaccurate or unavailable, in which case uconv will report the offset in the output stream at which the error occurred. AUTHORS Jonas Utterstroem Yves Arrouye VERSION 77.1 COPYRIGHT Copyright (C) 2000-2005 IBM, Inc. and others. SEE ALSO iconv(1) ICU MANPAGE 2005-jul-1 UCONV(1)
GENDICT(1) ICU 77.1 Manual GENDICT(1) NAME gendict - Компилирует список слов в словарь ICU в виде строки трие SYNOPSIS gendict [ --uchars | --bytes --transform transform ] [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -i, --icud‐ atadir directory ] input-file output-file DESCRIPTION gendict читает список слов из файла словаря и создаёт файл словаря строки трие. Обычно этот файл данных имеет расширение .dict. Слова начинаются в начале строки и заканчиваются первым пробелом. Строки, начинающиеся с пробела, игнорируются. OPTIONS -h, -?, --help Вывести справку по использованию и выйти. -V, --version Вывести версию gendict и выйти. -c, --copyright Внедрить стандартное авторское право ICU в output-file. -v, --verbose Выводить дополнительные информационные сообщения во время выполнения. -i, --icudatadir directory Искать необходимые файлы данных ICU в указанном каталоге. Например, файл pnames.icu должен быть доступен, если данные ICU не собраны как разделяемая библиотека. Каталог данных ICU по умолчанию указывается переменной среды ICU_DATA. Большинство конфигураций ICU не требуют этого аргумента. --uchars Установить тип выходного трие на UChar. Взаимоисключаемо с --bytes. --bytes Установить тип выходного трие на Bytes. Взаимоисключаемо с --uchars. --transform Установить тип преобразования. Должно указываться только с --bytes. В настоящее время поддерживаемые преобразования: offset-<шестнадцатеричное-число>, которое указывает смещение для вычитания из всех входных символов. Следует отметить, что преобразование offset также отображает U+200D в 0xFF и U+200C в 0xFE, чтобы обеспечить совместимость с языками, требующими этих символов. Преобразование должно быть указано для трие bytes, и при применении к неценовым символам в input-file оно должно производить вывод между 0x00 и 0xFF. input-file Исходный файл для чтения. output-file Файл, в который будет записан выходной словарь. CAVEATS Предполагается, что input-file закодирован в UTF-8. Целые числа в input-file, используемые в качестве значений, должны состоять из цифр ASCII. Они могут быть указаны либо в шестнадцатеричном формате с префиксом 0x, либо в десятичном. Должен быть указан либо --bytes, либо --uchars. ENVIRONMENT ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию /usr/share/icu/77.1/. Некоторые инструменты ICU зависят от наличия завершающего слеша. Поэтому важно убедиться, что он присутствует, если задана ICU_DATA. AUTHORS Maxime Serrano VERSION 1.0 COPYRIGHT Copyright (C) 2012 International Business Machines Corporation and others SEE ALSO http://www.icu-project.org/userguide/boundaryAnalysis.html ICU MANPAGE 1 June 2012 GENDICT(1)
GENDICT(1) ICU 77.1 Manual GENDICT(1) NAME gendict - Compiles word list into ICU string trie dictionary SYNOPSIS gendict [ --uchars | --bytes --transform transform ] [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -i, --icud‐ atadir directory ] input-file output-file DESCRIPTION gendict reads the word list from dictionary-file and creates a string trie dictionary file. Normally this data file has the .dict extension. Words begin at the beginning of a line and are terminated by the first whitespace. Lines that begin with whitespace are ignored. OPTIONS -h, -?, --help Print help about usage and exit. -V, --version Print the version of gendict and exit. -c, --copyright Embeds the standard ICU copyright into the output-file. -v, --verbose Display extra informative messages during execution. -i, --icudatadir directory Look for any necessary ICU data files in directory. For exam‐ ple, the file pnames.icu must be located when ICU's data is not built as a shared library. The default ICU data directory is specified by the environment variable ICU_DATA. Most configura‐ tions of ICU do not require this argument. --uchars Set the output trie type to UChar. Mutually exclusive with --bytes. --bytes Set the output trie type to Bytes. Mutually exclusive with --uchars. --transform Set the transform type. Should only be specified with --bytes. Currently supported transforms are: offset-<hex-number>, which specifies an offset to subtract from all input characters. It should be noted that the offset transform also maps U+200D to 0xFF and U+200C to 0xFE, in order to offer compatibility to lan‐ guages that require these characters. A transform must be spec‐ ified for a bytes trie, and when applied to the non-value char‐ acters in the input-file must produce output between 0x00 and 0xFF. input-file The source file to read. output-file The file to write the output dictionary to. CAVEATS The input-file is assumed to be encoded in UTF-8. The integers in the input-file that are used as values must be made up of ASCII digits. They may be specified either in hex, by using a 0x prefix, or in deci‐ mal. Either --bytes or --uchars must be specified. ENVIRONMENT ICU_DATA Specifies the directory containing ICU data. Defaults to /usr/share/icu/77.1/. Some tools in ICU depend on the pres‐ ence of the trailing slash. It is thus important to make sure that it is present if ICU_DATA is set. AUTHORS Maxime Serrano VERSION 1.0 COPYRIGHT Copyright (C) 2012 International Business Machines Corporation and oth‐ ers SEE ALSO http://www.icu-project.org/userguide/boundaryAnalysis.html ICU MANPAGE 1 June 2012 GENDICT(1)
ICU-CONFIG(1) ICU 77.1 Manual ICU-CONFIG(1) NAME icu-config - вывод параметров сборки ICU SYNOPSIS icu-config [ --bindir ] [ --cc ] [ --cflags ] [ --cppflags ] [ --cppflags-searchpath ] [ --cxx ] [ --cxxflags ] [ --detect-prefix ] [ --exec-prefix ] [ --exists ] [ --help, -?, --usage ] [ --icudata ] [ --icudata-install-dir ] [ --icudata-mode ] [ --icudatadir ] [ --invoke ] [ --invoke=prog ] [ --ldflags ] [ --ldflags-libsonly ] [ --ld‐ flags-searchpath ] [ --ldflags-system ] [ --ldflags-icuio ] [ --mandir ] [ --prefix ] [ --prefix=prefix ] [ --sbindir ] [ --shared-datadir ] [ --sysconfdir ] [ --unicode-version ] [ --version ] [ --incfile ] DESCRIPTION icu-config упрощает задачу сборки и связывания с ICU по сравнению с ручной настройкой пользовательских makefile или эквивалентных. Поскольку icu-config является исполняемым скриптом, он также решает проблему поиска библиотек и заголовков ICU, позволяя системе PATH находить его. EXAMPLES icu-config можно использовать без makefile. Следующая команда строки достаточно для сборки однолинейной программы на C++ с ICU. (Например, icu/source/samples/props/props.cpp) `icu-config --cxx --cxxflags --cppflags --ldflags` -o props props.cpp Чаще icu-config вызывается из makefile и используется для установки переменных. В следующем примере также собирается пример props. CC=$(shell icu-config --cc) CXX=$(shell icu-config --cxx) CPPFLAGS=$(shell icu-config --cppflags) CXXFLAGS=$(shell icu-config --cxxflags) LDFLAGS =$(shell icu-config --ldflags) all: props props.o: props.cpp make(1) автоматически использует указанные выше переменные. OPTIONS --bindir Выводит путь к каталогу бинарных (исполняемых) файлов. Обычно эквивалентно 'bin'. Приложения и скрипты ICU, исполняемые пользователем, находятся здесь. --cc Выводит используемый компилятор C. Эквивалентно переменной $(CC) Makefile. --cflags Выводит флаги компилятора C. Эквивалентно переменной $(CFLAGS) Makefile. Не включает директивы препроцессора, такие как пути include или определенные символы. Примеры включают флаги отладки (-g) и оптимизации. --cppflags Выводит флаги препроцессора C. Эквивалентно переменной $(CPPFLAGS) Makefile. Примеры: -I пути include и -D директивы определения. --cppflags-searchpath Выводит флаги препроцессора C, как выше, но только -I пути поиска. --cxx Выводит компилятор C++. Эквивалентно переменной $(CXX) Makefile. --cxxflags Выводит флаги компилятора C++. Эквивалентно переменной $(CXXFLAGS) Makefile. --detect-prefix Если ICU был перемещен из места установки, добавление этого флага к другим вызовам icu-config попытается найти ICU относительно расположения скрипта icu-config. Можно использовать как последнюю попытку, если установка ICU повреждена. --exec-prefix Выводит префикс, используемый для каталогов исполняемых программ (таких как bin, sbin и т.д.). Обычно совпадает с префиксом. --exists Скрипт вернет успешный (0) статус, если ICU кажется установленным и расположенным правильно, в противном случае будет выведено сообщение об ошибке и ненулевой статус. --help, -?,--usage Выводит сообщение помощи и использования. --icudata Выводит короткое имя файла данных ICU. Это не включает суффиксы, такие как .dat, .dll, .so, .lib, .a и т.д., ни префиксы, такие как 'lib'. Может быть в форме icudt21b. --icudata-install-dir Выводит каталог, куда должны быть установлены упакованные данные ICU. Можно использовать как опцию --install для pkgdata(1). --icudata-mode Выводит режим данных ICU по умолчанию, такой как dll или common. Можно использовать как опцию --mode для pkgdata(1). --icudatadir Выводит путь к упакованным архивным данным. (Должен быть там, куда указывает $ICU_DATA или эквивалентный путь по умолчанию.) Не будет указывать на libdir. --invoke Если ICU не установлен в месте, где операционная система найдет его общие библиотеки, эта опция выведет команды для установки соответствующих переменных окружения для загрузки общих библиотек ICU. Например, на многих системах переменная с именем LD_LIBRARY_PATH или эквивалентная должна быть установлена. --invoke=prog То же, что и опция --invoke, кроме того, включает опции для вызова программы с именем prog. Если prog — имя инструмента ICU, такого как genrb(1), то icu-config также включит полный путь к этому инструменту. --ldflags Выводит любые флаги, которые должны быть переданы линковщику. Они могут включать -L для путей поиска библиотек и -l для включения библиотек ICU. По умолчанию эта опция попытается связать библиотеки "common" (libicuuc) и "i18n" (libicui18n), а также библиотеку данных. Если требуются дополнительные библиотеки, любые из следующих двух флагов могут быть добавлены в сочетании с этим, например "--ldflags --ldflags-icuio", если библиотека icuio требуется в дополнение к стандартным библиотекам ICU. Эквивалентно переменной $(LDFLAGS) Makefile. --ldflags-layout Выводит опцию связи для библиотеки макета ICU. --ldflags-icuio Выводит опцию связи для добавления пакета ICU I/O. --ldflags-libsonly Похоже на --ldflags, но включает только опции -l. --ldflags-searchpath Похоже на --ldflags, но включает только опции -L путей поиска. --ldflags-system Похоже на --ldflags, но включает только системные библиотеки (такие как pthreads). --mandir Выводит расположение установленных страниц руководства ICU. Обычно (man) --prefix Выводит префикс (базовый каталог), под которым установлен ICU. --prefix=prefix Устанавливает префикс ICU на prefix для остатка этой командной строки. Не проверяет, действителен ли новый префикс. --sbindir Выводит расположение системных бинарных файлов ICU, обычно (sbin) --shared-datadir Выводит расположение общих данных ICU, обычно (share) --sysconfdir Выводит расположение системных конфигурационных данных ICU, обычно (etc) --unicode-version Выводит версию стандарта Unicode, который использует текущий ICU. --version Выводит текущую версию ICU. --incfile Выводит путь к 'Makefile.inc', подходящий для использования с опцией -O pkgdata(1). AUTHORS Steven Loomis VERSION 77.1 COPYRIGHT Copyright (C) 2002-2004 IBM, Inc. and others. ICU MANPAGE 17 мая 2004 ICU-CONFIG(1)
ICU-CONFIG(1) ICU 77.1 Manual ICU-CONFIG(1) NAME icu-config - output ICU build options SYNOPSIS icu-config [ --bindir ] [ --cc ] [ --cflags ] [ --cppflags ] [ --cppflags-searchpath ] [ --cxx ] [ --cxxflags ] [ --detect-prefix ] [ --exec-prefix ] [ --exists ] [ --help, -?, --usage ] [ --icudata ] [ --icudata-install-dir ] [ --icudata-mode ] [ --icudatadir ] [ --invoke ] [ --invoke=prog ] [ --ldflags ] [ --ldflags-libsonly ] [ --ld‐ flags-searchpath ] [ --ldflags-system ] [ --ldflags-icuio ] [ --mandir ] [ --prefix ] [ --prefix=prefix ] [ --sbindir ] [ --shared-datadir ] [ --sysconfdir ] [ --unicode-version ] [ --version ] [ --incfile ] DESCRIPTION icu-config simplifies the task of building and linking against ICU as compared to manually configuring user makefiles or equivalent. Because icu-config is an executable script, it also solves the problem of lo‐ cating the ICU libraries and headers, by allowing the system PATH to locate it. EXAMPLES icu-config can be used without a makefile. The command line below is sufficient for building a single-file c++ program against ICU. (For ex‐ ample, icu/source/samples/props/props.cpp) `icu-config --cxx --cxxflags --cppflags --ldflags` -o props props.cpp More commonly, icu-config will be called from within a makefile, and used to set up variables. The following example also builds the props example. CC=$(shell icu-config --cc) CXX=$(shell icu-config --cxx) CPPFLAGS=$(shell icu-config --cppflags) CXXFLAGS=$(shell icu-config --cxxflags) LDFLAGS =$(shell icu-config --ldflags) all: props props.o: props.cpp make(1) will automatically use the above variables. OPTIONS --bindir Prints the binary (executable) directory path. Normally equiva‐ lent to 'bin'. ICU user-executable applications and scripts are found here. --cc Print the C compiler used. Equivalent to the $(CC) Makefile variable. --cflags Print the C compiler flags. Equivalent to the $(CFLAGS) Makefile variable. Does NOT include preprocessor directives such as in‐ clude path or defined symbols. Examples include debugging (-g) and optimization flags --cppflags Print the C preprocessor flags. Equivalent to the $(CPPFLAGS) Makefile variable. Examples are -I include paths and -D define directives. --cppflags-searchpath Print the C preprocessor flags, as above but only -I search paths. --cxx Print the C++ compiler. Equivalent to the $(CXX) Makefile vari‐ able. --cxxflags Print the C++ compiler flags. Equivalent to the $(CXXFLAGS) Makefile variable. --detect-prefix If ICU has been moved from its installed location, prepending this flag to other icu-config calls will attempt to locate ICU relative to where the icu-config script has been located. Can be used as a last-chance effort if the ICU install has been dam‐ aged. --exec-prefix Print the prefix used for executable program directories (such as bin, sbin, etc). Normally the same as the prefix. --exists Script will return with a successful (0) status if ICU seems to be installed and located correctly, otherwise an error message and nonzero status will be displayed. --help, -?,--usage Print a help and usage message. --icudata Print the shortname of the ICU data file. This does not include any suffix such as .dat, .dll, .so, .lib, .a, etc nor does it include prefixes such as 'lib'. It may be in the form icudt21b --icudata-install-dir Print the directory where ICU packaged data should be installed. Can use as pkgdata(1)'s --install option. --icudata-mode Print the default ICU pkgdata mode, such as dll or common. Can use as pkgdata(1)'s --mode option. --icudatadir Print the path to packaged archive data. (should be where $ICU_DATA or equivalent default path points.) Will NOT point to the libdir. --invoke If ICU is not installed in a location where the operating system will locate its shared libraries, this option will print out commands so as to set the appropriate environment variables to load ICU's shared libraries. For example, on many systems a variable named LD_LIBRARY_PATH or equivalent must be set. --invoke=prog Same as the --invoke option, except includes options for invok‐ ing a program named prog. If prog is the name of an ICU tool, such as genrb(1), then icu-config will also include the full path to that tool. --ldflags Print any flags which should be passed to the linker. These may include -L for library search paths, and -l for including ICU libraries. By default, this option will attempt to link in the "common" (libicuuc) and "i18n" (libicui18n) libraries, as well as the data library. If additional libraries are required, any of the following two flags may be added in conjunction with this one, for example "--ldflags --ldflags-icuio" if the icuio li‐ brary is required in addition to the standard ICU libraries. Equivalent to the $(LDFLAGS) Makefile variable. --ldflags-layout Prints the link option for the ICU layout library. --ldflags-icuio Prints the link option to add the ICU I/O package --ldflags-libsonly Similar to --ldflags but only includes the -l options. --ldflags-searchpath Similar to --ldflags but only includes the -L search path op‐ tions. --ldflags-system Similar to --ldflags but only includes system libraries (such as pthreads) --mandir Prints the location of the installed ICU man pages. Normally (man) --prefix Prints the prefix (base directory) under which the installed ICU resides. --prefix=prefix Sets the ICU prefix to prefix for the remainder of this command line. Does test whether the new prefix is valid. --sbindir Prints the location of ICU system binaries, normally (sbin) --shared-datadir Prints the location of ICU shared data, normally (share) --sysconfdir Prints the location of ICU system configuration data, normally (etc) --unicode-version Prints the Version of the Unicode Standard which the current ICU uses. --version Prints the current version of ICU. --incfile Prints the 'Makefile.inc' path, suitable for use with pkg‐ data(1)'s -O option. AUTHORS Steven Loomis VERSION 77.1 COPYRIGHT Copyright (C) 2002-2004 IBM, Inc. and others. ICU MANPAGE 17 May 2004 ICU-CONFIG(1)
ICUPKG(8) ICU 77.1 Manual ICUPKG(8) NAME icupkg - извлечение или модификация архива ICU .dat SYNOPSIS icupkg [ -h, -?, --help ] [ -tl, --type l | -tb, --type b | -te, --type e ] [ -c, --copyright | -C, --comment comment ] [ -a, --add list ] [ -r, --remove list ] [ -x, --extract list ] [ -l, --list ] [ -s, --sourcedir source ] [ -d, --destdir destination ] [ -w, --writepkg ] [ -m, --matchmode mode ] infilename [ outfilename ] DESCRIPTION icupkg читает входной файл пакета ICU .dat, модифицирует его в соответствии с опциями, преобразует его в свойства целевой платформы (кодировка и порядок байтов), и, при необходимости, записывает результирующий пакет ICU .dat в выходной файл. Элементы удаляются, затем добавляются, затем извлекаются и перечисляются. Пакет ICU .dat записывается, если элементы удалены или добавлены, или если входное и выходное имена файлов отличаются, или если установлена опция -w, --writepkg. Если входное имя файла — "new", то создаётся пустой пакет. Если выходное имя файла отсутствует, то оно автоматически генерируется на основе входного имени файла. Если входное имя файла заканчивается на l, b или e, соответствующее свойствам платформы, то выходное имя файла будет содержать букву из опции -t, --type. Этот инструмент также можно использовать для простого преобразования одного файла данных ICU, заменяя бывший инструмент icuswap. В этом режиме укажите infilename (и необязательное outfilename) для файла данных ICU, который не является пакетом. Допустимые опции включают -t, -w, -s и -d. Имена файлов могут быть абсолютными или относительными по отношению к путям source/dest dir. Другие опции в этом режиме не допускаются. OPTIONS -h, -?, --help Вывести справку по использованию и выйти. -tl, --type l Вывод для little-endian/семейства кодировок ASCII. Тип вывода по умолчанию соответствует типу входных данных. -tb, --type b Вывод для big-endian/семейства кодировок ASCII. Тип вывода по умолчанию соответствует типу входных данных. -te, --type e Вывод для big-endian/семейства кодировок EBCDIC. Тип вывода по умолчанию соответствует типу входных данных. -c,--copyright Включить уведомление об авторских правах ICU в результирующие данные. -C, --comment comment Включить указанный комментарий в результирующие данные вместо уведомления об авторских правах ICU. -a, --add list Добавить элементы из списка в пакет. Список может быть одним именем файла с расширением .txt, содержащим список имён элементов, или именем файла пакета ICU .dat. -r, --remove list Удалить элементы из списка из пакета. Список может быть одним именем файла с расширением .txt, содержащим список имён элементов, или именем файла пакета ICU .dat. -x, --extract list Извлечь элементы из списка из пакета. Список может быть одним именем файла с расширением .txt, содержащим список имён элементов, или именем файла пакета ICU .dat. -m, --matchmode mode Установить режим сопоставления для имён элементов с использованием подстановочных знаков. -s, --sourcedir source Установить исходный каталог на source. Каталог по умолчанию — текущий каталог. -d, --destdir destination Установить каталог назначения на destination. Каталог по умолчанию — текущий каталог. -l, --list Вывести элементы пакета в stdout (после модификации пакета). LIST FILE SYNTAX Элементы перечислены в одной или нескольких строках и разделены пробелами (пробел+табуляция). Комментарии начинаются с # и игнорируются. Пустые строки игнорируются. Строки, в которых первый непробельный символ — один из "%&'()*+,-./:;<=>?_", также игнорируются для резерва под будущий синтаксис. Элементы для удаления или извлечения могут содержать один подстановочный знак *. Символ * соответствует нулю или более символам. Если установлен -m, --matchmode noslash, то символ * не соответствует символу /. Элементы должны быть перечислены относительно пакета, и путь --sourcedir или --destdir будет добавлен в начало. Пути добавляются только к именам файлов элементов при добавлении или извлечении элементов, а не к именам файлов пакетов ICU .dat или списков. Пути могут содержать / вместо разделителя файлов платформы и преобразуются соответственно. AUTHORS Markus Scherer George Rhoten VERSION 1.0 COPYRIGHT Copyright (C) 2006 IBM, Inc. and others. SEE ALSO pkgdata(1) genrb(1) ICU MANPAGE 18 августа 2006 ICUPKG(8)
ICUPKG(8) ICU 77.1 Manual ICUPKG(8) NAME icupkg - extract or modify an ICU .dat archive SYNOPSIS icupkg [ -h, -?, --help ] [ -tl, --type l | -tb, --type b | -te, --type e ] [ -c, --copyright | -C, --comment comment ] [ -a, --add list ] [ -r, --remove list ] [ -x, --extract list ] [ -l, --list ] [ -s, --sourcedir source ] [ -d, --destdir destination ] [ -w, --writepkg ] [ -m, --matchmode mode ] infilename [ outfilename ] DESCRIPTION icupkg reads the input ICU .dat package file, modify it according to the options, swap it to the desired platform properties (charset & en‐ dianness), and optionally write the resulting ICU .dat package to the output file. Items are removed, then added, then extracted and listed. An ICU .dat package is written if items are removed or added, or if the input and output filenames differ, or if the -w, --writepkg option is set. If the input filename is "new" then an empty package is created. If the output filename is missing, then it is automatically generated from the input filename. If the input filename ends with an l, b, or e matching its platform properties, then the output filename will contain the letter from the -t, --type option. This tool can also be used to just swap a single ICU data file, replac‐ ing the former icuswap tool. For this mode, provide the infilename (and optional outfilename) for a non-package ICU data file. Allowed options include -t, -w, -s and -d The filenames can be absolute, or relative to the source/dest dir paths. Other options are not allowed in this mode. OPTIONS -h, -?, --help Print help about usage and exit. -tl, --type l Output for little-endian/ASCII charset family. The output type defaults to the input type. -tb, --type b Output for big-endian/ASCII charset family. The output type de‐ faults to the input type. -te, --type e Output for big-endian/EBCDIC charset family. The output type defaults to the input type. -c,--copyright Include the ICU copyright notice in the resulting data. -C, --comment comment Include the specified comment in the resulting data instead of the ICU copyright notice. -a, --add list Add items from the list to the package. The list can be a single filename with a .txt file extension containing a list of item filenames, or an ICU .dat package filename. -r, --remove list Remove items from the list from the package. The list can be a single filename with a .txt file extension containing a list of item filenames, or an ICU .dat package filename. -x, --extract list Extract items from the list from the package. The list can be a single filename with a .txt file extension containing a list of item filenames, or an ICU .dat package filename. -m, --matchmode mode Set the matching mode for item names with wildcards. -s, --sourcedir source Set the source directory to source. The default source direc‐ tory is the current directory. -d, --destdir destination Set the destination directory to destination. The default des‐ tination directory is the current directory. -l, --list List the package items to stdout (after modifying the package). LIST FILE SYNTAX Items are listed on one or more lines and separated by whitespace (space+tab). Comments begin with # and are ignored. Empty lines are ignored. Lines where the first non-whitespace character is one of "%&'()*+,-./:;<=>?_ are also ignored to reserve for future syntax. Items for removal or extraction may contain a single * wildcard charac‐ ter. The * matches zero or more characters. If -m, --matchmode noslash is set, then the * character does not match the / character. Items must be listed relative to the package, and the --sourcedir or the --destdir path will be prepended. The paths are only prepended to item filenames while adding or extracting items, not to ICU .dat pack‐ age or list filenames. Paths may contain / instead of the platform's file separator character and are converted as appropriate. AUTHORS Markus Scherer George Rhoten VERSION 1.0 COPYRIGHT Copyright (C) 2006 IBM, Inc. and others. SEE ALSO pkgdata(1) genrb(1) ICU MANPAGE 18 August 2006 ICUPKG(8)
GENBRK(1) ICU 77.1 Manual GENBRK(1) NAME genbrk - Компилирует исходные файлы правил разрыва ICU в бинарные файлы данных SYNOPSIS genbrk [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -d, --destdir destination ] [ -i, --icudatadir directory ] -r, --rules rule-file -o, --out output-file DESCRIPTION genbrk читает исходный код правил разрыва (границы) из rule-file и создает файл данных для итерации разрыва. Обычно этот файл данных имеет расширение .brk. Подробности синтаксиса правил можно найти в Руководстве пользователя ICU. OPTIONS -h, -?, --help Выводит справку по использованию и выходит. -V, --version Выводит версию genbrk и выходит. -c, --copyright Встраивает стандартное авторское право ICU в output-file. -v, --verbose Выводит дополнительные информационные сообщения во время выполнения. -d, --destdir destination Устанавливает каталог назначения для output-file как destination. -i, --icudatadir directory Ищет необходимые файлы данных ICU в каталоге directory. Например, файл pnames.icu должен быть расположен, когда данные ICU не построены как разделяемая библиотека. Каталог данных ICU по умолчанию указывается переменной окружения ICU_DATA. Большинство конфигураций ICU не требуют этого аргумента. -r, --rules rule-file Исходный файл для чтения. -o, --out output-file Выходной файл данных для записи. CAVEATS Если rule-file содержит метку порядка байтов (BOM) в начале файла, которая является символом Unicode U+FEFF, то rule-file интерпретируется как Unicode. Без BOM файл интерпретируется в текущей кодовой странице операционной системы по умолчанию. Чтобы устранить всякую неоднозначность кодировки, с которой был записан rule-file, рекомендуется писать этот файл в UTF-8 с BOM. ENVIRONMENT ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию /usr/share/icu/77.1/. Некоторые инструменты в ICU зависят от наличия завершающего слеша. Поэтому важно убедиться, что он присутствует, если ICU_DATA задана. AUTHORS George Rhoten Andy Heninger VERSION 1.0 COPYRIGHT Copyright (C) 2005 International Business Machines Corporation and others SEE ALSO http://www.icu-project.org/userguide/boundaryAnalysis.html ICU MANPAGE 2 December 2005 GENBRK(1)
GENBRK(1) ICU 77.1 Manual GENBRK(1) NAME genbrk - Compiles ICU break iteration rules source files into binary data files SYNOPSIS genbrk [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -d, --destdir destination ] [ -i, --icudatadir directory ] -r, --rules rule-file -o, --out output-file DESCRIPTION genbrk reads the break (boundary) rule source code from rule-file and creates a break iteration data file. Normally this data file has the .brk extension. The details of the rule syntax can be found in ICU's User Guide. OPTIONS -h, -?, --help Print help about usage and exit. -V, --version Print the version of genbrk and exit. -c, --copyright Embeds the standard ICU copyright into the output-file. -v, --verbose Display extra informative messages during execution. -d, --destdir destination Set the destination directory of the output-file to destination. -i, --icudatadir directory Look for any necessary ICU data files in directory. For exam‐ ple, the file pnames.icu must be located when ICU's data is not built as a shared library. The default ICU data directory is specified by the environment variable ICU_DATA. Most configura‐ tions of ICU do not require this argument. -r, --rules rule-file The source file to read. -o, --out output-file The output data file to write. CAVEATS When the rule-file contains a byte order mark (BOM) at the beginning of the file, which is the Unicode character U+FEFF, then the rule-file is interpreted as Unicode. Without the BOM, the file is interpreted in the current operating system default codepage. In order to eliminate any ambiguity of the encoding for how the rule-file was written, it is rec‐ ommended that you write this file in UTF-8 with the BOM. ENVIRONMENT ICU_DATA Specifies the directory containing ICU data. Defaults to /usr/share/icu/77.1/. Some tools in ICU depend on the pres‐ ence of the trailing slash. It is thus important to make sure that it is present if ICU_DATA is set. AUTHORS George Rhoten Andy Heninger VERSION 1.0 COPYRIGHT Copyright (C) 2005 International Business Machines Corporation and oth‐ ers SEE ALSO http://www.icu-project.org/userguide/boundaryAnalysis.html ICU MANPAGE 2 December 2005 GENBRK(1)