Пакет: icu
- Версия
- 77.1
- Релиз
- 1.niceos5
- Архитектура
- x86_64
- Хэш GOST
- ff559f7be8abaa05ae89ea914348a0c62bb16bd2f91f0341a66f24fa20802124
- Хэш MD5
- 246dbeb933479e167a3b2f8af29c2b10
- Хэш SHA256
- 9ce6688c9e9b14c89e1fe4c138667d6869d95fff3467a63f865c48d8cc793970
- Лицензия
- MIT и UCD и Public Domain
- Дата сборки
- 12 мая 2025 г.
- Размер
- 38,846 ГиБ
- Совместимые ОС
- rpm файл:
- icu-77.1-1.niceos5.x86_64.rpm
Зависимости
Имя | Тип | Версия |
---|---|---|
/bin/sh | runtime | - |
ld-linux-x86-64.so.2()(64bit) | runtime | - |
ld-linux-x86-64.so.2(GLIBC_2.3)(64bit) | runtime | - |
libc.so.6()(64bit) | runtime | - |
libc.so.6(GLIBC_2.14)(64bit) | runtime | - |
libc.so.6(GLIBC_2.2.5)(64bit) | runtime | - |
libc.so.6(GLIBC_2.3)(64bit) | runtime | - |
libc.so.6(GLIBC_2.33)(64bit) | runtime | - |
libc.so.6(GLIBC_2.34)(64bit) | runtime | - |
libc.so.6(GLIBC_2.38)(64bit) | runtime | - |
libc.so.6(GLIBC_2.4)(64bit) | runtime | - |
libgcc_s.so.1()(64bit) | runtime | - |
libgcc_s.so.1(GCC_3.0)(64bit) | runtime | - |
libicudata.so.77()(64bit) | runtime | - |
libicui18n.so.77()(64bit) | runtime | - |
libicuio.so.77()(64bit) | runtime | - |
libicutu.so.77()(64bit) | runtime | - |
libicuuc.so.77()(64bit) | runtime | - |
libm.so.6()(64bit) | runtime | - |
libm.so.6(GLIBC_2.2.5)(64bit) | runtime | - |
libm.so.6(GLIBC_2.27)(64bit) | runtime | - |
libm.so.6(GLIBC_2.29)(64bit) | runtime | - |
libm.so.6(GLIBC_2.38)(64bit) | runtime | - |
libstdc++.so.6()(64bit) | runtime | - |
libstdc++.so.6(CXXABI_1.3)(64bit) | runtime | - |
libstdc++.so.6(CXXABI_1.3.15)(64bit) | runtime | - |
libstdc++.so.6(CXXABI_1.3.8)(64bit) | runtime | - |
libstdc++.so.6(CXXABI_1.3.9)(64bit) | runtime | - |
libstdc++.so.6(GLIBCXX_3.4)(64bit) | runtime | - |
libstdc++.so.6(GLIBCXX_3.4.11)(64bit) | runtime | - |
libstdc++.so.6(GLIBCXX_3.4.14)(64bit) | runtime | - |
libstdc++.so.6(GLIBCXX_3.4.15)(64bit) | runtime | - |
libstdc++.so.6(GLIBCXX_3.4.20)(64bit) | runtime | - |
libstdc++.so.6(GLIBCXX_3.4.21)(64bit) | runtime | - |
libstdc++.so.6(GLIBCXX_3.4.29)(64bit) | runtime | - |
libstdc++.so.6(GLIBCXX_3.4.30)(64bit) | runtime | - |
libstdc++.so.6(GLIBCXX_3.4.32)(64bit) | runtime | - |
libstdc++.so.6(GLIBCXX_3.4.9)(64bit) | runtime | - |
rtld(GNU_HASH) | runtime | - |
Граф зависимостей
История изменений
Дата | Автор | Сообщение |
---|---|---|
31 мар. 2025 г. | Stanislav Belikov <sbelikov@ncsgp.ru> | Первая сборка для icu |
Файлы пакета
-
-
- /usr/bin/derb 34,453 КиБ
- /usr/bin/genbrk 21,867 КиБ
- /usr/bin/gencfu 17,242 КиБ
- /usr/bin/gencnval 30,398 КиБ
- /usr/bin/gendict 41,32 КиБ
- /usr/bin/genrb 217,055 КиБ
- /usr/bin/icu-config 21,702 КиБ
- /usr/bin/icuexportdata 74,703 КиБ
- /usr/bin/icuinfo 16,742 КиБ
- /usr/bin/makeconv 58,344 КиБ
- /usr/bin/pkgdata 54,336 КиБ
- /usr/bin/uconv 62,898 КиБ
-
-
- /usr/lib/libicudata.so.77 18 Б
- /usr/lib/libicudata.so.77.1 30,427 МиБ
- /usr/lib/libicui18n.so.77 18 Б
- /usr/lib/libicui18n.so.77.1 4,638 МиБ
- /usr/lib/libicuio.so.77 16 Б
- /usr/lib/libicuio.so.77.1 71,492 КиБ
- /usr/lib/libicutest.so.77 18 Б
- /usr/lib/libicutest.so.77.1 95,906 КиБ
- /usr/lib/libicutu.so.77 16 Б
- /usr/lib/libicutu.so.77.1 267,211 КиБ
- /usr/lib/libicuuc.so.77 16 Б
- /usr/lib/libicuuc.so.77.1 2,504 МиБ
-
-
- /usr/sbin/escapesrc 29,242 КиБ
- /usr/sbin/genccode 16,516 КиБ
- /usr/sbin/gencmn 16,234 КиБ
- /usr/sbin/gennorm2 84,289 КиБ
- /usr/sbin/gensprep 30,93 КиБ
- /usr/sbin/icupkg 26,336 КиБ
-
-
-
-
- /usr/share/man/man1/derb.1.gz 2,016 КиБ
- /usr/share/man/man1/genbrk.1.gz 1,322 КиБ
- /usr/share/man/man1/gencfu.1.gz 1,012 КиБ
- /usr/share/man/man1/gencnval.1.gz 1,034 КиБ
- /usr/share/man/man1/gendict.1.gz 1,517 КиБ
- /usr/share/man/man1/genrb.1.gz 1,627 КиБ
- /usr/share/man/man1/icu-config.1.gz 2,693 КиБ
- /usr/share/man/man1/icuexportdata.1.gz 317 Б
- /usr/share/man/man1/makeconv.1.gz 1,515 КиБ
- /usr/share/man/man1/pkgdata.1.gz 2,679 КиБ
- /usr/share/man/man1/uconv.1.gz 3,324 КиБ
-
-
-
-
Документация (man-страницы)
PKGDATA(1) ICU 77.1 Manual PKGDATA(1) NAME pkgdata - упаковка данных для использования с ICU SYNOPSIS pkgdata [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright | -C, --comment comment ] [ -m, --mode mode ] -p, --name name -O, --bldopt options [ -e, --entrypoint name ] [ -r, --revision version ] [ -F, --rebuild ] [ -I, --install ] [ -s, --sourcedir source ] [ -d, --dest‐ dir destination ] [ -T, --tempdir directory ] [ file ... ] DESCRIPTION pkgdata берет набор файлов данных и упаковывает их для использования с ICU или приложениями, которые используют ICU. Основная причина упаковки файлов с помощью pkgdata — упрощение их распространения и ускорение их загрузки ICU, а также уменьшение потребления ограниченных системных ре‐ сурсов, таких как дескрипторы файлов. Упакованные данные также позволяют приложениям распространяться с меньшим количеством файлов ресурсов или даже без них, если они напрямую связаны с упакованными данными. pkgdata поддерживает несколько различных методов упаковки данных, кото‐ рые служат разным целям. Режим упаковки по умолчанию — common, или archive. В этом режиме раз‐ личные файлы данных объединяются в архитектурно-зависимый файл, который позже может быть отображен в память для использования ICU. Данные, упа‐ кованные с помощью этого режима, будут искаться в каталоге данных ICU. Такая упаковка удобна для приложений с пакетами ресурсов, например, по‐ скольку приложение может установить упакованный файл в каталог данных ICU. Другой режим упаковки — dll, или library, где файлы данных компилиру‐ ются в разделяемую библиотеку. ICU ранее могла динамически загружать эти разделяемые библиотеки, но начиная с ICU 2.0 такая поддержка была удалена. Этот режим все равно полезен для двух основных целей: для сборки ICU самой по себе, поскольку данные ICU по умолчанию упаковыва‐ ются в разделяемую библиотеку; и для сборки пакетов ресурсов, которые связаны с приложением, использующим их. Такие пакеты ресурсов могут размещаться в любом месте, где системный динамический линкер будет искать разделяемые библиотеки, вместо того чтобы быть вынужденными на‐ ходиться внутри каталога данных ICU. Статический режим упаковки похож на режим разделяемой библиотеки, кро‐ ме того, что он производит статическую библиотеку. Наконец, pkgdata поддерживает режим files, который просто копирует фай‐ лы данных вместо их упаковки в единый файл или библиотеку. Этот режим в основном предназначен для обеспечения поддержки сборки ICU до ее упа‐ ковки в отдельные небольшие пакеты для распространения с операционны‐ ми системами, такими как Debian GNU/Linux. Для получения дополнитель‐ ной информации о использовании этого режима обратитесь к документации по упаковке в дистрибутиве исходного кода ICU. pkgdata строит, упаковывает, устанавливает или очищает соответствующие данные на основе заданных опций, без необходимости вызова GNU make. OPTIONS -h, -?, --help Вывести справку по использованию и выйти. -v, --verbose Выводить дополнительные информационные сообщения во время вы‐ полнения. -c, --copyright Включить уведомление об авторских правах в двоичные данные. -C, --comment comment Включить указанный комментарий в результирующие данные вместо уведомления об авторских правах ICU. -m, --mode mode Установить режим упаковки, используемый pkgdata. Разные режимы и их значения объяснены в разделе DESCRIPTION выше. Допустимые имена режимов — common (или archive), dll (или library) и files. -O, --bldopt options Указать опции для сборщика. Сборщик используется внутренне pkgdata для генерации правильного упакованного файла. Такие оп‐ ции включают, но не ограничиваются, установкой переменных, ис‐ пользуемых make(1) во время сборки упакованного файла. Приме‐ чание: Если icu-config доступен, то эта опция не нужна. -p, --name name Установить имя упакованного файла как name. Это имя также ис‐ пользуется в качестве имени точки входа по умолчанию после пре‐ образования в допустимый идентификатор C. -e, --entrypoint name Установить точку входа данных (используется для связывания с да‐ ними в форме разделяемой библиотеки) как name. Имя точки входа по умолчанию — имя, установленное опцией -n, --name. -r, --revision version Включить версионность разделяемой библиотеки, произведенной в режиме dll или library. Номер версии имеет формат major.mi‐ nor.patchlevel, и все части, кроме major, являются необязатель‐ ными. Если указано только major, то версия считается major.0 для целей версионности. -F, --rebuild Принудительно перестроить все данные и их повторную упаковку. -I, --install Установить упакованный файл (или все файлы в режиме files). Если переменная DESTDIR задана, она будет использована для ус‐ тановки. -s, --sourcedir source Установить исходный каталог как source. Каталог по умолчанию — текущий каталог. -d, --destdir destination Установить каталог назначения как destination. Каталог назна‐ чения по умолчанию — текущий каталог. -T, --tempdir directory Установить каталог для генерации временных файлов как directory. Каталог временных файлов по умолчанию — тот же, что и каталог назначения, установленный опцией -d, --destdir. AUTHORS Steven Loomis Yves Arrouye VERSION 77.1 COPYRIGHT Copyright (C) 2000-2009 IBM, Inc. и другие. ICU MANPAGE 6 февраля 2009 PKGDATA(1)
PKGDATA(1) ICU 77.1 Manual PKGDATA(1) NAME pkgdata - package data for use by ICU SYNOPSIS pkgdata [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright | -C, --comment comment ] [ -m, --mode mode ] -p, --name name -O, --bldopt options [ -e, --entrypoint name ] [ -r, --revision version ] [ -F, --rebuild ] [ -I, --install ] [ -s, --sourcedir source ] [ -d, --dest‐ dir destination ] [ -T, --tempdir directory ] [ file ... ] DESCRIPTION pkgdata takes a set of data files and packages them for use by ICU or applications that use ICU. The typical reason to package files using pkgdata is to make their distribution easier and their loading by ICU faster and less consuming of limited system resources such as file de‐ scriptors. Packaged data also allow applications to be distributed with fewer resource files, or even with none at all if they link against the packaged data directly. pkgdata supports a few different methods of packaging data that serve different purposes. The default packaging mode is common, or archive. In this mode, the different data files are bundled together as an architecture-dependent file that can later be memory mapped for use by ICU. Data packaged us‐ ing this mode will be looked up under the ICU data directory. Such packaging is easy to use for applications resource bundles, for exam‐ ple, as long as the application can install the packaged file in the ICU data directory. Another packaging mode is the dll, or library, mode, where the data files are compiled into a shared library. ICU used to be able to dynam‐ ically load these shared libraries, but as of ICU 2.0, such support has been removed. This mode is still useful for two main purposes: to build ICU itself, as the ICU data is packaged as a shared library by default; and to build resource bundles that are linked to the application that uses them. Such resource bundles can then be placed anywhere where the system's dynamic linker will be looking for shared libraries, instead of being forced to live inside the ICU data directory. The static packaging mode is similar to the shared library one except that it produces a static library. Finally, pkgdata supports a files mode which simply copies the data files instead of packaging them as a single file or library. This mode is mainly intended to provide support for building ICU before it is packaged as separate small packages for distribution with operating systems such as Debian GNU/Linux for example. Please refer to the pack‐ aging documentation in the ICU source distribution for further informa‐ tion on the use of this mode. pkgdata builds, packages, installs, or cleans the appropriate data based on the options given without the need to call GNU make anymore. OPTIONS -h, -?, --help Print help about usage and exit. -v, --verbose Display extra informative messages during execution. -c, --copyright Include a copyright notice in the binary data. -C, --comment comment Includes the specified comment in the resulting data instead of the ICU copyright notice. -m, --mode mode Set the packaging mode to be used by pkgdata. The different modes and their meaning are explained in the DESCRIPTION section above. The valid mode names are common (or archive), dll (or li‐ brary), and files. -O, --bldopt options Specify options for the builder. The builder is used internally by pkgdata to generate the correct packaged file. Such options include, but are not limited to, setting variables used by make(1) during the build of the packaged file. Note: If icu-con‐ fig is available, then this option is not needed. -p, --name name Set the packaged file name to name. This name is also used as the default entry point name after having been turned into a valid C identifier. -e, --entrypoint name Set the data entry point (used for linking against the data in a shared library form) to name. The default entry point name is the name set by the -n, --name option. -r, --revision version Enable versioning of the shared library produced in dll, or li‐ brary, mode. The version number has the format major.mi‐ nor.patchlevel and all parts except for major are optional. If only major is supplied then the version is assumed to be major.0 for versioning purposes. -F, --rebuild Force the rebuilding of all data and their repackaging. -I, --install Install the packaged file (or all the files in the files mode). If the variable DESTDIR is set it will be used for installation. -s, --sourcedir source Set the source directory to source. The default source direc‐ tory is the current directory. -d, --destdir destination Set the destination directory to destination. The default des‐ tination directory is the current directory. -T, --tempdir directory Set the directory used to generate temporary files to directory. The default temporary directory is the same as the destination directory as set by the -d, --destdir option. AUTHORS Steven Loomis Yves Arrouye VERSION 77.1 COPYRIGHT Copyright (C) 2000-2009 IBM, Inc. and others. ICU MANPAGE 6 February 2009 PKGDATA(1)
GENCFU(1) ICU 77.1 Руководство GENCFU(1) NAME gencfu - Генерирует файлы данных Unicode Confusable SYNOPSIS gencfu [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -d, --destdir destination ] [ -i, --icudatadir directory ] -r, --rules rule-file -w, --wsrules whole-script-rule-file -o, --out output-file DESCRIPTION gencfu читает определения путаемых символов в файле ввода, которые представляют собой простые текстовые файлы, содержащие определения путаемых символов в формате ввода, определённом Unicode UAX39 для фи‐ лов confusables.txt и confusablesWholeScript.txt. Этот исходный (.txt) формат также принимается детекторами подделок ICU. Файлы должны быть закодированы в формате utf-8, с BOM или без него. Обычно выходной файл данных имеет расширение .cfu. OPTIONS -h, -?, --help Вывести справку по использованию и выйти. -V, --version Вывести версию gencfu и выйти. -c, --copyright Внедрить стандартный авторский текст ICU в выходной файл. -v, --verbose Выводить дополнительные информационные сообщения во время вы‐ полнения. -d, --destdir destination Установить каталог назначения для выходного файла как destina‐ tion. -i, --icudatadir directory Искать необходимые файлы данных ICU в каталоге directory. На пример, файл pnames.icu должен быть найден, когда данные ICU не построены как разделяемая библиотека. Каталог данных ICU по умолчанию указывается переменной среды ICU_DATA. Большин‐ ство конфигураций ICU не требует этого аргумента. -r, --rules rule-file Исходный файл для чтения. -w, --wsrules whole-script-rule-file Исходный файл для всего скрипта для чтения. -o, --out output-file Выходной файл данных для записи. VERSION 1.0 COPYRIGHT Copyright (C) 2009 International Business Machines Corporation и дру‐ гие ICU MANPAGE 24 May 2009 GENCFU(1)
GENCFU(1) ICU 77.1 Manual GENCFU(1) NAME gencfu - Generates Unicode Confusable data files SYNOPSIS gencfu [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -d, --destdir destination ] [ -i, --icudatadir directory ] -r, --rules rule-file -w, --wsrules whole-script-rule-file -o, --out output-file DESCRIPTION gencfu reads confusable character definitions in the input file, which are plain text files containing confusable character definitions in the input format defined by Unicode UAX39 for the files confusables.txt and confusablesWholeScript.txt. This source (.txt) format is also accepted by ICU spoof detectors. The files must be encoded in utf-8 format, with or without a BOM. Normally the output data file has the .cfu ex‐ tension. OPTIONS -h, -?, --help Print help about usage and exit. -V, --version Print the version of gencfu and exit. -c, --copyright Embeds the standard ICU copyright into the output-file. -v, --verbose Display extra informative messages during execution. -d, --destdir destination Set the destination directory of the output-file to destination. -i, --icudatadir directory Look for any necessary ICU data files in directory. For exam‐ ple, the file pnames.icu must be located when ICU's data is not built as a shared library. The default ICU data directory is specified by the environment variable ICU_DATA. Most configura‐ tions of ICU do not require this argument. -r, --rules rule-file The source file to read. -w, --wsrules whole-script-rule-file The whole script source file to read. -o, --out output-file The output data file to write. VERSION 1.0 COPYRIGHT Copyright (C) 2009 International Business Machines Corporation and oth‐ ers ICU MANPAGE 24 May 2009 GENCFU(1)
GENCNVAL(1) ICU 77.1 Manual GENCNVAL(1) NAME gencnval - компилировать файл псевдонимов преобразователей SYNOPSIS gencnval [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright ] [ -s, --sourcedir source ] [ -d, --destdir destination ] [ converterfile ] DESCRIPTION gencnval преобразует файл псевдонимов ICU converterfile в двоичный файл cnvalias.icu. Этот двоичный файл может быть прочитан напрямую ICU, или использован pkgdata(1) для включения в больший архив или библиотеку. Если converterfile не указан, используется файл convrtrs.txt по умолчанию для ICU. OPTIONS -h, -?, --help Вывести справку по использованию и выйти. -v, --verbose Выводить подробный вывод. Эта информация может включать информацию о конфликтующих псевдонимах и преобразователях, к которым они приводят. -c, --copyright Включить уведомление об авторских правах в двоичные данные. -s, --sourcedir source Установить исходный каталог на source. Каталог по умолчанию указывается переменной окружения ICU_DATA. -d, --destdir destination Установить каталог назначения на destination. Каталог назначения по умолчанию указывается переменной окружения ICU_DATA. ENVIRONMENT ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию /usr/share/icu/77.1/. Некоторые инструменты в ICU зависят от наличия завершающего слеша. Поэтому важно убедиться, что он присутствует, если ICU_DATA задана. FILES icu/source/data/mappings/convrtrs.txt Описание преобразователей ICU и их псевдонимов. Этот файл данных обычно не устанавливается и доступен как часть исходного кода ICU. VERSION 77.1 COPYRIGHT Copyright (C) 2000-2004 IBM, Inc. and others. SEE ALSO pkgdata(1) ICU MANPAGE 11 March 2004 GENCNVAL(1)
GENCNVAL(1) ICU 77.1 Manual GENCNVAL(1) NAME gencnval - compile the converters aliases file SYNOPSIS gencnval [ -h, -?, --help ] [ -v, --verbose ] [ -c, --copyright ] [ -s, --sourcedir source ] [ -d, --destdir destination ] [ converterfile ] DESCRIPTION gencnval converts the ICU aliases file converterfile into the binary file cnvalias.icu. This binary file can then be read directly by ICU, or used by pkgdata(1) for incorporation into a larger archive or li‐ brary. If converterfile is not provided, the default ICU convrtrs.txt file is used. OPTIONS -h, -?, --help Print help about usage and exit. -v, --verbose Display verbose output. This information can include information about conflicting aliases and the converters the aliases resolve to. -c, --copyright Include a copyright notice in the binary data. -s, --sourcedir source Set the source directory to source. The default source direc‐ tory is specified by the environment variable ICU_DATA. -d, --destdir destination Set the destination directory to destination. The default des‐ tination directory is specified by the environment variable ICU_DATA. ENVIRONMENT ICU_DATA Specifies the directory containing ICU data. Defaults to /usr/share/icu/77.1/. Some tools in ICU depend on the pres‐ ence of the trailing slash. It is thus important to make sure that it is present if ICU_DATA is set. FILES icu/source/data/mappings/convrtrs.txt Description of ICU's converters and their aliases. This data file is not normally installed, and it is available as a part of ICU source code. VERSION 77.1 COPYRIGHT Copyright (C) 2000-2004 IBM, Inc. and others. SEE ALSO pkgdata(1) ICU MANPAGE 11 March 2004 GENCNVAL(1)
GENRB(1) ICU 77.1 Manual GENRB(1) NAME genrb - компилировать ресурсный пакет SYNOPSIS genrb [ -h, -?, --help ] [ -V, --version ] [ -v, --verbose ] [ -e, --encoding encoding ] [ -j, --write-java [ encoding ] ] [ -s, --sourcedir source ] [ -d, --destdir destination ] [ -i, --icudatadir directory ] bundle ... DESCRIPTION genrb преобразует исходные файлы ресурсных пакетов, переданные в ком‐ андной строке, в их бинарную форму или в файл исходного кода Java для использования с ICU4J. Результирующие бинарные файлы имеют расш‐ ирение .res, в то время как исходные файлы ресурсных пакетов об‐ ично имеют расширение .txt. Файлы исходного кода Java имеют расш‐ ирение java и следуют соглашениям именования ICU4J. Принято называть ресурсные пакеты по имени локали, то есть исполь‐ зовать идентификатор локали для имени файла пакета, например ja_JP.txt для данных японского языка (Япония) или root.txt для корневого па‐ кета. В любом случае, genrb создаст файл, базовое имя которого будет именем локали, найденной в файле ресурса, а не базовым именем самого файла ресурса. Бинарные файлы могут быть прочитаны напрямую ICU или использованы с pkgdata(1) для включения в больший архив или библиотеку. OPTIONS -h, -?, --help Вывести справку по использованию и выйти. -V, --version Вывести версию genrb и выйти. -v, --verbose Выводить дополнительные информационные сообщения во время вып‐ олнения. -e, --encoding encoding Установить кодировку для чтения входных файлов как encoding. По умолчанию используется инвариантная (подмножество ASCII или EBCDIC) кодовая страница системы (см. раздел INVARIANT CHARAC‐ TERS). Кодировки UTF-8, UTF-16BE и UTF-16LE определяются авто‐ матически, если присутствует метка порядка байтов (BOM). -j, --write-java [ encoding ] Сгенерировать исходный код Java для использования с ICU4J. Мо‐ жно указать необязательную кодировку для файла Java. -s, --sourcedir source Установить каталог исходных файлов как source. Каталог по умолчанию указывается в переменной среды ICU_DATA или в расположении, установленном при сборке ICU, если ICU_DATA не ука‐ зана. -d, --destdir destination Установить каталог назначения как destination. Каталог по умолчанию указывается в переменной среды ICU_DATA или в расположении, установленном при сборке ICU, если ICU_DATA не ука‐ зана. -i, --icudatadir directory Искать необходимые файлы данных ICU в каталоге directory. Например, при обработке переопределений сортировки файл ucadata.dat должен быть расположен. Каталог данных ICU по умолчанию ука‐ зывается в переменной среды ICU_DATA. INVARIANT CHARACTERS Инвариантный набор символов включает следующий набор символов, выраженный как стандартное POSIX-выражение: [a-z]|[A-Z]|[0-9]|_| |+|-|*|/. Это набор, который гарантированно доступен независимо от кодовой ст‐ раницы. ENVIRONMENT ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию это /usr/share/icu/77.1/. Некоторые инструменты в ICU зависят от наличия завершающего слеша. Поэтому важно убедиться, что он присутствует, если ICU_DATA установлена. VERSION 77.1 COPYRIGHT Copyright (C) 2000-2002 IBM, Inc. и другие. SEE ALSO derb(1) pkgdata(1) ICU MANPAGE 16 апреля 2002 GENRB(1)
GENRB(1) ICU 77.1 Manual GENRB(1) NAME genrb - compile a resource bundle SYNOPSIS genrb [ -h, -?, --help ] [ -V, --version ] [ -v, --verbose ] [ -e, --encoding encoding ] [ -j, --write-java [ encoding ] ] [ -s, --sourcedir source ] [ -d, --destdir destination ] [ -i, --icudatadir directory ] bundle ... DESCRIPTION genrb converts the resource bundle source files passed on the command line to their binary form or to a Java source file for use with ICU4J. The resulting binary files have a .res extension while resource bundle source files typically have a .txt extension. Java source files have a java extension and follow the ICU4J naming conventions. It is customary to name the resource bundles by their locale name, i.e. to use a local identifier for the bundle filename, e.g. ja_JP.txt for Japanese (Japan) data, or root.txt for the root bundle. In any case, genrb will produce a file whose base name is the name of the locale found in the resource file, not the base name of the resource file it‐ self. The binary files can be read directly by ICU, or used by pkgdata(1) for incorporation into a larger archive or library. OPTIONS -h, -?, --help Print help about usage and exit. -V, --version Print the version of genrb and exit. -v, --verbose Display extra informative messages during execution. -e, --encoding encoding Set the encoding used to read input files to encoding. The de‐ fault encoding is the invariant (subset of ASCII or EBCDIC) codepage for the system (see section INVARIANT CHARACTERS). The encodings UTF-8, UTF-16BE, and UTF-16LE are automatically de‐ tected if a byte order mark (BOM) is present. -j, --write-java [ encoding ] Generate a Java source code for use with ICU4J. An optional en‐ coding for the Java file can be given. -s, --sourcedir source Set the source directory to source. The default source direc‐ tory is specified by the environment variable ICU_DATA, or the location set when ICU was built if ICU_DATA is not set. -d, --destdir destination Set the destination directory to destination. The default des‐ tination directory is specified by the environment variable ICU_DATA or is the location set when ICU was built if ICU_DATA is not set. -i, --icudatadir directory Look for any necessary ICU data files in directory. For exam‐ ple, when processing collation overrides, the file ucadata.dat must be located. The default ICU data directory is specified by the environment variable ICU_DATA. INVARIANT CHARACTERS The invariant character set consists of the following set of charac‐ ters, expressed as a standard POSIX regular expression: [a-z]|[A- Z]|[0-9]|_| |+|-|*|/. This is the set which is guaranteed to be avail‐ able regardless of code page. ENVIRONMENT ICU_DATA Specifies the directory containing ICU data. Defaults to /usr/share/icu/77.1/. Some tools in ICU depend on the pres‐ ence of the trailing slash. It is thus important to make sure that it is present if ICU_DATA is set. VERSION 77.1 COPYRIGHT Copyright (C) 2000-2002 IBM, Inc. and others. SEE ALSO derb(1) pkgdata(1) ICU MANPAGE 16 April 2002 GENRB(1)
MAKECONV(1) ICU 77.1 Manual MAKECONV(1) НАЗВАНИЕ icuexportdata - Записывает текстовые файлы с данными свойств Unicode из ICU. ICU РУКОВОДСТВО 12 июня 2021 MAKECONV(1)
MAKECONV(1) ICU 77.1 Manual MAKECONV(1) NAME icuexportdata - Writes text files with Unicode properties data from ICU. ICU MANPAGE 12 June 2021 MAKECONV(1)
DERB(1) ICU 77.1 Manual DERB(1) NAME derb - разбирает resource bundle SYNOPSIS derb [ -h, -?, --help ] [ -V, --version ] [ -v, --verbose ] [ -e, --en‐ coding encoding ] [ --bom ] [ -t, --truncate [ size ] ] [ -s, --sourcedir source ] [ -d, --destdir destination ] [ -i, --icudatadir directory ] [ -c, --to-stdout ] bundle ... DESCRIPTION derb читает скомпилированные файлы resource bundle, переданные в коман‐ дной строке, и записывает их обратно в текстовом виде. Результирую‐ щие текстовые файлы имеют расширение .txt, в то время как исходные фай‐ лы скомпилированных resource bundle обычно имеют расширение .res. Принято называть resource bundle по имени локали, то есть использо‐ вать идентификатор локали для имени файла, например, ja_JP.res для дан‐ ных на японском языке (Япония) или root.res для корневого пакета. Это особенно важно для derb, поскольку имя локали недоступно напрямую из скомпилированного resource bundle, и для определения, какую локаль зап‐ рашивать при открытии пакета. derb создаст файл, базовое имя которого совпадает с базовым именем скомпилированного файла resource. Если опция --to-stdout, -c используется, то текст будет записан в стандартный вы‐ ход. OPTIONS -h, -?, --help Вывести справку по использованию и выйти. -V, --version Вывести версию derb и выйти. -v, --verbose Выводить дополнительные информационные сообщения во время вы‐ полнения. -A, --suppressAliases Не следовать за алиасами при формировании вывода. -e, --encoding encoding Установить кодировку, используемую для записи выходных файлов, в encoding. Кодировка по умолчанию — инвариантная (подмноже‐ ство ASCII или EBCDIC) кодовая страница системы (см. раздел IN‐ VARIANT CHARACTERS). Выбор кодировки не влияет на данные, а то‐ лько на их представление. Символы, которые нельзя предста‐ вить в кодировке, будут представлены с помощью последовательнос‐ тей \uhhhh. --bom Записать метку порядка байтов (BOM) в начале файла. -l, --locale locale Установить локаль для resource bundle, которая используется как в сгенерированном тексте, так и в качестве базового имени вы‐ ходного файла. -t, --truncate [ size ] Обрезать индивидуальные ресурсы (строки или бинарные данные) до size байт. Значение по умолчанию, если size не указано, — 80 байт. -s, --sourcedir source Установить исходный каталог в source. Исходный каталог по умол‐ чанию — текущий каталог. Если передан -, то bundle будет ис‐ кан в его расположении по умолчанию, указанном переменной ок‐ ружения ICU_DATA (или по умолчанию в месте, установленном при сборке ICU, если ICU_DATA не задана). -d, --destdir destination Установить целевой каталог в destination. Целевой каталог по умолчанию указывается переменной окружения ICU_DATA или местом, установленным при сборке ICU, если ICU_DATA не задана. -i, --icudatadir directory Искать необходимые файлы данных ICU в directory. Например, при обработке переопределений сортировки файл ucadata.dat должени быть найден. Каталог данных ICU по умолчанию указывается пе‐ ременной окружения ICU_DATA. -c, --to-stdout Записать разобранный bundle в стандартный вывод вместо файла. CAVEATS При использовании опции --bom символ U+FEFF записывается в кодировке назначения независимо от того, является ли это форматом преобразования Unicode (UTF) или нет. Эта опция должна использоваться только с UTF- кодировкой, так как метки порядка байтов не имеют смысла для других ко‐ дировок. INVARIANT CHARACTERS Множество инвариантных символов состоит из следующих символов, выражен‐ ных как стандартное регулярное выражение POSIX: [a-z]|[A-Z]|[0-9]|_| |+|-|*|/ . Это множество, которое гарантированно доступно независимо от кодовой страницы. ENVIRONMENT ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию это /usr/share/icu/77.1/. Некоторые инструменты в ICU зависят от наличия завершающего слеша. Поэтому важно убедиться, что он присутствует, если задана ICU_DATA. AUTHORS Vladimir Weinstein Yves Arrouye VERSION 1.0 COPYRIGHT Copyright (C) 2002 IBM, Inc. and others. SEE ALSO genrb(1) ICU MANPAGE 7 Mar 2014 DERB(1)
DERB(1) ICU 77.1 Manual DERB(1) NAME derb - disassemble a resource bundle SYNOPSIS derb [ -h, -?, --help ] [ -V, --version ] [ -v, --verbose ] [ -e, --en‐ coding encoding ] [ --bom ] [ -t, --truncate [ size ] ] [ -s, --sourcedir source ] [ -d, --destdir destination ] [ -i, --icudatadir directory ] [ -c, --to-stdout ] bundle ... DESCRIPTION derb reads the compiled resource bundle files passed on the command line and write them back in text form. The resulting text files have a .txt extension while compiled resource bundle source files typically have a .res extension. It is customary to name the resource bundles by their locale name, i.e. to use a local identifier for the bundle filename, e.g. ja_JP.res for Japanese (Japan) data, or root.res for the root bundle. This is espe‐ cially important for derb since the locale name is not accessible di‐ rectly from the compiled resource bundle, and to know which locale to ask for when opening the bundle. derb will produce a file whose base name is the base name of the compiled resource file itself. If the --to-stdout, -c option is used, however, the text will be written on the standard output. OPTIONS -h, -?, --help Print help about usage and exit. -V, --version Print the version of derb and exit. -v, --verbose Display extra informative messages during execution. -A, --suppressAliases Don't follow aliases when producing output. -e, --encoding encoding Set the encoding used to write output files to encoding. The default encoding is the invariant (subset of ASCII or EBCDIC) codepage for the system (see section INVARIANT CHARACTERS). The choice of the encoding does not affect the data, just their rep‐ resentation. Characters that cannot be represented in the encod‐ ing will be represented using \uhhhh escape sequences. --bom Write a byte order mark (BOM) at the beginning of the file. -l, --locale locale Set the locale for the resource bundle, which is used both in the generated text and as the base name of the output file. -t, --truncate [ size ] Truncate individual resources (strings or binary data) to size bytes. The default if size is not specified is 80 bytes. -s, --sourcedir source Set the source directory to source. The default source direc‐ tory is the current directory. If - is passed for source, then the bundle will be looked for in its default location, specified by the ICU_DATA environment variable (or defaulting to the loca‐ tion set when ICU was built if ICU_DATA is not set). -d, --destdir destination Set the destination directory to destination. The default des‐ tination directory is specified by the environment variable ICU_DATA or is the location set when ICU was built if ICU_DATA is not set. -i, --icudatadir directory Look for any necessary ICU data files in directory. For exam‐ ple, when processing collation overrides, the file ucadata.dat must be located. The default ICU data directory is specified by the environment variable ICU_DATA. -c, --to-stdout Write the disassembled bundle on standard output instead of into a file. CAVEATS When the option --bom is used, the character U+FEFF is written in the destination encoding regardless of whether it is a Unicode transforma‐ tion format (UTF) or not. This option should only be used with an UTF encoding, as byte order marks are not meaningful for other encodings. INVARIANT CHARACTERS The invariant character set consists of the following set of charac‐ ters, expressed as a standard POSIX regular expression: [a-z]|[A- Z]|[0-9]|_| |+|-|*|/. This is the set which is guaranteed to be avail‐ able regardless of code page. ENVIRONMENT ICU_DATA Specifies the directory containing ICU data. Defaults to /usr/share/icu/77.1/. Some tools in ICU depend on the pres‐ ence of the trailing slash. It is thus important to make sure that it is present if ICU_DATA is set. AUTHORS Vladimir Weinstein Yves Arrouye VERSION 1.0 COPYRIGHT Copyright (C) 2002 IBM, Inc. and others. SEE ALSO genrb(1) ICU MANPAGE 7 Mar 2014 DERB(1)
MAKECONV(1) Руководство ICU 77.1 MAKECONV(1) NAME makeconv - скомпилировать таблицу конвертера SYNOPSIS makeconv [ -h, -?, --help ] [ -c, --copyright ] [ -v, --verbose ] [ -d, --destdir destination ] convertertable ... DESCRIPTION makeconv преобразует таблицу конвертера ICU convertertable в двоичный файл. Бинарный файл имеет то же базовое имя, что и convertertable, но с расширением .cnv (вместо типичного расширения .ucm файла convertertable). Этот бинарный файл затем может быть прочитан напрямую ICU или использован pkgdata(1) для включения в больший архив или библиотеку. Таблица convertertable должна быть в формате ICU ucm (Unicode Codepage Mapping), чтобы быть понятой makeconv. Формат ICU ucm похож на файлы IBM NLTC upmap/tpmap/rpmap. Комментарии в convertertable обрабатываются следующим образом. Если комментарий (начинающийся с символа '#'), который следует за каким-то текстом, содержит индикатор отката '|', то только текст, начинающийся с символа '#', и заканчивающийся перед символом '|', игнорируется. В противном случае, или если комментарий является первым на строке, комментарий продолжается до конца строки. Эта специальная обработка комментариев предназначена для учета практики размещения информации об откате в комментариях в строгом формате IBM NLTC ucmap. Обратите внимание, что новые конвертеры будут автоматически найдены ICU после их установки в каталог данных ICU. Им не нужно перечислять в convrtrs.txt(5) файл псевдонимов конвертеров, чтобы быть доступными приложениям, использующим ICU. Им нужно перечислять там, если кто-то хочет дать им псевдонимы или теги. OPTIONS -h, -?, --help Вывести справку по использованию и выйти. -c, --copyright Включить уведомление об авторском праве в бинарные данные. -v, --verbose Отобразить дополнительные информационные сообщения во время выполнения. -d, --destdir destination Установить каталог назначения в destination. Каталог назначения по умолчанию указывается переменной окружения ICU_DATA. CAVEATS Если существующая таблица конвертера изменена и перекомпилирована с помощью makeconv, результирующий бинарный файл должен быть упакован так же, как он был упакован изначально. Например, если конвертеры были сгруппированы вместе в архиве или библиотеке с pkgdata(1), то архив или библиотека должны быть перестроены с новым бинарным файлом. Самостоятельный бинарный файл конвертера не будет иметь приоритета над упакованным. ENVIRONMENT ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию /usr/share/icu/77.1/. Некоторые инструлы в ICU зависят от наличия конечного слеша. Поэтому важно убедиться, что он присутствует, если ICU_DATA установлена. VERSION 77.1 COPYRIGHT Copyright (C) 2000 IBM, Inc. and others. SEE ALSO convrtrs.txt(5) pkgdata(1) РУКОВОДСТВО ICU 16 апреля 2002 MAKECONV(1)
MAKECONV(1) ICU 77.1 Manual MAKECONV(1) NAME makeconv - compile a converter table SYNOPSIS makeconv [ -h, -?, --help ] [ -c, --copyright ] [ -v, --verbose ] [ -d, --destdir destination ] convertertable ... DESCRIPTION makeconv converts the ICU converter table convertertable into a binary file. The binary file has the same base name as convertertable but has a .cnv extension (instead of the typical .ucm extension of the convert‐ ertable file). This binary file can then be read directly by ICU, or used by pkgdata(1) for incorporation into a larger archive or library. The convertertable must be in the ICU ucm (Unicode Codepage Mapping) format in order to be understood by makeconv. The ICU ucm format is similar to the IBM NLTC upmap/tpmap/rpmap files. Comments in the con‐ vertertable are handled as follows. If a comment (starting with a `#' sign) that is after some text does contain the fallback indicator `|' then only the text starting with the `#' sign, and ending before the `|' sign, is ignored. Otherwise, or if the comment is the first thing on the line, the comment runs up to the end of the line. This special handling of comments is to accommodate the practice of putting fallback information in comments in the strict IBM NLTC ucmap format. Note that new converters will be automatically found by ICU after their installation in ICU's data directory. They do not need to be listed in the convrtrs.txt(5) converters aliases file in order to be available to applications using ICU. They do need to be listed there if one wants to give them aliases, or tags, though. OPTIONS -h, -?, --help Print help about usage and exit. -c, --copyright Include a copyright notice in the binary data. -v, --verbose Display extra informative messages during execution. -d, --destdir destination Set the destination directory to destination. The default des‐ tination directory is specified by the environment variable ICU_DATA. CAVEATS If an existing converter table is changed and recompiled using make‐ conv, the resulting binary file must be packaged in the same way that it was packaged initially. For example, if converters were grouped to‐ gether in an archive or a library with pkgdata(1), then the archive or library must be rebuilt with the new binary file. A standalone binary converter file will not take precedence over a packaged one. ENVIRONMENT ICU_DATA Specifies the directory containing ICU data. Defaults to /usr/share/icu/77.1/. Some tools in ICU depend on the pres‐ ence of the trailing slash. It is thus important to make sure that it is present if ICU_DATA is set. VERSION 77.1 COPYRIGHT Copyright (C) 2000 IBM, Inc. and others. SEE ALSO convrtrs.txt(5) pkgdata(1) ICU MANPAGE 16 April 2002 MAKECONV(1)
UCONV(1) ICU 77.1 Manual UCONV(1) NAME uconv - преобразовать данные из одного encoding в другое SYNOPSIS uconv [ -h, -?, --help ] [ -V, --version ] [ -s, --silent ] [ -v, --verbose ] [ -l, --list | -l, --list-code code | --default-code | -L, --list-transliterators ] [ --canon ] [ -x transliteration ] [ --to-callback callback | -c ] [ --from-callback callback | -i ] [ --callback callback ] [ --fallback | --no-fallback ] [ -b, --block-size size ] [ -f, --from-code encoding ] [ -t, --to-code encoding ] [ --add-signature ] [ --remove-signature ] [ -o, --output file ] [ file... ] DESCRIPTION uconv преобразует, или транскодирует, каждый указанный файл (или стандартный ввод, если файл не указан) из одного encoding в другое. Транскодирование выполняется с использованием Unicode в качестве промежуточного encoding (т.е. данные сначала транскодируются из исходного encoding в Unicode, а затем из Unicode в целевое encoding). Если encoding не указано или указано как -, используется encoding по умолчанию. Таким образом, вызов uconv без указания encoding предоставляет простой способ проверки и очистки файлов данных для дальнейшего использования инструментами, требующими данных в encoding по умолчанию. При вызове uconv можно указать callbacks, которые используются для обработки недопустимых символов во входных данных или символов, которые нельзя транскодировать в целевое encoding. Некоторые encoding, например, предлагают символ замены по умолчанию, который может быть использован для представления таких символов во входных данных. Другие callbacks предоставляют полезное визуальное представление недопустимых данных. uconv также может выполнять указанную transliteration на транскодированных данных, в этом случае transliteration происходит как промежуточный шаг после транскодирования данных в Unicode. Transliteration может быть либо списком имен transliterator'ов, разделенных точкой с запятой, либо произвольным сложным набором правил в формате правил transliteration ICU. Для целей транскодирования опции uconv совместимы с опциями iconv(1), что облегчает его замену в скриптах. Однако имена encoding, используемые uconv и ICU, не обязательно совпадают с теми, что используются iconv(1). Кроме того, опции, предоставляющие информационные данные, такие как -l, --list, предлагаемые некоторыми вариантами iconv(1), такими как GNU's, выдают данные в слегка отличающемся и более простом для разбора формате. OPTIONS -h, -?, --help Вывести справку по использованию и выйти. -V, --version Вывести версию uconv и выйти. -s, --silent Подавить сообщения во время выполнения. -v, --verbose Выводить дополнительные информационные сообщения во время выполнения. -l, --list Вывести список всех доступных encoding и выйти. -l, --list-code code Вывести только encoding code и выйти. Если code не является правильным encoding, выйти с ошибкой. --default-code Вывести только имя encoding по умолчанию и выйти. -L, --list-transliterators Вывести список всех доступных transliterator'ов и выйти. --canon Если используется с -l, --list или --default-code, список encoding выводится в формате, совместимом с convrtrs.txt(5). Если используется с -L, --list-transliterators, выводить только одно имя transliterator на строку. -x transliteration Выполнить указанную transliteration на транскодированных Unicode-данных и использовать transliterated данные как вход для транскодирования в целевое encoding. --to-callback callback Использовать callback для обработки символов, которые нельзя транскодировать в целевое encoding. См. раздел CALLBACKS для деталей о допустимых callbacks. -c Исключить недопустимые символы из вывода. То же, что и --to-callback skip. --from-callback callback Использовать callback для обработки символов, которые нельзя транскодировать из исходного encoding. См. раздел CALLBACKS для деталей о допустимых callbacks. -i Игнорировать недопустимые последовательности во входных данных. То же, что и --from-callback skip. --callback callback Использовать callback для обработки символов, которые нельзя транскодировать из исходного encoding и символов, которые нельзя транскодировать в целевое encoding. См. раздел CALLBACKS для деталей о допустимых callbacks. --fallback Использовать fallback mapping при транскодировании из Unicode в целевое encoding. --no-fallback Не использовать fallback mapping при транскодировании из Unicode в целевое encoding. Это значение по умолчанию. -b, --block-size size Чтение входных данных блоками по size байт за раз. Значение block-size по умолчанию — 4096. -f, --from-code encoding Установить исходное encoding данных как encoding. -t, --to-code encoding Транскодировать данные в encoding. --add-signature Добавить символ сигнатуры Unicode U+FEFF (BOM), если output charset поддерживает его и не добавляет автоматически. --remove-signature Удалить символ сигнатуры Unicode U+FEFF (BOM). -o, --output file Записать транскодированные данные в file. CALLBACKS uconv поддерживает указание callbacks для обработки недопустимых данных. Callbacks можно установить для обоих направлений транскодирования: из исходного encoding в Unicode с опцией --from-callback и из Unicode в целевое encoding с опцией --to-callback. Ниже приведен список допустимых имен callbacks с описанием их поведения. Список callbacks, фактически поддерживаемых uconv, отображается при вызове с -h, --help. substitute Записать последовательность замены encoding или символ замены Unicode U+FFFD при транскодировании в Unicode. skip Игнорировать недопустимые данные. stop Остановить выполнение с ошибкой при обнаружении недопустимых данных. Это callback по умолчанию. escape То же, что и escape-icu. escape-icu Заменить отсутствующие символы на строку формата %Uhhhh для символов плоскости 0 и %Uhhhh%Uhhhh для символов плоскостей 1 и выше, где hhhh — шестнадцатеричное значение одного из кодовых единиц UTF-16, представляющих символ. Символы из плоскостей 1 и выше записываются как пара кодовых единиц UTF-16 суррогатов. escape-java Заменить отсутствующие символы на строку формата \uhhhh для символов плоскости 0 и \uhhhh\uhhhh для символов плоскостей 1 и выше, где hhhh — шестнадцатеричное значение одного из кодовых единиц UTF-16, представляющих символ. Символы из плоскостей 1 и выше записываются как пара кодовых единиц UTF-16 суррогатов. escape-c Заменить отсутствующие символы на строку формата \uhhhh для символов плоскости 0 и \Uhhhhhhhh для символов плоскостей 1 и выше, где hhhh и hhhhhhhh — шестнадцатеричные значения кодовой точки Unicode. escape-xml См. escape-xml-hex. escape-xml-hex Заменить отсутствующие символы на строку формата &#xhhhh;, где hhhh — шестнадцатеричное значение кодовой точки Unicode. escape-xml-dec Заменить отсутствующие символы на строку формата &#nnnn;, где nnnn — десятичное значение кодовой точки Unicode. escape-unicode Заменить отсутствующие символы на строку формата {U+hhhh}, где hhhh — шестнадцатеричное значение кодовой точки Unicode. Эта шестнадцатеричная строка имеет переменную длину и может использовать от 4 до 6 цифр. Это формат, универсально используемый для обозначения кодовой точки Unicode в литературе, ограниченный фигурными скобками для легкого распознавания этих замен в выводе. EXAMPLES Преобразовать данные из указанного encoding в encoding платформы: $ uconv -f encoding Проверить, содержит ли файл допустимые данные для указанного encoding: $ uconv -f encoding -c file >/dev/null Преобразовать файл в UTF-8 в указанное encoding и убедиться, что результирующий текст подходит для любой версии HTML: $ uconv -f utf-8 -t encoding \ --callback escape-xml-dec file Вывести имена кодовых точек Unicode в файле UTF: $ uconv -f utf-8 -x any-name file Вывести имя кодовой точки Unicode, значение которой известно (U+30AB в этом примере): $ echo '\u30ab' | uconv -x 'hex-any; any-name'; echo {KATAKANA LETTER KA}{LINE FEED} $ (Имена ограничены фигурными скобками. Также выводится имя разделителя строк.) Нормализовать данные в UTF-8 с использованием Unicode NFKC, удалить все управляющие символы и преобразовать Katakana в Hiragana: $ uconv -f utf-8 -t utf-8 \ -x '::nfkc; [:Cc:] >; ::katakana-hiragana;' CAVEATS AND BUGS uconv сообщает об ошибках как о происходящих на первом недопустимом байте. Это может запутать пользователей GNU iconv(1), который сообщает об ошибках как о происходящих на первом байте недопустимой последовательности. Для multi-byte character sets или encoding это означает, что позиции ошибок в uconv могут быть на более позднем смещении в потоке входных данных, чем в случае с GNU iconv(1). Сообщение о позициях ошибок при использовании transliterator может быть неточным или недоступным, в этом случае uconv сообщит смещение в потоке вывода, где произошла ошибка. AUTHORS Jonas Utterstroem Yves Arrouye VERSION 77.1 COPYRIGHT Copyright (C) 2000-2005 IBM, Inc. and others. SEE ALSO iconv(1) ICU MANPAGE 2005-jul-1 UCONV(1)
UCONV(1) ICU 77.1 Manual UCONV(1) NAME uconv - convert data from one encoding to another SYNOPSIS uconv [ -h, -?, --help ] [ -V, --version ] [ -s, --silent ] [ -v, --verbose ] [ -l, --list | -l, --list-code code | --default-code | -L, --list-transliterators ] [ --canon ] [ -x transliteration ] [ --to-callback callback | -c ] [ --from-callback callback | -i ] [ --callback callback ] [ --fallback | --no-fallback ] [ -b, --block-size size ] [ -f, --from-code encoding ] [ -t, --to-code encoding ] [ --add-signature ] [ --remove-signature ] [ -o, --output file ] [ file... ] DESCRIPTION uconv converts, or transcodes, each given file (or its standard input if no file is specified) from one encoding to another. The transcoding is done using Unicode as a pivot encoding (i.e. the data are first transcoded from their original encoding to Unicode, and then from Uni‐ code to the destination encoding). If an encoding is not specified or is -, the default encoding is used. Thus, calling uconv with no encoding provides an easy way to validate and sanitize data files for further consumption by tools requiring data in the default encoding. When calling uconv, it is possible to specify callbacks that are used to handle invalid characters in the input, or characters that cannot be transcoded to the destination encoding. Some encodings, for example, offer a default substitution character that can be used to represent the occurrence of such characters in the input. Other callbacks offer a useful visual representation of the invalid data. uconv can also run the specified transliteration on the transcoded data, in which case transliteration will happen as an intermediate step, after the data have been transcoded to Unicode. The translitera‐ tion can be either a list of semicolon-separated transliterator names, or an arbitrarily complex set of rules in the ICU transliteration rules format. For transcoding purposes, uconv options are compatible with those of iconv(1), making it easy to replace it in scripts. It is not necessar‐ ily the case, however, that the encoding names used by uconv and ICU are the same as the ones used by iconv(1). Also, options that provide informational data, such as the -l, --list one offered by some iconv(1) variants such as GNU's, produce data in a slightly different and easier to parse format. OPTIONS -h, -?, --help Print help about usage and exit. -V, --version Print the version of uconv and exit. -s, --silent Suppress messages during execution. -v, --verbose Display extra informative messages during execution. -l, --list List all the available encodings and exit. -l, --list-code code List only the code encoding and exit. If code is not a proper encoding, exit with an error. --default-code List only the name of the default encoding and exit. -L, --list-transliterators List all the available transliterators and exit. --canon If used with -l, --list or --default-code, the list of encodings is produced in a format compatible with convrtrs.txt(5). If used with -L, --list-transliterators, print only one transliter‐ ator name per line. -x transliteration Run the given transliteration on the transcoded Unicode data, and use the transliterated data as input for the transcoding to the destination encoding. --to-callback callback Use callback to handle characters that cannot be transcoded to the destination encoding. See section CALLBACKS for details on valid callbacks. -c Omit invalid characters from the output. Same as --to-callback skip. --from-callback callback Use callback to handle characters that cannot be transcoded from the original encoding. See section CALLBACKS for details on valid callbacks. -i Ignore invalid sequences in the input. Same as --from-callback skip. --callback callback Use callback to handle both characters that cannot be transcoded from the original encoding and characters that cannot be transcoded to the destination encoding. See section CALLBACKS for details on valid callbacks. --fallback Use the fallback mapping when transcoding from Unicode to the destination encoding. --no-fallback Do not use the fallback mapping when transcoding from Unicode to the destination encoding. This is the default. -b, --block-size size Read input in blocks of size bytes at a time. The default block size is 4096. -f, --from-code encoding Set the original encoding of the data to encoding. -t, --to-code encoding Transcode the data to encoding. --add-signature Add a U+FEFF Unicode signature character (BOM) if the output charset supports it and does not add one anyway. --remove-signature Remove a U+FEFF Unicode signature character (BOM). -o, --output file Write the transcoded data to file. CALLBACKS uconv supports specifying callbacks to handle invalid data. Callbacks can be set for both directions of transcoding: from the original encod‐ ing to Unicode, with the --from-callback option, and from Unicode to the destination encoding, with the --to-callback option. The following is a list of valid callback names, along with a descrip‐ tion of their behavior. The list of callbacks actually supported by uconv is displayed when it is called with -h, --help. substitute Write the encoding's substitute sequence, or the Uni‐ code replacement character U+FFFD when transcoding to Unicode. skip Ignore the invalid data. stop Stop with an error when encountering invalid data. This is the default callback. escape Same as escape-icu. escape-icu Replace the missing characters with a string of the format %Uhhhh for plane 0 characters, and %Uhhhh%Uhhhh for planes 1 and above characters, where hhhh is the hexadecimal value of one of the UTF-16 code units rep‐ resenting the character. Characters from planes 1 and above are written as a pair of UTF-16 surrogate code units. escape-java Replace the missing characters with a string of the format \uhhhh for plane 0 characters, and \uhhhh\uhhhh for planes 1 and above characters, where hhhh is the hexadecimal value of one of the UTF-16 code units rep‐ resenting the character. Characters from planes 1 and above are written as a pair of UTF-16 surrogate code units. escape-c Replace the missing characters with a string of the format \uhhhh for plane 0 characters, and \Uhhhhhhhh for planes 1 and above characters, where hhhh and hhh‐ hhhhh are the hexadecimal values of the Unicode code‐ point. escape-xml Same as escape-xml-hex. escape-xml-hex Replace the missing characters with a string of the format &#xhhhh;, where hhhh is the hexadecimal value of the Unicode codepoint. escape-xml-dec Replace the missing characters with a string of the format &#nnnn;, where nnnn is the decimal value of the Unicode codepoint. escape-unicode Replace the missing characters with a string of the format {U+hhhh}, where hhhh is the hexadecimal value of the Unicode codepoint. That hexadecimal string is of variable length and can use from 4 to 6 digits. This is the format universally used to denote a Uni‐ code codepoint in the literature, delimited by curly braces for easy recognition of those substitutions in the output. EXAMPLES Convert data from a given encoding to the platform encoding: $ uconv -f encoding Check if a file contains valid data for a given encoding: $ uconv -f encoding -c file >/dev/null Convert a UTF-8 file to a given encoding and ensure that the resulting text is good for any version of HTML: $ uconv -f utf-8 -t encoding \ --callback escape-xml-dec file Display the names of the Unicode code points in a UTF-file: $ uconv -f utf-8 -x any-name file Print the name of a Unicode code point whose value is known (U+30AB in this example): $ echo '\u30ab' | uconv -x 'hex-any; any-name'; echo {KATAKANA LETTER KA}{LINE FEED} $ (The names are delimited by curly braces. Also, the name of the line terminator is also displayed.) Normalize UTF-8 data using Unicode NFKC, remove all control characters, and map Katakana to Hiragana: $ uconv -f utf-8 -t utf-8 \ -x '::nfkc; [:Cc:] >; ::katakana-hiragana;' CAVEATS AND BUGS uconv does report errors as occurring at the first invalid byte encoun‐ tered. This may be confusing to users of GNU iconv(1), which reports errors as occurring at the first byte of an invalid sequence. For multi-byte character sets or encodings, this means that uconv error po‐ sitions may be at a later offset in the input stream than would be the case with GNU iconv(1). The reporting of error positions when a transliterator is used may be inaccurate or unavailable, in which case uconv will report the offset in the output stream at which the error occurred. AUTHORS Jonas Utterstroem Yves Arrouye VERSION 77.1 COPYRIGHT Copyright (C) 2000-2005 IBM, Inc. and others. SEE ALSO iconv(1) ICU MANPAGE 2005-jul-1 UCONV(1)
GENDICT(1) Руководство ICU 77.1 GENDICT(1) НАЗВАНИЕ gendict - Компилирует список слов в словарь ICU string trie СИНОПСИС gendict [ --uchars | --bytes --transform transform ] [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -i, --icud‐ atadir directory ] input-file output-file ОПИСАНИЕ gendict читает список слов из файла input-file и создаёт файл словаря string trie. Обычно этот файл данных имеет расширение .dict. Слова начинаются с начала строки и заканчиваются первым пробельным символом. Строки, начинающиеся с пробельного символа, игнорируются. ОПЦИИ -h, -?, --help Выводит справку по использованию и выходит. -V, --version Выводит версию gendict и выходит. -c, --copyright Встраивает стандартный текст авторских прав ICU в output-file. -v, --verbose Выводит дополнительные информационные сообщения во время выполнения. -i, --icudatadir directory Ищет необходимые файлы данных ICU в указанном каталоге. Например, файл pnames.icu должен быть доступен, если данные ICU не собраны в виде общей библиотеки. Каталог данных ICU по умолчанию задаётся переменной окружения ICU_DATA. Большинство конфигураций ICU не требуют этой опции. --uchars Устанавливает тип выходного трие на UChar. Взаимоисключаемо с --bytes. --bytes Устанавливает тип выходного трие на Bytes. Взаимоисключаемо с --uchars. --transform Устанавливает тип преобразования. Должно указываться только с --bytes. Поддерживаемые преобразования: offset-<шестнадцатеричное-число>, которое задаёт смещение для вычитания из всех входных символов. Обратите внимание, что преобразование offset также отображает U+200D в 0xFF и U+200C в 0xFE для обеспечения совместимости с языками, требующими эти символы. Преобразование должно быть указано для трие bytes, и при применении к неценовым символам в input-file оно должно производить вывод в диапазоне от 0x00 до 0xFF. input-file Исходный файл для чтения. output-file Файл, в который будет записан выходной словарь. ПРЕДУПРЕЖДЕНИЯ Предполагается, что input-file закодирован в UTF-8. Целые числа в input-file, используемые в качестве значений, должны состоять из цифр ASCII. Они могут быть указаны либо в шестнадцатеричном формате с префиксом 0x, либо в десятичном. Должна быть указана либо опция --bytes, либо --uchars. ОКРУЖЕНИЕ ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию /usr/share/icu/77.1/. Некоторые инструменты ICU зависят от наличия завершающего слеша. Поэтому важно убедиться, что он присутствует, если задана ICU_DATA. АВТОРЫ Maxime Serrano ВЕРСИЯ 1.0 АВТОРСКИЕ ПРАВА Copyright (C) 2012 International Business Machines Corporation and others СМ. ТАКЖЕ http://www.icu-project.org/userguide/boundaryAnalysis.html РУКОВОДСТВО ICU 1 июня 2012 GENDICT(1)
GENDICT(1) ICU 77.1 Manual GENDICT(1) NAME gendict - Compiles word list into ICU string trie dictionary SYNOPSIS gendict [ --uchars | --bytes --transform transform ] [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -i, --icud‐ atadir directory ] input-file output-file DESCRIPTION gendict reads the word list from dictionary-file and creates a string trie dictionary file. Normally this data file has the .dict extension. Words begin at the beginning of a line and are terminated by the first whitespace. Lines that begin with whitespace are ignored. OPTIONS -h, -?, --help Print help about usage and exit. -V, --version Print the version of gendict and exit. -c, --copyright Embeds the standard ICU copyright into the output-file. -v, --verbose Display extra informative messages during execution. -i, --icudatadir directory Look for any necessary ICU data files in directory. For exam‐ ple, the file pnames.icu must be located when ICU's data is not built as a shared library. The default ICU data directory is specified by the environment variable ICU_DATA. Most configura‐ tions of ICU do not require this argument. --uchars Set the output trie type to UChar. Mutually exclusive with --bytes. --bytes Set the output trie type to Bytes. Mutually exclusive with --uchars. --transform Set the transform type. Should only be specified with --bytes. Currently supported transforms are: offset-<hex-number>, which specifies an offset to subtract from all input characters. It should be noted that the offset transform also maps U+200D to 0xFF and U+200C to 0xFE, in order to offer compatibility to lan‐ guages that require these characters. A transform must be spec‐ ified for a bytes trie, and when applied to the non-value char‐ acters in the input-file must produce output between 0x00 and 0xFF. input-file The source file to read. output-file The file to write the output dictionary to. CAVEATS The input-file is assumed to be encoded in UTF-8. The integers in the input-file that are used as values must be made up of ASCII digits. They may be specified either in hex, by using a 0x prefix, or in deci‐ mal. Either --bytes or --uchars must be specified. ENVIRONMENT ICU_DATA Specifies the directory containing ICU data. Defaults to /usr/share/icu/77.1/. Some tools in ICU depend on the pres‐ ence of the trailing slash. It is thus important to make sure that it is present if ICU_DATA is set. AUTHORS Maxime Serrano VERSION 1.0 COPYRIGHT Copyright (C) 2012 International Business Machines Corporation and oth‐ ers SEE ALSO http://www.icu-project.org/userguide/boundaryAnalysis.html ICU MANPAGE 1 June 2012 GENDICT(1)
ICU-CONFIG(1) ICU 77.1 Manual ICU-CONFIG(1) NAME icu-config - вывод опций сборки ICU SYNOPSIS icu-config [ --bindir ] [ --cc ] [ --cflags ] [ --cppflags ] [ --cppflags-searchpath ] [ --cxx ] [ --cxxflags ] [ --detect-prefix ] [ --exec-prefix ] [ --exists ] [ --help, -?, --usage ] [ --icudata ] [ --icudata-install-dir ] [ --icudata-mode ] [ --icudatadir ] [ --invoke ] [ --invoke=prog ] [ --ldflags ] [ --ldflags-libsonly ] [ --ld‐ flags-searchpath ] [ --ldflags-system ] [ --ldflags-icuio ] [ --mandir ] [ --prefix ] [ --prefix=prefix ] [ --sbindir ] [ --shared-datadir ] [ --sysconfdir ] [ --unicode-version ] [ --version ] [ --incfile ] DESCRIPTION icu-config упрощает задачу сборки и связывания с ICU по сравнению с ручной конфигурацией пользовательских makefile или эквивалентных. Поскольку icu-config является исполняемым скриптом, он также решает проблему локализации библиотек и заголовков ICU, позволяя системе PATH найти его. EXAMPLES icu-config можно использовать без makefile. Команда ниже достаточна для сборки одноблочного C++-программы с ICU. (Например, icu/source/samples/props/props.cpp) `icu-config --cxx --cxxflags --cppflags --ldflags` -o props props.cpp Чаще icu-config вызывается из makefile и используется для установки переменных. В следующем примере также строится пример props. CC=$(shell icu-config --cc) CXX=$(shell icu-config --cxx) CPPFLAGS=$(shell icu-config --cppflags) CXXFLAGS=$(shell icu-config --cxxflags) LDFLAGS =$(shell icu-config --ldflags) all: props props.o: props.cpp make(1) автоматически использует указанные выше переменные. OPTIONS --bindir Выводит путь к каталогу с двоичными (исполняемыми) файлами. Обычно эквивалентно 'bin'. Приложения и скрипты ICU, предназначенные для пользователей, находятся здесь. --cc Выводит используемый C-компилятор. Эквивалентно переменной $(CC) в Makefile. --cflags Выводит флаги C-компилятора. Эквивалентно переменной $(CFLAGS) в Makefile. Не включает директивы препроцессора, такие как пути include или определённые символы. Примеры: флаги отладки (-g) и оптимизации. --cppflags Выводит флаги препроцессора C. Эквивалентно переменной $(CPPFLAGS) в Makefile. Примеры: -I пути include и -D директивы определения. --cppflags-searchpath Выводит флаги препроцессора C, как выше, но только -I пути поиска. --cxx Выводит C++-компилятор. Эквивалентно переменной $(CXX) в Makefile. --cxxflags Выводит флаги C++-компилятора. Эквивалентно переменной $(CXXFLAGS) в Makefile. --detect-prefix Если ICU был перемещён из места установки, добавление этого флага к другим вызовам icu-config попытается локализовать ICU относительно места, где находится скрипт icu-config. Можно использовать как последнюю попытку, если установка ICU повреждена. --exec-prefix Выводит префикс, используемый для каталогов с исполняемыми программами (такими как bin, sbin и т.д.). Обычно совпадает с префиксом. --exists Скрипт вернёт успешный (0) статус, если ICU установлен и локализован правильно, в противном случае будет выведено сообщение об ошибке и ненулевой статус. --help, -?,--usage Выводит сообщение помощи и использования. --icudata Выводит короткое имя файла данных ICU. Это не включает суффиксы, такие как .dat, .dll, .so, .lib, .a и т.д., а также префиксы, такие как 'lib'. Может быть в форме icudt21b. --icudata-install-dir Выводит каталог, куда должны быть установлены упакованные данные ICU. Можно использовать как опцию --install в pkgdata(1). --icudata-mode Выводит режим данных ICU по умолчанию, такой как dll или common. Можно использовать как опцию --mode в pkgdata(1). --icudatadir Выводит путь к упакованным архивным данным. (Должен быть там, куда указывает $ICU_DATA или эквивалентный путь по умолчанию.) Не указывает на libdir. --invoke Если ICU не установлен в месте, где операционная система найдёт его разделяемые библиотеки, эта опция выведет команды для установки соответствующих переменных окружения для загрузки разделяемых библиотек ICU. Например, на многих системах нужно установить переменную, такую как LD_LIBRARY_PATH или эквивалентную. --invoke=prog То же, что и опция --invoke, но включает опции для вызова программы с именем prog. Если prog — имя инструмента ICU, такого как genrb(1), то icu-config также включит полный путь к этому инструменту. --ldflags Выводит любые флаги, которые должны быть переданы линковщику. Они могут включать -L для путей поиска библиотек и -l для включения библиотек ICU. По умолчанию эта опция попытается связать библиотеки "common" (libicuuc) и "i18n" (libicui18n), а также библиотеку данных. Если требуются дополнительные библиотеки, можно добавить любой из следующих двух флагов в сочетании с этим, например "--ldflags --ldflags-icuio", если требуется библиотека icuio помимо стандартных библиотек ICU. Эквивалентно переменной $(LDFLAGS) в Makefile. --ldflags-layout Выводит опцию связи для библиотеки макета ICU. --ldflags-icuio Выводит опцию связи для добавления пакета ICU I/O. --ldflags-libsonly Похоже на --ldflags, но включает только опции -l. --ldflags-searchpath Похоже на --ldflags, но включает только опции -L путей поиска. --ldflags-system Похоже на --ldflags, но включает только системные библиотеки (такие как pthreads). --mandir Выводит расположение установленных страниц руководства ICU. Обычно (man) --prefix Выводит префикс (базовый каталог), под которым установлен ICU. --prefix=prefix Устанавливает префикс ICU на prefix для остальной части этой командной строки. Не проверяет, действителен ли новый префикс. --sbindir Выводит расположение системных двоичных файлов ICU, обычно (sbin) --shared-datadir Выводит расположение общих данных ICU, обычно (share) --sysconfdir Выводит расположение системных конфигурационных данных ICU, обычно (etc) --unicode-version Выводит версию стандарта Unicode, который использует текущий ICU. --version Выводит текущую версию ICU. --incfile Выводит путь к 'Makefile.inc', подходящий для использования с опцией -O в pkgdata(1). AUTHORS Steven Loomis VERSION 77.1 COPYRIGHT Copyright (C) 2002-2004 IBM, Inc. and others. ICU MANPAGE 17 May 2004 ICU-CONFIG(1)
ICU-CONFIG(1) ICU 77.1 Manual ICU-CONFIG(1) NAME icu-config - output ICU build options SYNOPSIS icu-config [ --bindir ] [ --cc ] [ --cflags ] [ --cppflags ] [ --cppflags-searchpath ] [ --cxx ] [ --cxxflags ] [ --detect-prefix ] [ --exec-prefix ] [ --exists ] [ --help, -?, --usage ] [ --icudata ] [ --icudata-install-dir ] [ --icudata-mode ] [ --icudatadir ] [ --invoke ] [ --invoke=prog ] [ --ldflags ] [ --ldflags-libsonly ] [ --ld‐ flags-searchpath ] [ --ldflags-system ] [ --ldflags-icuio ] [ --mandir ] [ --prefix ] [ --prefix=prefix ] [ --sbindir ] [ --shared-datadir ] [ --sysconfdir ] [ --unicode-version ] [ --version ] [ --incfile ] DESCRIPTION icu-config simplifies the task of building and linking against ICU as compared to manually configuring user makefiles or equivalent. Because icu-config is an executable script, it also solves the problem of lo‐ cating the ICU libraries and headers, by allowing the system PATH to locate it. EXAMPLES icu-config can be used without a makefile. The command line below is sufficient for building a single-file c++ program against ICU. (For ex‐ ample, icu/source/samples/props/props.cpp) `icu-config --cxx --cxxflags --cppflags --ldflags` -o props props.cpp More commonly, icu-config will be called from within a makefile, and used to set up variables. The following example also builds the props example. CC=$(shell icu-config --cc) CXX=$(shell icu-config --cxx) CPPFLAGS=$(shell icu-config --cppflags) CXXFLAGS=$(shell icu-config --cxxflags) LDFLAGS =$(shell icu-config --ldflags) all: props props.o: props.cpp make(1) will automatically use the above variables. OPTIONS --bindir Prints the binary (executable) directory path. Normally equiva‐ lent to 'bin'. ICU user-executable applications and scripts are found here. --cc Print the C compiler used. Equivalent to the $(CC) Makefile variable. --cflags Print the C compiler flags. Equivalent to the $(CFLAGS) Makefile variable. Does NOT include preprocessor directives such as in‐ clude path or defined symbols. Examples include debugging (-g) and optimization flags --cppflags Print the C preprocessor flags. Equivalent to the $(CPPFLAGS) Makefile variable. Examples are -I include paths and -D define directives. --cppflags-searchpath Print the C preprocessor flags, as above but only -I search paths. --cxx Print the C++ compiler. Equivalent to the $(CXX) Makefile vari‐ able. --cxxflags Print the C++ compiler flags. Equivalent to the $(CXXFLAGS) Makefile variable. --detect-prefix If ICU has been moved from its installed location, prepending this flag to other icu-config calls will attempt to locate ICU relative to where the icu-config script has been located. Can be used as a last-chance effort if the ICU install has been dam‐ aged. --exec-prefix Print the prefix used for executable program directories (such as bin, sbin, etc). Normally the same as the prefix. --exists Script will return with a successful (0) status if ICU seems to be installed and located correctly, otherwise an error message and nonzero status will be displayed. --help, -?,--usage Print a help and usage message. --icudata Print the shortname of the ICU data file. This does not include any suffix such as .dat, .dll, .so, .lib, .a, etc nor does it include prefixes such as 'lib'. It may be in the form icudt21b --icudata-install-dir Print the directory where ICU packaged data should be installed. Can use as pkgdata(1)'s --install option. --icudata-mode Print the default ICU pkgdata mode, such as dll or common. Can use as pkgdata(1)'s --mode option. --icudatadir Print the path to packaged archive data. (should be where $ICU_DATA or equivalent default path points.) Will NOT point to the libdir. --invoke If ICU is not installed in a location where the operating system will locate its shared libraries, this option will print out commands so as to set the appropriate environment variables to load ICU's shared libraries. For example, on many systems a variable named LD_LIBRARY_PATH or equivalent must be set. --invoke=prog Same as the --invoke option, except includes options for invok‐ ing a program named prog. If prog is the name of an ICU tool, such as genrb(1), then icu-config will also include the full path to that tool. --ldflags Print any flags which should be passed to the linker. These may include -L for library search paths, and -l for including ICU libraries. By default, this option will attempt to link in the "common" (libicuuc) and "i18n" (libicui18n) libraries, as well as the data library. If additional libraries are required, any of the following two flags may be added in conjunction with this one, for example "--ldflags --ldflags-icuio" if the icuio li‐ brary is required in addition to the standard ICU libraries. Equivalent to the $(LDFLAGS) Makefile variable. --ldflags-layout Prints the link option for the ICU layout library. --ldflags-icuio Prints the link option to add the ICU I/O package --ldflags-libsonly Similar to --ldflags but only includes the -l options. --ldflags-searchpath Similar to --ldflags but only includes the -L search path op‐ tions. --ldflags-system Similar to --ldflags but only includes system libraries (such as pthreads) --mandir Prints the location of the installed ICU man pages. Normally (man) --prefix Prints the prefix (base directory) under which the installed ICU resides. --prefix=prefix Sets the ICU prefix to prefix for the remainder of this command line. Does test whether the new prefix is valid. --sbindir Prints the location of ICU system binaries, normally (sbin) --shared-datadir Prints the location of ICU shared data, normally (share) --sysconfdir Prints the location of ICU system configuration data, normally (etc) --unicode-version Prints the Version of the Unicode Standard which the current ICU uses. --version Prints the current version of ICU. --incfile Prints the 'Makefile.inc' path, suitable for use with pkg‐ data(1)'s -O option. AUTHORS Steven Loomis VERSION 77.1 COPYRIGHT Copyright (C) 2002-2004 IBM, Inc. and others. ICU MANPAGE 17 May 2004 ICU-CONFIG(1)
GENBRK(1) ICU 77.1 Manual GENBRK(1) NAME genbrk - Компилирует исходные файлы правил итерации разрывов ICU в бинарные файлы данных SYNOPSIS genbrk [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -d, --destdir destination ] [ -i, --icudatadir directory ] -r, --rules rule-file -o, --out output-file DESCRIPTION genbrk читает исходный код правил разрывов (границ) из rule-file и создаёт файл данных итерации разрывов. Обычно этот файл данных имеет расширение .brk. Подробности синтаксиса правил можно найти в Руководстве пользователя ICU. OPTIONS -h, -?, --help Выводит справку по использованию и выходит. -V, --version Выводит версию genbrk и выходит. -c, --copyright Встраивает стандартный текст авторских прав ICU в output-file. -v, --verbose Выводит дополнительные информационные сообщения во время выполнения. -d, --destdir destination Устанавливает каталог назначения для output-file как destination. -i, --icudatadir directory Ищет необходимые файлы данных ICU в каталоге directory. Например, файл pnames.icu должен быть доступен, если данные ICU не собраны как разделяемая библиотека. Каталог данных ICU по умолчанию указывается переменной окружения ICU_DATA. Большинство конфигураций ICU не требуют этого аргумента. -r, --rules rule-file Исходный файл для чтения. -o, --out output-file Выходной файл данных для записи. CAVEATS Если rule-file содержит метку порядка байтов (BOM) в начале файла, которая является Юникод-символом U+FEFF, то rule-file интерпретируется как Юникод. Без BOM файл интерпретируется в кодовой странице по умолчанию операционной системы. Чтобы избежать неоднозначности кодировки, с которой был записан rule-file, рекомендуется писать этот файл в UTF-8 с BOM. ENVIRONMENT ICU_DATA Указывает каталог, содержащий данные ICU. По умолчанию это /usr/share/icu/77.1/. Некоторые инструменты ICU зависят от наличия завершающего слеша. Важно убедиться, что он присутствует, если ICU_DATA задана. AUTHORS George Rhoten Andy Heninger VERSION 1.0 COPYRIGHT Copyright (C) 2005 International Business Machines Corporation и другие SEE ALSO http://www.icu-project.org/userguide/boundaryAnalysis.html ICU MANPAGE 2 December 2005 GENBRK(1)
GENBRK(1) ICU 77.1 Manual GENBRK(1) NAME genbrk - Compiles ICU break iteration rules source files into binary data files SYNOPSIS genbrk [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -d, --destdir destination ] [ -i, --icudatadir directory ] -r, --rules rule-file -o, --out output-file DESCRIPTION genbrk reads the break (boundary) rule source code from rule-file and creates a break iteration data file. Normally this data file has the .brk extension. The details of the rule syntax can be found in ICU's User Guide. OPTIONS -h, -?, --help Print help about usage and exit. -V, --version Print the version of genbrk and exit. -c, --copyright Embeds the standard ICU copyright into the output-file. -v, --verbose Display extra informative messages during execution. -d, --destdir destination Set the destination directory of the output-file to destination. -i, --icudatadir directory Look for any necessary ICU data files in directory. For exam‐ ple, the file pnames.icu must be located when ICU's data is not built as a shared library. The default ICU data directory is specified by the environment variable ICU_DATA. Most configura‐ tions of ICU do not require this argument. -r, --rules rule-file The source file to read. -o, --out output-file The output data file to write. CAVEATS When the rule-file contains a byte order mark (BOM) at the beginning of the file, which is the Unicode character U+FEFF, then the rule-file is interpreted as Unicode. Without the BOM, the file is interpreted in the current operating system default codepage. In order to eliminate any ambiguity of the encoding for how the rule-file was written, it is rec‐ ommended that you write this file in UTF-8 with the BOM. ENVIRONMENT ICU_DATA Specifies the directory containing ICU data. Defaults to /usr/share/icu/77.1/. Some tools in ICU depend on the pres‐ ence of the trailing slash. It is thus important to make sure that it is present if ICU_DATA is set. AUTHORS George Rhoten Andy Heninger VERSION 1.0 COPYRIGHT Copyright (C) 2005 International Business Machines Corporation and oth‐ ers SEE ALSO http://www.icu-project.org/userguide/boundaryAnalysis.html ICU MANPAGE 2 December 2005 GENBRK(1)