gunicode.h source code [include/glib-2.0/glib/gunicode.h]

1	/ gunicode.h - Unicode manipulation functions*
2	*
3	* Copyright (C) 1999, 2000 Tom Tromey
4	* Copyright 2000, 2005 Red Hat, Inc.
5	*
6	* SPDX-License-Identifier: LGPL-2.1-or-later
7	*
8	* This library is free software; you can redistribute it and/or
9	* modify it under the terms of the GNU Lesser General Public
10	* License as published by the Free Software Foundation; either
11	* version 2.1 of the License, or (at your option) any later version.
12	*
13	* This library is distributed in the hope that it will be useful,
14	* but WITHOUT ANY WARRANTY; without even the implied warranty of
15	* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
16	* Lesser General Public License for more details.
17	*
18	* You should have received a copy of the GNU Lesser General Public License
19	* along with this library; if not, see <http://www.gnu.org/licenses/>.
20	*/
21
22	#ifndef __G_UNICODE_H__
23	#define __G_UNICODE_H__
24
25	#if !defined (__GLIB_H_INSIDE__) && !defined (GLIB_COMPILATION)
26	#error "Only <glib.h> can be included directly."
27	#endif
28
29	#include <glib/gerror.h>
30	#include <glib/gtypes.h>
31
32	G_BEGIN_DECLS
33
34	/**
35	* gunichar:
36	*
37	* A type which can hold any UTF-32 or UCS-4 character code,
38	* also known as a Unicode code point.
39	*
40	* If you want to produce the UTF-8 representation of a #gunichar,
41	* use g_ucs4_to_utf8(). See also g_utf8_to_ucs4() for the reverse
42	* process.
43	*
44	* To print/scan values of this type as integer, use
45	* %G_GINT32_MODIFIER and/or %G_GUINT32_FORMAT.
46	*
47	* The notation to express a Unicode code point in running text is
48	* as a hexadecimal number with four to six digits and uppercase
49	* letters, prefixed by the string "U+". Leading zeros are omitted,
50	* unless the code point would have fewer than four hexadecimal digits.
51	* For example, "U+0041 LATIN CAPITAL LETTER A". To print a code point
52	* in the U+-notation, use the format string "U+\%04"G_GINT32_FORMAT"X".
53	* To scan, use the format string "U+\%06"G_GINT32_FORMAT"X".
54	*
55	* \|[
56	* gunichar c;
57	* sscanf ("U+0041", "U+%06"G_GINT32_FORMAT"X", &c)
58	* g_print ("Read U+%04"G_GINT32_FORMAT"X", c);
59	* ]\|
60	*/
61	typedef guint32 gunichar;
62
63	/**
64	* gunichar2:
65	*
66	* A type which can hold any UTF-16 code
67	* point<footnote id="utf16_surrogate_pairs">UTF-16 also has so called
68	* <firstterm>surrogate pairs</firstterm> to encode characters beyond
69	* the BMP as pairs of 16bit numbers. Surrogate pairs cannot be stored
70	* in a single gunichar2 field, but all GLib functions accepting gunichar2
71	* arrays will correctly interpret surrogate pairs.</footnote>.
72	*
73	* To print/scan values of this type to/from text you need to convert
74	* to/from UTF-8, using g_utf16_to_utf8()/g_utf8_to_utf16().
75	*
76	* To print/scan values of this type as integer, use
77	* %G_GINT16_MODIFIER and/or %G_GUINT16_FORMAT.
78	*/
79	typedef guint16 gunichar2;
80
81	/**
82	* GUnicodeType:
83	* @G_UNICODE_CONTROL: General category "Other, Control" (Cc)
84	* @G_UNICODE_FORMAT: General category "Other, Format" (Cf)
85	* @G_UNICODE_UNASSIGNED: General category "Other, Not Assigned" (Cn)
86	* @G_UNICODE_PRIVATE_USE: General category "Other, Private Use" (Co)
87	* @G_UNICODE_SURROGATE: General category "Other, Surrogate" (Cs)
88	* @G_UNICODE_LOWERCASE_LETTER: General category "Letter, Lowercase" (Ll)
89	* @G_UNICODE_MODIFIER_LETTER: General category "Letter, Modifier" (Lm)
90	* @G_UNICODE_OTHER_LETTER: General category "Letter, Other" (Lo)
91	* @G_UNICODE_TITLECASE_LETTER: General category "Letter, Titlecase" (Lt)
92	* @G_UNICODE_UPPERCASE_LETTER: General category "Letter, Uppercase" (Lu)
93	* @G_UNICODE_SPACING_MARK: General category "Mark, Spacing" (Mc)
94	* @G_UNICODE_ENCLOSING_MARK: General category "Mark, Enclosing" (Me)
95	* @G_UNICODE_NON_SPACING_MARK: General category "Mark, Nonspacing" (Mn)
96	* @G_UNICODE_DECIMAL_NUMBER: General category "Number, Decimal Digit" (Nd)
97	* @G_UNICODE_LETTER_NUMBER: General category "Number, Letter" (Nl)
98	* @G_UNICODE_OTHER_NUMBER: General category "Number, Other" (No)
99	* @G_UNICODE_CONNECT_PUNCTUATION: General category "Punctuation, Connector" (Pc)
100	* @G_UNICODE_DASH_PUNCTUATION: General category "Punctuation, Dash" (Pd)
101	* @G_UNICODE_CLOSE_PUNCTUATION: General category "Punctuation, Close" (Pe)
102	* @G_UNICODE_FINAL_PUNCTUATION: General category "Punctuation, Final quote" (Pf)
103	* @G_UNICODE_INITIAL_PUNCTUATION: General category "Punctuation, Initial quote" (Pi)
104	* @G_UNICODE_OTHER_PUNCTUATION: General category "Punctuation, Other" (Po)
105	* @G_UNICODE_OPEN_PUNCTUATION: General category "Punctuation, Open" (Ps)
106	* @G_UNICODE_CURRENCY_SYMBOL: General category "Symbol, Currency" (Sc)
107	* @G_UNICODE_MODIFIER_SYMBOL: General category "Symbol, Modifier" (Sk)
108	* @G_UNICODE_MATH_SYMBOL: General category "Symbol, Math" (Sm)
109	* @G_UNICODE_OTHER_SYMBOL: General category "Symbol, Other" (So)
110	* @G_UNICODE_LINE_SEPARATOR: General category "Separator, Line" (Zl)
111	* @G_UNICODE_PARAGRAPH_SEPARATOR: General category "Separator, Paragraph" (Zp)
112	* @G_UNICODE_SPACE_SEPARATOR: General category "Separator, Space" (Zs)
113	*
114	* These are the possible character classifications from the
115	* Unicode specification.
116	* See [Unicode Character Database](http://www.unicode.org/reports/tr44/#General_Category_Values).
117	*/
118	typedef enum
119	{
120	G_UNICODE_CONTROL,
121	G_UNICODE_FORMAT,
122	G_UNICODE_UNASSIGNED,
123	G_UNICODE_PRIVATE_USE,
124	G_UNICODE_SURROGATE,
125	G_UNICODE_LOWERCASE_LETTER,
126	G_UNICODE_MODIFIER_LETTER,
127	G_UNICODE_OTHER_LETTER,
128	G_UNICODE_TITLECASE_LETTER,
129	G_UNICODE_UPPERCASE_LETTER,
130	G_UNICODE_SPACING_MARK,
131	G_UNICODE_ENCLOSING_MARK,
132	G_UNICODE_NON_SPACING_MARK,
133	G_UNICODE_DECIMAL_NUMBER,
134	G_UNICODE_LETTER_NUMBER,
135	G_UNICODE_OTHER_NUMBER,
136	G_UNICODE_CONNECT_PUNCTUATION,
137	G_UNICODE_DASH_PUNCTUATION,
138	G_UNICODE_CLOSE_PUNCTUATION,
139	G_UNICODE_FINAL_PUNCTUATION,
140	G_UNICODE_INITIAL_PUNCTUATION,
141	G_UNICODE_OTHER_PUNCTUATION,
142	G_UNICODE_OPEN_PUNCTUATION,
143	G_UNICODE_CURRENCY_SYMBOL,
144	G_UNICODE_MODIFIER_SYMBOL,
145	G_UNICODE_MATH_SYMBOL,
146	G_UNICODE_OTHER_SYMBOL,
147	G_UNICODE_LINE_SEPARATOR,
148	G_UNICODE_PARAGRAPH_SEPARATOR,
149	G_UNICODE_SPACE_SEPARATOR
150	} GUnicodeType;
151
152	/**
153	* G_UNICODE_COMBINING_MARK:
154	*
155	* Older name for %G_UNICODE_SPACING_MARK.
156	*
157	* Deprecated: 2.30: Use %G_UNICODE_SPACING_MARK.
158	*/
159	#define G_UNICODE_COMBINING_MARK G_UNICODE_SPACING_MARK GLIB_DEPRECATED_MACRO_IN_2_30_FOR(G_UNICODE_SPACING_MARK)
160
161	/**
162	* GUnicodeBreakType:
163	* @G_UNICODE_BREAK_MANDATORY: Mandatory Break (BK)
164	* @G_UNICODE_BREAK_CARRIAGE_RETURN: Carriage Return (CR)
165	* @G_UNICODE_BREAK_LINE_FEED: Line Feed (LF)
166	* @G_UNICODE_BREAK_COMBINING_MARK: Attached Characters and Combining Marks (CM)
167	* @G_UNICODE_BREAK_SURROGATE: Surrogates (SG)
168	* @G_UNICODE_BREAK_ZERO_WIDTH_SPACE: Zero Width Space (ZW)
169	* @G_UNICODE_BREAK_INSEPARABLE: Inseparable (IN)
170	* @G_UNICODE_BREAK_NON_BREAKING_GLUE: Non-breaking ("Glue") (GL)
171	* @G_UNICODE_BREAK_CONTINGENT: Contingent Break Opportunity (CB)
172	* @G_UNICODE_BREAK_SPACE: Space (SP)
173	* @G_UNICODE_BREAK_AFTER: Break Opportunity After (BA)
174	* @G_UNICODE_BREAK_BEFORE: Break Opportunity Before (BB)
175	* @G_UNICODE_BREAK_BEFORE_AND_AFTER: Break Opportunity Before and After (B2)
176	* @G_UNICODE_BREAK_HYPHEN: Hyphen (HY)
177	* @G_UNICODE_BREAK_NON_STARTER: Nonstarter (NS)
178	* @G_UNICODE_BREAK_OPEN_PUNCTUATION: Opening Punctuation (OP)
179	* @G_UNICODE_BREAK_CLOSE_PUNCTUATION: Closing Punctuation (CL)
180	* @G_UNICODE_BREAK_QUOTATION: Ambiguous Quotation (QU)
181	* @G_UNICODE_BREAK_EXCLAMATION: Exclamation/Interrogation (EX)
182	* @G_UNICODE_BREAK_IDEOGRAPHIC: Ideographic (ID)
183	* @G_UNICODE_BREAK_NUMERIC: Numeric (NU)
184	* @G_UNICODE_BREAK_INFIX_SEPARATOR: Infix Separator (Numeric) (IS)
185	* @G_UNICODE_BREAK_SYMBOL: Symbols Allowing Break After (SY)
186	* @G_UNICODE_BREAK_ALPHABETIC: Ordinary Alphabetic and Symbol Characters (AL)
187	* @G_UNICODE_BREAK_PREFIX: Prefix (Numeric) (PR)
188	* @G_UNICODE_BREAK_POSTFIX: Postfix (Numeric) (PO)
189	* @G_UNICODE_BREAK_COMPLEX_CONTEXT: Complex Content Dependent (South East Asian) (SA)
190	* @G_UNICODE_BREAK_AMBIGUOUS: Ambiguous (Alphabetic or Ideographic) (AI)
191	* @G_UNICODE_BREAK_UNKNOWN: Unknown (XX)
192	* @G_UNICODE_BREAK_NEXT_LINE: Next Line (NL)
193	* @G_UNICODE_BREAK_WORD_JOINER: Word Joiner (WJ)
194	* @G_UNICODE_BREAK_HANGUL_L_JAMO: Hangul L Jamo (JL)
195	* @G_UNICODE_BREAK_HANGUL_V_JAMO: Hangul V Jamo (JV)
196	* @G_UNICODE_BREAK_HANGUL_T_JAMO: Hangul T Jamo (JT)
197	* @G_UNICODE_BREAK_HANGUL_LV_SYLLABLE: Hangul LV Syllable (H2)
198	* @G_UNICODE_BREAK_HANGUL_LVT_SYLLABLE: Hangul LVT Syllable (H3)
199	* @G_UNICODE_BREAK_CLOSE_PARANTHESIS: Closing Parenthesis (CP). Since 2.28. Deprecated: 2.70: Use %G_UNICODE_BREAK_CLOSE_PARENTHESIS instead.
200	* @G_UNICODE_BREAK_CLOSE_PARENTHESIS: Closing Parenthesis (CP). Since 2.70
201	* @G_UNICODE_BREAK_CONDITIONAL_JAPANESE_STARTER: Conditional Japanese Starter (CJ). Since: 2.32
202	* @G_UNICODE_BREAK_HEBREW_LETTER: Hebrew Letter (HL). Since: 2.32
203	* @G_UNICODE_BREAK_REGIONAL_INDICATOR: Regional Indicator (RI). Since: 2.36
204	* @G_UNICODE_BREAK_EMOJI_BASE: Emoji Base (EB). Since: 2.50
205	* @G_UNICODE_BREAK_EMOJI_MODIFIER: Emoji Modifier (EM). Since: 2.50
206	* @G_UNICODE_BREAK_ZERO_WIDTH_JOINER: Zero Width Joiner (ZWJ). Since: 2.50
207	* @G_UNICODE_BREAK_AKSARA: Aksara (AK). Since: 2.80
208	* @G_UNICODE_BREAK_AKSARA_PRE_BASE: Aksara Pre-Base (AP). Since: 2.80
209	* @G_UNICODE_BREAK_AKSARA_START: Aksara Start (AS). Since: 2.80
210	* @G_UNICODE_BREAK_VIRAMA_FINAL: Virama Final (VF). Since: 2.80
211	* @G_UNICODE_BREAK_VIRAMA: Virama (VI). Since: 2.80
212	* @G_UNICODE_BREAK_UNAMBIGUOUS_HYPHEN: Unambiguous Hyphen (HH). Since: 2.88
213	*
214	* These are the possible line break classifications.
215	*
216	* Since new Unicode versions may add new types here, applications should be ready
217	* to handle unknown values. They may be regarded as %G_UNICODE_BREAK_UNKNOWN.
218	*
219	* See [Unicode Line Breaking Algorithm](https://www.unicode.org/reports/tr14/).
220	*/
221	typedef enum
222	{
223	G_UNICODE_BREAK_MANDATORY,
224	G_UNICODE_BREAK_CARRIAGE_RETURN,
225	G_UNICODE_BREAK_LINE_FEED,
226	G_UNICODE_BREAK_COMBINING_MARK,
227	G_UNICODE_BREAK_SURROGATE,
228	G_UNICODE_BREAK_ZERO_WIDTH_SPACE,
229	G_UNICODE_BREAK_INSEPARABLE,
230	G_UNICODE_BREAK_NON_BREAKING_GLUE,
231	G_UNICODE_BREAK_CONTINGENT,
232	G_UNICODE_BREAK_SPACE,
233	G_UNICODE_BREAK_AFTER,
234	G_UNICODE_BREAK_BEFORE,
235	G_UNICODE_BREAK_BEFORE_AND_AFTER,
236	G_UNICODE_BREAK_HYPHEN,
237	G_UNICODE_BREAK_NON_STARTER,
238	G_UNICODE_BREAK_OPEN_PUNCTUATION,
239	G_UNICODE_BREAK_CLOSE_PUNCTUATION,
240	G_UNICODE_BREAK_QUOTATION,
241	G_UNICODE_BREAK_EXCLAMATION,
242	G_UNICODE_BREAK_IDEOGRAPHIC,
243	G_UNICODE_BREAK_NUMERIC,
244	G_UNICODE_BREAK_INFIX_SEPARATOR,
245	G_UNICODE_BREAK_SYMBOL,
246	G_UNICODE_BREAK_ALPHABETIC,
247	G_UNICODE_BREAK_PREFIX,
248	G_UNICODE_BREAK_POSTFIX,
249	G_UNICODE_BREAK_COMPLEX_CONTEXT,
250	G_UNICODE_BREAK_AMBIGUOUS,
251	G_UNICODE_BREAK_UNKNOWN,
252	G_UNICODE_BREAK_NEXT_LINE,
253	G_UNICODE_BREAK_WORD_JOINER,
254	G_UNICODE_BREAK_HANGUL_L_JAMO,
255	G_UNICODE_BREAK_HANGUL_V_JAMO,
256	G_UNICODE_BREAK_HANGUL_T_JAMO,
257	G_UNICODE_BREAK_HANGUL_LV_SYLLABLE,
258	G_UNICODE_BREAK_HANGUL_LVT_SYLLABLE,
259	G_UNICODE_BREAK_CLOSE_PARANTHESIS,
260	G_UNICODE_BREAK_CLOSE_PARENTHESIS GLIB_AVAILABLE_ENUMERATOR_IN_2_70 = G_UNICODE_BREAK_CLOSE_PARANTHESIS,
261	G_UNICODE_BREAK_CONDITIONAL_JAPANESE_STARTER,
262	G_UNICODE_BREAK_HEBREW_LETTER,
263	G_UNICODE_BREAK_REGIONAL_INDICATOR,
264	G_UNICODE_BREAK_EMOJI_BASE,
265	G_UNICODE_BREAK_EMOJI_MODIFIER,
266	G_UNICODE_BREAK_ZERO_WIDTH_JOINER,
267	G_UNICODE_BREAK_AKSARA,
268	G_UNICODE_BREAK_AKSARA_PRE_BASE,
269	G_UNICODE_BREAK_AKSARA_START,
270	G_UNICODE_BREAK_VIRAMA_FINAL,
271	G_UNICODE_BREAK_VIRAMA,
272	G_UNICODE_BREAK_UNAMBIGUOUS_HYPHEN GLIB_AVAILABLE_ENUMERATOR_IN_2_88,
273	} GUnicodeBreakType;
274
275	/**
276	* GUnicodeScript:
277	* @G_UNICODE_SCRIPT_INVALID_CODE:
278	* a value never returned from g_unichar_get_script()
279	* @G_UNICODE_SCRIPT_COMMON: a character used by multiple different scripts
280	* @G_UNICODE_SCRIPT_INHERITED: a mark glyph that takes its script from the
281	* base glyph to which it is attached
282	* @G_UNICODE_SCRIPT_ARABIC: Arabic
283	* @G_UNICODE_SCRIPT_ARMENIAN: Armenian
284	* @G_UNICODE_SCRIPT_BENGALI: Bengali
285	* @G_UNICODE_SCRIPT_BOPOMOFO: Bopomofo
286	* @G_UNICODE_SCRIPT_CHEROKEE: Cherokee
287	* @G_UNICODE_SCRIPT_COPTIC: Coptic
288	* @G_UNICODE_SCRIPT_CYRILLIC: Cyrillic
289	* @G_UNICODE_SCRIPT_DESERET: Deseret
290	* @G_UNICODE_SCRIPT_DEVANAGARI: Devanagari
291	* @G_UNICODE_SCRIPT_ETHIOPIC: Ethiopic
292	* @G_UNICODE_SCRIPT_GEORGIAN: Georgian
293	* @G_UNICODE_SCRIPT_GOTHIC: Gothic
294	* @G_UNICODE_SCRIPT_GREEK: Greek
295	* @G_UNICODE_SCRIPT_GUJARATI: Gujarati
296	* @G_UNICODE_SCRIPT_GURMUKHI: Gurmukhi
297	* @G_UNICODE_SCRIPT_HAN: Han
298	* @G_UNICODE_SCRIPT_HANGUL: Hangul
299	* @G_UNICODE_SCRIPT_HEBREW: Hebrew
300	* @G_UNICODE_SCRIPT_HIRAGANA: Hiragana
301	* @G_UNICODE_SCRIPT_KANNADA: Kannada
302	* @G_UNICODE_SCRIPT_KATAKANA: Katakana
303	* @G_UNICODE_SCRIPT_KHMER: Khmer
304	* @G_UNICODE_SCRIPT_LAO: Lao
305	* @G_UNICODE_SCRIPT_LATIN: Latin
306	* @G_UNICODE_SCRIPT_MALAYALAM: Malayalam
307	* @G_UNICODE_SCRIPT_MONGOLIAN: Mongolian
308	* @G_UNICODE_SCRIPT_MYANMAR: Myanmar
309	* @G_UNICODE_SCRIPT_OGHAM: Ogham
310	* @G_UNICODE_SCRIPT_OLD_ITALIC: Old Italic
311	* @G_UNICODE_SCRIPT_ORIYA: Oriya
312	* @G_UNICODE_SCRIPT_RUNIC: Runic
313	* @G_UNICODE_SCRIPT_SINHALA: Sinhala
314	* @G_UNICODE_SCRIPT_SYRIAC: Syriac
315	* @G_UNICODE_SCRIPT_TAMIL: Tamil
316	* @G_UNICODE_SCRIPT_TELUGU: Telugu
317	* @G_UNICODE_SCRIPT_THAANA: Thaana
318	* @G_UNICODE_SCRIPT_THAI: Thai
319	* @G_UNICODE_SCRIPT_TIBETAN: Tibetan
320	* @G_UNICODE_SCRIPT_CANADIAN_ABORIGINAL:
321	* Canadian Aboriginal
322	* @G_UNICODE_SCRIPT_YI: Yi
323	* @G_UNICODE_SCRIPT_TAGALOG: Tagalog
324	* @G_UNICODE_SCRIPT_HANUNOO: Hanunoo
325	* @G_UNICODE_SCRIPT_BUHID: Buhid
326	* @G_UNICODE_SCRIPT_TAGBANWA: Tagbanwa
327	* @G_UNICODE_SCRIPT_BRAILLE: Braille
328	* @G_UNICODE_SCRIPT_CYPRIOT: Cypriot
329	* @G_UNICODE_SCRIPT_LIMBU: Limbu
330	* @G_UNICODE_SCRIPT_OSMANYA: Osmanya
331	* @G_UNICODE_SCRIPT_SHAVIAN: Shavian
332	* @G_UNICODE_SCRIPT_LINEAR_B: Linear B
333	* @G_UNICODE_SCRIPT_TAI_LE: Tai Le
334	* @G_UNICODE_SCRIPT_UGARITIC: Ugaritic
335	* @G_UNICODE_SCRIPT_NEW_TAI_LUE:
336	* New Tai Lue
337	* @G_UNICODE_SCRIPT_BUGINESE: Buginese
338	* @G_UNICODE_SCRIPT_GLAGOLITIC: Glagolitic
339	* @G_UNICODE_SCRIPT_TIFINAGH: Tifinagh
340	* @G_UNICODE_SCRIPT_SYLOTI_NAGRI:
341	* Syloti Nagri
342	* @G_UNICODE_SCRIPT_OLD_PERSIAN:
343	* Old Persian
344	* @G_UNICODE_SCRIPT_KHAROSHTHI: Kharoshthi
345	* @G_UNICODE_SCRIPT_UNKNOWN: an unassigned code point
346	* @G_UNICODE_SCRIPT_BALINESE: Balinese
347	* @G_UNICODE_SCRIPT_CUNEIFORM: Cuneiform
348	* @G_UNICODE_SCRIPT_PHOENICIAN: Phoenician
349	* @G_UNICODE_SCRIPT_PHAGS_PA: Phags-pa
350	* @G_UNICODE_SCRIPT_NKO: N'Ko
351	* @G_UNICODE_SCRIPT_KAYAH_LI: Kayah Li. Since 2.16.3
352	* @G_UNICODE_SCRIPT_LEPCHA: Lepcha. Since 2.16.3
353	* @G_UNICODE_SCRIPT_REJANG: Rejang. Since 2.16.3
354	* @G_UNICODE_SCRIPT_SUNDANESE: Sundanese. Since 2.16.3
355	* @G_UNICODE_SCRIPT_SAURASHTRA: Saurashtra. Since 2.16.3
356	* @G_UNICODE_SCRIPT_CHAM: Cham. Since 2.16.3
357	* @G_UNICODE_SCRIPT_OL_CHIKI: Ol Chiki. Since 2.16.3
358	* @G_UNICODE_SCRIPT_VAI: Vai. Since 2.16.3
359	* @G_UNICODE_SCRIPT_CARIAN: Carian. Since 2.16.3
360	* @G_UNICODE_SCRIPT_LYCIAN: Lycian. Since 2.16.3
361	* @G_UNICODE_SCRIPT_LYDIAN: Lydian. Since 2.16.3
362	* @G_UNICODE_SCRIPT_AVESTAN: Avestan. Since 2.26
363	* @G_UNICODE_SCRIPT_BAMUM: Bamum. Since 2.26
364	* @G_UNICODE_SCRIPT_EGYPTIAN_HIEROGLYPHS:
365	* Egyptian Hieroglpyhs. Since 2.26
366	* @G_UNICODE_SCRIPT_IMPERIAL_ARAMAIC:
367	* Imperial Aramaic. Since 2.26
368	* @G_UNICODE_SCRIPT_INSCRIPTIONAL_PAHLAVI:
369	* Inscriptional Pahlavi. Since 2.26
370	* @G_UNICODE_SCRIPT_INSCRIPTIONAL_PARTHIAN:
371	* Inscriptional Parthian. Since 2.26
372	* @G_UNICODE_SCRIPT_JAVANESE: Javanese. Since 2.26
373	* @G_UNICODE_SCRIPT_KAITHI: Kaithi. Since 2.26
374	* @G_UNICODE_SCRIPT_LISU: Lisu. Since 2.26
375	* @G_UNICODE_SCRIPT_MEETEI_MAYEK:
376	* Meetei Mayek. Since 2.26
377	* @G_UNICODE_SCRIPT_OLD_SOUTH_ARABIAN:
378	* Old South Arabian. Since 2.26
379	* @G_UNICODE_SCRIPT_OLD_TURKIC: Old Turkic. Since 2.28
380	* @G_UNICODE_SCRIPT_SAMARITAN: Samaritan. Since 2.26
381	* @G_UNICODE_SCRIPT_TAI_THAM: Tai Tham. Since 2.26
382	* @G_UNICODE_SCRIPT_TAI_VIET: Tai Viet. Since 2.26
383	* @G_UNICODE_SCRIPT_BATAK: Batak. Since 2.28
384	* @G_UNICODE_SCRIPT_BRAHMI: Brahmi. Since 2.28
385	* @G_UNICODE_SCRIPT_MANDAIC: Mandaic. Since 2.28
386	* @G_UNICODE_SCRIPT_CHAKMA: Chakma. Since: 2.32
387	* @G_UNICODE_SCRIPT_MEROITIC_CURSIVE: Meroitic Cursive. Since: 2.32
388	* @G_UNICODE_SCRIPT_MEROITIC_HIEROGLYPHS: Meroitic Hieroglyphs. Since: 2.32
389	* @G_UNICODE_SCRIPT_MIAO: Miao. Since: 2.32
390	* @G_UNICODE_SCRIPT_SHARADA: Sharada. Since: 2.32
391	* @G_UNICODE_SCRIPT_SORA_SOMPENG: Sora Sompeng. Since: 2.32
392	* @G_UNICODE_SCRIPT_TAKRI: Takri. Since: 2.32
393	* @G_UNICODE_SCRIPT_BASSA_VAH: Bassa. Since: 2.42
394	* @G_UNICODE_SCRIPT_CAUCASIAN_ALBANIAN: Caucasian Albanian. Since: 2.42
395	* @G_UNICODE_SCRIPT_DUPLOYAN: Duployan. Since: 2.42
396	* @G_UNICODE_SCRIPT_ELBASAN: Elbasan. Since: 2.42
397	* @G_UNICODE_SCRIPT_GRANTHA: Grantha. Since: 2.42
398	* @G_UNICODE_SCRIPT_KHOJKI: Kjohki. Since: 2.42
399	* @G_UNICODE_SCRIPT_KHUDAWADI: Khudawadi, Sindhi. Since: 2.42
400	* @G_UNICODE_SCRIPT_LINEAR_A: Linear A. Since: 2.42
401	* @G_UNICODE_SCRIPT_MAHAJANI: Mahajani. Since: 2.42
402	* @G_UNICODE_SCRIPT_MANICHAEAN: Manichaean. Since: 2.42
403	* @G_UNICODE_SCRIPT_MENDE_KIKAKUI: Mende Kikakui. Since: 2.42
404	* @G_UNICODE_SCRIPT_MODI: Modi. Since: 2.42
405	* @G_UNICODE_SCRIPT_MRO: Mro. Since: 2.42
406	* @G_UNICODE_SCRIPT_NABATAEAN: Nabataean. Since: 2.42
407	* @G_UNICODE_SCRIPT_OLD_NORTH_ARABIAN: Old North Arabian. Since: 2.42
408	* @G_UNICODE_SCRIPT_OLD_PERMIC: Old Permic. Since: 2.42
409	* @G_UNICODE_SCRIPT_PAHAWH_HMONG: Pahawh Hmong. Since: 2.42
410	* @G_UNICODE_SCRIPT_PALMYRENE: Palmyrene. Since: 2.42
411	* @G_UNICODE_SCRIPT_PAU_CIN_HAU: Pau Cin Hau. Since: 2.42
412	* @G_UNICODE_SCRIPT_PSALTER_PAHLAVI: Psalter Pahlavi. Since: 2.42
413	* @G_UNICODE_SCRIPT_SIDDHAM: Siddham. Since: 2.42
414	* @G_UNICODE_SCRIPT_TIRHUTA: Tirhuta. Since: 2.42
415	* @G_UNICODE_SCRIPT_WARANG_CITI: Warang Citi. Since: 2.42
416	* @G_UNICODE_SCRIPT_AHOM: Ahom. Since: 2.48
417	* @G_UNICODE_SCRIPT_ANATOLIAN_HIEROGLYPHS: Anatolian Hieroglyphs. Since: 2.48
418	* @G_UNICODE_SCRIPT_HATRAN: Hatran. Since: 2.48
419	* @G_UNICODE_SCRIPT_MULTANI: Multani. Since: 2.48
420	* @G_UNICODE_SCRIPT_OLD_HUNGARIAN: Old Hungarian. Since: 2.48
421	* @G_UNICODE_SCRIPT_SIGNWRITING: Signwriting. Since: 2.48
422	* @G_UNICODE_SCRIPT_ADLAM: Adlam. Since: 2.50
423	* @G_UNICODE_SCRIPT_BHAIKSUKI: Bhaiksuki. Since: 2.50
424	* @G_UNICODE_SCRIPT_MARCHEN: Marchen. Since: 2.50
425	* @G_UNICODE_SCRIPT_NEWA: Newa. Since: 2.50
426	* @G_UNICODE_SCRIPT_OSAGE: Osage. Since: 2.50
427	* @G_UNICODE_SCRIPT_TANGUT: Tangut. Since: 2.50
428	* @G_UNICODE_SCRIPT_MASARAM_GONDI: Masaram Gondi. Since: 2.54
429	* @G_UNICODE_SCRIPT_NUSHU: Nushu. Since: 2.54
430	* @G_UNICODE_SCRIPT_SOYOMBO: Soyombo. Since: 2.54
431	* @G_UNICODE_SCRIPT_ZANABAZAR_SQUARE: Zanabazar Square. Since: 2.54
432	* @G_UNICODE_SCRIPT_DOGRA: Dogra. Since: 2.58
433	* @G_UNICODE_SCRIPT_GUNJALA_GONDI: Gunjala Gondi. Since: 2.58
434	* @G_UNICODE_SCRIPT_HANIFI_ROHINGYA: Hanifi Rohingya. Since: 2.58
435	* @G_UNICODE_SCRIPT_MAKASAR: Makasar. Since: 2.58
436	* @G_UNICODE_SCRIPT_MEDEFAIDRIN: Medefaidrin. Since: 2.58
437	* @G_UNICODE_SCRIPT_OLD_SOGDIAN: Old Sogdian. Since: 2.58
438	* @G_UNICODE_SCRIPT_SOGDIAN: Sogdian. Since: 2.58
439	* @G_UNICODE_SCRIPT_ELYMAIC: Elym. Since: 2.62
440	* @G_UNICODE_SCRIPT_NANDINAGARI: Nand. Since: 2.62
441	* @G_UNICODE_SCRIPT_NYIAKENG_PUACHUE_HMONG: Rohg. Since: 2.62
442	* @G_UNICODE_SCRIPT_WANCHO: Wcho. Since: 2.62
443	* @G_UNICODE_SCRIPT_CHORASMIAN: Chorasmian. Since: 2.66
444	* @G_UNICODE_SCRIPT_DIVES_AKURU: Dives Akuru. Since: 2.66
445	* @G_UNICODE_SCRIPT_KHITAN_SMALL_SCRIPT: Khitan small script. Since: 2.66
446	* @G_UNICODE_SCRIPT_YEZIDI: Yezidi. Since: 2.66
447	* @G_UNICODE_SCRIPT_CYPRO_MINOAN: Cypro-Minoan. Since: 2.72
448	* @G_UNICODE_SCRIPT_OLD_UYGHUR: Old Uyghur. Since: 2.72
449	* @G_UNICODE_SCRIPT_TANGSA: Tangsa. Since: 2.72
450	* @G_UNICODE_SCRIPT_TOTO: Toto. Since: 2.72
451	* @G_UNICODE_SCRIPT_VITHKUQI: Vithkuqi. Since: 2.72
452	* @G_UNICODE_SCRIPT_MATH: Mathematical notation. Since: 2.72
453	* @G_UNICODE_SCRIPT_KAWI: Kawi. Since 2.74
454	* @G_UNICODE_SCRIPT_NAG_MUNDARI: Nag Mundari. Since 2.74
455	* @G_UNICODE_SCRIPT_TODHRI: Todhri. Since: 2.84
456	* @G_UNICODE_SCRIPT_GARAY: Garay. Since: 2.84
457	* @G_UNICODE_SCRIPT_TULU_TIGALARI: Tulu-Tigalari. Since: 2.84
458	* @G_UNICODE_SCRIPT_SUNUWAR: Sunuwar. Since: 2.84
459	* @G_UNICODE_SCRIPT_GURUNG_KHEMA: Gurung Khema. Since: 2.84
460	* @G_UNICODE_SCRIPT_KIRAT_RAI: Kirat Rai. Since: 2.84
461	* @G_UNICODE_SCRIPT_OL_ONAL: Ol Onal. Since: 2.84
462	* @G_UNICODE_SCRIPT_SIDETIC: Sidetic. Since: 2.88
463	* @G_UNICODE_SCRIPT_TOLONG_SIKI: Tolong Siki. Since: 2.88
464	* @G_UNICODE_SCRIPT_TAI_YO: Tai Yo. Since: 2.88
465	* @G_UNICODE_SCRIPT_BERIA_ERFE: Beria Erfe. Since: 2.88
466	*
467	* The #GUnicodeScript enumeration identifies different writing
468	* systems. The values correspond to the names as defined in the
469	* Unicode standard. The enumeration has been added in GLib 2.14,
470	* and is interchangeable with #PangoScript.
471	*
472	* Note that new types may be added in the future. Applications
473	* should be ready to handle unknown values.
474	* See [Unicode Standard Annex #24: Script names](http://www.unicode.org/reports/tr24/).
475	*/
476	typedef enum
477	{ / ISO 15924 code /
478	G_UNICODE_SCRIPT_INVALID_CODE = -`1`,
479	G_UNICODE_SCRIPT_COMMON = `0`, / Zyyy /
480	G_UNICODE_SCRIPT_INHERITED, / Zinh (Qaai) /
481	G_UNICODE_SCRIPT_ARABIC, / Arab /
482	G_UNICODE_SCRIPT_ARMENIAN, / Armn /
483	G_UNICODE_SCRIPT_BENGALI, / Beng /
484	G_UNICODE_SCRIPT_BOPOMOFO, / Bopo /
485	G_UNICODE_SCRIPT_CHEROKEE, / Cher /
486	G_UNICODE_SCRIPT_COPTIC, / Copt (Qaac) /
487	G_UNICODE_SCRIPT_CYRILLIC, / Cyrl (Cyrs) /
488	G_UNICODE_SCRIPT_DESERET, / Dsrt /
489	G_UNICODE_SCRIPT_DEVANAGARI, / Deva /
490	G_UNICODE_SCRIPT_ETHIOPIC, / Ethi /
491	G_UNICODE_SCRIPT_GEORGIAN, / Geor (Geon, Geoa) /
492	G_UNICODE_SCRIPT_GOTHIC, / Goth /
493	G_UNICODE_SCRIPT_GREEK, / Grek /
494	G_UNICODE_SCRIPT_GUJARATI, / Gujr /
495	G_UNICODE_SCRIPT_GURMUKHI, / Guru /
496	G_UNICODE_SCRIPT_HAN, / Hani /
497	G_UNICODE_SCRIPT_HANGUL, / Hang /
498	G_UNICODE_SCRIPT_HEBREW, / Hebr /
499	G_UNICODE_SCRIPT_HIRAGANA, / Hira /
500	G_UNICODE_SCRIPT_KANNADA, / Knda /
501	G_UNICODE_SCRIPT_KATAKANA, / Kana /
502	G_UNICODE_SCRIPT_KHMER, / Khmr /
503	G_UNICODE_SCRIPT_LAO, / Laoo /
504	G_UNICODE_SCRIPT_LATIN, / Latn (Latf, Latg) /
505	G_UNICODE_SCRIPT_MALAYALAM, / Mlym /
506	G_UNICODE_SCRIPT_MONGOLIAN, / Mong /
507	G_UNICODE_SCRIPT_MYANMAR, / Mymr /
508	G_UNICODE_SCRIPT_OGHAM, / Ogam /
509	G_UNICODE_SCRIPT_OLD_ITALIC, / Ital /
510	G_UNICODE_SCRIPT_ORIYA, / Orya /
511	G_UNICODE_SCRIPT_RUNIC, / Runr /
512	G_UNICODE_SCRIPT_SINHALA, / Sinh /
513	G_UNICODE_SCRIPT_SYRIAC, / Syrc (Syrj, Syrn, Syre) /
514	G_UNICODE_SCRIPT_TAMIL, / Taml /
515	G_UNICODE_SCRIPT_TELUGU, / Telu /
516	G_UNICODE_SCRIPT_THAANA, / Thaa /
517	G_UNICODE_SCRIPT_THAI, / Thai /
518	G_UNICODE_SCRIPT_TIBETAN, / Tibt /
519	G_UNICODE_SCRIPT_CANADIAN_ABORIGINAL, / Cans /
520	G_UNICODE_SCRIPT_YI, / Yiii /
521	G_UNICODE_SCRIPT_TAGALOG, / Tglg /
522	G_UNICODE_SCRIPT_HANUNOO, / Hano /
523	G_UNICODE_SCRIPT_BUHID, / Buhd /
524	G_UNICODE_SCRIPT_TAGBANWA, / Tagb /
525
526	/ Unicode-4.0 additions /
527	G_UNICODE_SCRIPT_BRAILLE, / Brai /
528	G_UNICODE_SCRIPT_CYPRIOT, / Cprt /
529	G_UNICODE_SCRIPT_LIMBU, / Limb /
530	G_UNICODE_SCRIPT_OSMANYA, / Osma /
531	G_UNICODE_SCRIPT_SHAVIAN, / Shaw /
532	G_UNICODE_SCRIPT_LINEAR_B, / Linb /
533	G_UNICODE_SCRIPT_TAI_LE, / Tale /
534	G_UNICODE_SCRIPT_UGARITIC, / Ugar /
535
536	/ Unicode-4.1 additions /
537	G_UNICODE_SCRIPT_NEW_TAI_LUE, / Talu /
538	G_UNICODE_SCRIPT_BUGINESE, / Bugi /
539	G_UNICODE_SCRIPT_GLAGOLITIC, / Glag /
540	G_UNICODE_SCRIPT_TIFINAGH, / Tfng /
541	G_UNICODE_SCRIPT_SYLOTI_NAGRI, / Sylo /
542	G_UNICODE_SCRIPT_OLD_PERSIAN, / Xpeo /
543	G_UNICODE_SCRIPT_KHAROSHTHI, / Khar /
544
545	/ Unicode-5.0 additions /
546	G_UNICODE_SCRIPT_UNKNOWN, / Zzzz /
547	G_UNICODE_SCRIPT_BALINESE, / Bali /
548	G_UNICODE_SCRIPT_CUNEIFORM, / Xsux /
549	G_UNICODE_SCRIPT_PHOENICIAN, / Phnx /
550	G_UNICODE_SCRIPT_PHAGS_PA, / Phag /
551	G_UNICODE_SCRIPT_NKO, / Nkoo /
552
553	/ Unicode-5.1 additions /
554	G_UNICODE_SCRIPT_KAYAH_LI, / Kali /
555	G_UNICODE_SCRIPT_LEPCHA, / Lepc /
556	G_UNICODE_SCRIPT_REJANG, / Rjng /
557	G_UNICODE_SCRIPT_SUNDANESE, / Sund /
558	G_UNICODE_SCRIPT_SAURASHTRA, / Saur /
559	G_UNICODE_SCRIPT_CHAM, / Cham /
560	G_UNICODE_SCRIPT_OL_CHIKI, / Olck /
561	G_UNICODE_SCRIPT_VAI, / Vaii /
562	G_UNICODE_SCRIPT_CARIAN, / Cari /
563	G_UNICODE_SCRIPT_LYCIAN, / Lyci /
564	G_UNICODE_SCRIPT_LYDIAN, / Lydi /
565
566	/ Unicode-5.2 additions /
567	G_UNICODE_SCRIPT_AVESTAN, / Avst /
568	G_UNICODE_SCRIPT_BAMUM, / Bamu /
569	G_UNICODE_SCRIPT_EGYPTIAN_HIEROGLYPHS, / Egyp /
570	G_UNICODE_SCRIPT_IMPERIAL_ARAMAIC, / Armi /
571	G_UNICODE_SCRIPT_INSCRIPTIONAL_PAHLAVI, / Phli /
572	G_UNICODE_SCRIPT_INSCRIPTIONAL_PARTHIAN, / Prti /
573	G_UNICODE_SCRIPT_JAVANESE, / Java /
574	G_UNICODE_SCRIPT_KAITHI, / Kthi /
575	G_UNICODE_SCRIPT_LISU, / Lisu /
576	G_UNICODE_SCRIPT_MEETEI_MAYEK, / Mtei /
577	G_UNICODE_SCRIPT_OLD_SOUTH_ARABIAN, / Sarb /
578	G_UNICODE_SCRIPT_OLD_TURKIC, / Orkh /
579	G_UNICODE_SCRIPT_SAMARITAN, / Samr /
580	G_UNICODE_SCRIPT_TAI_THAM, / Lana /
581	G_UNICODE_SCRIPT_TAI_VIET, / Tavt /
582
583	/ Unicode-6.0 additions /
584	G_UNICODE_SCRIPT_BATAK, / Batk /
585	G_UNICODE_SCRIPT_BRAHMI, / Brah /
586	G_UNICODE_SCRIPT_MANDAIC, / Mand /
587
588	/ Unicode-6.1 additions /
589	G_UNICODE_SCRIPT_CHAKMA, / Cakm /
590	G_UNICODE_SCRIPT_MEROITIC_CURSIVE, / Merc /
591	G_UNICODE_SCRIPT_MEROITIC_HIEROGLYPHS, / Mero /
592	G_UNICODE_SCRIPT_MIAO, / Plrd /
593	G_UNICODE_SCRIPT_SHARADA, / Shrd /
594	G_UNICODE_SCRIPT_SORA_SOMPENG, / Sora /
595	G_UNICODE_SCRIPT_TAKRI, / Takr /
596
597	/ Unicode 7.0 additions /
598	G_UNICODE_SCRIPT_BASSA_VAH, / Bass /
599	G_UNICODE_SCRIPT_CAUCASIAN_ALBANIAN, / Aghb /
600	G_UNICODE_SCRIPT_DUPLOYAN, / Dupl /
601	G_UNICODE_SCRIPT_ELBASAN, / Elba /
602	G_UNICODE_SCRIPT_GRANTHA, / Gran /
603	G_UNICODE_SCRIPT_KHOJKI, / Khoj /
604	G_UNICODE_SCRIPT_KHUDAWADI, / Sind /
605	G_UNICODE_SCRIPT_LINEAR_A, / Lina /
606	G_UNICODE_SCRIPT_MAHAJANI, / Mahj /
607	G_UNICODE_SCRIPT_MANICHAEAN, / Mani /
608	G_UNICODE_SCRIPT_MENDE_KIKAKUI, / Mend /
609	G_UNICODE_SCRIPT_MODI, / Modi /
610	G_UNICODE_SCRIPT_MRO, / Mroo /
611	G_UNICODE_SCRIPT_NABATAEAN, / Nbat /
612	G_UNICODE_SCRIPT_OLD_NORTH_ARABIAN, / Narb /
613	G_UNICODE_SCRIPT_OLD_PERMIC, / Perm /
614	G_UNICODE_SCRIPT_PAHAWH_HMONG, / Hmng /
615	G_UNICODE_SCRIPT_PALMYRENE, / Palm /
616	G_UNICODE_SCRIPT_PAU_CIN_HAU, / Pauc /
617	G_UNICODE_SCRIPT_PSALTER_PAHLAVI, / Phlp /
618	G_UNICODE_SCRIPT_SIDDHAM, / Sidd /
619	G_UNICODE_SCRIPT_TIRHUTA, / Tirh /
620	G_UNICODE_SCRIPT_WARANG_CITI, / Wara /
621
622	/ Unicode 8.0 additions /
623	G_UNICODE_SCRIPT_AHOM, / Ahom /
624	G_UNICODE_SCRIPT_ANATOLIAN_HIEROGLYPHS, / Hluw /
625	G_UNICODE_SCRIPT_HATRAN, / Hatr /
626	G_UNICODE_SCRIPT_MULTANI, / Mult /
627	G_UNICODE_SCRIPT_OLD_HUNGARIAN, / Hung /
628	G_UNICODE_SCRIPT_SIGNWRITING, / Sgnw /
629
630	/ Unicode 9.0 additions /
631	G_UNICODE_SCRIPT_ADLAM, / Adlm /
632	G_UNICODE_SCRIPT_BHAIKSUKI, / Bhks /
633	G_UNICODE_SCRIPT_MARCHEN, / Marc /
634	G_UNICODE_SCRIPT_NEWA, / Newa /
635	G_UNICODE_SCRIPT_OSAGE, / Osge /
636	G_UNICODE_SCRIPT_TANGUT, / Tang /
637
638	/ Unicode 10.0 additions /
639	G_UNICODE_SCRIPT_MASARAM_GONDI, / Gonm /
640	G_UNICODE_SCRIPT_NUSHU, / Nshu /
641	G_UNICODE_SCRIPT_SOYOMBO, / Soyo /
642	G_UNICODE_SCRIPT_ZANABAZAR_SQUARE, / Zanb /
643
644	/ Unicode 11.0 additions /
645	G_UNICODE_SCRIPT_DOGRA, / Dogr /
646	G_UNICODE_SCRIPT_GUNJALA_GONDI, / Gong /
647	G_UNICODE_SCRIPT_HANIFI_ROHINGYA, / Rohg /
648	G_UNICODE_SCRIPT_MAKASAR, / Maka /
649	G_UNICODE_SCRIPT_MEDEFAIDRIN, / Medf /
650	G_UNICODE_SCRIPT_OLD_SOGDIAN, / Sogo /
651	G_UNICODE_SCRIPT_SOGDIAN, / Sogd /
652
653	/ Unicode 12.0 additions /
654	G_UNICODE_SCRIPT_ELYMAIC, / Elym /
655	G_UNICODE_SCRIPT_NANDINAGARI, / Nand /
656	G_UNICODE_SCRIPT_NYIAKENG_PUACHUE_HMONG, / Rohg /
657	G_UNICODE_SCRIPT_WANCHO, / Wcho /
658
659	/ Unicode 13.0 additions /
660	G_UNICODE_SCRIPT_CHORASMIAN, / Chrs /
661	G_UNICODE_SCRIPT_DIVES_AKURU, / Diak /
662	G_UNICODE_SCRIPT_KHITAN_SMALL_SCRIPT, / Kits /
663	G_UNICODE_SCRIPT_YEZIDI, / Yezi /
664
665	/ Unicode 14.0 additions /
666	G_UNICODE_SCRIPT_CYPRO_MINOAN, / Cpmn /
667	G_UNICODE_SCRIPT_OLD_UYGHUR, / Ougr /
668	G_UNICODE_SCRIPT_TANGSA, / Tnsa /
669	G_UNICODE_SCRIPT_TOTO, / Toto /
670	G_UNICODE_SCRIPT_VITHKUQI, / Vith /
671
672	/ not really a Unicode script, but part of ISO 15924 /
673	G_UNICODE_SCRIPT_MATH, / Zmth /
674
675	/ Unicode 15.0 additions /
676	G_UNICODE_SCRIPT_KAWI GLIB_AVAILABLE_ENUMERATOR_IN_2_74, / Kawi /
677	G_UNICODE_SCRIPT_NAG_MUNDARI GLIB_AVAILABLE_ENUMERATOR_IN_2_74, / Nagm /
678
679	/ Unicode 16.0 additions /
680	G_UNICODE_SCRIPT_TODHRI GLIB_AVAILABLE_ENUMERATOR_IN_2_84, / Todr /
681	G_UNICODE_SCRIPT_GARAY GLIB_AVAILABLE_ENUMERATOR_IN_2_84, / Gara /
682	G_UNICODE_SCRIPT_TULU_TIGALARI GLIB_AVAILABLE_ENUMERATOR_IN_2_84, / Tutg /
683	G_UNICODE_SCRIPT_SUNUWAR GLIB_AVAILABLE_ENUMERATOR_IN_2_84, / Sunu /
684	G_UNICODE_SCRIPT_GURUNG_KHEMA GLIB_AVAILABLE_ENUMERATOR_IN_2_84, / Gukh /
685	G_UNICODE_SCRIPT_KIRAT_RAI GLIB_AVAILABLE_ENUMERATOR_IN_2_84, / Krai /
686	G_UNICODE_SCRIPT_OL_ONAL GLIB_AVAILABLE_ENUMERATOR_IN_2_84, / Onao /
687
688	/ Unicode 17.0 additions /
689	G_UNICODE_SCRIPT_SIDETIC GLIB_AVAILABLE_ENUMERATOR_IN_2_88, / Sidt /
690	G_UNICODE_SCRIPT_TOLONG_SIKI GLIB_AVAILABLE_ENUMERATOR_IN_2_88, / Tols /
691	G_UNICODE_SCRIPT_TAI_YO GLIB_AVAILABLE_ENUMERATOR_IN_2_88, / Tayo /
692	G_UNICODE_SCRIPT_BERIA_ERFE GLIB_AVAILABLE_ENUMERATOR_IN_2_88, / Berf /
693	} GUnicodeScript;
694
695	GLIB_AVAILABLE_IN_ALL
696	guint32 g_unicode_script_to_iso15924 (GUnicodeScript script);
697	GLIB_AVAILABLE_IN_ALL
698	GUnicodeScript g_unicode_script_from_iso15924 (guint32 iso15924);
699
700	/ These are all analogs of the <ctype.h> functions.*
701	*/
702	GLIB_AVAILABLE_IN_ALL
703	gboolean g_unichar_isalnum (gunichar c) G_GNUC_CONST;
704	GLIB_AVAILABLE_IN_ALL
705	gboolean g_unichar_isalpha (gunichar c) G_GNUC_CONST;
706	GLIB_AVAILABLE_IN_ALL
707	gboolean g_unichar_iscntrl (gunichar c) G_GNUC_CONST;
708	GLIB_AVAILABLE_IN_ALL
709	gboolean g_unichar_isdigit (gunichar c) G_GNUC_CONST;
710	GLIB_AVAILABLE_IN_ALL
711	gboolean g_unichar_isgraph (gunichar c) G_GNUC_CONST;
712	GLIB_AVAILABLE_IN_ALL
713	gboolean g_unichar_islower (gunichar c) G_GNUC_CONST;
714	GLIB_AVAILABLE_IN_ALL
715	gboolean g_unichar_isprint (gunichar c) G_GNUC_CONST;
716	GLIB_AVAILABLE_IN_ALL
717	gboolean g_unichar_ispunct (gunichar c) G_GNUC_CONST;
718	GLIB_AVAILABLE_IN_ALL
719	gboolean g_unichar_isspace (gunichar c) G_GNUC_CONST;
720	GLIB_AVAILABLE_IN_ALL
721	gboolean g_unichar_isupper (gunichar c) G_GNUC_CONST;
722	GLIB_AVAILABLE_IN_ALL
723	gboolean g_unichar_isxdigit (gunichar c) G_GNUC_CONST;
724	GLIB_AVAILABLE_IN_ALL
725	gboolean g_unichar_istitle (gunichar c) G_GNUC_CONST;
726	GLIB_AVAILABLE_IN_ALL
727	gboolean g_unichar_isdefined (gunichar c) G_GNUC_CONST;
728	GLIB_AVAILABLE_IN_ALL
729	gboolean g_unichar_iswide (gunichar c) G_GNUC_CONST;
730	GLIB_AVAILABLE_IN_ALL
731	gboolean g_unichar_iswide_cjk(gunichar c) G_GNUC_CONST;
732	GLIB_AVAILABLE_IN_ALL
733	gboolean g_unichar_iszerowidth(gunichar c) G_GNUC_CONST;
734	GLIB_AVAILABLE_IN_ALL
735	gboolean g_unichar_ismark (gunichar c) G_GNUC_CONST;
736
737	/ More <ctype.h> functions. These convert between the three cases.*
738	* See the Unicode book to understand title case. */
739	GLIB_AVAILABLE_IN_ALL
740	gunichar g_unichar_toupper (gunichar c) G_GNUC_CONST;
741	GLIB_AVAILABLE_IN_ALL
742	gunichar g_unichar_tolower (gunichar c) G_GNUC_CONST;
743	GLIB_AVAILABLE_IN_ALL
744	gunichar g_unichar_totitle (gunichar c) G_GNUC_CONST;
745
746	/ If C is a digit (according to 'g_unichar_isdigit'), then return its*
747	numeric value. Otherwise return -1. /*
748	GLIB_AVAILABLE_IN_ALL
749	gint g_unichar_digit_value (gunichar c) G_GNUC_CONST;
750
751	GLIB_AVAILABLE_IN_ALL
752	gint g_unichar_xdigit_value (gunichar c) G_GNUC_CONST;
753
754	/ Return the Unicode character type of a given character. /
755	GLIB_AVAILABLE_IN_ALL
756	GUnicodeType g_unichar_type (gunichar c) G_GNUC_CONST;
757
758	/ Return the line break property for a given character /
759	GLIB_AVAILABLE_IN_ALL
760	GUnicodeBreakType g_unichar_break_type (gunichar c) G_GNUC_CONST;
761
762	/ Returns the combining class for a given character /
763	GLIB_AVAILABLE_IN_ALL
764	gint g_unichar_combining_class (gunichar uc) G_GNUC_CONST;
765
766	GLIB_AVAILABLE_IN_ALL
767	gboolean g_unichar_get_mirror_char (gunichar ch,
768	gunichar *mirrored_ch);
769
770	GLIB_AVAILABLE_IN_ALL
771	GUnicodeScript g_unichar_get_script (gunichar ch) G_GNUC_CONST;
772
773	/ Validate a Unicode character /
774	GLIB_AVAILABLE_IN_ALL
775	gboolean g_unichar_validate (gunichar ch) G_GNUC_CONST;
776
777	/ Pairwise canonical compose/decompose /
778	GLIB_AVAILABLE_IN_ALL
779	gboolean g_unichar_compose (gunichar a,
780	gunichar b,
781	gunichar *ch);
782	GLIB_AVAILABLE_IN_ALL
783	gboolean g_unichar_decompose (gunichar ch,
784	gunichar *a,
785	gunichar *b);
786
787	GLIB_AVAILABLE_IN_ALL
788	gsize g_unichar_fully_decompose (gunichar ch,
789	gboolean compat,
790	gunichar *result,
791	gsize result_len);
792
793	/**
794	* G_UNICHAR_MAX_DECOMPOSITION_LENGTH:
795	*
796	* The maximum length (in codepoints) of a compatibility or canonical
797	* decomposition of a single Unicode character.
798	*
799	* This is as defined by Unicode 6.1.
800	*
801	* Since: 2.32
802	*/
803	#define G_UNICHAR_MAX_DECOMPOSITION_LENGTH 18 /* codepoints */
804
805	/ Compute canonical ordering of a string in-place. This rearranges*
806	decomposed characters in the string according to their combining
807	classes. See the Unicode manual for more information. /*
808	GLIB_AVAILABLE_IN_ALL
809	void g_unicode_canonical_ordering (gunichar *string,
810	gsize len);
811
812
813	GLIB_DEPRECATED_IN_2_30
814	gunichar *g_unicode_canonical_decomposition (gunichar ch,
815	gsize *result_len) G_GNUC_MALLOC;
816
817	/ Array of skip-bytes-per-initial character.*
818	*/
819	GLIB_VAR const gchar * const g_utf8_skip;
820
821	/**
822	* g_utf8_next_char:
823	* @p: Pointer to the start of a valid UTF-8 character
824	*
825	* Skips to the next character in a UTF-8 string.
826	*
827	* The string must be valid; this macro is as fast as possible, and has
828	* no error-checking.
829	*
830	* You would use this macro to iterate over a string character by character.
831	*
832	* The macro returns the start of the next UTF-8 character.
833	*
834	* Before using this macro, use g_utf8_validate() to validate strings
835	* that may contain invalid UTF-8.
836	*/
837	#define g_utf8_next_char(p) ((p) + g_utf8_skip[(const guchar )(p)])
838
839	GLIB_AVAILABLE_IN_ALL
840	gunichar g_utf8_get_char (const gchar *p) G_GNUC_PURE;
841	GLIB_AVAILABLE_IN_ALL
842	gunichar g_utf8_get_char_validated (const gchar *p,
843	gssize max_len) G_GNUC_PURE;
844
845	GLIB_AVAILABLE_IN_ALL
846	gchar* g_utf8_offset_to_pointer (const gchar *str,
847	glong offset) G_GNUC_PURE;
848	GLIB_AVAILABLE_IN_ALL
849	glong g_utf8_pointer_to_offset (const gchar *str,
850	const gchar *pos) G_GNUC_PURE;
851	GLIB_AVAILABLE_IN_ALL
852	gchar* g_utf8_prev_char (const gchar *p) G_GNUC_PURE;
853	GLIB_AVAILABLE_IN_ALL
854	gchar* g_utf8_find_next_char (const gchar *p,
855	const gchar *end) G_GNUC_PURE;
856	GLIB_AVAILABLE_IN_ALL
857	gchar* g_utf8_find_prev_char (const gchar *str,
858	const gchar *p) G_GNUC_PURE;
859
860	GLIB_AVAILABLE_IN_ALL
861	glong g_utf8_strlen (const gchar *p,
862	gssize max) G_GNUC_PURE;
863
864	GLIB_AVAILABLE_IN_2_30
865	gchar g_utf8_substring (const* gchar *str,
866	glong start_pos,
867	glong end_pos) G_GNUC_MALLOC;
868
869	GLIB_AVAILABLE_IN_ALL
870	gchar g_utf8_strncpy (gchar dest,
871	const gchar *src,
872	gsize n);
873
874	GLIB_AVAILABLE_IN_2_78
875	gchar g_utf8_truncate_middle (const* gchar *string,
876	gsize truncate_length);
877
878	/ Find the UTF-8 character corresponding to ch, in string p. These*
879	functions are equivalents to strchr and strrchr /*
880	GLIB_AVAILABLE_IN_ALL
881	gchar* g_utf8_strchr (const gchar *p,
882	gssize len,
883	gunichar c);
884	GLIB_AVAILABLE_IN_ALL
885	gchar* g_utf8_strrchr (const gchar *p,
886	gssize len,
887	gunichar c);
888	GLIB_AVAILABLE_IN_ALL
889	gchar* g_utf8_strreverse (const gchar *str,
890	gssize len);
891
892	GLIB_AVAILABLE_IN_ALL
893	gunichar2 g_utf8_to_utf16 (const* gchar *str,
894	glong len,
895	glong *items_read,
896	glong *items_written,
897	GError **error) G_GNUC_MALLOC;
898	GLIB_AVAILABLE_IN_ALL
899	gunichar * g_utf8_to_ucs4 (const gchar *str,
900	glong len,
901	glong *items_read,
902	glong *items_written,
903	GError **error) G_GNUC_MALLOC;
904	GLIB_AVAILABLE_IN_ALL
905	gunichar * g_utf8_to_ucs4_fast (const gchar *str,
906	glong len,
907	glong *items_written) G_GNUC_MALLOC;
908	GLIB_AVAILABLE_IN_ALL
909	gunichar * g_utf16_to_ucs4 (const gunichar2 *str,
910	glong len,
911	glong *items_read,
912	glong *items_written,
913	GError **error) G_GNUC_MALLOC;
914	GLIB_AVAILABLE_IN_ALL
915	gchar* g_utf16_to_utf8 (const gunichar2 *str,
916	glong len,
917	glong *items_read,
918	glong *items_written,
919	GError **error) G_GNUC_MALLOC;
920	GLIB_AVAILABLE_IN_ALL
921	gunichar2 g_ucs4_to_utf16 (const* gunichar *str,
922	glong len,
923	glong *items_read,
924	glong *items_written,
925	GError **error) G_GNUC_MALLOC;
926	GLIB_AVAILABLE_IN_ALL
927	gchar* g_ucs4_to_utf8 (const gunichar *str,
928	glong len,
929	glong *items_read,
930	glong *items_written,
931	GError **error) G_GNUC_MALLOC;
932
933	GLIB_AVAILABLE_IN_ALL
934	gint g_unichar_to_utf8 (gunichar c,
935	gchar *outbuf);
936
937	GLIB_AVAILABLE_IN_ALL
938	gboolean g_utf8_validate (const gchar *str,
939	gssize max_len,
940	const gchar **end);
941	GLIB_AVAILABLE_IN_2_60
942	gboolean g_utf8_validate_len (const gchar *str,
943	gsize max_len,
944	const gchar **end);
945
946	GLIB_AVAILABLE_IN_ALL
947	gchar g_utf8_strup (const* gchar *str,
948	gssize len) G_GNUC_MALLOC;
949	GLIB_AVAILABLE_IN_ALL
950	gchar g_utf8_strdown (const* gchar *str,
951	gssize len) G_GNUC_MALLOC;
952	GLIB_AVAILABLE_IN_ALL
953	gchar g_utf8_casefold (const* gchar *str,
954	gssize len) G_GNUC_MALLOC;
955
956	/**
957	* GNormalizeMode:
958	* @G_NORMALIZE_DEFAULT: standardize differences that do not affect the
959	* text content, such as the above-mentioned accent representation
960	* @G_NORMALIZE_NFD: another name for %G_NORMALIZE_DEFAULT
961	* @G_NORMALIZE_DEFAULT_COMPOSE: like %G_NORMALIZE_DEFAULT, but with
962	* composed forms rather than a maximally decomposed form
963	* @G_NORMALIZE_NFC: another name for %G_NORMALIZE_DEFAULT_COMPOSE
964	* @G_NORMALIZE_ALL: beyond %G_NORMALIZE_DEFAULT also standardize the
965	* "compatibility" characters in Unicode, such as SUPERSCRIPT THREE
966	* to the standard forms (in this case DIGIT THREE). Formatting
967	* information may be lost but for most text operations such
968	* characters should be considered the same
969	* @G_NORMALIZE_NFKD: another name for %G_NORMALIZE_ALL
970	* @G_NORMALIZE_ALL_COMPOSE: like %G_NORMALIZE_ALL, but with composed
971	* forms rather than a maximally decomposed form
972	* @G_NORMALIZE_NFKC: another name for %G_NORMALIZE_ALL_COMPOSE
973	*
974	* Defines how a Unicode string is transformed in a canonical
975	* form, standardizing such issues as whether a character with
976	* an accent is represented as a base character and combining
977	* accent or as a single precomposed character. Unicode strings
978	* should generally be normalized before comparing them.
979	*/
980	typedef enum {
981	G_NORMALIZE_DEFAULT,
982	G_NORMALIZE_NFD = G_NORMALIZE_DEFAULT,
983	G_NORMALIZE_DEFAULT_COMPOSE,
984	G_NORMALIZE_NFC = G_NORMALIZE_DEFAULT_COMPOSE,
985	G_NORMALIZE_ALL,
986	G_NORMALIZE_NFKD = G_NORMALIZE_ALL,
987	G_NORMALIZE_ALL_COMPOSE,
988	G_NORMALIZE_NFKC = G_NORMALIZE_ALL_COMPOSE
989	} GNormalizeMode;
990
991	GLIB_AVAILABLE_IN_ALL
992	gchar g_utf8_normalize (const* gchar *str,
993	gssize len,
994	GNormalizeMode mode) G_GNUC_MALLOC;
995
996	GLIB_AVAILABLE_IN_ALL
997	gint g_utf8_collate (const gchar *str1,
998	const gchar *str2) G_GNUC_PURE;
999	GLIB_AVAILABLE_IN_ALL
1000	gchar g_utf8_collate_key (const* gchar *str,
1001	gssize len) G_GNUC_MALLOC;
1002	GLIB_AVAILABLE_IN_ALL
1003	gchar g_utf8_collate_key_for_filename (const* gchar *str,
1004	gssize len) G_GNUC_MALLOC;
1005
1006	GLIB_AVAILABLE_IN_2_52
1007	gchar g_utf8_make_valid (const* gchar *str,
1008	gssize len) G_GNUC_MALLOC;
1009
1010	G_END_DECLS
1011
1012	#endif /* __G_UNICODE_H__ */
1013

Browse the source code of include/glib-2.0/glib/gunicode.h